OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话,还附赠一个限时圣诞老人声音
OpenAI为期12个工作日的新产品和技术发布活动出了新王炸:在首次公开演示将近七个月后,OpenAI正式面向广大付费用户推出ChatGPT类人高级人工智能(AI)语音助手的新功能,包括视频对话和实时屏幕共享,以及一个增添节日趣味的“圣诞老人”音色。
美东时间12月12日,OpenAI宣布,在ChatGPT的移动端应用程序App中,上线ChatGPT高级语音模式Advanced Voice的视频和共享屏幕功能。Advanced Voice由OpenAI的多模态模型GPT-4o支持。
视频功能启动方式很简单,点击对话框右下角的高级语音模式图标,加载完成后点击新增的“视频”按钮即可开始。
OpenAI的研究员在直播中演示了任何运用新功能,点击ChatGPT聊天栏旁边的语音图标,然后点击左下角的视频图标,就可以启动视频对话。如果想共享屏幕,手机用户要点击打开一个有三个喧嚣的菜单,选择其中的“共享屏幕”(Share Screen)。
在和ChatGPT的视频对话中,OpenAI研究员提问,研究员先让GPT看到并和现场的OpenAI工作人员分别打过招呼,然后问GPT,现场谁的打扮最像圣诞老人,谁像圣诞老人的驯鹿,GPT均作出准确而回答。研究员演示了,给GPT转发一个短信内容及图片,让GPT建议如何回复对方的短信。
研究员还演示了,利用Advanced Voice的新功能让GPT帮忙校对或者通过GPT学习新东西。比如找出一些制作手冲咖啡的咖啡壶、过滤杯等工具,向GPT展示并询问如何使用这些工具,在操作时,让GPT评价做得如何,并给出建议。
再来是屏幕共享功能。只需要把自己的屏幕内容实时分享给 ChatGPT ,向它寻求帮助。点击高级语音模式图标后,从下拉菜单中选择“共享屏幕”选项即可。
Rowan继续与ChatGPT分享了消息应用中的对话内容,请它帮忙编辑一条幽默礼貌的回复。
视频对话是OpenAI今年5月首次演示高级语音模式后,就被用户敲碗的新功能,如今总算兑现。能想到的使用场景有技能学习,比如烹饪、手工制作、运动技巧,也可用于日常生活种答疑和景点、产品介绍等。
屏幕共享则支持用户分享各种文档内容,获取优化建议,或是实时展示手机设备和软件问题,让ChatGPT提供实际解决方案。添加新交互方式后的语音模式,一定程度上也提升了对话的直观性和实用性。
OpenAI表示,大多数ChatGPT Plus和Pro套餐的订阅用户以及所有Team用户都将可以在今后几天内通过ChatGPT的App访问12月12日推出的新功能,预计欧盟、瑞士、冰岛、挪威和列支敦士登的ChatGPT Plus和Pro用户也将很快可以运用新功能。ChatGPT的企业版和教育版Enterprise和Edu将于2025年1月上线新功能。
同时OpenAI宣布,在Advanced Voice这一高级语音模式中,新增了“限时”的圣诞老人声音作为“节日特供”,有效期持续到明年1月初,在全球范围内,所有移动、网络和桌面App用户都可选用。
点击主界面雪花图标,或在设置中启用“圣诞老人”后,就可以和他语音对话了。即使用户的高级语音额度已用完,首次与圣诞老人对话时,系统也会重置额度,确保人人都能体验。
值得注意的是,今年5月OpenAI就在推出新旗舰模型GPT-4o时演示了语音模式Voice Mode,不过该模式真正落地一波三折。
OpenAI原计划6月末向一小批Plus计划用户推出该语音模式,6月又宣布推迟一个月发布,以便确保该功能安全有效地处理来自数百万用户的请求。当时OpenAI称,计划今年秋季让所有Plus用户都可以访问该功能,确切的时间表取决于是否达到内部对安全性和可靠性的高标准。
7月末,OpenAI对有限的部分付费Plus用户推出高级语音模式下的ChatGPT,称语音模式无法模仿他人的说话方式,且增加了新的过滤器,保证软件能够发现并拒绝某些生成音乐或其他形式受版权保护音频的请求。当时上线的语音模式缺少5月OpenAI展示过的不少功能,比如计算机视觉功能,类似于本周四OpenAI宣布将要推出的视频对话答问。
每日经济新闻综合公开资料