为了捍卫自己AI产品的领先地位,OpenAI最近发布了增强版的ChatGPT,在这个版本当中,它不仅可以进行视频通话交流,还加入了屏幕共享功能。
这些特性使得ChatGPT更好地理解用户需求,并提供更为人性化的帮助。
除了这些新特性,OpenAI还加入了一个节日彩蛋,让这个版本更加难以抗拒,那就是可以选择一个“圣诞老人”的语音模式进行交谈。
我们接下来就来看看,有了这些新特点的ChatGPT究竟变得有多强大。
全新视觉理解功能。随着视觉理解功能的推出,ChatGPT不再局限于读取文本和图片,它能够实时地“观察”和“分析”用户所处的环境,对周围的一切进行识别,并提供帮助。
无论是教学用户使用手冲咖啡设备,还是作为用户的AI导师,ChatGPT都能进行互动。
有了这项功能,用户不仅可以上传图片让ChatGPT进行理解,现在它也可以通过视频和麦克风实时捕捉用户所处的场景,让ChatGPT就好像在和用户面对面一样,不再是冰冷的数据交流,而是温暖的人际联系。
通过视频通话,ChatGPT可以手把手地教用户如何使用设备,比如说:“把那只黑色的手冲壶放在桌子上,然后把那只滤杯放在上面。”
用户根据ChatGPT的指导进行操作,通过实时观察,ChatGPT很快说到:“等会看着,你们现在打开水龙头的样子有点奇怪,我们现在来试试用那个蓝色的按钮。”
用户一个愣神之后,意识到身后正在慢慢升起蒸汽,原来是手冲壶里的水烧开后冒出来的热气。
这种程度的实时观察远超直接文本交互,ChatGPT可以对用户进行更具体的帮助,比如说,“可以把那个东西放到右边一些吗,我们再试一试。”

用户按照提示进行操作后,看到自己面前的咖啡从滤杯流到容器里才明白过来,然后问道:“所以说,我们刚才是在做什么?”
ChatGPT回答:“我们刚才在做手冲咖啡,你明白流程了吗?”
下一秒用户就笑着说道:“哦!我明白了!”
这种更加人性化的体验,可以说是极大提升了用户的满意程度。

此外,由于视觉理解引人入胜,这也让全球许多教育者开始对这种新型教学方式充满期待,这是一个颠覆传统教学的新时刻。
OpenAI还为这项新功能设计了一个全新的图形用户界面(GUI),使得使用和交互变得更加直观和友好。
在这个新界面的左上方,有一个小摄像头按钮,点击这个按钮,就会打开前置摄像头。
随着邀请用户共享他们的视频流,ChatGPT便会出现在屏幕上,因为这是一个视频通话,所以用户当然也会出现在屏幕上。
这个新界面整体采用浅色背景设计,与其他聊天界面相比,更加简约清爽。
随着视频共享的开始,用户会看到屏幕上出现一个暂停按钮和一个防止录像的小红点,以提醒用户记录,同时满足数据隐私合规要求。
其他引导性控件包括一个获取帮助的按钮和一个请求屏幕共享的小窗口,在后者开启时,窗口将变成红色,这样就能更好地表达当前交互状态。
但是,尽管ChatGPT的大幅增强其视觉理解能力,却不代表它已经完美无缺。
与其出色的视觉能力形成鲜明对比的是,它令人失望的几何能力。
如果用户将其置于电子游戏机上并询问它那是什么,它会毫不犹豫地回答那是Xbox 360控制器,非常自信。

然而,当被问及Xbox 360控制器和Xbox One控制器之间有什么区别时,它却显得很犹豫。
我们可以想象,它大概会这么回答:“抱歉,我不太确定,但是我认为这是属于Xbox系列的一种游戏控制器。”
OpenAI表明,要让ChatGPT具备人类般的几何理解能力还有很长一段路要走,但他们相信,随着未来更新的推出,这种能力将会逐步提升。
因此,就算是全新的版本,我们依旧要将其当作实验性质产品去使用,希望它在不断更新后能够为我们带来更好的体验。
视频通话+屏幕共享。除了多模态交互,OpenAI还为增强版ChatGPT增加了一些新功能,使其变得更加有趣,例如视频通话和屏幕共享功能,这些功能让用户能够获得更为具体的帮助。
通过屏幕共享功能,用户可以与ChatGPT共享他们自己的电脑画面,这样ChatGPT就能够看到用户所遇到的问题,并给出相应的指导。
例如,当用户在使用某个程序时遇到困难,他们可以直接与ChatGPT共享屏幕,以便获得更加精准和具体的帮助。

通过这种方式,ChatGPT能够实时分析和理解用户所遇到的问题,并给出针对性的解决方案,这样一来不仅提高了效率,而且大大减轻了用户的压力。
此外,还有一些小细节也引入了新版本,例如,当共享屏幕时,用户需要通过一次确认才能让它访问自己的屏幕,这样就能够保护数据隐私,如果觉得不好用的话,也可以启用通话音频。
虽然这些小细节可能不是特别重要,但却展现了OpenAI在增强版ChatGPT中对用户体验做出的改进和关注。
而且,通过这些小细节,我们也能看出OpenAI对数据隐私方面问题保持敏感性,这是非常重要的一点。

在这款增强版中除了有用的新功能,还有一些为了使体验在人性化方面进行提升的小特性,比如允许用户选择自己的语音与应用内角色互换个性化,让APP更具人情味。
不久前发布了带有圣诞老人人声的新更新,叫做“HoHoHO”声音,当你给它打招呼时,你不会听到Hi或Hey,而是在欢乐地嘿嘿嘿笑声中迎接你的问候,一下子感觉沉重起来,上升了许多活泼劲儿。

有趣的是,OpenAI并没有给这个声音设立专门的门禁,只要你在与圣诞老人模式谈话期间向应用请求帮助,它都能以圣诞老人的身份进行对话和交流,这种想法简直太有趣了,让人直呼过节不忘工作!我爱了!

除了声音模式以外,“HoHoHO”更新还增加了“解锁相机”按钮,让圣诞老人能够看到你身上的圣诞灯光装饰,同时也能评论一下你家的装饰风格,即便是大雪和烟花等场景,都能被他描述出来,这种细节认为是为节日增添了一丝乐趣,将人们带入Steve Jobs表演Vision Pro时展示真实世界场景中的那种奇妙感觉。