OpenAI又憋了个大招啊。OpenAI春季发布会来了,没有大家期待的GPT-5和搜索引擎,这次推出一个新的旗舰模型:GPT-4o。“o”是Omni的缩写,意为“全能”,接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出。
从直播来看,GPT-4o的多模态、实时交互能力,非常惊艳,科幻电影《her》变成了现实。有几大核心能力,首先是零延迟实时语音交互,在这个环节,GPT表现得像是富有情感的真人。除了语音交互外,还可以通过视觉+语音的形式,如实时视频、上传图片等方式,与GPT-4o进行多模态交互。
编程能力又上新高度,以后程序员可能真的要失业了。