OpenAI翻车,已经不足为奇了?

趣唠科技不打烊 2024-08-11 07:40:45

文丨俊俊

AI翻车已经不足为奇了?

近日,OpenAI带着自家 AI 搜索引擎——SearchGPT 高调入场,将传言许久的进军搜索领域的战略给“坐实”了。

但,SearchGPT 却让OpenAI 惨遭打脸!

SearchGPT 官方演示大翻车

AI+搜索已经不是什么稀罕事,OpenAI作为元老级别的大模型存在,其发布AI搜索引擎自然是万众期待。

如果单就从搜索引擎的商业价值考量,或许SearchGPT 早就应该发布了。

在OpenAI 看来,过去在网络上获取答案需要付出很多努力,通常需要多次尝试才能获得相关结果。通过使用来自网络的实时信息增强 AI 模型的对话能力,用户可以更快、更轻松地找到所需内容。

确实,传统搜索的效率,和 AI 搜索一比,着实低了太多。

网友测试,SearchGPT结果输出十分神速,令所有人为之震惊。

且移动版本的回答速度,回答延迟几乎为0。

OpenAI 官方表示,“这款搜索引擎旨在将 AI 模型的优势与来自网络的信息相结合,为网友提供快速及时的答案以及清晰且相关的来源。”

目前SearchGPT还在测试阶段,是一个临时原型,只对小部分用户和出版商开放和收集反馈。

基于 SearchGPT,我们可以像与人交谈一样,每个查询都会构建共享的上下文。

SearchGPT 的对话+追问模式,确实吸引了大众的目光。

在大家还没有感受完 SearchGPT 的优秀,示例就先“翻车”了。

在 OpenAI 发布的官方示例中,当用户询问“8月Boone音乐节”时,给出的结果不仅有六月的,还有这个月已经结束的,更有位置距离Boone需要驱车几小时……

在基础信息错误面前,0延迟的回复就没有那么有意义了。

此外,SearchGPT 源代码竟暴露搜索机制。

与当前ChatGPT提供的通用Bing搜索功能不同,SearchGPT更擅长提供实时信息。

科技媒体TestingCatolog内测发现,虽然仍旧依赖Bing的索引,但SearchGPT将会有自己的网络爬虫(类似Perplexity),用于动态获取实时数据,从而克服Bing速度较慢的问题。甚至,TestingCatalog还挖出了SearchGPT的源代码。

不止是SearchGPT

SearchGPT 或许侧面证明了生成式 AI 容易提供不正确的信息,有时候甚至是完全虚构的。

当然并不是SearchGPT 如此,大模型幻觉才是常态,2023年2月,谷歌推出了这个聊天机器人产品以对抗ChatGPT,但首次亮相就出现了事实性错误。

不少人发现,它不仅冒充专家来回答问题,还分享诸多不合理、甚至是“有毒”的答案。比如,当被问到“我每天应该吃多少块石头”时,AI Overview 称地质学家建议“每天至少吃一块小石头”等离谱回答。

这也导致Alphabet股价当天暴跌9%,市值瞬间蒸发1000亿美元。

早早进入AI赛道深耕,谷歌的“保守”主义,害怕产品不完善,会犯错,令自己始终都没有拿出过真正颠覆性的AI产品。面对没有历史包袱的OpenAI,谷歌的步伐确实慢了太多。

这次OpenAI的翻车,是不是能让大家意识到,AI不可能不翻车俨然是事实的存在。更何况,我们目前还没有发现足够可靠且有效的方法,来消除LLM的废话和幻觉。“幻觉并不是bug,而是LLM最大的特点。”

谷歌是否也为此能扳回一局呢?

毋庸置疑,AI赛道的竞争是一场持久战。

花钱费力,却不讨好

属于 AI+ 搜索引擎之路必将任重而道远,因为其不仅面临如上的技术挑战,在运营上同样如此。

AI竞赛巨额投资,回本遥遥无期(可参考往期文章),据估计,OpenAI人工智能训练和推理成本将达70亿美元,再加上15亿美元的劳动力成本,今年的运营成本可能高达85亿美元,但其营收只约在35亿至45亿美元之间。

SearchGPT 在首次推出时将免费,而且由于该功能目前似乎没有广告,很明显 OpenAI 必须尽快找到盈利方式,才能更好地生存。

AI投入成本在不断增加,但训练却不能停,且状况不断。

近日,Meta 发布的一份研究报告显示,其用于训练 4050 亿参数模型 Llama 3 的 16384 个英伟达 H100 显卡集群在 54 天内出现了 419 次意外故障,平均每三小时就有一次。其中,一半以上的故障是由显卡或其搭载的高带宽内存(HBM3)引起的。

由于系统规模巨大且任务高度同步,单个显卡故障可能导致整个训练任务中断,需要重新开始。尽管如此,Meta 团队还是保持了 90% 以上的有效训练时间。

在为期 54 天的预训练中,共出现了 466 次工作中断,其中 47 次是计划中断,419 次是意外中断。计划内的中断是由于自动化维护造成的,而意外的中断则主要源于硬件问题。GPU 问题是导致故障的主要原因,占意外中断的 58.7%。其中只有三起事件需要大量人工干预,其余的由自动化管理。

这也不得不令部分观众们怀疑,AI如此入不敷出,是不是一场骗局?

当然,技术肯定都会有个提升的过程,不断追求完美的前提是,我们要接受AI在可控范围内的犯错。

可以看出,SearchGPT 仅开放内测的做法是相当谨慎。

似是关注到了业界的一些负面舆论,所以在推出 SearchGPT 之际,OpenAI 也宣布 SearchGPT 是与多家新闻合作伙伴合作开发的,其中包括《华尔街日报》的所有者、美联社和 The Verge 的母公司 Vox Media 等组织。

确实,AI 搜索是大趋势,国内的天工、Kimi、豆包等大模型都添加了实时搜索功能。

只不过,用 AI 重塑千行百业仍需要时间来验证,AI搜索亦是如此。

0 阅读:0

趣唠科技不打烊

简介:感谢大家的关注