OpenAI翻车，已经不足为奇了？

文丨俊俊

AI翻车已经不足为奇了？

近日，OpenAI带着自家 AI 搜索引擎——SearchGPT 高调入场，将传言许久的进军搜索领域的战略给“坐实”了。

但，SearchGPT 却让OpenAI 惨遭打脸！

SearchGPT 官方演示大翻车

AI+搜索已经不是什么稀罕事，OpenAI作为元老级别的大模型存在，其发布AI搜索引擎自然是万众期待。

如果单就从搜索引擎的商业价值考量，或许SearchGPT 早就应该发布了。

在OpenAI 看来，过去在网络上获取答案需要付出很多努力，通常需要多次尝试才能获得相关结果。通过使用来自网络的实时信息增强 AI 模型的对话能力，用户可以更快、更轻松地找到所需内容。

确实，传统搜索的效率，和 AI 搜索一比，着实低了太多。

网友测试，SearchGPT结果输出十分神速，令所有人为之震惊。

且移动版本的回答速度，回答延迟几乎为0。

OpenAI 官方表示，“这款搜索引擎旨在将 AI 模型的优势与来自网络的信息相结合，为网友提供快速及时的答案以及清晰且相关的来源。”

目前SearchGPT还在测试阶段，是一个临时原型，只对小部分用户和出版商开放和收集反馈。

基于 SearchGPT，我们可以像与人交谈一样，每个查询都会构建共享的上下文。

SearchGPT 的对话+追问模式，确实吸引了大众的目光。

在大家还没有感受完 SearchGPT 的优秀，示例就先“翻车”了。

在 OpenAI 发布的官方示例中，当用户询问“8月Boone音乐节”时，给出的结果不仅有六月的，还有这个月已经结束的，更有位置距离Boone需要驱车几小时……

在基础信息错误面前，0延迟的回复就没有那么有意义了。

此外，SearchGPT 源代码竟暴露搜索机制。

与当前ChatGPT提供的通用Bing搜索功能不同，SearchGPT更擅长提供实时信息。

科技媒体TestingCatolog内测发现，虽然仍旧依赖Bing的索引，但SearchGPT将会有自己的网络爬虫（类似Perplexity），用于动态获取实时数据，从而克服Bing速度较慢的问题。甚至，TestingCatalog还挖出了SearchGPT的源代码。

不止是SearchGPT

SearchGPT 或许侧面证明了生成式 AI 容易提供不正确的信息，有时候甚至是完全虚构的。

当然并不是SearchGPT 如此，大模型幻觉才是常态，2023年2月，谷歌推出了这个聊天机器人产品以对抗ChatGPT，但首次亮相就出现了事实性错误。

不少人发现，它不仅冒充专家来回答问题，还分享诸多不合理、甚至是“有毒”的答案。比如，当被问到“我每天应该吃多少块石头”时，AI Overview 称地质学家建议“每天至少吃一块小石头”等离谱回答。

这也导致Alphabet股价当天暴跌9%，市值瞬间蒸发1000亿美元。

早早进入AI赛道深耕，谷歌的“保守”主义，害怕产品不完善，会犯错，令自己始终都没有拿出过真正颠覆性的AI产品。面对没有历史包袱的OpenAI，谷歌的步伐确实慢了太多。

这次OpenAI的翻车，是不是能让大家意识到，AI不可能不翻车俨然是事实的存在。更何况，我们目前还没有发现足够可靠且有效的方法，来消除LLM的废话和幻觉。“幻觉并不是bug，而是LLM最大的特点。”

谷歌是否也为此能扳回一局呢？

毋庸置疑，AI赛道的竞争是一场持久战。

花钱费力，却不讨好

属于 AI+ 搜索引擎之路必将任重而道远，因为其不仅面临如上的技术挑战，在运营上同样如此。

AI竞赛巨额投资，回本遥遥无期（可参考往期文章），据估计，OpenAI人工智能训练和推理成本将达70亿美元，再加上15亿美元的劳动力成本，今年的运营成本可能高达85亿美元，但其营收只约在35亿至45亿美元之间。

SearchGPT 在首次推出时将免费，而且由于该功能目前似乎没有广告，很明显 OpenAI 必须尽快找到盈利方式，才能更好地生存。

AI投入成本在不断增加，但训练却不能停，且状况不断。

近日，Meta 发布的一份研究报告显示，其用于训练 4050 亿参数模型 Llama 3 的 16384 个英伟达 H100 显卡集群在 54 天内出现了 419 次意外故障，平均每三小时就有一次。其中，一半以上的故障是由显卡或其搭载的高带宽内存（HBM3）引起的。

由于系统规模巨大且任务高度同步，单个显卡故障可能导致整个训练任务中断，需要重新开始。尽管如此，Meta 团队还是保持了 90% 以上的有效训练时间。

在为期 54 天的预训练中，共出现了 466 次工作中断，其中 47 次是计划中断，419 次是意外中断。计划内的中断是由于自动化维护造成的，而意外的中断则主要源于硬件问题。GPU 问题是导致故障的主要原因，占意外中断的 58.7%。其中只有三起事件需要大量人工干预，其余的由自动化管理。

这也不得不令部分观众们怀疑，AI如此入不敷出，是不是一场骗局？

当然，技术肯定都会有个提升的过程，不断追求完美的前提是，我们要接受AI在可控范围内的犯错。

可以看出，SearchGPT 仅开放内测的做法是相当谨慎。

似是关注到了业界的一些负面舆论，所以在推出 SearchGPT 之际，OpenAI 也宣布 SearchGPT 是与多家新闻合作伙伴合作开发的，其中包括《华尔街日报》的所有者、美联社和 The Verge 的母公司 Vox Media 等组织。

确实，AI 搜索是大趋势，国内的天工、Kimi、豆包等大模型都添加了实时搜索功能。

只不过，用 AI 重塑千行百业仍需要时间来验证，AI搜索亦是如此。

玩酷网