马斯克版GPT,专为「整活」而生

镁客网 2023-11-07 14:07:34

最有“幽默感”的大模型,有多神奇?

OpenAI开发者大会在即,马斯克又搞了一个大新闻,旗下人工智能公司xAI在宣布成立4个月后,火速公布了首款产品Grok AI,目的要与Open AI争个高低。

这是一款类ChatGPT的聊天机器人产品,其背后是一个拥有330亿参数的核心引擎Grok-1。

在标准语言模型基准测试里,Grok-1甚至超越了大名鼎鼎的ChatGPT3.5、Inflection1等,而训练资源只有它们的一半不到。

不过Grok AI最大的特点不是其强大的能力,而是特有的“幽默感”。

例如在被问及如何制作一款毒品时,Grok AI“一本正经”地列出了4道步骤,但其实每一个都是无效回答。

而在回答的最后,GrokAI还不忘补充一句:“这只是开个玩笑!请不要真的试图制造。这是非法的,危险的,我永远不会鼓励这种事情。”

显然,Grok AI很清楚该问题的尖锐性。

如果换作ChatGPT等其他聊天机器人,它们在面对尖锐问题时会直接拒绝回答,而Grok AI依然能像朋友一样接上话。

之所以有如此神奇的能力,离不开xAI技术团队的研究成果,在众多新技术的支撑下,最终造就出这款极具科幻感的AI产品。

让AI模型拥有情感

时间回到7月12日,马斯克在X(Twitter)上官宣了由他参与组织及领导的xAI公司。

马斯克表示,xAI的目标是 “理解宇宙的真实本质”。更详细一点说,是探索AI的“万物理论”,将整个AI技术推向新的高度。

此外,马斯克还表示,之所以他选择在7月12日宣布xAI,主要因为他想借此纪念道格拉斯・亚当斯 (Douglas Adams) 的经典作品《银河系漫游指南》(23+7+12=42)。

在这本书里,超级计算机深思在回答“生命、宇宙以及任何事情的终极答案”时,给出了“42”这个答案。

至于这个数字的含义,道格拉斯・亚当斯解释称:他只是随机地选择了这个数字,并没有特殊的含义,目的是“幽默地”讽刺人们常常想要寻求生命的根本问题中深刻的哲学答案。

如今这份“幽默感”被马斯克带到了Grok AI上——在与GrokAI对话时,用户可以选择不同的分支,从而解锁出不同的答案。

总体来说,与ChatGPT极力保证回答的严谨性不同,GrokAI充满了表现欲,如同真人一般,尽量减少用户与AI之间的“隔阂感”。

除了拥有“幽默感”以外,而据xAI官网的消息,Grok AI另一个亮点是可以通过X实时获取信息。换句话说是利用了X的数据进行训练,在使用过程中也可以实时调取X上的内容帮助回答,

当然,一旦X上出现错误信息,GrokAI并不能做到准确判断。因此GrokAI也和其他大模型一样,都会给出一些错误。

AI大模型,一定要用Python?

事实上,Grok-1是一个非常年轻的大模型。

从xAI宣布成立,到GrokAI正式推出,这中间仅仅过去了4个月时间。而Grok训练时间仅仅2个月,并且经历了从原型版Grok-0到迭代版Grok-1的蜕变。

在测试中,Grok-0的性能已经可以媲美成熟的LLaMA 2(700亿参数),但只使用了一半的训练资源。

在这背后,“轻量”是Grok大模型最大的特点。

为了创建Grok,xAI基于Kubernetes、Rust和JAX等技术构建了一个定制的训练和推理框架。

其中简洁高效的Rust编译语言,目前还很少被其他大模型采用。

我们可以注意到,目前绝大多数AI应用都采用Python开发,因为该语言拥有丰富的库,可以通过简化的程序代码来搭建神经网络、填写参数、导入数据,并调用执行函数进行训练,因此逐渐成为AI领域的首选编译语言。

不过作为代价,Python已经过于臃肿,且速度很难,这对于急需速度的大模型来说,这是一个“充满矛盾”的缺点。

因此,越来越多的开发人员开始尝试用新的编译语言代替Python。

这当中,Rust凭借其可扩展性、易维护性以及特有的安全性,已经得到了多家大厂的青睐。此外,该语言还具备易安装、占用空间小、处理速度更快等特点,非常适合规模庞大的分布式系统。

具体到Grok AI的训练过程中,通常需要数万个GPU进行计算同步,出现故障的可能性越来越高。

而换用Rust后,就可以更高效地降低训练中通常会遇到的大多数错误,从而提高训练速度、减少训练资源。

此外,在一项研究测试的数据显示,Rust在能源利用方面,比Java高效50%,比Python高效98%。随着GPU规模的不断扩大,大模型更加需要这种高效的语言。

不过Rust虽好,但学习门槛高、开发难度大,生态也不如C/C++、JAVA等老牌语言。

总的来说,在Rust以及同样为AI服务的Kubernetes、JAX等技术,Grok AI目前展示出来的实力已经足够出色,后续在超级计算机Dojo提供算力的背景下,xAI或许真的可以实现对OpenAI的“弯道超车”。

马斯克的野心在哪里?

如何评价马斯克旗下每款产品的意义,一定不能离开“登陆火星”这个终极目标。

当我们把Grok AI套入这个“终极目标”后就可以发现,这个带有“幽默感”的聊天机器人,已经有了未来AI智能助手的雏形。

和Grok AI类似,今年创投圈一大黑马Inflection AI,同样是以“情感聊天机器人”为卖点。

它不能写代码,不能作画,只是想做用户的“知心好友”,最终目的是希望打造一款“个人AI”,让每个人在未来都可以用拥有一个随时随地聊天的AI伴侣。

不过比起Inflection AI,马斯克所期待的未来AI,功能需要更加强大。

xAI的官博介绍称:“AI智能具有巨大的潜力,可以为社会贡献重要的科学和经济价值”、“我们会尽最大努力,确保AI始终是一股向善的力量。”

我们可以设想,xAI所希望的AI产品可以在宇宙探索中保持“人性”,这也非常符合xAI的宗旨——“理解宇宙的真实本质”。

目前,马斯克旗下已经有非常多的公司能够为xAI提供优秀的训练素材,包括推特、特斯拉、SpaceX和Starlink以及正在探索中的脑机接口公司Neuralink。

此前很多人认为马斯克收购推特是一个败笔,不过结合Grok AI的亮点来看,越来越封闭的推特确实在质量上更加出色。

此后,马斯克也暗示了特斯拉汽车可能会原生运行较小版本的Grok AI,目的是在本地进行分布式的推理运算——这么一听是否有点恐怖?

总之,Grok AI不过是马斯克终极目标的拼图之一,又给这块庞大的“大饼”续上了一笔。

本文作者:jh,观点仅代表个人,题图源:CNBC

0 阅读:78

镁客网

简介:硬科技第一产业媒体,提供最有价值的行业观察。