AI六小牛们:希望不要再辜负这个时代

很多事不好说吖 2024-03-19 05:27:43

中国的大模型网友圈已经分化成了三大流派:

死磕AGI、信仰scaling law的技术信仰派,思维本土,坚持商业化变现的市场实践派,以及相信技术与应用能够实现双翼齐飞的中间派。

投资界“独角兽猎手”朱啸虎认为中国大模型“没戏”,尤其是缺乏场景和数据的公司更是不会投。

相对地,清华大学90后博士杨植麟作为AI领域的新星,坚定地追求AGI。他说,“AI不是我在接下来一两年找到什么PMF,而是接下来十到二十年如何改变世界。”

百川智能创始人王小川则提出了中国AGI的第三种可能性,即在技术和市场、理想主义和现实主义之间找到平衡。

他认为,中国在技术和哲学思考上并不逊色于美国,所缺乏的是一种自信。

沿着朱啸虎的思路,中国大模型行业需要重新审视自身;顺着王小川的逻辑,我们无需妄自菲薄,应该在技术和场景的交叉点上寻求突破;但如果你也跟杨植麟一样怀揣AGI信念,那么AI技术必定走向更深远的边界。

01 AI新势力们,涌向大模型吸金占位

过去一年的AI企业普遍挣扎在焦虑而逼仄的生存命题里,但还是有一批新势力们在资本冷风中逆势吸金。

最近的一笔是商汤系公司MiniMax拿到的。

今年3月,由阿里领投6亿美元,这之后的MiniMax估值已经超过25亿美元。

MiniMax由商汤科技前副总裁闫俊杰于2021年12月创立,公司从一开始就全力投入AGI的研发。其早期产品Glow和Inspo,尤其是基于Transformer的消费者虚拟聊天应用Glow,在上线四个月后用户数接近500万。

它最新推出的AI社交应用星野,主打陪伴属性,面向C端市场,可视为Glow与Inspo的高端合体。

同样被阿里相中的,还有清华系大模型公司月之暗面。

而且时间更早一个月,金额超10亿美元B轮融资。尽管他们拒绝回应此事,但也难掩公司一路高歌的势头,成立短短1年估值已达25亿美元。月之暗面目前最火爆的产品是面向消费者的产品Kimi。

Kimi的长文本处理能力,包括丰富的信息理解、连贯有逻辑的对话或决策,以及复杂任务处理,被视为迈向AGI的关键一步。

而杨植麟所描述的“第二步”则是在长文本处理能力的基础上进一步发展AI,推动AI技术向多模态理解(处理如文本、图像、视频等不同模态)和自我进化发展(AI将具备更强的自主学习和适应能力),实现更高阶的人工智能目标。

相比之下,Kimi则可能更侧重于交互式对话和即时信息处理,而零一万物的Yi-34B-Chat-200K的超长上下文处理能力则在处理大量连续文本方面有比较优势。

零一万物,是李开复带队孵化的AI2.0公司。

Yi-34B-Chat-200K,是零一万物API开放平台为开发者提供的三大模型之一。另外两款分别是支持通用聊天功能的Yi-34B-Chat-0205,以及支持多模态输入的Yi-VL-Plus。

通过这些模型,开发者可以构建各种智能应用程序。值得一提的是,零一万物API开放平台还与OpenAI API兼容,这意味着,熟悉OpenAI API的开发者可以快速上手零一万物的平台,更高效地开发和部署AI应用。

李开复曾说,中美大模型只能存活五六家,手握超千亿参数大模型Baichuan 3的百川智能潜力如何?

百川智能,近期全面升级了Baichuan 3

据测评,它已经在多个中文任务评测中超越了GPT-4。医疗领域英文任务成绩也接近GPT-4。

王小川的创业愿景是在创造、健康和快乐这三个领域内为用户提供价值。反观,LeptonAI的口号是"Build AI The Simple Way",即帮助开发者以最简单直接的方式构建AI应用。

LeptonAI,由阿里原技术副总裁贾扬清创立。

团队推出的AI搜索引擎Lepton Search项目,曾因简洁的代码和高效的功能引起轰动。

为了向开发者证明“天下没有难构建的AI应用”,LeptonAI团队只用了500行代码就搭出来这个项目。

时间再早一些,LeptonAI还推出了AIGC提示工具PromptLLM,允许用户用简短的提示引导AI生成详细的绘图。

LeptonAI之外,智谱AI也是同一梯队的新晋独角兽。

智谱AI从传统NLP顺利转型大语言模型。从时间上看,它全力投入大模型研发的时间比ChatGPT问世还要早,2022年就推出了GLM-130B。

到去年底,智谱AI还推出了性能显著提升的新一代基座大模型GLM-4。融资方面,智谱AI去年已经拿下超25亿人民币,一度被传以200亿元估值进行下一轮融资。

02 后发的中国AI,大多数在焦虑赚钱

面对OpenAI GPT系列的飞速进化,国内大模型一直在烧钱追赶。

不过,大模型的竞争关乎巨额资本和稀缺人才,AI领域的投资回报实在是太长了。

从“卷”基础大模型到“卷”落地应用,科技圈内弥漫着一种“要拿着锤子找钉子”的商业化焦虑。

尤其对初创企业来讲,找准市场空缺,并通过运营手段快速推广,在有限的窗口期验证自我造血能力,被视为最有效的生存策略。

“秒鸭相机”小程序作为国内首个AIGC爆款应用,以9.9 元实现写真自由迅速打开大模型 C 端应用的商业市场。

2023年第四季度,大模型为百度云业务带来约6.6亿元增量收入,李彦宏预计,到2024年,这一数值有望达到数十亿元人民币。

生成式AI和基础模型被看作百度的“救命药”。早在通义千问1.0发布时,阿里就说旗下所有产品都要接入大模型;

科大讯飞推出讯飞星火认知大模型后,不仅内部落地了学习机,还对外向顶尖企业赋能;无独有偶,自盘古大模型3.0发布以来,华为云也开始在各行各业中探索应用。

业内已然形成了一个共识:尽管中国在基础大模型方面尚未形成领先优势,但在应用层面有望另辟蹊径。事实上,不仅是创业公司与科技大厂,AI新势力们无一不在理想与现实之间寻找权衡。

今年2月,数势科技与百川智能联合发布的大模型数据分析垂直领域应用解决方案,象征着双方在商业化道路上迈出了坚实的一步。

打开百川官网,还能看到百川大模型的收费标准,横向维度的通用大模型,纵向维度涵盖角色大模型、知识库等多样化服务。

参考OpenAI商业化模式,主要分为API调用收费和ChatGPT订阅制收费两大类。

智谱AI遵循相似的商业模式,主要面向B端市场,提供包括云端私有化和本地私有化部署在内的大模型定制化开发服务,以及基于tokens使用量的大模型API接入。

还有MiniMax,也是通过技术授权的方式对外开放API来收费。与此同时,MiniMax还基于C端的Glow,设置了购买“会员权限卡”增加对话额度的项目。

至于Kimi智能助手和零一万物,虽然目前尚未公布具体的收费细节,但从产品布局来看无非也是以上两类,其中的Kimi应该会侧重在C端市场。

当然,作为坚定的AGI拥护者,月之暗面或许会成为一个特殊的存在,毕竟杨植麟最关心的,是如何改变世界,而不是快速找到PMF。

03 中美差距是真实存在的,但不会太大?

应用or技术,哪个更重要,是大模型圈近期争论的焦点。

但国内AI新势力们,绝不会让自己过多沉浸在理想与现实的剧烈拉扯中。

这有两个既定事实。一方面,因为政策支持和对场景落地的重视,中国的AI大模型在实际应用层面已经走在世界前列。

凭借中国巨大的市场规模和丰富的应用场景,中国企业有望在生成式AI应用和大模型行业解决方案应用领域超越美国。

另一方面,美国在底层技术创新领域有着先发优势,而且除了OpenAI的ChatGPT,美国不少代表性公司推出的产品,都在各自领域展现出卓越性能。

比如,由OpenAI前高管创立的Anthropic,其大模型产品Claude2性能优异,甚至被认为在某些方面优于ChatGPT-4。Anthropic的估值达到300亿美元。

比如,一家专注于ToB市场的大模型公司Cohere,强调数据隐私和定制化服务。它的产品包括文本检索、生成和分类,且不受云端平台限制,提供本地部署选项。

再比如,Google DeepMind推出的多模态AI模型Gemini能够跨文字、图片、影音等多种模态进行学习和理解,其性能在多项测试中超过GPT-4。

类似应用or技术的辩论,中美差距这个问题,也是横梗在话题热搜榜的常客。

然而,相比起外界风评的始终没有定论,大佬们对于“中国追上美国通用大模型”的时间预期都更加乐观。

科大讯飞董事长刘庆峰给出了定量描述是,1-2年,追平;周鸿祎预测了相同的时间,他认为,中美在AI上的差距主要在于“确定技术方向”上,一旦方向确定,中国凭借快速学习能力的优势,在一两年内能够追上。

王小川给的时间更快,他说预计2024年就有机会追赶GPT-4。杨植麟同样承认,国内大模型公司正朝着追赶OpenAI的共同目标努力。

除此之外,他还强调了综合能力之外的其他方面,也能展示独特能力,甚至达到世界领先水平。比如长上下文处理(Long context)是一个可以发展的方向,而DALL-E3的图片生成效果就不如Midjourney V6。

综合考量AI六小牛的战略定位,我们可以清晰地看到,行业大模型与通用大模型确实不是什么对立关系。·技术与应用的双翼齐飞,应该是最符合中国国情的选择。

周鸿祎曾这样建议:初创企业应优先考虑开发符合行业特定需求的大模型,而将通用大模型的研发重任委托给如百川智能、月之暗面这样在资本和技术实力上更为雄厚的团队。

04 2024,技术创新、市场扩张和行业整合都会发生….

时下,中美两国在大模型领域的竞争和发展模式各有特色,且都在积极寻求突破和应用。

与其单纯划分AI流派,不如研究他们的定位与方向。透过中国AI新势力的视角,我们还可以遇见更多中国AI产业趋势:

比如,人工智能技术在新质生产力的培育和发展中起着至关重要的作用。脑机接口、具身智能、量子通信等前沿领域的科研技术和工程成果将持续涌现。

再比如,2024年的国内大模型产业,将迎来更大用户量级的产品,在某些特定领域或维度上创造出世界领先的新能力,以及可能会经历一系列的合并、收购或合作等等 ……

在全世界各产业积极拥抱AI的浪潮下,AI六小牛们:希望不要再辜负这个时代!

0 阅读:0

很多事不好说吖

简介:感谢大家的关注