百度阿里宣战Kimi:国产“GPT”迎来混战期?

Hawk Insight 2024-03-26 11:48:41

近几日,国产大模型的“激战”再度升温,阿里、百度、360等一种互联网巨头纷纷官宣升级其AI产品的长文本处理功能,而此次“激战”的导火索,则来源于智能助手Kimi的爆火。

Kimi智能助手又称Kimi Chat,是AI初创公司月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式AI智能文本助手,其入口包括网页、App和微信小程序。

2023年10月,该软件正式问世,主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解AAPI开发文档等,是全球首个支持输入20万汉字的AI文本处理器。

资料显示,月之暗面公司创立于2023年3月,创始团队核心成员参与了Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。

据了解,Kimi具备六大主要功能:长文总结和生成、联网搜索、数据处理、编写代码、用户交互以及翻译。而不到半年时间,该产品就在长上下文窗口技术上再次取得突破。

aicpb.com数据显示,2024年2月,Kimi的访问量达305万,较上月上涨107.6%,在国内AI产品访问量排行榜位列第3,仅次于百度文心一言的1,006万和阿里通义千问的365万。

不仅如此,Kimi目前的日活跃用户数已达100万人,且留存率还在持续上涨中。截至发稿,其App下载量在iOS商店中已摘得桂冠(效率类应用免费榜)。

2024年3月18日,月之暗面公开表示,Kimi已可以支持200万字的超长无损上下文,并同时开启产品内测。

据目前的用户体验来看,Kimi并非全能选手。有用户反馈表示,对于诸如结构化信息处理、图像中潦草文字识别等复杂任务,Kimi在对话连续性上表现不佳。而在生成能力和语音能力上,Kimi也尚未将这些模态装备完全。

尽管如此,Kimi的长文本能力仍然不言而喻。目前,市面上的大模型应用,GPT-4Turbo-128k公布的文本范围约为10万汉字,Claude3200k上下文约16万汉字。

消息公布后,Kimi概念股即刻引爆市场,3月21日,Kimi由于访问量激增而一度陷入宕机。无论是在用户端还是资本市场方面,Kimi都迎来了爆火的局面。

月之暗面工程师副总裁许欣然表示:“大模型无损上下文长度的数量级提升,会进一步帮助大家打开对AI应用场景的想象力,包括完整代码库的分析理解、可以自主完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。”

业内人士也称,由于模型训练结构的限制,以往大模型的文本范围都不算长,但复杂任务和行业知识通常篇幅很大,在这种情况下,只能把提问拆分后再输入,但这可能会导致输出的结果上下不连贯逻辑不通顺。长文本使AI对于上下文的理解具备连贯性,满足问答的需求。

由此,年仅5个月的Kimi再次激活了整个国产大模型市场,24小时内,阿里、百度、360等国内大厂纷纷出手,挤入长文本赛道加快布局:

3月22日晚,阿里通义千问重磅升级,向所有人免费开放了1,000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。即日起,用户可通过通义千问网站和App快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、总结深度文章等等。

3月23日,360智脑宣布正式内测500万字长文本处理功能,且即将入驻360 AI浏览器,App版本同时上线。

下个月,百度文心一言也将进行版本升级,届时也将开放200万-500万字的长文本处理功能。

总的看来,国产AI大模型性能的快速提升一方面确实为AI应用创新提供了更多选择,降低了应用门槛;但另一方面,下游应用也面临着依赖于模型提供商而来的同质化挑战,生成内容的知识产权问题也将依然是商业化过程中的挑战。

0 阅读:42