首发自研大模型矩阵,OriginOS4将如何“放大招”?

壹观察 2023-10-19 16:22:17

文丨壹观察 宿艺

“大模型”是今年全球科技行业最火爆的“关键词”之一。

仅上半年中国市场发布的各类“大模型”就已过百,因此也被媒体和行业评价为“百模大战”。

但“大模型”从技术创新、到可靠的应用落地,再到用户与市场普及,每一个都是巨大跨越。如果没有构建于基础大模型之上丰富AI原生应用,大模型就相当于“空谈”,很难完成产业价值转移。这也是过去很多科技概念从迅速爆火再走向衰退的重要原因。

vivo官方近期宣布,将于11月1日举办vivo开发者大会(2023 VDC)上发布的全新手机操作系统OriginOS 4,将成为业界首个接入自研大模型矩阵的手机操作系统,也代表了手机智慧化进阶与端侧大模型应用创新的重要探索方向。

vivo自研大模型有何不同?

从vivo已经公布的信息来看,其自研大模型最大的技术特点之一,就是在中文语言模型领域“遥遥领先”。

两个最新榜单可以非常直观地体现这一点:

根据10月16日更新的C-Eval大模型评测榜单,vivo自研大模型在C-Eval全球中文榜单中排名第一。而在此之前,vivo自研大模型已斩获了 C-Eval百亿内大模型榜单第一,以及CMMLU全球中文榜单第一与百亿内大模型榜单第一。

这两个榜单的分量很重。

C-Eval榜单是目前行业权威的中文AI大模型评测榜单,由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,涵盖52个不同学科,共有13948道多项选择题。严格的预设机制杜绝了混入训练集的可能,在行业顶尖企业和开发者中皆具备很高的权威性。

CMMLU 数据集则是一个行业普遍认可的综合性的中文评估基准,涵盖了从基础学科到高级专业水平的67个主题,由MBZUAI、上海交通大学、微软亚洲研究院共同推出,评估语言模型在中文语境下的知识和推理能力方面极具权威性。

同时登顶C-Eval、CMMLU两大权威榜单,印证了vivo自研AI大模型在中文语言模型领域绝对领先的技术实力和创新潜力。

但这离“应用和体验领先”,还远远不够。

vivo此次透露称,此次发布的大模型包括了由十亿、百亿、千亿三个不同参数量级、共5款自研大模型组成的“大模型矩阵”。

今年9月举行的博鳌亚洲论坛国际科技与创新论坛第三届大会期间,vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围就已透露了相关信息。相比很多互联网企业提出的“单个通用大模型”,由不同量级组合而成“大模型矩阵”也体现了vivo对于端侧大模型实际应用的独特思考:一方面需要尽可能的覆盖用户的核心应用场景,更加聚焦精准地解决用户痛点需求;另一方面也必须兼顾大模型带来的成本、时延、能耗等现实挑战,避免伴随大模型接入带来的用户体验“反向优化”问题。

值得关注的,还有vivo自研大模型矩阵的接入载体 ——新版OriginOS 4系统。

作为全球主要TOP手机品牌,vivo用户超过5亿。这意味着相比其他互联网大模型,vivo自研大模型矩阵可以直接接入vivo系统级的入口服务,比如桌面、负一屏等方式,以及与Jovi的深度结合,从而直接推动大模型快速融入大众生活,打通与用户真实体验与使用场景的“最后一米”。同时基于庞大的用户基数,以及更加直接的真实用户反馈,可以加速大模型迭代,并保持正确的引领创新方向,这在大模型的“竞速初期”尤为重要。

领跑端侧大模型创新,为何又是vivo?

“百模大战”开打同时,相当于拥有应用创新与市场普及“快车道”的手机端侧大模型,同样引发了高通、谷歌、微软、华为等全球主要科技企业的重点关注。

今年3月的2023 MWC上,高通就展示终端侧运行超过10亿参数模型,基于文本输入生成图像的Stable Diffusion演示,且性能和精确度达到与云端相似的水平。vivo领跑端侧大模型,并成为业界首个将自研大模型矩阵接入手机操作系统的厂商,其实业界并不感到意外。

首先,vivo是最早关注AI应用在手机创新的科技企业之一。

早在2016年AlphaGo以4:1轻松战胜李世石,不仅震惊了围棋行业,也深深震动了全球科技企业,vivo就是其中之一。

2017年夏天,vivo创始人、CEO沈炜带着核心团队访问了包括卡内基梅隆大学等全球在人工智能领域的顶尖科研机构,管理层迅速达成了“必须重点投入”的一致决定。接着,vivo人工智能全球研究院于2018年,是首批设立专攻人工智能方向研究院的中国手机公司之一,并且初期就投入了超过千人的研发团队。当很多手机企业还在“拼参数营销”之时,vivo已经在人工智能研发领域“抢先一个身位”,并且至今“过饱和”投入已有六年。

第二,vivo在大模型领域拥有清晰地认知,以及独特的创新实践方法论。

作为vivo人工智能全球研究院院长的周围认为:人工智能从“本原”上来看包含了四个要素:数据、人力、算法、算力,而vivo均做到了“行业领先”,简单概括来说:

数据方面,2018年vivo成立了图谱研究院,其使命就是通过建立专业团队来搭建专业的知识图谱体系,并找到更先进的高纬抽象能力。截至目前整个图谱数据已超过2800T,用于大模型训练的有效数据大约是150T。这相当于1.6亿侧图书,或者2.5个中国国家图书馆的藏书量,从而满足了如今大模型所必须具备的完整数据底座。

人力方面,vivo人工智能全球研究院在2021年初聚焦在AI大模型研发投入就已经超过600人。与之相比,Open AI公司早期核心团队大约150人,之后增长到300人左右。周围在媒体专访中也用了“应对大模型游刃有余”来概括vivo在人工智能领域的深厚储备。

算法同样是vivo的“显性优势”之一。周围透露称,算法是vivo人工智能研究院成立之初就确定的核心方向之一,比如整个团队已经发布了超过70篇人工智能领域的全球顶级论文,同时也专门成立了一个团队去跟踪全球最先进的论文和理念,并将其转化为vivo的算法训练和工程应用,其目标就是“对标行业最前沿”。

算力作为人工智能的“引擎”,也是如今所有大模型的“瓶颈”。据海外媒体报道,ChatGPT4一次完整的训练更是高达6000万美元。这种挑战对于中国科技企业而言更加突出:不仅要考虑成本,还要考虑能否买到最先进的GPU等算力设备。vivo的做法,是在加大算力投入的同时,通过工程能力的创新充分挖掘算力潜力,实现更加高效的模型训练和推理部署。单就算力这个模块,vivo就布局了一个150人左右的强大工程团队,这让vivo在不断提升算力的同时,保障大模型具备更加强劲的持续成长进化力。

从以上两个维度,其实已经可以清晰地看到vivo在大模型领域的早期敏锐判断、长期投入,以及对端侧大模型实际场景应用与普及落地方式的独特理解。

在其背后,则是vivo长期重视“技术驱动”与“设计驱动”协同创新优势的再次体现:基于“用户导向”的设计驱动,让vivo在长期技术投入上得以沉下心“埋头种因”,愿意在用户看不见但体验得到的地方下功夫,从而洞察到用户最真实的需求,反过来更好地印制自身对技术趋势和创新方向的敏锐判断。重视“技术驱动”,让vivo敢于领先行业在重点技术方向上“持续重投入”,包括“大幅提升长期技术研发人员占比”与确立“对准5年-10年的前沿技术”的长赛道优势。两者共同组成了vivo的“耦合式创新点”,进而形成技术-产品-品牌-用户高度耦合、可持续迭代的正向创新能力。

这其实也是vivo在端侧大模型初期,就再次领先行业拿出技术和理念足够领先、应用有较高成熟度,以及可以迅速转化为大众用户感知与上手体验大模型的重要原因。

vivo执行副总裁、首席运营官、vivo中央研究院院长胡柏山也对此表示:vivo的本心就是要用永不停歇的科技创新,去满足用户对诸多“不可能”的向往。

《壹观察》评论

2023-2024年注定会成为智能手机行业重要的“拐点周期”。

一方面,全球智能手机依旧呈现下滑趋势,Counterpoint Research近期发布报告称,2023全年预计全球智能手机出货量将下降6%,创下近十年来最低水平。另一方面,以大模型、折叠屏、5.5G/6G为代表的重要技术革新正在从概念论证加速走向标准化与产业化。

智能手机历经16年发展演进,至今依旧是一个年出货量约12亿部规模的万亿大市场,也是大众用户距离“智慧生活”变革最高频、最便捷的使用入口。而从近期各大科技巨头和手机企业的一系列的密集动作来看,2024年大概率将会成为“端侧AI大模型的普及元年”,这将对智能手机系统功能的“软体验”带来强劲的跃迁式创新力。

站在2023年底这个关键时间点,成为业界首个接入自研大模型矩阵的手机操作系统的OriginOS 4,不仅给行业树立了“新标杆”和“高门槛”,也让整个行业看到了智能手机与大模型结合之后依旧存在巨大的智慧化创新空间。

另一个值得关注的,是周围今年9月在博鳌亚洲论坛国际科技与创新论坛第三届大会上提出的“智能体”概念。对于vivo来说,“大模型”只是技术基础投入,重点还是如何强化用户的“智慧感知”,尤其是在接入大模型矩阵之后,可以给用户带来真实的使用价值提升与体验“惊喜感”。这无论是对vivo、还是对整个手机行业、乃至大模型领域的继续发展都至关重要。

或者说,提升智能手机的“智商推理”能力与“拟人化交互”体验,才符合业界和大众用户对端侧大模型革新的向往所在。这也让我们对将在11月1日vivo开发者大会(2023 VDC)上发布的vivo自研大模型矩阵、全新的 OriginOS 4操作系统,Jovi的“智慧力”与生态进阶,以及vivo“智能体”如何“放大招”,充满了更多期待。

0 阅读:327