商汤，在通用人工智能时代出产“大模型专家”

出品 | 创业最前线

作者 | 晓光

编辑 | 方芳

美编 | 邱添

审核 | 颂文

2023过半，但大模型的热度丝毫未减。不久前在“AI届的春晚”WAIC2023大会上，大模型当之无愧成为了顶流。

人们如此关注大模型，是因为大模型的本质是加速了AGI时代（通用人工智能时代）的到来，之前AI领域被局限的商业化空间，变得十分广阔。虽然大模型商业化才刚刚开始半年，但是已经很快地融入教育、医疗、制造、办公、律师、游戏、艺术等多个领域，渗透程度和渗透效率都是前所未有的。

在今年的沃斯世界经济论坛上，微软的CEO萨蒂亚这样形容大模型带来的AGI时代——我一生中从未见过，美国西海岸的先进科技可以在几个月内，以非常真实的方式出现在印度农村，对于知识型工作者来说，也许这一次完全等于工业革命。

不过大模型从入局到真正落地并推向市场，难度不小，资金、人才、基础设施、场景及商业化落地等，成为每个玩家都要跨过的“障碍赛”。

所以在国内掀起“百模大战”的时刻，我们也需要回答，什么样的大模型才能称得上智能生产力？各行各业行业未来需要怎样的大模型和服务？

1、大模型+大装置，仍然是AGI涌现的基础

为了回答这个问题，商汤在几个月前提出了“商汤日日新SenseNova”大模型体系，并且在不久前的WAIC2023大会上，又释放出了该体系及体系下的产品全方位升级更新的信息。

对于大模型服务于人类，商汤的第一重思考是——把底座做牢固。因为大模型的形成并不复杂，它是“大数据+大算力+强算法”结合的产物。

为了让大模型的底座更牢固，商汤一直在通过“大模型+大装置”持续推动AI基础设施能力的跃进提升，公开资料显示，商汤历时多年建设了业界领先的AI大算力，其拥有超过2万7千块GPU芯片卡，可输出5000P的总算力，是亚洲目前最大的智能计算平台之一。

基于大装置的能力，商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型，而且大装置也成为了商汤降低AI模型的生产成本、让大模型深入百业的根本。

站在“大模型+大装置”的AGI战略布局上，商汤日日新SenseNova大模型体系，正在实现着飞速升级。

有业内人士对「界面新闻·创业最前线」表示，在大模型的基础上，具备知识图谱、能对行业知识和数据进行提炼的小模型，在专业领域中的能力一定会超过大模型，这就让商汤大模型的“体系化”更有意义。

我们也可以这样理解，“日日新SenseNova”体系，是AGI“涌现效应”的外在表现，就像人到了18岁之后突然有了能力和心智上的突破一样。现在，“日日新SenseNova”大模型体系在智能座舱、交通、金融、医疗、电商等方面，都有了低门槛、低成本、高效率的创新应用和突破。

（图 / 日日新大模型目前落地的应用场景）

有位一级市场的投资人甚至这样对「界面新闻·创业最前线」表示——企业当然可以选择不接轨大模型，毕竟谋局落子、各有千秋，但未来打败你的也不是大模型，而是有着AI大模型加持的对手。

2、让大模型更垂直、更专业

需要强调的是，商汤的“日日新”是一个大模型“体系”，商汤内部对它的定位，是提供一个大模型的超市，在这个“日日新”大模型超市里面，有数据、模型训练以及部署的三位一体的飞轮，以此来作为上下游合作的基础。

并且大模型超市也可提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力，同时结合决策智能大模型，为AGI实现提供重要起点。

目前，“日日新SenseNova”体系包含了中文语言大模型“商量”，作为千亿级参数的自然语言处理模型，商汤商量SenseChat 2.0版本突破了大语言模型输入长度的限制，并推出不同参数量级的模型版本，可完美适配移动端、云端等不同终端及场景的应用需求；还有文生图生成模型“秒画”、AI数字人视频生成平台“如影”、3D背景建筑生成平台“琼宇”和3D物体生成平台“格物”等等。

（图 / SenseChat 2.0的技术升级）

具体到应用上，之前许多大模型都是通才，但它缺乏行业深度，之前大家被GPT震惊的时候，认为它什么都会，但如果你是一个行业的资深用户，你会发现通用大模型在安全、金融、语音这些垂直领域还不是全才。

目前商汤发布的这几个大模型，都在各自的领域里称得上是“行业专家”。有位券商的计算机行业研究员对「界面新闻·创业最前线」说，他对日日新大模型体系中人（AI数字人）-物（3D物体生成）-场（3D背景建筑生成）的搭建印象很深。

负责3D物体生成的格物2.0版本，现在支持了多种物品品类的复刻，达到毫米级别，特别是格物还解决了传统的重建技术中，对高反光、镜面物体的采集和复刻这一行业难题。珠宝首饰，小家电，金属物件都能被格物“复原”出来，不仅可以避免伤害和改变物品的情况，还能精确还原物品的外观和特征。

如果一家博物馆，想对几万件动物标本进行3D化处理，依赖激光重建技术还原一个标本就要千把块钱，这项投入高达数千万元，没财力的博物馆根本不能去做，而今格物2.0可以完成效果更好的重建，还可以把成本打到很低。

再例如，格物还包含一键成图和一键成片等再创作服务，通过一键成图功能，用户可以生成与物品使用场景相融合的海报，或者试穿试戴的真人海报，相比其他AI技术只能部分还原商品细节，一键成图可以100%还原物品的各个视角和效果。

（图 / 格物现阶段的能力）

基于此，该研究员预判道，商汤的大模型体系在技术上，可以为电商带来“通用”的颠覆性解法。

在格物的加持下，许多商家不用再去自研商品的上身效果呈现，就能对一件商品各个视角和效果重塑，提升客户的沉浸体验；直播间的实景搭建也不用再耗费太多的真金白银，基于3D内容生成平台琼宇，不仅有身临其境的背景，而且搭建效率、渲染效率也能大幅提升；另外，直播间的“人海战术”也不用太频繁，因为通过如影的数字人搭载商量的语言能力，“硅基生命”也可以进行完备的介绍。

公开资料显示，日日新大模型体系下的商量、琼宇、格物、如影都在各自的赛道上创造了不小的技术突破，现在已经与一批头部厂商开始了合作。

基于日日新大模型体系，不仅可以对现实生活中的“人、物、场”进行全面构建，融合不同垂直领域的专业知识，还能构建更懂行业、更具专长的交叉行业大模型，从根本上降低大模型的下游应用成本和门槛，也使得商汤的收入更加多元化，提升抗风险能力大大增强。

商汤智慧生活等新兴业务收入增长加速，且占比大幅提高，多元化的收入结构标志着商汤的业绩成长或步入上升通道，同时也印证了商汤一直坚持投入大模型、赋能百业战略的前瞻性。

3、产业应用场景：最佳练兵场

对于商汤来说，其定位一直是ToB的企业，B端的大模型需求，更多的考虑AI的“泛化能力”，泛化能力通俗来讲就是指学习到的模型对未知数据的预测能力。

许多企业客户知道自己要什么，他们会对大模型的应用给出一个“轮廓”，但是需要商汤用泛化能力，去稳定的预测、迭代，并一步步逼近真实的痛点。

所以，应用场景成为检验大模型能力的关键，特别是不同行业还给出了商汤“跨场景”的考验。

以商汤打造的车路云协同的交通体系为例，商汤凭借多模态、多任务通用大模型，开发了路侧视觉感知大模型，又结合琼宇2.0及格物2.0构建了一个智能交通孪生与仿真系统，再利用商量2.0的感知推理和人机交互能力，实现了车路云共同向大模型对话式交互的演进。

我们看到的交通场景应用是，在车舱外，商汤可以展开端云协同；在车舱内，打造了一个更懂用户的“车舱大脑”，带来集安全、娱乐、教育及效率于一体的智能座舱体验。

（图 / 在汽车行业的“跨场景”应用）

与此同时，商汤日日新大模型体系还积累了大量的场景优势与场景经验，这对于通用型技术的开发也有巨大的助推作用。

在医疗行业，商汤由于有着大装置的超大算力和医疗基础模型群的坚实基础，商汤能够化身“医疗大模型工厂”，基于特定需求，帮助医疗下游的临床长尾问题高效训练模型，满足着不同医疗机构个性化、多样化的临床诊疗需求。

公开资料显示，商汤已经与行业伙伴合作推出医疗语言大模型、医疗影像大模型、生信大模型等多种垂类基础模型群，覆盖CT、超声、内镜、病理、医学文本等不同医疗数据模态。

在具体应用上，商汤为郑州大学第一附属医院打造影像、病理、心电三大智能远程诊断平台，借助大模型辅助地区特色病、疑难病的诊疗，有效推动医疗长尾问题的解决。

另外，基于海量药学知识和专家经验，郑大一附院还与商汤合作研发了行业前沿的用药咨询语言大模型，将为患者提供更智慧便捷高效的线上用药咨询服务和体验，再次实现了大模型从医到药的“长尾渗透”。

这些解决方案，现在已落地全国多家头部三甲医院，商汤正在用跨场景、跨行业的AI技术，助力医院在诊疗、科研、决策等各个层面，实现智慧化转型升级。

所以在B端，商汤的能力不是模型，也不是模型群，而是扩大自己在行业中的大模型工厂，对企业客户的痛点解决得更精准。一旦企业客户习惯于商汤带来的大模型后，客户较高的转换成本也会为商汤形成较深的护城河。

接下来的大模型军备赛，或许不再是局限于大模型训练的追逐，也不是问AGI到底能颠覆什么产业，因为不同的产业应用场景已成为大模型的最佳“练兵场”。把不同的赛道整合进一个体系里，构建起产业生态，才会把价值链做到足够长，这时候，我们要问：“AGI究竟不能颠覆什么？”

*注：文中题图来自摄图网，基于VRF协议。

玩酷网

商汤，在通用人工智能时代出产“大模型专家”

创业最前线