大模型进化的前哨，被科大讯飞吹响

“对标ChatGPT、超越ChatGPT”，这句话在大模型界，就像手机行业经常喊出的“超越iPhone、对标友商”一样。

最近，“真实的超越”逐渐从幕后走向台前，根据国务院发展中心国研经济研究院的横评报告，星火大模型综合能力已超越ChatGPT，实现国内领先、国际一流，且在教育、医疗和法律行业表现尤为突出。

对此，科大讯飞董事长刘庆峰还是很谦逊，他说国产大模型必须正视和GPT-4的差距，“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距离GPT-4还有差距。唯有实事求是的科学精神，才能真正实现超越。”

1.科大讯飞是如何做到真·超越的？

用最浅显易懂的话来说，大模型想要超越GPT-4，不只是技术上的“裸奔”，要有技术底座的支撑，与其他专业工具和相应资源相结合，才能把“超越”落地。

在刚刚结束的“科大讯飞2023全球1024开发者节”上，科大讯飞董事长刘庆峰表示，星火认知大模型V3.0（以下简称星火3.0）全面对标ChatGPT（GPT 3.5），中文能力客观评测超越ChatGPT，英文能力对标ChatGPT-4，特别是在医疗领域，星火大模型V3.0和已经完全超越GPT-4。

之所以星火3.0能在医疗上“燎原”GPT-4，就是因为讯飞的产品和技术过去多年间，都在和医疗领域互相浸润。

医疗领域是一个很有中文语境特色的领域，而且医疗还有严肃性、敏感性、专业性等特殊性，所以医疗领域的大模型并不是简单的“从0到1”，仅仅拥有大模型不能解决所有问题。

讯飞需要深度融入医疗场景，契合临床、病患、医生、医院的真实需求，背后靠的是讯飞星火医疗大模型的核心能力支撑，也靠的是讯飞多年在医疗领域的积淀。例如早在2017年讯飞智医助理就已经通过国家执业医师资格考试，排名超过96.3%的人类考生，在医疗大模型出现之前，讯飞就在给基层医院及等级医院的医生提供帮助。

某头部券商生物医药行业研究员对指北Focus表示，之前人工智能大模型的应用都在医院端，而讯飞此次发布的基于医疗大模型的APP应用，更加侧重于向患者提供问诊咨询，需求面非常广，未来的渗透速度也会很快。

例如我国每年有出院患者2.5亿人次、绝大部分患者面临着“出院即脱管”，可能他们出院了，但是病还没有完全好。这时候讯飞医疗大模型平台可根据患者在院期间的病历数据，抽取关键的画像信息，生成出院后患者个性化健康指导。

另外有业内人士表示，在医疗方面的落地只是星火大模型落地一个缩影，各行各业的升级换代中，已经有了大模型提供嵌入式增值服务的空间。

例如在今年的开发者大会上，星火3.0版本实现了文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大能力均持续提升。所以无论是自身的认知性能，还是推进应用落地。科大讯飞董事长刘庆峰也透露，在2024年上半年，科大讯飞星火大模型4.0版本将正式全面对标GPT-4。

2.大模型竞争的第二阶段：比拼落地

有超越GPT-4的储备和计划、稳居国内大模型第一梯队，标志着讯飞将率先进入百模大战的第二阶段，进一步解放生产力。

复盘近年来用科技解放生产力最成功的案例，莫过于个人PC和互联网的发展，将它们投入商业市场的土地中逐渐生根发芽，带动了全产业高质效发展，最终生长成为参天大树。

所以历史经验告诉我们，哪个行业能运用最先进的商业科技技术，打造出一个能够引导产业经济高质量创新与供给的平台，谁最终就将问鼎产业之巅。

回归到大模型上，这样的生产力解放，正在定义互联网商业模式最强一浪。而科大讯飞掀起最强一浪的方式，是落地。

面对首要的落地领域，科大讯飞董事长刘庆峰称“大模型首先要能够在工业和科研领域造福人类，这才是我们真正解决社会刚需的地方。”

这次在开发者大会上，我对讯飞星火大模型在工业上的落地有了新的认知。例如以星火的通用能力为底座，结合工业场景实际需求打造而成的“羚羊工业大模型”，已经将工业文本生成、工业知识问答、工业理解计算、工业代码生成、工业多模态5大核心能力升级。以工业多模态能力为例，在工业场景中，对比人工检测，玻璃翘曲度检测数据获取效率和准确率均提升90%以上。

可以简单设想一下，未来依托着羚羊工业大模型，工业企业可以实现智能时代的“研产供销服管”的多模态知识服务，能省下多少成本？能减少多少不必要的浪费？这种工业大模型带来的“水面之下的涌动”，值得产业链上所有人注意。

除了在工业基建上用苦功外，星火大模型作为底座，也一直在更普惠、更刚需、更民生的领域中落地，例如前文提到的医疗，和更需要平权化的教育。

一位传媒行业研究员在参加讯飞开发者大会时和我聊到，他认为在星火大模型在教育上的落地，社会价值和业务价值是双管齐下的。

这些年，全国各地的师资力量差距一直很大，讯飞证明了教育+AI确实能有效缓解教育方面的马太效应。在智慧教育领域，讯飞已深耕19年了，发展脚步可以说是和我国的教育信息化同频，从教学过程、教学内容再到考试评比，可以说在国内几乎没有对手。所以未来，大模型在教育行业中的标准都有可能需要讯飞来制定，这种能力和高度其他公司暂时还难以企及。

另外，资本市场还关注到了星火大模型落地在教育后，讯飞在教育业务的快速放量。在星火大模型发布后的5月-6月，科大讯飞C端硬件同比实现翻倍增长。以学习机为例，5月和6月，在大模型出现后，其GMV分别同比增长136%和217%，与此同时，科大讯飞的公司AI硬件（包括AI学习、AI办公、AI健康）也在618期间销售额同比去年大增125%。

显而易见，打磨大模型时，不同于其他大模型厂商，科大讯飞思考的不止是技术，而是前沿技术开发、商业化落地、社会价值的齐头并进。

我想到李开复不久前这样评价大模型：“AI 2.0是个全新且巨大的平台机会，所有的应用和生态都要重写一遍，可以说，AI2.0就是来掀桌子的。”从各个落地场景来看，科大讯飞就是李开复所言的在人工智能时代负责掀桌子的公司之一。

3.强强联手，国产大模型的燃眉之急的新解法

“百模大战”发展了将近一年，目前市场上各自为战的氛围很浓厚，但是科大讯飞却反其道而行之，它的态度其实一直都是开放的，不论是和开发者还是和合作伙伴。

开发者生态是大模型中很重要的一环，我们刚刚讲了讯飞的大模型的顺利落地和他们懂场景分不开。大模型需要各个场景里都有人去用，不断训练它，最后再反哺回来，成为“最聪明的模型”。

自今年5月6日星火发布以来，讯飞开放平台新增143.4万开发者团队，同比增幅331%，汇聚553万AI生态开发者团队。其中新增大模型开发者17.8万，讯飞正与10万+企业客户用星火创新应用新体验。

而且科大讯飞搭建起的生态还降低了开发者门槛，在讯飞星火上，已有1.5万助手开发者，开发超2.9万个助手应用，而且科大讯飞联合行业龙头共同发布12个行业大模型，包含金融、汽车、运营商、工业、住建、物业、法律等行业，加速产业升级。

在讯飞星火蓬勃的生态背后，与华为联手打造的自主可控的创新算力底座也浮上了水面。很多人忽略了讯飞和华为的联手，有两重意义。

从成本和解决方案上来说，国外的算力现在不见得能买得到，就算买到训练完以后，安全性也很难得到保障。华为有更强的算力基础，昇腾AI集群规模已从最初的4000卡集群扩展至16000卡，是业界首个万卡AI集群，拥有更快的训练速度和30天以上的稳定训练周期。

科大讯飞也有更强的大模型训练落地能力，多年来，科大讯飞有着强大的算法优势与清晰的技术路径；伴随着每一次星火认知大模型能力迭代的，都是科大讯飞一系列的产品与行业方案的升级。

这种强强联手，有点像微软Windows操作系统和英特尔硬件的无缝配合，他们当年几乎主导了世界的运算体验；而讯飞和华为的联手，也被市场寄予了“扩容大模型生态”的厚望。

从安全性上来说，现在大模型的通用能力让其能够应用到人类生产生活的各个场景中，可谓“无孔不入”，AI的发展因此带来了新的安全隐私问题。

解决这一隐患，当然是把大模型从算力到训练再到落地形成应用掌握在自己手中，要把未来发展构建在完全自主可控的平台上。高效、稳定、安全可控的国产算力基础设施，才是我们能长期用来解放生产力的工具。

所以这两个行业头部开始形成1+1>2的合力，降低大模型使用门槛、加高安全网、加速行业落地，也是他们的责任之一，科大讯飞在大模型落地中呈现出的解锁逻辑，已经在不经意问，展露出了未来图景的重要一角。

玩酷网

大模型进化的前哨，被科大讯飞吹响

指北Focus