大模型进化的前哨,被科大讯飞吹响

指北Focus 2023-10-31 17:44:51

“对标ChatGPT、超越ChatGPT”,这句话在大模型界,就像手机行业经常喊出的“超越iPhone、对标友商”一样。

最近,“真实的超越”逐渐从幕后走向台前,根据国务院发展中心国研经济研究院的横评报告,星火大模型综合能力已超越ChatGPT,实现国内领先、国际一流,且在教育、医疗和法律行业表现尤为突出。

对此,科大讯飞董事长刘庆峰还是很谦逊,他说国产大模型必须正视和GPT-4的差距,“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距离GPT-4还有差距。唯有实事求是的科学精神,才能真正实现超越。”

1.科大讯飞是如何做到真·超越的?

用最浅显易懂的话来说,大模型想要超越GPT-4,不只是技术上的“裸奔”,要有技术底座的支撑,与其他专业工具和相应资源相结合,才能把“超越”落地。

在刚刚结束的“科大讯飞2023全球1024开发者节”上,科大讯飞董事长刘庆峰表示,星火认知大模型V3.0(以下简称星火3.0)全面对标ChatGPT(GPT 3.5),中文能力客观评测超越ChatGPT,英文能力对标ChatGPT-4,特别是在医疗领域,星火大模型V3.0和已经完全超越GPT-4。

之所以星火3.0能在医疗上“燎原”GPT-4,就是因为讯飞的产品和技术过去多年间,都在和医疗领域互相浸润。

医疗领域是一个很有中文语境特色的领域,而且医疗还有严肃性、敏感性、专业性等特殊性,所以医疗领域的大模型并不是简单的“从0到1”,仅仅拥有大模型不能解决所有问题。

讯飞需要深度融入医疗场景,契合临床、病患、医生、医院的真实需求,背后靠的是讯飞星火医疗大模型的核心能力支撑,也靠的是讯飞多年在医疗领域的积淀。例如早在2017年讯飞智医助理就已经通过国家执业医师资格考试,排名超过96.3%的人类考生,在医疗大模型出现之前,讯飞就在给基层医院及等级医院的医生提供帮助。

某头部券商生物医药行业研究员对指北Focus表示,之前人工智能大模型的应用都在医院端,而讯飞此次发布的基于医疗大模型的APP应用,更加侧重于向患者提供问诊咨询,需求面非常广,未来的渗透速度也会很快。

例如我国每年有出院患者2.5亿人次、绝大部分患者面临着“出院即脱管”,可能他们出院了,但是病还没有完全好。这时候讯飞医疗大模型平台可根据患者在院期间的病历数据,抽取关键的画像信息,生成出院后患者个性化健康指导。

另外有业内人士表示,在医疗方面的落地只是星火大模型落地一个缩影,各行各业的升级换代中,已经有了大模型提供嵌入式增值服务的空间。

例如在今年的开发者大会上,星火3.0版本实现了文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大能力均持续提升。所以无论是自身的认知性能,还是推进应用落地。科大讯飞董事长刘庆峰也透露,在2024年上半年,科大讯飞星火大模型4.0版本将正式全面对标GPT-4。

2.大模型竞争的第二阶段:比拼落地

有超越GPT-4的储备和计划、稳居国内大模型第一梯队,标志着讯飞将率先进入百模大战的第二阶段,进一步解放生产力。

复盘近年来用科技解放生产力最成功的案例,莫过于个人PC和互联网的发展,将它们投入商业市场的土地中逐渐生根发芽,带动了全产业高质效发展,最终生长成为参天大树。

所以历史经验告诉我们,哪个行业能运用最先进的商业科技技术,打造出一个能够引导产业经济高质量创新与供给的平台,谁最终就将问鼎产业之巅。

回归到大模型上,这样的生产力解放,正在定义互联网商业模式最强一浪。而科大讯飞掀起最强一浪的方式,是落地。

面对首要的落地领域,科大讯飞董事长刘庆峰称“大模型首先要能够在工业和科研领域造福人类,这才是我们真正解决社会刚需的地方。”

这次在开发者大会上,我对讯飞星火大模型在工业上的落地有了新的认知。例如以星火的通用能力为底座,结合工业场景实际需求打造而成的“羚羊工业大模型”,已经将工业文本生成、工业知识问答、工业理解计算、工业代码生成、工业多模态5大核心能力升级。以工业多模态能力为例,在工业场景中,对比人工检测,玻璃翘曲度检测数据获取效率和准确率均提升90%以上。

可以简单设想一下,未来依托着羚羊工业大模型,工业企业可以实现智能时代的“研产供销服管”的多模态知识服务,能省下多少成本?能减少多少不必要的浪费?这种工业大模型带来的“水面之下的涌动”,值得产业链上所有人注意。

除了在工业基建上用苦功外,星火大模型作为底座,也一直在更普惠、更刚需、更民生的领域中落地,例如前文提到的医疗,和更需要平权化的教育。

一位传媒行业研究员在参加讯飞开发者大会时和我聊到,他认为在星火大模型在教育上的落地,社会价值和业务价值是双管齐下的。

这些年,全国各地的师资力量差距一直很大,讯飞证明了教育+AI确实能有效缓解教育方面的马太效应。在智慧教育领域,讯飞已深耕19年了,发展脚步可以说是和我国的教育信息化同频,从教学过程、教学内容再到考试评比,可以说在国内几乎没有对手。所以未来,大模型在教育行业中的标准都有可能需要讯飞来制定,这种能力和高度其他公司暂时还难以企及。

另外,资本市场还关注到了星火大模型落地在教育后,讯飞在教育业务的快速放量。在星火大模型发布后的5月-6月,科大讯飞C端硬件同比实现翻倍增长。以学习机为例,5月和6月,在大模型出现后,其GMV分别同比增长136%和217%,与此同时,科大讯飞的公司AI硬件(包括AI学习、AI办公、AI健康)也在618期间销售额同比去年大增125%。

显而易见,打磨大模型时,不同于其他大模型厂商,科大讯飞思考的不止是技术,而是前沿技术开发、商业化落地、社会价值的齐头并进。

我想到李开复不久前这样评价大模型:“AI 2.0是个全新且巨大的平台机会,所有的应用和生态都要重写一遍,可以说,AI2.0就是来掀桌子的。”从各个落地场景来看,科大讯飞就是李开复所言的在人工智能时代负责掀桌子的公司之一。

3.强强联手,国产大模型的燃眉之急的新解法

“百模大战”发展了将近一年,目前市场上各自为战的氛围很浓厚,但是科大讯飞却反其道而行之,它的态度其实一直都是开放的,不论是和开发者还是和合作伙伴。

开发者生态是大模型中很重要的一环,我们刚刚讲了讯飞的大模型的顺利落地和他们懂场景分不开。大模型需要各个场景里都有人去用,不断训练它,最后再反哺回来,成为“最聪明的模型”。

自今年5月6日星火发布以来,讯飞开放平台新增143.4万开发者团队,同比增幅331%,汇聚553万AI生态开发者团队。其中新增大模型开发者17.8万,讯飞正与10万+企业客户用星火创新应用新体验。

而且科大讯飞搭建起的生态还降低了开发者门槛,在讯飞星火上,已有1.5万助手开发者,开发超2.9万个助手应用,而且科大讯飞联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律等行业,加速产业升级。

在讯飞星火蓬勃的生态背后,与华为联手打造的自主可控的创新算力底座也浮上了水面。很多人忽略了讯飞和华为的联手,有两重意义。

从成本和解决方案上来说,国外的算力现在不见得能买得到,就算买到训练完以后,安全性也很难得到保障。华为有更强的算力基础,昇腾AI集群规模已从最初的4000卡集群扩展至16000卡,是业界首个万卡AI集群,拥有更快的训练速度和30天以上的稳定训练周期。

科大讯飞也有更强的大模型训练落地能力,多年来,科大讯飞有着强大的算法优势与清晰的技术路径;伴随着每一次星火认知大模型能力迭代的,都是科大讯飞一系列的产品与行业方案的升级。

这种强强联手,有点像微软Windows操作系统和英特尔硬件的无缝配合,他们当年几乎主导了世界的运算体验;而讯飞和华为的联手,也被市场寄予了“扩容大模型生态”的厚望。

从安全性上来说,现在大模型的通用能力让其能够应用到人类生产生活的各个场景中,可谓“无孔不入”,AI的发展因此带来了新的安全隐私问题。

解决这一隐患,当然是把大模型从算力到训练再到落地形成应用掌握在自己手中,要把未来发展构建在完全自主可控的平台上。高效、稳定、安全可控的国产算力基础设施,才是我们能长期用来解放生产力的工具。

所以这两个行业头部开始形成1+1>2的合力,降低大模型使用门槛、加高安全网、加速行业落地,也是他们的责任之一,科大讯飞在大模型落地中呈现出的解锁逻辑,已经在不经意问,展露出了未来图景的重要一角。

0 阅读:58

指北Focus

简介:互联网赞美家