四张国产卡满血部署,讯飞星火X1直击三大行业痛点

数智前线 2025-04-22 21:21:51

业界从星火X1升级方向来看,科大讯飞目标明确,它要进一步打开垂类行业市场。

文|周路平 赵艳秋

编|牛慧

深度推理模型已经是厂商竞争和企业关注的焦点。

去年以来,深度推理模型掀起了热潮。由于能模拟人类的系统性思维过程,它在解决复杂问题上的能力显著提升;在算力层面,DeepSeek通过软硬技术优化,实现了算力节省和成本降低;科大讯飞成功在全国产算力上跑通相关技术,这些突破都在不断降低企业的使用门槛。在应用层面,深度推理模型已呈现出广泛行业应用爆发的趋势。

为此,包括DeepSeek、科大讯飞、阿里和腾讯,都在今年一季度陆续推出了深度推理大模型。

今年1月,科大讯飞推出推理模型星火X1,并在最近两个多月,多次对模型能力进行升级迭代。4月20日,讯飞星火X1再次宣布全面升级,在模型参数小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。

业界观察,从这次升级的情况来看,科大讯飞的定位明确:它要进一步打开垂类行业市场——无论从模型大小的选择、算力成本降低,还是相关行业数据的采用,亦或是强化学习和微调工具链和解决方案,以及“快思考、慢思考统一模型”,都瞄准了行业的落地痛点。星火X1升级后,将在教育、医疗、司法、能源、汽车等多个行业中,加快落地进程。

01

全栈国产化大模型,稳站第一梯队

4月20日,讯飞星火X1再次宣布全面升级。除了之前升级的数学能力,星火X1在代码、逻辑推理、文本生成、语言理解、知识问答等通用能力上,实现了以小一个数量级的参数规模,即70B大小的模型,整体效果比肩OpenAI o1和DeepSeek R1。

而且,除了常见的通用任务,讯飞星火X1由于融入了更多行业场景的复杂类型数据,其泛化性得到很大提升的同时,在多个行业任务上也展现出业界领先的能力。在重点行业如教育、医疗、司法等进一步扩大了领先优势。

比如,在专业性很强的司法行业,升级后的星火X1可以根据用户指令需求,详细分析案件争议点,快速定位材料中的关键信息,准确总结案件事实以及判决理由。

讯飞星火X1这次全新升级背后,涉及到三大核心技术突破——提出基于问题难度的大规模多阶段强化学习方法、统一模型下的快慢思考混合训练方法,以及多项工程技术的创新。

相比于其他大模型厂商,科大讯飞采用了全国产算力平台是“独一份”的,来做大模型训练和推理,背后是针对国产算力卡适配的大规模投入、技术突破和生态完善。

两年前,科大讯飞就与华为合作,建设了首个万卡国产算力平台“飞星一号”,能支持万亿参数大模型训练。科大讯飞董事长刘庆峰在今年年初透露,“飞星二号”将在2025年交付使用首批算力。

而最近,双方团队也基于全国产算力,在模型训练和推理上取得更大突破。针对MoE(混合专家系统)已成为大模型技术发展的核心趋势之一,今年3月,讯飞携手华为突破了在国产算力集群上,MoE模型的大规模跨节点专家并行集群推理,这是继DeepSeek公布其MoE模型训练推理方案后,业界首个基于国产算力的全新解决方案。4月,双方再次通过多种优化手段,将MoE模型集群推理的性能实现翻番。

DeepSeek掀起的热潮,让其成为业界新宠,一度对其他大模型厂商带来了巨大压力和挑战。但通过在算法和数据训练策略上下功夫、算法与国产算力上的技术攻关、工程优化等,讯飞深度推理大模型不仅在行业第一梯队,还在教育、医疗等行业领域更具优势。

02

降低行业赛道落地门槛是核心

业界从这次星火X1的升级重点来看,科大讯飞针对行业市场落地面临的痛点需求,逐一给出了解决方案。

DeepSeek-R1推出后,数智前线获悉,在行业中,一些客户场景必须选择满血版模型,才能满足性能上的要求。但满血版部署至少需要8张卡,算力成本不低。

为此,一些企业选择先将模型蒸馏到32B,来降低算力花费。“但32B肯定是没法与满血版相比的,它适合专属助手,类似安全规范、律所卷宗搜索、报告生成这种应用。”一位在工业领域的人工智能应用人士告诉数智前线。

这次星火X1满血版则选择70B大小的参数量,推出“快思考、慢思考统一模型”,由一个模型同时支持两种思考模式,让模型部署仅需4张卡(华为910B),而整体效果对标OpenAI o1和DeepSeek-R1。这样的考量和创新,应该是基于企业落地的综合性价比。

值得关注的是,此前,一些企业选择深度推理模型上有些犹豫。“因为它的慢思考时延较长,在一些场景下,用户等不及。”一位政务行业应用人士告诉数智前线。而星火X1让企业能根据自身场景要求,选择不同的思考模式,适配不同的时延要求。

除此之外,讯飞强调星火X1训练中,融入了更多场景的复杂类型数据。从它的表述来看,不少数据可能来自它的重点赛道,如教育、医疗、司法等。一位教育行业应用人士分析这一做法的重要性。“专业语料的积累、质量和独特性,可能会成为各大模型竞争的终极战场。”讯飞也强调,这让其在“多个行业任务上展现出业界领先的能力”。

而产业链中非常核心的环节是,企业的私有数据如何与通用模型结合,最终做出行业模型和智能体应用。有行业人士告诉数智前线,今年以来,这方面的技术路线出现了一些变化。

在2023年到2024年间,大家采用的常规模式是,通用大模型结合RAG本地知识库,在一些更高要求的场景中,则去做模型微调。今年很多企业则通过强化学习方式,将自有数据训练到模型上去,形成行业小模型。

“从我们的业务实践中发现,强化学习需要的数据量更小,而且深度推理模型,经过强化学习之后,它的推理质量、任务响应力也有很好地提升。”一位金融企业人士说,由于强化学习对硬件需求大幅下降,也让大量企业能实现更快地落地。

而此次星火X1也全新升级了模型定制优化工具链,支持SFT(监督微调)、强化学习两种模型定制优化方案,可完成行业定制优化。

值得关注的是,科大讯飞大幅降低了模型定制门槛,SFT、强化学习两种模型定制优化方案只需16张卡(华为910B)。之前,对满血版DeepSeek的SFT,则需要256张卡,仅算力就要投资数千万元,这让一般企业望尘莫及。

这一系列降低模型落地的门槛举措,让各行各业都可以拥抱AI。而每降低一些门槛,就会激发出更大的长尾市场,进一步推动AI行业应用井喷。

还有一个关键的点是,在大模型落地中,企业需要的是智能化的应用,而不仅仅是一个AI平台。在去年的科大讯飞全球1024开发者节上,科大讯飞提出“建算力、理数据、训模型,到落场景、保安全、精运营”的全链路方法,提出从场景出发,给客户提供人工智能的解决方案。

以理数据为例,这是目前大模型应用落地中,非常关键的一环。在用户现场,数据以各种形式存在,质量参差不齐。科大讯飞在项目中沉淀了一套工具链。与行业主流开源工具相比,数据清洗、SFT数据准备效率都有大幅提升,而在知识问答领域里面,“多模态零采编”方案的能力优于开源工具,目前在中石油、中国绿发、华润集团和厦门航空都在使用。

多年的政府侧、企业侧积累,让科大讯飞建立了解决方案思路,并建立了很强的交付体系。“在现场,客户提出需求,甚至是人机界面这样的需求,科大讯飞的团队都会开发。”一位大型企业人士观察。这些打法,都支撑星火X1进一步打开行业市场。

03

行业应用将加速

得益于包括深度推理在内的大模型性能的提升和门槛的降低,业内普遍认为,今年是行业应用爆发之年。

原来企业落地大模型的一大痛点是,大模型本身能力还不够强。而伴随各类大模型性能的提高,包括深度推理模型在系统性思维过程的提高,大大提升了大模型在行业落地中的能力。

过去两年,科大讯飞在央国企、教育、汽车、医疗、政务、金融等领域中,实现了大量应用落地,而星火X1将激发出更多、更深入的行业场景应用。

央国企在大模型应用落地中动作较多。央国企扮演着基础设施的角色,涉及国计民生的方方面面,所以它们对技术自主可控的需求更加严苛。科大讯飞的全栈国产化能力,让其获得了这一市场的信赖。根据IDC 2024年《中国央国企大模型解决方案市场份额》报告,2024年央国企在大模型解决方案市场规模达 31.8 亿元。其中,科大讯飞市场份额居首位。

2025年开年以来,央国企在大模型应用上动作频繁。以中国石油为例,去年它已经与中国移动、华为、科大讯飞共建的昆仑大模型,已发布涵盖43个专业应用和通用应用创新场景。今年2月28日,昆仑大模型完成了新一轮模型能力、应用场景迭代和新增。目前,对外发布“行业大家”,面向能源化工领域,打造综合性知识服务与信息检索平台,已开启社会邀请体验。

行业人士认为,过去一年多的落地,央国企市场应用其实都还处于浅中层,业界面临落地逐步走向深水区的挑战,如油田勘探数据分析、金融风控交易链分析甚至电力调度这一非常有深度的场景。而包括星火X1在内的深度推理大模型,也正从辅助工具逐步走向决策“大脑”,探索进入更多核心场景。

在教育、科研和央国企领域,AI for Science的应用越来越重要。目前,讯飞联合中科大刘海燕教授团队,成功设计了48个自然界不存在的全新蛋白质,把原来需要6个月的实验提速到只需1天完成。另外在单细胞基因表达课题的研究,托卡马克等离子体控制的研究上,大模型的应用正在加快科研工作的进展。

此外,科大讯飞还联合中科大研发“化学大模型”,联合中科院大连化学物理研究所研发“化工大模型”。而讯飞发布的星火科研助手,已在中科院下属116个院所使用。

在智算建设市场,业界提出智算中心要避免重建设、轻需求,以应用为导向,提高整个算力中心的利用率,并带动各地产业经济。4月17日,在湖北利川武陵山(利川)人工智能计算中心二期上线中,科大讯飞帮助打造的全国首个县域文旅大模型,也同期投入运行,构建起覆盖游客、商户、政府的三端服务体系。这是智算中心建设运营的生动体现。讯飞将持续通过“算力+数据+算法+场景+生态”五维体系,助力城市打造AI产业底座,推动传统产业智能化升级。

汽车智能化也是当下的热点。以大模型上车为例,科大讯飞与支付宝合作搭建了咖啡助手智能体,支持车内刷脸无感支付订咖啡。

另外,通过“快思考”与“慢思考”的统一,讯飞星火大模型将实现根据用户提出的问题类型,智能分配算力资源,选择合适的模型进行处理。比如简单的车辆控制指令,如调节车窗、空调温度等,采用“快思考”模型快速响应;而旅游规划、餐厅推荐等需要多轮交互和深度推理的复杂问题,则会启用“慢思考”模型,提升用户体验。

目前,讯飞星火大模型已落地16余款车型,在中国汽车出海的前十强车企中,有八家选择与科大讯飞合作。而本周将举办的上海车展,讯飞也将会有新的合作进展披露。

随着落地门槛的降低,与行业需求的交融,结合讯飞在多个行业赛道一二十年的积累和全链路打法,星火X1在行业赛道上将释放更大潜能,推动行业应用迈向深水区,争夺行业智能化市场。

0 阅读:9

数智前线

简介:关注数字化、云计算、智能硬件。