近日,在中国移动的助力下,中国石油高效完成DeepSeek V3/R1全栈国产化的训推适配和私有化部署。基于DeepSeek的关键技术点,此次部署开展了系列基础模型算法创新,实现了从底层芯片到框架、模型的全栈自主可控,为推动人工智能技术在能源化工领域的深度应用与国产AI技术生态的规模化落地注入了强大动力。
一直以来,中国移动与中国石油两大央企积极响应国家人工智能战略,努力推动“人工智能+”在能源化工行业落地生根。此前,中国移动携手中国石油发布能源化工领域首个行业大模型——700亿参数昆仑大模型。
面对中国石油多模态、超百亿参数的大模型训练任务需求,移动云凭借强大的算力网络能力,实现了资源的快速响应、弹性扩展及高质量供给。目前,移动云已提供超过1000P的稳定算力资源,为大模型的建设和运行提供了坚实的算力保障。
当大家还在为DeepSeek的全球爆火惊叹不已时,中国移动却已经开启“实干模式”。为了使DeepSeek系列模型在昆仑大模型原有的框架下,获得更好的适配效果和执行性能。中国移动通过配置化开发,在DeepSeek V3模型基础上快速实现了自定义模型参数和规模的针对性优化。
中国移动复现并优化了DeepSeek MTP多Tokens预测功能,通过DeepSeek-V3/R1主模型和MTP Module的分布式调度,实现一次解码生成多个Token,并通过整图编译功能,组合计算图的通用算子,实现自动融合加速,提升DeepSeek-V3/R1端到端的推理性能。
此次DeepSeek大模型的成功部署,为中国政企客户实现DeepSeek V3/R1全栈国产化的训推适配和部署提供了重要参考。它也为中国石油昆仑大模型优化应用效果、缩短研发周期、构建健康生态提供了新引擎,推动“数智中国石油”建设步入快车道。
在应用层面,昆仑大模型的问答应用“行业大家”目前已新增DeepSeek深度推理能力。在模型层面,昆仑大模型的AI中台模型广场目前已上线DeepSeek-V3与DeepSeek-R1模型版本,并实现全尺寸适配,满足不同场景的需求。
中国移动反应这么快可不是偶然,这背后是其在AI领域长期布局的硬实力。作为央企AI国家队,中国移动早已将人工智能纳入公司发展战略,对AI的探索可以追溯到10多年前。如今,中国移动正全面实施“AI+”行动计划,致力于“让AI不仅能做事,还能做更复杂、更具创造性的事”。
在筑牢高性能AI发展底座方面,中国移动持续优化“4+N+31+X” 算力基础设施布局,建设哈尔滨、呼和浩特两个自主可控万卡集群及浙江、上海、江苏等12个千卡资源池,智能算力规模已达到19.6EFLOPS,为人工智能发展夯实智算基础。
在锻造高水平AI大模型方面,中国移动构建“1+N”通专协同的大模型矩阵,布局训练万亿参数、全栈自主可控的九天多模态大模型基座,联合央国企、行业龙头打造N个工业行业大模型,提供工业视觉分析、工业知识问答等服务;强化训推一体化的模型即服务,完善从数据管理、模型训练、应用开发部署的全套工具,满足一站式智能化应用开发需求。
此次部署,中国移动再一次向我们秀出了自己在AI产品创新上的“硬核肌肉”。据悉,未来中国移动将继续与中国石油“搞事情”,在油气勘探开发、炼油化工、油气销售、工程建设等核心业务领域深入挖掘AI潜力,以新质生产力为中国式现代化建设贡献力量。可以预见,中国移动还将带着这份耕耘经验,进一步推动AI技术在更多领域应用。