11月27日,猎户星空联合聚云科技举办了题为《Data Ready for Al,MoE大模型发布暨商业闭环分享》媒体见面会。猎户星空正式发布了自主研发的Orion-MoE8×7B大模型,并携手聚云科技推出了基于该大模型的数据服务产品——AI数据宝AirDS(AI-Ready Data Service)。这两项重要成果的发布,不仅标志着猎户星空在AI技术领域的又一重大突破,更为AI行业商业化进程注入新动能。
(猎豹移动董事长兼CEO、猎户星空董事长傅盛线上接受媒体采访)
Orion-MoE 8×7B-Base:引领多语言大模型新潮流
猎户星空首席科学家韩堃出席会议,首先对Orion-MoE8×7B大模型进行了详细介绍。这款大模型是猎户星空自主研发的开源混合架构专家大模型,拥有8×70亿参数,采用了生成式混合专家的设计,涵盖了中文、英语、日语、韩语等多种语言,展现出卓越的性能。
早在2024年年初,猎户星空隆重发布自研“为企业应用而生”的百亿参数大语言基座模型Orion-14B。为什么要在2024年底发布MoE大模型?
猎户星空在探索AI应用场景过程中,一方面以客户视角为出发点,模型既要效果好又要速度快;另一方面从大模型技术发展来看,相比稠密模型的“通才”、一群“专家”的MoE能更高效专业地完成企业复杂任务,而且在不显著增加计算成本的前提下大幅增加模型容量。所以,这款极具性价比的Orion-MoE 8x7B大模型是“为匹配企业客户需求而生”。
在主流的公开基准评测中,Orion-MoE8×7B与同规模参数级别的基座大模型对比,各项评测指标均表现优异,特别是在多语言能力方面展现出强大实力。此外,在推理速度方面也表现抢眼,显著高于同等参数规模的稠密模型。
AI数据宝AirDS:开启大模型商业化闭环
猎户星空基于研发MoE大模型对数据训练的认知理解和能力积累,携手猎豹移动旗下聚云科技共同推出大模型数据服务产品——AI数据宝AirDS(AI-Ready Data Service),为全球化企业提供更为高效、精准的AI数据服务支持,助力其在AI应用落地过程中实现“最后一公里”的突破。
猎户星空首席科学家韩堃介绍道,近年来,由于计算能力的提升、大规模数据集的可用性以及算法的改进,AI大模型进入爆发增长期,算力、算法、数据,是大模型发展的关键三要素。然而,相比于算法和算力,在大模型商业闭环中,数据明显成为最直接影响其在垂直行业落地效果的关键。
“捅破AI行业窗户纸,百模大战靠数据”,AI数据宝AirDS提供全方位的大模型数据服务,涵盖数据收集、清洗、标注、提示词工程以及评估等环节。在实际应用中,已服务包括移动通信终端、互联网娱乐、新能源汽车等多个领域的中国领先出海品牌,帮助客户显著提升AI应用的效果与效率,助力全球市场竞争。
猎豹移动副总裁童宁在会上详细介绍了AI数据宝AirDS的成功案例。例如,在移动通信终端领域,AI数据宝AirDS通过收集多场景、多语⾔数据,完成开发测试平台,优化prompt⼯程,提升⼤模型针对用户需求的数据返回准确率;还有,AI数据宝AirDS通过开发⼤模型⾃动化⼯具测试平台以及prompt⼯程,实现移动终端多语⾔用户之间语⾳交互翻译,准确率大幅提升。在互联网娱乐领域,AI数据宝AirDS服务让用户可通过⾃然语⾔交互实现⼤模型对外部互联⽹应⽤API的调⽤。在这些案例之外,AI数据宝还服务于出海新能源汽车、出海互联网金融、出海消费零售等行业。
总结:猎豹移动的集团基因及整合优势
会议接近尾声,猎豹移动高级副总裁孙明焱总结此次推出AI数据宝AirDS是基于猎豹移动在多个领域的既有基因和显著优势,包括出海全球化经验、应用开发能力、AI机器人和大模型行业实践与技术积累。
做为中国第一批成功出海的互联网企业,猎豹移动凭借工具应用开拓了全球市场。近年来,猎豹移动战略转型从传统的ToC业务转向以AI和大模型为核心的ToB业务,并通过控股猎户星空,进一步加强在AI服务机器人和AI大模型领域的布局。
在获取客户需求层面,猎豹移动旗下聚云科技拥有超过十年的出海运维经验,对外赋能、服务中国企业出海上云、用云、管理云,拥有了一大批服务中国品牌出海的实践案例,深刻掌握着客户在云端的GenAI应用需求;在AI数据服务能力层面,猎豹移动控股的猎户星空对通过提升数据质量来改善大模型效果有着充分的实践经验。此次猎户星空携手聚云科技聚合大模型数据收集、清洗、标注、提示词工程和评估的全方位服务,共创AI数据宝AirDS(AI-Ready Data Service)。相对于传统的数据标注公司,拥有在AI数据服务能力上划时代的技术优势,是大模型业内对外开放数据能力的唯一厂商。
除了发布Orion-MoE8×7B大模型和AI数据宝AirDS外,猎户星空宣布与香港大学计算与数据科学学院签订了合作协议,双方将联合研发用于课程教学场景的AI应用教育工具,并开展“专注具身智能相关的课程项目”,共同推动AI技术在应用领域的普及与应用。
Orion-MoE8×7B线上体验参考链接:
GitHub: https://github.com/OrionStarAI/Orion-MoE
HuggingFace: https://huggingface.co/OrionStarAI/Orion-MoE8x7B
ModelScope: https://www.modelscope.cn/models/OrionStarAI/Orion-MOE8x7B-Base