比肩OpenAI?中国联通这是准备放“大招”了!

南斗星君 2025-02-20 09:45:11

近日,联通数据智能有限公司发布元景思维链大模型。

作为央企首个开源的通用思维链大模型,元景思维链大模型既拥有强大慢思考能力,又具备不限于数学的多学科、多场景通用推理能力,且能做到针对不同任务和难度的自适应慢思考,大幅降低资源消耗。

目前,元景思维链模型已在GitHub 、魔搭、始智等社区全面开源。

中国联通表示,主流榜单的测评结果显示, 元景思维链大模型的表现超过了目前最好的通用语言模型(OpenAI GPT-4o和Deepseek V3)以及开源思维链模型通义千问QwQ。

通过任务自适应和难度自适应两种策略,元景思维链大模型能实现模型的“自适应慢思考”。

主流思维链大模型在知识问答、信息提取等非推理任务中常因过度思考生成冗余信息。元景思维链大模型通过将通用领域指令数据与推理任务的长思维链数据合理配比后,以混合微调方式赋予模型一定的任务自适应能力。

该模型在推理任务中使用慢思考长思维链模式,在常规任务中输出简洁回答,显著优化了推理性能并缓解了信息过载问题。

在非推理任务测评集上对比,元景思维链模型在保证正确率的情况下明显倾向于生成更短的答案(长度小于100和200个token的数量明显多于通义千问QwQ)。

该大模型在评估模型生成的长思维链数据时, 除了考虑生成的答案正确与否,还综合考虑了问题的难度以及生成答案的长度,通过强化学习让模型将答案长度与当前问题的难度相匹配。

根据官方演示,元景思维链模型可顺利解答物理、化学高考真题、24点游戏、逻辑推理等问题。

如今,联通元景思维链大模型不仅能够完成复杂的推理任务,而且通过“自适应慢思考”有效提升了思维链模型应用的性价比,具备赋能医疗诊断、工业设备故障检测等应用场景落地的能力。

未来,中国联通将持续升级基础模型能力,不断量化和扩展模型能力边界,深化与国产算力的合作,为千行百业提供更懂行业,更加安全普惠的数智服务。

0 阅读:0

南斗星君

简介:感谢大家的关注