零一万物回应放弃预训练传言，称将推出新模型

继此前有传言称，国内数家大模型公司已放弃预训练，其中就包括AI初创公司零一万物后。日前零一万物创始人李开复对此回应称，零一万物一直在做预训练，去年和今年发布的Yi-34B、Yi-Large、Yi-Coder、Yi-VL，以及Yi-Vision在发布时均是全球第一梯队、国内领先的预训练模型。

此外他还进一步表示，“而且我们的新预训练模型也即将推出，届时谣言将不攻自破”。随后零一万物方面证实，预计下周开始将发布包括新款旗舰模型等在内的一系列产品。

据悉，预训练是一种深度学习模型的训练策略，可以让大模型学习到更多信息、不断提高性能，停止预训练也就意味着将不再投入资源研发新模型，而是利用已有的模型进行应用开发，公司的发展方向将发生重大变化。

公开资料显示，零一万物是由创新工场董事长、前微软全球副总裁李开复创立，主要方向集中在大模型技术、人工智能算法、自然语言处理、算力架构、数据安全等领域。其前身是李开复在2023年3月成立的孵化AI 2.0公司，同年7月正式更名为零一万物，其团队核心成员均来自阿里巴巴、百度、谷歌、微软等公司。

自成立以来，零一万物已发布多款产品。例如其在2023年11月6日发布了首款预训练大模型Yi-34B，随后于2024年5月推出一站式AI工作平台“万知”和全球SOTA千亿参数闭源大模型Yi-Large 。同年6月，Yi-Large等一系列大模型登陆阿里云百炼平台。

此前在今年9月，零一万物方面宣布开源Yi-Coder系列模型，并表示这是继5月13日开源Yi-1.5系列模型之后，其在开源方向上的又一重要成果。据零一万物方面介绍，Yi-Coder系列模型是专为编码任务设计，提供1.5B和9B两种参数。其中Yi-Coder-9B的性能表现优于其他规模在10B参数以下的模型，例如CodeQwen1.5 7B、CodeGeex4 9B，甚至能够与DeepSeek-Coder 33B相媲美。

值得一提的是，此前在8月曾有消息显示，零一万物已完成新一轮数亿美元的融资。当时据相关人士透露，此次融资的参与方包括某国际战投、东南亚财团等机构，并且近期来自谷歌、微软等公司的多位高阶人才已加盟零一万物。但彼时零一万物方面对相关传言未进行回应。

玩酷网

零一万物回应放弃预训练传言，称将推出新模型

聊点科技行叭