零一万物回应放弃预训练传言,称将推出新模型

聊点科技行叭 2024-10-16 05:32:32

继此前有传言称,国内数家大模型公司已放弃预训练,其中就包括AI初创公司零一万物后。日前零一万物创始人李开复对此回应称,零一万物一直在做预训练,去年和今年发布的Yi-34B、Yi-Large、Yi-Coder、Yi-VL,以及Yi-Vision在发布时均是全球第一梯队、国内领先的预训练模型。

此外他还进一步表示,“而且我们的新预训练模型也即将推出,届时谣言将不攻自破”。随后零一万物方面证实,预计下周开始将发布包括新款旗舰模型等在内的一系列产品。

据悉,预训练是一种深度学习模型的训练策略,可以让大模型学习到更多信息、不断提高性能,停止预训练也就意味着将不再投入资源研发新模型,而是利用已有的模型进行应用开发,公司的发展方向将发生重大变化。

公开资料显示,零一万物是由创新工场董事长、前微软全球副总裁李开复创立,主要方向集中在大模型技术、人工智能算法、自然语言处理、算力架构、数据安全等领域。其前身是李开复在2023年3月成立的孵化AI 2.0公司,同年7月正式更名为零一万物,其团队核心成员均来自阿里巴巴、百度、谷歌、微软等公司。

自成立以来,零一万物已发布多款产品。例如其在2023年11月6日发布了首款预训练大模型Yi-34B,随后于2024年5月推出一站式AI工作平台“万知”和全球SOTA千亿参数闭源大模型Yi-Large 。同年6月,Yi-Large等一系列大模型登陆阿里云百炼平台。

此前在今年9月,零一万物方面宣布开源Yi-Coder系列模型,并表示这是继5月13日开源Yi-1.5系列模型之后,其在开源方向上的又一重要成果。据零一万物方面介绍,Yi-Coder系列模型是专为编码任务设计,提供1.5B和9B两种参数。其中Yi-Coder-9B的性能表现优于其他规模在10B参数以下的模型,例如CodeQwen1.5 7B、CodeGeex4 9B,甚至能够与DeepSeek-Coder 33B相媲美。

值得一提的是,此前在8月曾有消息显示,零一万物已完成新一轮数亿美元的融资。当时据相关人士透露,此次融资的参与方包括某国际战投、东南亚财团等机构,并且近期来自谷歌、微软等公司的多位高阶人才已加盟零一万物。但彼时零一万物方面对相关传言未进行回应。

0 阅读:2

聊点科技行叭

简介:感谢大家的关注