《中国经济周刊》 记者 石青川
今年的政府工作报告提出,要“深入推进数字经济创新发展。制定支持数字经济高质量发展政策,积极推进数字产业化、产业数字化,促进数字技术和实体经济深度融合。深化大数据、人工智能等研发应用,开展‘人工智能+’行动,打造具有国际竞争力的数字产业集群”。
对此,科大讯飞董事长刘庆峰倍感振奋。
近两年,人工智能技术的快速进步在全球掀起热潮,尤其是ChatGPT、Sora等大模型创新不断涌现。在他看来,以大模型为代表的人工智能技术,或将改变当前以人力和时长为主要商业模式的产业形态,根本上重塑产业的全球竞争力。
“时间紧,任务重。”刘庆峰向《中国经济周刊》记者表示,“我国若想在这个领域快速赶上,有必要根据新的形势制定系统性规划。”
建议制定国家通用人工智能发展规划
我国曾于2017年出台过《新一代人工智能发展规划》。刘庆峰表示,在此规划的指引下,中国在认知智能领域已具备非常扎实的技术储备和成建制的团队,有望成为全球智能涌现的第二极。但他同时表示,当前时代背景下,发展规划也到了需要升级的时刻。
当前,通用人工智能是全球科技竞争的焦点,在这个技术领域内的“主战场”就是在通用底座能力上持续进行对标。刘庆峰透露,目前OpenAI的GPT-4/4V代表全球通用大模型底座能力的最先进水平,DALL-E3、Whisper、Sora等都是基于GPT-4/4V的底座能力平台所延伸出来的特定领域的成功实践。
国产大模型离全球最高水平有多大距离?刘庆峰表示,以讯飞星火大模型为例,“其预计在6个月内可达到GPT-4/4V当前最好水平”,但随着GPT-5的发布,这个差距可能会被拉到一年以上,如果从算力、数据、模型训练等方面组织好资源全力追赶,这个差距也有望在一到两年内被追平到相当的水平。
不过,我国在通用大模型领域也有自己的优势。刘庆峰透露,我国在语音大模型、医疗大模型等领域也形成了国际领先的比较优势。“我们有信心在通用大模型上不会出现代差级落后的差距,在此基础上结合行业场景和数据进行打磨,有望实现典型行业领域的超越。”刘庆峰说,“但在追赶的同时,结合全新的技术发展、竞争格局、产业赋能以及在社会生活中的各种变化,非常有必要根据新的形势制定系统性规划。”
刘庆峰判断,2024年全球人工智能的竞争将进一步升级为系统性竞争,各国在基础大模型、行业应用、硬件、产业链等各方面将开始全面较量,中美在大模型深度应用和战略需求上角逐,今年将是关键期。为此,他建议在2017年《新一代人工智能发展规划》的基础上,制定出全局性的通用人工智能发展规划。
“瞄准我国通用人工智能发展中需要重点补上的短板进行设计,围绕自主可控算力生态构建、高质量数据开放共享、科学的评测标准制定、源头技术前瞻研发、人才培养、法律制定和伦理人文等维度,系统性制定国家通用人工智能发展规划。”刘庆峰表示,“国家高位推动规划的制定和落地,不断缩小中美通用人工智能产业在通用底座平台方面的差距,并在行业应用和价值创造上打造我国的比较优势。”
人工智能发展受制于算力与人才
今年2月,美国OpenAI公司发布的首个文本生成视频人工智能模型Sora再次引起全球热议。
“我们并没有那么惊讶。我觉得它是被很多不是太了解的人神化了。”刘庆峰认为,Sora底层的认知还是GPT-4,因为有了GPT-4V的视频模型,它可以对海量的视频做更生动更全面的标注,有了GPT-4的底层能力,加上GPT-4未来用机器帮助人进行标注,就使得海量视频的学习具备了可能性。
但在破除技术差距焦虑的同时也让科大讯飞意识到,未来以Sora为代表的多模态模型需要更大量的音视频数据和更大规模算力的支撑。
据介绍,目前国内大模型在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,这几块也相应是技术上的难点。此外,随着大模型参数和训练数据的不断增长,算力的考验也愈发严峻。更具挑战的是,对于国内大模型来说,AI芯片等软硬件已成为当前“卡脖子”的底层基础设施,而国产智算芯片和软件生态与国际一流水平也有一定差距。
在刘庆峰看来,对于未来大模型多模态与多语言、海量数据的高质量处理、系统性创新、软硬一体国产化等技术发展方向,国内通用大模型行业需要产业链条所有环节的能力提升。“面对行业冲击和劳动力市场变化,需要建立更有前瞻性的应对机制。” 刘庆峰表示,人工智能领域人才输送与市场需求存在不对等,基础算法和创新型领军人才的培养需求进一步加大,同时产业复合型创新人才也非常紧缺。在本轮通用人工智能对千行百业的深度赋能和冲击过程中,也要提前研究社会救助体系以及各领域相应的法律法规。
此外,刘庆峰建议,要加快运用大模型的现有能力打造教师和学生的“助手”,赋能从中小学到职业教育和大学教学的提质增效。同时,设立国家人工智能学院,以“核心+基地”的组织形式和全新机制推动我国拔尖人工智能人才培养。
考虑到人工智能对社会劳动力结构的影响,刘庆峰还建议,关注通用人工智能对社会各行业带来的冲击,加快建设新的人才能力素质模型和课程培养体系,特别是加快用通用人工智能赋能软件代码、语言学习、艺术创意等应用型人才的培养。
(本文刊发于《中国经济周刊》2024年第6期)
科大讯飞到现在也没有跨时代产品,但是大家都预期了很多年……。真希望差距只有一两年。
ai模型的训练数据以及模型输出要严格审查
遥遥领先怎么说追赶?
少比较,多研究多发展,努力营造诚信公平的环境,肯定会越来越好。
国产大模型离全球最高水平有多大距离?刘庆峰以我国首个基于全国产算力训练的全民开放大模型——讯飞星火大模型为例,“其预计在6个月内可达到GPT4/4V当前最好水平”,但随着GPT-5的发布,这个差距可能会被拉到一年以上,如果从算力、数据、模型训练等方面组织好资源全力追赶,这个差距也有望在1-2年内被追平到相当的水平,同时我国也在语音大模型、医疗大模型等领域形成了国际领先的比较优势。
懂行的呼吁“正视差距”,外行的吹嘘“遥遥领先”!