作者:文雨,编辑:小市妹
2017年,8位谷歌计算机科学家在《Attention Is All You Need》论文中向全世界公开了Transformer算法,新一轮人工智能热潮的扳机就此被扣下。同样在这一年,中国制定了《新一代人工智能发展规划》,举全国之力发展人工智能。正因如此,中国才得以在这一轮科技大战中保持全球第一梯队。
2024年,全球通用人工智能竞争将升级为系统性竞争,GPT热度未降,Sora又横空出世,一个新的科技革命正呼之欲出。通用人工智能赛场,美国已率先抢跑,中美差距究竟处于什么状态,未来又该如何缩小,这些已经成为全社会都高度关注的话题,也是今年两会极具热度的议题之一。
【成绩很大,差距仍在】
两会之际,人工智能再次成为舆论关注的焦点,有20多位全国人大代表或政协委员谈到了大模型相关内容,覆盖到从底层数据算力、模型层以及应用层的方方面面,其中全国人大代表、科大讯飞董事长刘庆峰关于如何缩小中美之间通用大模型差距的提案在社会上引发强烈反响与热议。
首先应该承认,中国在大模型数量上并不落后于美国。
相关数据显示,截至2023年7月,国内大模型数量已达130个,高于美国的114个。另据《中国人工智能大模型地图研究报告》,目前全球范围内累计推出的10亿以上参数大语言模型总数为202个,其中中美两国所发布的模型总数占比近90%,中国10亿参数规模以上的大模型已发布79个。
数量占优的另一面是质量欠缺。
必须清醒的认识到,2023年国内的“百模大战”虽然热闹,但绝大多数都是行业大模型和垂直应用,通用大模型相对较少,而后者才是决定人工智能技术强大与否的关键所在。通用模型具有广泛适用性,能够处理多种任务和应用于不同领域,而行业模型则只能具体针对某个特定行业或领域需求,行业模型都是建立在通用模型之上的,DALL-E3、Whisper、Sora等新进展都是基于GPT-4/4V通用模型的底座能力平台所延伸出来的特定领域的成功实践,没有GPT-4的语义理解能力、文本生成能力,Sora根本做不出来。
不夸张的说,没有通用模型的行业模型就是无本之木,无源之水,一旦GPT通用模型升级,国内很多行业模型可能瞬间就会被降维打击。这也就是为什么刘庆峰直截了当的指出,中美博弈最核心的“主战场”是通用大模型,只有通用大模型能力能够对标国际最先进水平,行业模型才具备持续提升的潜力。
当前OpenAI的GPT-4/4V代表全球通用大模型底座能力的最先进水平,而最能代表中国实力的当属讯飞星火认知大模型V3.5。
最能代表中国有两层含义,其一是完全中国自主研发,星火大模型V3.5是中国第一个基于全国产算力训练的全民开放大模型;其二是性能领先,星火大模型V3.5的语言理解能力、数学能力均已超过GPT-4Turbo,代码达到GPT-4Turbo的96%,多模态理解能力达到GPT-4V的91%,综合能力逼近GPT-4Turbo的最新水平。
刘庆峰谈道,星火大模型可以在6个月内达到GPT4/4V当前最好水平,但是随着GPT-5发布,这个差距可能会被拉开到一年以上。如果从算力、数据、模型训练等方面组织好资源全力追赶,差距有望在1-2年内拉平。
也就是说,中美之间虽然存在距离,但这个距离并非不可逾越的鸿沟,现在的关键是我们应该如何去做。
【凝聚力量,顶格推进】
中国人工智能目前正面临两个现实。
一是投入巨大。
2018年发布的GPT-1和BERT模型参数量大约为1亿,到2020年发布的GPT-3模型参数规模就已暴增至1750亿,2023年推出的GPT-4和Gemini模型规模进一步达到万亿水平。据业界估算,OpenAI训练1750亿参数的GPT-3的费用大概是1200万美元,而训练万亿参数的GPT-4成本可能直接飙升至1亿美元以上。简言之,参数量与训练费用均非线性增长,而是指数增长。
二是美国封锁。
2019年,以将华为、科大讯飞等一众企业列入实体清单为标志,美国正式对中国科技产业实行封锁。在后来的时间里,这种打压的广度和深度越来越大,去年10月,美国发布对华半导体出口管制最终规则,在2022年出台的临时规则基础上进一步加严对人工智能相关芯片的对华出口限制,其核心目的就是限制中国在前沿科技——大模型上的发展。
要移开压在中国人工智能产业头上的两座大山,靠单个企业分散突围难免势单力薄。
在两会建言中,针对社会关切的缩小中美大模型差距问题,刘庆峰一针见血的指出,中国有必要发挥举国体制优势进行系统性推进,在2017年《新一代人工智能发展规划》的基础上,瞄准我国通用人工智能发展中需要重点补上的短板进行设计,围绕自主可控算力生态构建、高质量数据开放共享、科学的评测标准制定、源头技术前瞻研发、人才培养、法律制定和伦理人文等维度,系统性制定国家《通用人工智能发展规划》。
除此之外,刘庆峰还建议从以下九个方面加快推动相关工作:
第一,聚焦通用大模型“主战场”,整合各方资源,持续加大投入。
第二,围绕通用人工智能相关领域,布局战略性、前瞻性基础研究,坚持以源头核心技术突破来推动颠覆式创新的探索。
第三,加快形成以国产大模型为核心的自主可控产业生态。
第四,推动国家级高质量训练数据开放和共享,支持国家战略科技力量以揭榜挂帅形式优先、低成本使用。
第五,出台客观、公正、可信的评测方法,推动大模型在行业领域应用的健康发展。
第六,加快推广人工智能通识教育,赋能基础教育、职业教育和高等教育全学段,同时以全新机制加快探索我国人工智能拔尖创新人才培养。
第七,研究通用人工智能时代人才能力素质模型和培养方案,加快对社会各行业应用型人才的培训。
第八,尽快制定通用人工智能技术与应用相关领域法律法规。
第九,设立软课题,进行通用人工智能伦理人文研究。
我国必须要有自主可控、对标国际前沿的通用大模型。这是刘庆峰对于中国人工智能产业发展的一个核心认识,而他这一观点的形成,与科大讯飞自身的实践有直接关系。
被美国制裁后,科大讯飞在加大自主研发的同时也在国内积极寻求与头部科技公司合作。刘庆峰曾透露,他第一时间去华为请教交流,并跟华为达成一致意见,这才有了后来两家公司成立联合特战队,并共同打造出中国首个支撑万亿参数大模型训练的国产算力平台——“飞星一号”。并基于该平台训练出讯飞星火3.5,整体效果逼近GPT-4 Turbo,为中国人工智能发展注入“强心剂”。
这个过程中,双方进行了数百次基于硬件工具和算子库的优化,进行了大量bug修订以及算子效率优化,使得“飞星一号”算力集群可以训练超大规模的通用人工智能模型。短期来看,可能这样的工作使大模型的节奏稍微放缓,但长远来说,这是一种重要的投入前置,为未来在国产化平台上持续拓展打下坚实基础。
科大讯飞与华为用实际行动说明了一件事,就是虽然有困难、有差距,但只要能够凝聚意志、集合力量,国内军团可以迎头赶上,缩小与美国差距的。
【保持信心,前途光明】
算法、算力、数据之外,决定人工智能强大兴衰与否的另一个变量是场景,而中国在这方面有得天独厚的优势。
在B端,中国拥有41个工业大类、207个工业中类、666个工业小类,是全世界唯一拥有联合国产业分类中全部工业门类的国家。中国同时是世界制造业第一大国,制造业增加值占全球约30%,连续14年位居世界首位。
在C端,中国拥有14亿人口以及旺盛的购买力,是仅次于美国的全球第二大消费市场,拔地而起的中产群体注定了国内消费还有巨大的潜力。
市场空间是科技发展的第一推动力,无论B端还是C端,中国都给人工智能的全面展开腾出了广阔的纵深空间,本土AI企业随时都有海量应用场景可以落地,这是中国发展人工智能产业的一个重要比较优势。
星火大模型立项之初科大讯飞就确立了“1+N”的原则,“1”指的是通用大模型,而“N”代指一众下游应用场景。讯飞星火在教育、医疗、工业、司法等行业领域加速落地,比如讯飞医疗大模型效果比GPT-4还好。同时讯飞携手金融、能源、汽车、通信、化工等领域龙头企业共同打造行业大模型,与华为、中国移动、中国一汽、奇瑞、太平洋保险、国能集团、交通银行、国家博物馆、中国教科院等行业龙头企业进行深度战略合作,持续创造刚需场景价值,加速产业化落地。
不仅赋能产业,也加持个人。
讯飞星火用户目前已达数千万,他们使用最多的不是周末而是工作日,其中上午9:30、下午3:30是高峰期,其根本原因在于讯飞星火提升了个体的工作效率,带来了很多刚需应用上的提高。
C端智能硬件上,搭载了讯飞星火的AI学习机、智能办公本、翻译机、录音笔拿下2023年“双11”京东&天猫7个品类销售冠军,讯飞AI硬件销售额同比2022年增长126%。
只要真正满足市场需求,中国完全有机会在应用落地层面引领世界,进而反哺技术更新,形成良性的自迭代发展闭环,乃至成为世界智慧涌现的第二极。
2024年是全球人工智能竞争加剧的一年,也是发展加速的一年,作为国产大模型的代表,科大讯飞率先向自己发难,定下四项“狠”目标:
星火通用大模型国内领先对标GPT-4;赋能智能硬件终端1000万、独立软件用户数过亿;教育/医疗/汽车等行业市场第一;汇聚100万大模型开发者,打造行业第一生态。
AI革命浪潮滚滚、方兴未艾,这注定是一场持久战,注定会有万千强人前仆后继的进场厮杀,我们要做的就是直面问题,正视差距,坚定信心,埋头攻坚。刘庆峰在两会提案中从专业层面给出九条具体发展措施,每一条都有很强的现实意义,值得思考和重视,也希望能有更多从业者站出来贡献智慧,大家一起把这盘棋做大、做活。
直面差距,积极追赶,紧紧抓住通用大模型这个主要矛盾,牢牢把握技术与产业应用相结合这条主线,我们的目标一定要达到,也一定能达到。
免责声明
本文涉及有关上市公司的内容,为作者依据上市公司根据其法定义务公开披露的信息(包括但不限于临时公告、定期报告和官方互动平台等)作出的个人分析与判断;文中的信息或意见不构成任何投资或其他商业建议,市值观察不对因采纳本文而产生的任何行动承担任何责任。
——END——
杀气腾腾……