今年上半年,是全球人工智能最波澜壮阔的半年。技术的突破、产品的迭代、应用的创新,基本上是以“周”的速度向前突进。
比如,随着GPT4大模型的发布,Chat GPT月活用户刚刚突破了10亿。人工智能芯片公司英伟达市值突破了万亿美元。6个月内,全球新诞生了1000家创业公司。在文本生成、图像生成等几类应用,已经有创业公司营收超过1亿美元。
大模型将重构全球数字化产业,重塑数字世界,已然成为共识。
就在刚刚落幕的“世界互联网大会数字文明尼山对话”中,百度创始人、董事长兼首席执行官李彦宏也透露了文心大模型的最新进展,让国人看到了百度在大模型技术和应用上的深度思考和领先探索。
“新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用,这些个应用在多大程度上提升了生产效率。”李彦宏在会上如是说。这句话的弦外之音是,创业公司完全没有必要去卷大模型,而是应该投身到应用层创新,做出像移动时代的滴滴、美团、抖音这样的AI原生应用。
李彦宏还透露,百度的文心大模型,也刚刚迭代到3.5版本,训练速度提升了2倍,推理速度提升了17倍。
01技术升级:百度硬核实力“非一日之功”文心大模型的进化速度可以用“一日千里”来形容。
今年3月16日,百度在全球科技互联网大厂中率先做出了大语言模型、生成式AI产品“文心一言”。更值得一提的是,文心大模型是完全自主可控的,做到了数据可控、框架可控、模型可控。
而这一切非一日之功,正如李彦宏所说:“无论是哪家公司,都不可能靠突击几个月就能做出(文心一言)这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”
早在2019年,在大模型还没被广泛关注的时候,百度就推出了文心大模型1.0。然后持续演进到2.0、3.0版本,直至今天的3.5版本。据了解,与文心大模型3.0相比,3.5版本不仅在创作、问答、推理和代码能力上全面升级,安全性显著提升,训练和推理速度也大幅提升。对比数据显示,文心大模型3.5的训练速度提升2倍,推理速度提升17倍,大大提高模型迭代升级的效率,大幅降低训练及使用成本,进一步提升用户体验。
对于大模型而言,想要极致优化推理速度和使用成本,算力、框架、模型、应用就像是四个齿轮,需要它们之间的“紧密配合”和“协同优化”。而百度是全球为数不多、在这四层架构都进行了全栈布局的人工智能公司,可以实现端到端优化,从而大幅提升大模型的训练和推理效率。
根据在公开测试集上进行基础模型少样本(Few-Shot)评测的结果,文心大模型3.5(ERNIE 3.5)在多个测试集的得分已超过Chat GPT。
据百度CTO王海峰透露,在此前知识增强和检索增强的基础上,文心大模型3.5版本进一步提出了“知识点增强技术”。具体而言,知识点增强技术首先是对用户输入的查询、问题等进行分析理解,并解析出生成答案所需要的相关知识点;之后运用知识图谱和搜索引擎为这些知识点找到相应答案,最后再用这些知识点构造输入给大模型的提示。显然,知识点增强技术能为大模型注入更具体、更详细、更专业的知识点,显著提升大模型对世界知识的掌握和运用,从而使其在各项任务上都取得了显著的效果提升。
技术实力的背后是十年持续的投入。百度的研发投入长期保持高位,过去10年AI投入超过1000亿元。也正是在这种高强度的研发投入下,百度围绕芯片、框架、模型、应用这四层打造了AI核心技术栈,在每一层均有领先业界的自研技术和产品,这在全球范围内都是比较罕见的。这也使得文心大模型保持如此高速的迭代升级效率。
02产业变革:大模型深入实体经济,拉动增长以大模型为核心,整个数字化产业将全面升级和刷新。中国将拥有全新的核心技术栈、新的计算平台、新的基础设施、新的算力体系、新的通讯体系,以及新的产品体系,这必将带动数字经济规模的巨大增长。
因此,大模型绝不是昙花一现的风口,而是有着产业纵深的技术变革,是拉动全球经济大增长的引擎,是绝对不能错过的重大战略机遇。今天,大模型正在重塑数字世界。
大模型如何重塑数字世界?答案是,“应用为王”。怎么把大模型技术,变成人人需要的产品?怎么应用到交通、制造、金融、能源等行业,让他们的生产效率大幅度地提升?怎么让大模型深入到实体经济中去,拉动经济的增长?这才是真正应该关心的事情。
截至目前,百度文心行业大模型的数量已经达到11个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域,进一步丰富了行业大模型的应用场景,在产业化落地的过程中使大模型真正赋能“千行百业”。
比如在汽车制造行业,最复杂的设计环节,需要有经验丰富的工程师在2万多个零部件、几十万个参数里,找到满足需求的各种组合,再写文档、画图纸。在长安汽车,大模型可以高效地找到组合信息,自动生成设计文档,大幅缩减研发周期和成本。在汽车和电子制造领域,百度AI已参与到车企数字工厂的建设。
在交通领域,通过大模型技术支持的智能交通方案,可以提升交通运行效率。比如,今年五一长假之前最后一个工作日,北京城市拥堵指数暴增2.5倍。从二环堵到六环,一片红,唯一绿的是亦庄。亦庄车流量同样明显增加,但因为部署了AI全域信控方案,300多个智能路口,都可以根据车流量自动调节红绿灯,亦庄成为不堵车的一片“绿洲”。在端午前一天,北京城区和亦庄的交通对比来看,惊人的相似:城区很堵,但亦庄畅通。百度智能交通解决方案已经被69个城市采用。通过智能调整红绿灯的时间,可以让通行效率提升15%-30%,这将拉动GDP2.4%-4.8%的增长。
在能源电力领域,国家电网通过百度 AI 大底座建设“两库一平台”智能基础设施,运用 AI 中台和知识中台服务,构建起安全隐患识别模型和知识管理平台,把安全隐患识别率提升了 30%,识别效率提升了 5 倍,形成了电力“人工智能+”的融合创新服务体系。在中石化、南方电网,大模型深入核心业务场景,在智能客服、供应链、系统调度等版块创新,促进行业的数字化转型和智能化提升。
可以预见,未来大模型将渗透到越来越多的领域,以大模型为关键驱动的数字经济,与实体经济深度融合,创造可观的增量价值,带来经济社会发展和产业的深刻变革。
03结尾
每一次的技术爆发,都会带来大量新的挑战,如何平衡“发展”与“安全”是所有大模型厂商都必须面对的难题。
对此,李彦宏公开表示,“人工智能技术飞速发展过程中,确实有可能出现对人类不利的方向,防止失控,需要拥有先进AI技术的国家通力协作,从人类命运共同体的高度来制定规则。而要参与规则的制定,就要先上牌桌,才能拥有话语权,才有全球竞赛的入场券。”
而中国具有庞大的市场规模和丰富的应用场景,这为人工智能技术的创新应用和产业发展奠定了坚实基础。未来,通过持续进步的人工智能模型训练和优化,中国有望在人工智能领域享受技术和经济的“双重红利”。
未来,相信以百度等为代表的中国科技公司,基于对中国文化的感悟和对中国市场的理解,能够做出不逊于国外公司的AI应用,在数智化的征程上,中国势必将拥有更壮大的数字化产业,数字经济规模也将获得巨大增长!
确实可以,就是能再可以点就太可以了