在加州的一家经济型旅馆,凌晨时分,被誉为“人工智能之父”的杰弗里·辛顿被一通电话惊醒。电话那头传来一个陌生的声音,告知他荣获了诺贝尔奖的殊荣。
起初,辛顿教授的直觉告诉他,这可能是一通诈骗电话。然而,对方那浓厚的瑞典口音让他不由自主地继续聆听。
在接下来的两周里,全球的目光都聚焦在了这一消息上,证实了那通电话并非骗局。辛顿因其在“利用人工神经网络实现机器学习领域的基础性发现和创新”方面的杰出贡献,荣获了2024年的诺贝尔物理学奖。这一成就不仅肯定了他在人工智能领域的先驱地位,也为全球的科技进步和机器学习的发展树立了新的里程碑。
在人工智能的发展历程中,杰弗里·辛顿提出的深度神经网络概念曾一度被忽视。然而,2010年9月,当AI科学家邓力访问中国科学技术大学并介绍这一理论时,虽然听众寥寥,却有几位科大讯飞研究院的年轻人深刻理解了这一概念,并提出了许多深刻的问题。他们是胡郁、王智国和刘聪,他们的到来不仅是为了聆听讲座,更是为了探索深度神经网络的潜力。
邓力后来回忆说,当时全球只有谷歌和科大讯飞对深度神经网络抱有信心。他的访问激发了科大讯飞对深度神经网络的研究热情。2011年,科大讯飞推出了国内首个基于深度学习的中文语音识别系统,并将其应用于讯飞输入法,成为中国首家将深度学习算法商业化的公司,效果显著。
两年后,科大讯飞将深度神经网络技术应用于多项产品中,客户和用户数量迅速增长,公司市值突破百亿元大关。深度神经网络的故事并未就此结束。2022年,ChatGPT的问世标志着大型语言模型时代的到来,OpenAI以其强大的影响力和巨额融资成为全球焦点。
在中国,科大讯飞在深度神经网络的产业化研究上取得了更深的进展。他们的讯飞星火模型在安卓端的下载量超过2亿次,成为国内工具类通用大模型的领头羊。在实际应用场景的测试中,讯飞星火4.0 Turbo在文本生成、语言理解、知识问答、逻辑推理、数学、代码和多模态等七个方面均超越了GPT-4 Turbo,特别是在数学和代码能力上,已经超越了GPT-4。
更重要的是,中国的大模型正在被应用于更多的现实场景中,如企业智能助手、员工AI助理、学生AI学习机、智慧黑板、科研实验室、政务大屏、智能驾驶舱以及为聋哑人群设计的助听器等,大模型的加入使得这些应用变得更加实用和便捷。
中国AI公司正以实用主义为导向,走出了一条与OpenAI不同的道路。这一切的发展,不仅推动了技术的进步,也引发了对AI和大模型在这个时代需求的深入思考。我们究竟需要怎样的AI和大模型?这是一个值得每个人,无论是技术开发者、企业决策者还是普通用户,都去深思的问题。
Part.01模型繁荣背后,泡沫隐忧?一个月前,OpenAI的首席执行官奥特曼在深夜时分发布了一篇题为《智能时代》的文章,引起了广泛关注。他在文章中预言,超级智能可能在不远的几千天后成为现实,这将是历史上的一个转折点。他展望了一个由AI助力的未来,人类将能够实现先辈们难以想象的壮举,全球的繁荣将达到前所未有的高度,人类的进步故事将继续书写。尽管发布时间是在凌晨,这篇文章的阅读量迅速突破了百万。然而,对于奥特曼突然发表这样一篇充满期待的文章,人们感到困惑,不清楚这位以概念营销著称的硅谷新贵为何突然向人类承诺了一个不确定的未来。
一周后,OpenAI宣布获得了66亿美元的新融资,投资方包括微软、英伟达和Thrive Capital等,公司估值飙升至1570亿美元。这时,人们才意识到奥特曼的文章背后可能隐藏着更深的意义。
尽管这轮融资规模创下了记录,但它也加剧了公众对AI泡沫的担忧。科技博客Techcrunch对此进行了讽刺,认为奥特曼从创始人模式转变为“上帝模式”,尽管他提出了许多AI拯救世界的方法,试图说服怀疑者,但这样的文章反而让人怀疑我们是否陷入了一种自欺欺人的境地。
就在一年前,奥特曼还被媒体誉为“我们时代的奥本海默”,但现在,这位“AI界的奥本海默”也不得不面对一个问题:AI是否正在变得脱离现实,变成了一个炒作的概念?
高盛在最近的一份报告中提出了一个关键问题:尽管美股巨头们已经为AI投入了数百亿美元,未来可能达到数万亿美元,但几乎没有实质性的、可见的成果来证明这些投资是合理的。
Gartner对美国市场的统计显示,在经历了两年的快速增长后,生成式AI的行业使用率仅为5%,除了提高开发人员的工作效率外,没有看到其他明显的效益。人们开始怀疑,这一轮AI热潮可能与之前的区块链、元宇宙一样,只是技术乐观主义者的幻想,并没有实际的价值。
在美国精英对AI的未来感到忧虑的同时,中国河南濮阳的一位普通高中物理老师许一龙,向AI健康助手讯飞晓医提出了他的第一个问题。当他第一次听说这款AI健康助手时,他想到了自己的岳父,一个86岁的老人,肝脏不好,饮食成了一个大问题。许一龙每天都要为如何让老人吃得既营养又不油腻而烦恼。
他向讯飞晓医询问“如何为有基础病的老人规划营养食谱?”这款医疗模型APP并没有直接给出答案,而是像一位严谨的老医生一样,询问了许一龙一系列问题:“年龄、性别、身高、体重、体检报告、健康史、个人史、家族史……”这不是许一龙熟悉的互联网搜索引擎,而更像是一位认真的医生。按照“AI医生”的指示,许一龙上传了所有必要的信息,最终得到了一份为岳父设计的营养食谱,食谱上详细列出了食材类型和精确到克的用量。
许一龙对此感到非常满意。在随后的时间里,他向讯飞晓医提出了更多关于自己和家人健康的问题。一年来,讯飞晓医成为了许一龙的“家庭健康顾问”。依托讯飞星火大模型的技术支持和丰富的医学知识,讯飞晓医能够进行健康自查、报告解读、医疗信息查询、健康档案管理等多种功能,累计下载量突破1500万次,累计咨询人次达到1.1亿。
科大讯飞董事长刘庆峰对公司大模型技术的快速发展感到惊讶。在体验ChatGPT后,他迅速认识到大模型对生产和生活方式的颠覆性影响,并预见到其在企业竞争中的重要性。
刘庆峰迅速做出三个决策:一是集中资源复现OpenAI的智慧涌现;二是实施“1+N”战略,即一个通用大模型加多个领域应用;三是建立科学的评测体系,指导技术发展。这些举措旨在将大模型转化为实际生产力,推动科大讯飞在AI领域的领先地位。
秉承着科大讯飞“技术顶天、应用落地”的战略,他们将大模型命名为“星火”,取自“星星之火,可以燎原”之意,“也是希望大模型能像火焰一样,点亮更多未知领域。”
Part.02模型落地的关键因素是什么?
在探讨AI应用的边界时,我们常回顾西蒙尔·派普特的思想实验。他曾设想,如果一个现代喷气发动机工程师回到200多年前,向马车夫展示喷气发动机,询问这是否对他们有用。马车夫可能会想到将其安装在马车上,以提高速度。但实际上,喷气发动机最终被用于汽车,因为社会需要更高效、成本更低的物流方式。这个实验告诉我们,人们最初的应用想法往往受限于现有的思维模式,而真正的创新应用可能带来更大的价值。这个思想实验在今天依然具有启发性,尤其是当AI大模型技术成为新的“喷气发动机”。2023年6月,奔驰宣布将ChatGPT整合到其车载语音控制系统中,并在美国启动了MBUX智能人机交互系统的测试。与此同时,中国的奇瑞和科大讯飞也在探索“大模型+智能座舱”的合作。
科大讯飞的刘庆峰和奇瑞的尹同跃,两位相识二十多年的企业家,一直在合作推动技术创新。2003年,奇瑞QQ搭载了科大讯飞的“I-say”数码听系统,这款集成了文本朗读和MP3播放功能的汽车,迅速在市场上取得了巨大成功。21年后,奇瑞已经成为《财富》世界500强公司,科大讯飞也成为了市值超千亿的AI龙头企业,双方的合作仍在继续。
去年,奇瑞与科大讯飞合作,将星火大模型首次应用于星途星纪元ES车型,并在第四届中国汽车风云盛典上获得了“最佳轿车”奖项。智能座舱对汽车行业的意义远不止是一个附加技术,它能够为驾驶员提供实时的帮助和解决方案,尤其是对于新手司机和海外司机来说,这种即时的交互和支持显得尤为重要。
人工智能技术的融入,让国产汽车在海外市场的服务体验大幅提升。车载语音系统支持23种主要语言,智能助手实时监控车辆状态,根据路况和车况解答用户问题,如自动驾驶辅助、车灯使用指导和维修保养建议等。
大模型技术的应用不仅提升了汽车的智能化水平,还让汽车成为生活的“第三空间”,提供影音娱乐、生活助手、工作智囊和育儿帮手等多重角色。数据显示,大模型技术使用户与汽车的交互次数显著增加,科大讯飞的星纪元ES车型在智能化方面已领先特斯拉。
大模型技术的影响力不仅限于汽车行业。2024年第三季度,中国市场上大模型相关项目中标数达369个,远超上半年的276个,尤其在能源、金融、教育和互联网行业表现活跃。科大讯飞在大模型市场中标数量和金额上均居首位,成为央国企的首选合作伙伴。
科大讯飞的大模型技术支撑了中国石油、中国移动、华为共建的昆仑大模型,中国海油、中国电信打造的“海能”AI模型,以及中国绿发的泰山大模型等。讯飞星火大模型已覆盖20多个行业300多个场景,包括医疗、教育、政务等民生相关行业,以及“AI for Science”等科研领域。
刘庆峰强调,科大讯飞之所以成为首选,是因为其大模型技术真正落地于实际场景,大幅提升了数据和模型训练的效率,增强了实用性。科大讯飞提供从算力建设、数据处理、模型训练到场景落地、安全保障、运营优化的全套解决方案,拥有提升数据处理和模型训练效率的工具链,以及覆盖300多个行业场景的实际应用案例,形成了规模化效应。同时,科大讯飞还拥有全国产化的算力平台,为大模型技术的发展提供了坚实的基础。
Part.03么样的大模型最适合中国?今年以来,国产AI模型的发展策略明显转变,从对标OpenAI的参数竞赛,转向了更注重产业应用的实际落地。年初时,许多中国大模型厂商曾雄心勃勃地宣称要成为中国的OpenAI,但随后的发展表明,这种“军备竞赛”式的策略并不完全适合中国市场。金沙江创投的朱啸虎在被问及是否会为了人类梦想和科学研究投资时,明确表示,投资应寻找产品与市场的匹配点(PMF),而不是无休止地烧钱。他强调,美国企业之所以敢于投资,是因为它们背后有巨大的市值支撑,而中国企业则需要更加注重商业化和自我造血的能力。
科大讯飞就是一个典型的例子,其“1+N”策略既重视技术开发,也注重应用落地。这种策略使得科大讯飞在2024年第三季度实现了利润的正增长,收入和利润均实现了显著增长。科大讯飞的成功证明了,技术创新和商业化并不是非此即彼的选择,而是可以相互促进的。
中国AI企业的发展现状表明,扎根于丰富的应用场景,实现自我造血,对于大模型创业公司来说至关重要。尽管在资金、算力、技术上可能不如美国,但中国企业可以通过深耕本土市场,发挥产业应用和自我造血的优势,走出一条适合自己的道路。
微软中国CTO韦青的观点也呼应了这一趋势,他认为在当前的AI时代,最不缺的是标准答案,最缺的是基于独立思考得到的适合自己的答案。科大讯飞等中国AI企业给出的答案是:中国大模型不必成为OpenAI,也不必模仿硅谷的游戏规则,而应找到适合自己的发展路径。