作者:王豪 华略智库高级研究员;陆辰佳 华略智库高级研究经理
来源:上海华略智库(ID:HUALUETT)
随着人工智能大模型的浪潮席卷全球,上海,这座璀璨的东方明珠,正从“魔都”向“模都”发起冲击。在这场大模型的科技竞速中,上海凭借其人工智能全产业链布局和创新生态构建,已经展现出非凡的竞争力。那么进入新的发展周期后,上海还面临哪些难题亟待解决?未来还需朝着什么方向发力?一起来看!
全文5349字,阅读约14分钟
无论是7月举世瞩目的2024世界人工智能大会,还是“萝卜快跑”无人驾驶网约车的迅速出圈,亦或是在巴黎奥运会乒乓球、射箭等赛事转播中出现的由商汤科技与上海东方传媒联手打造的“AI解说员”,我们都清楚地感受到,人工智能正以前所未有的速度和深度,渗透到千行百业中。
图:InnoMotion体育赛事AI产品实时呈现射箭赛事关键参数,来源:上海广播电视台
尤其是近两年来随着ChatGPT、Genimi等AI大模型的突飞猛进,整个科技界就像被打上了一剂强心针。这些大模型凭借巨量参数和深度网络结构,在自然语言理解、意图识别、推理、内容生成、通用问题求解等复杂任务中展现出卓越能力,被业界视作通向AGI(通用人工智能)的重要技术路径,并在智能家居、工业制造、医疗健康、金融服务等众多领域得到大规模应用。
毫无疑问,AI大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。
在人工智能领域的群雄逐鹿中,上海作为我国三大国际科技创新中心之一,具有发展颠覆性技术的强大内力,已成为资源汇聚的AI创新高地。当前首轮人工智能“上海方案”重点任务已全部落地,上海形成了从底层芯片到核心算法、从软件模型到智能终端、从基础研究到创新应用的全产业链布局。
如今,面对新一轮“百模大战”,上海正在跑出加速度,力争实现从“魔都”到“模都”的华丽蜕变。
为何是上海
图片来源:新华网
人工智能是上海重点布局的三大先导产业之一,也是中央交给上海的重大战略任务。2018年至2023年,上海人工智能规上企业数量从183家增长至348家,产业规模从1340亿元增长至超3800亿元。得益于在人工智能上率先开展产业化布局和技术积累,上海在大模型新赛道上跑在全国前列,正全面培育开放活跃的产业生态,推动研发到应用的全链路发展。
1.要素发展领先
数据、算力、算法被称为支撑AI大模型的“三驾马车”。在此轮AI大模型较量中,上海在这三者上的投入和建设均处于全国领先地位,可谓是占领发展先机。
在数据方面,上海始终处于全国第一梯队,并取得一系列成果,如上海数据交易所自2021年成立以来,在公共数据开放方面连续5年排名全国第一;2023年,中国大模型语料数据联盟成立并实体化运作、数据交易链正式启用、首批11个上海数据品牌发布等,标志着上海在语料数据建设方面取得显著进展。
在算力方面,据中国信息通信研究院《中国综合算力指数2023年》显示,上海算力综合指数全国排名第三(第一、二分别为广东省、江苏省)、在用算力规模全国排名第一、运力单项指数全国排名第一。上海还集聚了全国最多的智能芯片设计企业,成功实现24款各类智能芯片流片量产,启动运营亚洲最大AI算力中心——商汤科技人工智能计算中心。上海电信万卡集群已投产,将建成大规模智算集群,到2025年,上海市数据中心算力将超18000PFLOPS。
在算法方面,截至2024年6月底,上海大模型企业已达上百家,其中34款大模型已通过国家网信办生成式人工智能服务备案(约占全国1/5)。如复旦大学的MOSS是百模大战时期国内发布的首个类ChatGPT模型;上海大模型创业企业在国内外产品市场和资本市场赢得广泛青睐,截至2024年5月,上海Minimax成为国内估值最高的生成式AI独角兽之一。
表:上海AI大模型代表产品
图:全球生成式AI独角兽估值(亿美元),来源:硅谷科技评论数据库
2.产业生态共赢
栽好梧桐树,引得凤来栖。目前,上海已初步形成西有徐汇“模速空间”、东有浦东“模力社区”的大模型产业空间布局,积极打造高密度产业创新“苗圃”,以期吸引更多优质企业加速集聚。
2023世界人工智能大会闭幕不久,上海“模速空间”创新生态社区在徐汇西岸正式揭牌成立。作为全国首个大模型创新生态社区,“模速空间”集聚了大模型产业链底层技术、应用研发、场景设计、算力支持、产品营销等各环节的创新企业,并在算力调度、开放数据、评测服务、金融服务、综合服务等方面为AI企业全方位赋能。此外,“模速空间”还为初创企业提供“算力券”支持,有效降低了企业大模型训练门槛,促进大模型在金融、教育、医疗、制造等领域的垂直应用。“模速空间”自运营以来,已成功吸引80多家大模型企业入驻,其中超80%是垂类领域的应用企业。
而在2024世界人工智能大会的浦东新区人工智能产业生态推介会上,浦东张江“模力社区”正式启用。“模力社区”是浦东重点打造的聚焦垂类模型应用的大模型产业生态集聚区,以张江科学之门为核心,建设算力、语料、算法调用等功能支撑平台,向入驻企业提供强有力的技术支撑,并以张江科学城作为超级场景,推动垂类模型赋能具身智能、生命科学、智能生产、科技金融、科学研究、生活文娱、城市管理等浦东优势场景应用。目前,“模力社区”已集聚大模型上下游生态企业超30家。
图片来源:上海经信委
浦东张江与徐汇西岸东西呼应、隔江相望,形成错位发展的大模型产业空间布局。这表明,上海在加快培育发展以大模型为代表的新质生产力上,勇争先、走在前,以前瞻性的眼光谋划布局大模型产业应用端,并取得了一定先发优势。
图片来源:张江发布
3.超大城市优势
大模型创新发展的重点不仅在于“三驾马车”的拉动力、创新生态的构建力,还在于行业示范应用。作为我国少数几个超大城市之一,上海拥有丰富多元的应用场景,智慧城市、教育、医疗、文旅、工业、金融等领域皆可与AI大模型开展强强联合式的深度应用。同时,上海是国企、民企、外企分布最均衡的超大城市,三类企业在AI大模型发展中各展所长,多元化的企业环境可激发创新火花,带来多样化解决方案。更为重要的是,上海的高校、科研机构密集度仅次于北京,AI产业人才数约占全国1/3,可为大模型发展源源不断输送顶尖智力资源。
图片来源:乐游上海
纵有以上天然优势,上海要实现创新引领,依然需要为创新落地提供独特的应用场景支持。自2019年起,上海坚持发布AI重大应用场景,如张江人工智能岛、临港数字孪生城等,并围绕智能网联汽车、医疗影像辅助诊断、视觉图像身份识别、智能传感器等国家级赛道开展“揭榜挂帅”。这些顶级场景的发布,不仅为上海带来了全球最尖端的AI创新产品和解决方案,还加速大模型落地和商业化进程。
直面共性难题
上海AI大模型整体呈蓬勃发展之势,在技术创新和市场拓展等方面取得了显著进展,但仍面临一系列客观制约因素和行业共性难题。
1.算力成本居高不下筑成牢固的“行业门槛”
AI大模型的训练速度、产出质量均与算力直接相关,目前主要以英伟达的A100、H100等高性能GPU为大模型训练提供算力支撑。以ChatGPT为例,微软Azure云服务为其提供了一万枚英伟达A100 GPU,这也正是业内技术人士达成共识的研发门槛。然而,由于英伟达A100及以上的高性能GPU被列入管制清单,国内大模型企业不得不以英伟达A800 GPU等作为替代品,即便如此仍旧存在缺货和溢价情况。
同时,国产GPU还存在技术水平差距(华为昇腾910的制程为7纳米,国际水平能达4纳米)、价格高于同等性能的进口产品、产量无法满足国内需求等问题。更为严峻的是,企业若想留在赛道内,必须持续“烧钱”以提升大模型参数和训练量(据传OpenAI GPT-5大约投入5万张H100 GPU,参数量预计达到10万亿级别)。这种巨量投资对于多数初创企业而言是难以承担的,且即便公司愿意大量投资,一旦竞争对手先行提供开源服务,那么企业投资可能因技术落后而造成巨大损失。
因此,在多因素叠加的影响下,上海AI大模型企业仅凭现有融资支持和业务收入,难以独立承担日益增加的大模型研发和运营成本,部分企业或将面临业务调整乃至关闭的风险。
图:pixapay
2.用于模型训练的高质量数据集“供不应求”
AI大模型在前期训练和后期调优都依赖海量数据支撑,因此数据质量直接决定大模型的“聪明”程度。目前,AI大模型数据主要来自互联网、电商、社交、搜索等渠道,但通常存在数据体量不足、类型不全面、信息可信度不高、数据源调用有限等问题,导致目前市场上的高质量行业公开数据供应存在严重缺口。
高质量且具有行业特性的数据集不足会导致很多大模型企业不得不使用相同的开源数据集进行模型训练,限制了企业开发符合行业特定需求的垂类大模型的能力,不仅影响模型实际应用效果,也降低了模型的开发速度。
3.现阶段大模型应用层面易陷入“内卷陷阱”
当前,由于国内B端用户对大模型在具体业务赋能上的认知不足,且在实际应用中对模型性能要求不高,这导致大模型服务商之间的竞争主要集中在降低人工成本和提升服务水平层面。因此,大模型服务商往往倾向于采用更通用或已有的解决方案来适应不同行业的需求,工作导向转变为以最低成本和最快速度满足客户开发垂类大模型的需求,而非针对特定行业或企业定制或者优化模型性能。
如商汤科技、云从科技等上海大模型企业虽然在技术研发方面具有较强实力,但在人力成本管理、企业服务等方面不及具有国企背景的头部企业(后者在人均用工成本控制以及获得央国企的B端订单方面具有显著优势),导致这些技术驱动型企业在激烈的市场竞争中处于劣势地位。
这种现象使得行业发展趋向于表层化竞争,既不利于企业在技术层面的提升,也未能充分挖掘大模型商业化潜能(市场仍旧缺少大模型现象级应用)。
4.二级市场对大模型行业的支撑“力不从心”
美国大模型企业能通过微软、谷歌等科技巨头的投融资获得大量研发资金,而科技巨头通过投资前沿技术项目能取得显著的市值回报,相当于美国的投资者和金融机构间接支持了大模型企业研发。相较之下,中国的二级市场在资本流动性、散户对高科技行业认知度、长期投资意愿等方面尚不如美国市场成熟。如我国阿里、腾讯等科技巨头虽然也投资大模型企业,但并没有在股价上取得相应回报,若这一现象持续存在,可能会对大模型投融资环境产生负面影响。
因此,上海大模型企业在面对国内偏保守的投资环境时,可能会遇到资金筹集上的诸多困难,对其技术研发和市场推广等方面形成制约。
何以成为“模都”
在人工智能等新兴产业领域的产业研究中,笔者通过与上海AI大模型企业、研发机构的深入调研和交流,深刻感受到AI大模型已成为上海建设全球科创中心版图中一颗冉冉升起的新星,然而面对行业共性难题,上海有责任也有能力作为“探路者”破冰开路,在“模都”之战中保持引领地位。
图:pixapay
1.提升关键要素供给,推动“三驾马车”齐头并进
在算力方面,加速打造市级智能算力统筹调度平台并支持市区两级政府相关部门与顶尖云厂商合作,提升全市算力资源统筹供给能力,探索提供多元化优质普惠算力,降低企业、研究机构等对高算力的获取门槛;支持集成电路企业加速高性能芯片研发与创新,特别是在高算力GPU与AI专用芯片方面缩小与国际先进水平的技术差距;支持下一代高性能液冷服务器及机柜、高性能总线互连、全带宽交换技术研发,改善智能算力集群的运行效率和性能。
在算法方面,通过联合各类金融机构开发大模型产业专项贷等方式,支持上海大模型企业对标国际先进水准,研发十万亿级参数量的语言大模型和千亿级参数量的视觉、多模态、具身智能类大模型,加大对大模型高效并行训练、模型压缩、模型加速等关键技术的研发力度。
在数据方面,由市相关部门牵头制定数据采集、处理、存储、交易、共享等标准化流程,构建安全合规的开放基础训练数据集,优化公共部门数据开放和共享机制;打造生物医药、集成电路、高端装备等重点产业高质量数据集,赋能垂类大模型开发;推动上海大模型语料数据联盟、上海数据交易所等平台合规化、透明化运作,提升企业、研发机构等对数据平台信任度,拓展更广泛的行业合作。
2.激活企业创新动能,开展“育苗扶壮”分类培育
针对通用大模型企业,鼓励企业与高校、科研机构合作解决技术难题,探索以里程碑式奖励制度对企业取得的技术突破或重大成果予以专项支持。
针对垂类大模型企业,推动大模型创新应用平台建设,促进大模型企业与生物医药、科技金融、自动驾驶等领域深度融合,建立相对权威的垂类大模型专业能力和安全性评测标准,引导大模型开发商针对性提升模型质量。
针对AI Agent类企业,鼓励各类创新主体通过揭榜挂帅、案例征集、搭建供需对接平台等形式,开放场景合作机会,促使AI Agent类企业针对特定需求开发创新应用,集中资源加速打造更多高价值的创新应用。
3.力推资本赋能产业,引流“金融活水”润泽生态
一方面,利用上海人工智能产业基金千亿级规模优势,加大对海内外优质AI大模型企业、项目、团队等招商引资力度;通过提供匹配资金、风险补偿等措施,引导社会资本流向AI大模型产业。
另一方面,由市区相关部门牵头举办AI大模型投资者大会、技术交流会等行业盛会,为投资者和企业提供交流互动平台,展示AI大模型产业应用的商业潜力,同时增加投资透明度,促成投资者与企业的深度合作。
作为发展新质生产力的重要引擎和引领未来的战略性技术,人工智能尤其是AI大模型成为大城竞争的“兵家必争之地”。我们期待上海对“年轻产业”施展“魔力”,构筑更加开放、创新、活力的人工智能产业生态,代表国家赢取全球科技战略竞争主动权!