独家对话阿里云刘伟光:什么是真正的AI云

钛媒体APP 2025-01-09 15:58:34

过去一年,云计算行业“内卷式”竞争的趋势渐消,但如何在生成式AI浪潮中蹚出一条云计算新路,没有什么标准答案能参考,无论是海外的还是国内的云服务商,都在一边实践一边验证。

阿里云也不例外。阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“如果我不自己在一线去感受客户的需求,我没有办法或者没有信心去设计出面向未来几年的战略方向。”

他的解决方法很简单,也很有效。过去一年,他的日程表记录下了至少162家客户的走访日程——这还不是全部。来自一线的AI应用需求千差万别,最终如何沉淀为公共云平台的能力,这是刘伟光和阿里云公共云团队面临的挑战。

在革命性技术发展的早期,需求是广泛发散再到不断收敛的过程,现阶段的AI需求已经能够凝练出一些共性。

基础大模型的先行者还在持续地训练大模型,垂直化应用公司开始深度使用大模型,一些传统公司探索用大模型进行业务的创新和提效。一个更值得关注的趋势是,越来越多企业不仅是使用简单调用大模型,而是在原有应用中大量嵌入AI Agent,甚至在原有应用之外开发AI原生应用。

这些企业的需求集体推动了AI云的进化。如果说自2006年,云计算开创了一个时代,让更多中小企业上云、节省成本和降低门槛,初步成为企业的数字化生产力工具。

那么,AI和云的结合,将云计算产业送入一个至关重要的节点,未来所有基础设施的能力都会被AI所冲击。被冲击的过程就是云计算能力的完全迭代升级甚至重构的过程,AI云时代已经到来。

如同传统IT时代的IOE(IBM的小型机、Oracle数据库、EMC存储设备),作为上一个计算纪元的代表产物,它们缔造了通用算力的基础设施底座;AI云则是典型的智能算力的基础设施底座,大语言模型从诞生的第一天起,就生长在云上、成长在云上。

这一阶段的云服务的重要标志是——不论主动还是被动,企业拥抱云不是单纯的IaaS(Infrastructure as a Service,基础设施即服务)资源需求,而是IaaS、PaaS(Platform as a Service, 平台即服务)、大语言模型、AI应用等全栈能力,这个垂直技术栈的最佳承载毫无疑问便是云计算。

而对于云计算的最终使用者——企业而言,如何基于大模型形成智能时代的生产关系、发挥AI真正的价值成为一道必答题。

刘伟光在走访162家客户后,感知到越来越多的传统企业级市场客户、外资企业及跨国公司(MNC)不仅将资源迁移到云端,更是将业务系统全面云化,涵盖网络、存储、大数据、数据库等IaaS+PaaS一体化的全栈服务。

他给出了旗帜鲜明的观点:“只有具备IaaS+PaaS一体化能力的云,才能被称为真正的云。这是我今天对‘云’的定义。同样地,在AI时代不创造社会价值的大模型,很难称之为大模型。”

关于上述问题,在钛媒体《AI云年度10问》栏目中,钛媒体集团联合创始人、联席CEO、ITValue发起理事刘湘明与阿里云智能集团资深副总裁、公共云事业部总裁刘伟光,以及阿里云智能集团副总裁、公共云首席解决方案架构师韩鸿源,展开了一次对AI云的深度剖析。

以下为对话实录,经钛媒体编辑整理。

右一为阿里云智能集团资深副总裁、公共云事业部总裁刘伟光;左一为钛媒体集团联合创始人、联席CEO刘湘明

只有具备IaaS+PaaS一体化能力的云,才是真正的云

刘湘明:阿里云公共云事业部是去年11月底成立的,这一年以来作为公共云事业部总裁,你有什么感受?

刘伟光:我的第一感受是“希望”。无论是内部产品研发的进展、AI能力的提升,还是大语言模型的日益精进,以及各行各业客户在探索云和AI结合方面的实践,都让我对未来充满信心——不仅是未来一年,甚至是接下来的5到10年。

今天,许多客户不仅将云计算视为资源,更将其当成数字化转型的关键工具;同时,他们也不仅仅把AI看作创新手段,而是当作推动产业升级、面向未来的战略性武器。因此,我看到了非常大的希望。

刘湘明:AI可能是下一次“蒸汽机出现”的时刻,你提的“希望”我也特别认同。最近IDC发布《中国公有云服务市场(2024上半年)跟踪》,显示IaaS+PaaS市场同比增长12.2%,对比之前的增速,可以说中国公有云市场开始回暖了。其中 PaaS同比增长达21.9%,表现更突出一些,这里面阿里云依然保持市场领先和稳定的提升。背后的原因有哪些?

刘伟光:从内因来讲,阿里云一直在践行推动IaaS+PaaS一体化,而不仅仅把云当成资源来进行售卖。我们希望客户能大规模采用我们PaaS层的产品,尤其像数据库、大数据、容器化、Serverless、开发运维工具等产品。PaaS层的能力和数据能力对企业业务有非常直接的支撑作用,甚至可以直接推动业务。当PaaS的产品与客户业务百分百结合在一起,才能真正激发生产力。

许多传统企业级客户、外资企业及跨国企业(MNC),已经把IaaS+PaaS全栈搬上云去。因为他们认为全栈上云节省了采购、时间、创新成本,还缩短了创新的时间。

从外因角度看,这一年我拜访了非常多客户,发现他们对云的认知跟过去有了很大不同。很多客户认识到云不仅仅是服务器资源,更提供丰富的数字化能力。比如,开源软件发展速度远超商业化软件,在云上选择各种具备不同技术能力且开源的组件,是最好的选择。

如果客户自行开发软件、产品,所花费的人力成本、研发成本、服务器成本、创新成本、试错成本都非常高。相比之下,云计算提供的开箱即用的PaaS化能力,可以直接助力客户业务创新迭代。

越来越多的客户意识到,IaaS+PaaS一体化才是充分利用云、用云来实现业务的迭代创新、帮助业务实现直接的增长的最好选择。

阿里云服务了小红书、喜马拉雅、得物这种大型互联网企业,他们通过阿里云的大数据产品,不仅激发了数据价值,更实现了对搜索、推荐、广告等业务价值的直接提升。

2024年,小红书宣布成功迁移500PB数据湖至阿里云

最近,我跟很多同事讲,没有PaaS的云,很难称之为云,只有具备IaaS+PaaS一体化能力的云,才是真正的云。

刘湘明:可能十年前,大家经常问的问题是“为什么要上云”,处于摇摆状态。但当AI出现之后,大家发现需要的能力在本地再也无法获得了,一定要在云上获得。

刘伟光:非常对。我这一年遇到的企业几乎没有不谈AI的。这里面有一个重要的契机——企业大模型应用必须要跟数据结合,这就绕不过PaaS层的大数据、数据库产品。没有过去这么多年云计算规模化地从底层算力到网络、存储、大数据的积累,就不会有今天的大模型,它不可能在空中楼阁上建立起来。这也推动了很多客户重新审视云计算中IaaS、PaaS、SaaS的意义。

刘湘明:从资源池到技术栈,企业的用云深度在不断加强,从自研、自建向直接选择PaaS层产品,从简单的资源租赁到全栈上云,有哪些原因或者业务价值推动这种转变?

刘伟光:从外部市场看,云上的技术优势非常明显,所有的先进技术都优先诞生在云上。企业会优先选择先进的技术栈,而先进的技术栈只有云上有。

从云计算从业者角度看,我们要满足不同类型的客户需求,就必须把能力做“厚”——不仅是满足资源层面需求,还要做好容器化往上的所有PaaS层。

这里面还有一个与时俱进的点:云计算把所有客户聚集在云上,跟IOE时代把客户、技术散落在无数点上,是两种不同的技术主张。过去没有规模化的时候,只能看单点需求;在云上,当规模化的客户每天调用大模型时,大模型对网络、存储、弹性计算等都有着非常大的推动作用。因此,今天云必须要为AI改变、适配、升级原有的技术能力,才能满足今天AI使用者的需求。

没有商业价值和社会价值的大模型,很难称之为大模型

刘湘明:你出差很多,可能是国内见客户最多的人之一,对客户的痛点、需求应该也有很明显的体感。有没有统计过这一年大概见了多少客户?他们有什么痛点和需求?

刘伟光:从公共云事业部成立到今天为止,我大概拜访过162个客户,走遍大江南北,看千行百业。如果不去一线感受不同行业和地域的客户需求,就没有办法判断在下一个财年我们如何设计更好的战略,支撑好市场。

大家对AI的需求千差万别,有做基础大模型的先行者还在持续训练大模型,有做垂直化应用的公司在深度使用大模型,还有一些传统行业的公司用大模型进行业务创新和提效……他们不仅是简单调用,还会在原有应用中大量嵌入AI Agent(智能体),还有很多客户在原有的应用之外去开发AI原生的应用,不仅在手机端,还有PC端的企业应用。

我认为,未来整个市场对于大语言模型的使用,无论是从模型调用还是开发自己的模型,一定不仅仅局限在手机APP上。未来会有更多应用来自于企业应用。这些企业的应用如果站在大语言模型的肩膀上,其实真正释放的是商业价值,是社会价值。

阿里云服务了很多To B企业、创造商业价值。比如在中华财险,他们通过阿里云通义千问,输入目标客户各类情况的提示词,就可以自动生成一份定制化团险保单。如果不完整可以再次对话,大模型会继续设计。整个项目耗时只有人工的1‰或者1‱。最后如果成交就会创造商业价值。

2024年中华财险宣布新一代分布式核心系统全面上线,图为中华财险与阿里云的签约仪式

在快递领域,中国快递行业发展迅速,效率高、人员多、数据多且迭代快、场景多,大模型应用就非常有效果。申通快递和阿里云经过多次碰撞、验证场景之后,一起实现了大模型应用在网点经营分析、客服摘要、客服质检、地址校验等多个物流场景的落地,实现客服违规率下降50%,信息处理率提升60%。

一家国内领先的蓝领招聘企业利用Qwen-Plus整理本地公众号、微信群中的零散用工信息,降低了80%运营人力成本;使用模型检测潜在的用工歧视、跨国用工等风险信息,大幅提升平台合规能力。此外,人岗匹配、搜索推荐、客服质检等场景灰度上线中。

此外,中国的跨境电商非常发达,一家垂类的电商企业,面对大量细分品类和近百万SKU的日常上架及运营工作,通过通义大模型,进行商品关键词生成、标题提炼、商品描述,并辅助进行商品上架前的违规检测,可以高质量完成海量商品上线,提升商品上架效率。

还有,基于通义打造的智能招投标信息服务平台,利用大模型的自然语言理解和推理能力,通过Prompt工程识别项目名称和公告名称中的关键信息,进行关联概率计算,向最终用户提供与项目关联的所有公告信息的搜索查询服务。

尽管我们看到很多实实在在的效率提升成果,但从市场整体来看还是沧海一粟。未来中国在大语言模型发展和场景应用上会迎来快速普及,我对未来充满信心。因为越是人多,数据多、流程复杂、场景复杂的业务,大模型起到的效果就越明显。

我们明年有个目标,希望阿里云提供的推理资源能服务中国90%的AI agent、90%的AI原生应用。如果说没有PaaS的云今天不能称为云,那么大模型不能创造社会价值和商业价值也是没有意义的,所以我们朝着创造价值的方向来做。

刘湘明:AI在To B的价值要实现,意味着AI应用和服务一定要无缝嵌入现有数据流和工作流,真正进入生产环境才能发挥价值,有哪些挑战?

刘伟光:第一个难点是大家都知道AI重要,但是不知道如何下手,不知道大模型应该跟企业的哪一个场景、哪一类数据结合才能最快出效果。

第二个难点是人才。在实现AI最后一公里建设的时候,在开源模型和推理资源基础上构建专属模型、AI应用、AI Agent等等工作是需要客户自己来做,别人无法代劳。它是好几件事情的组合:第一是AI应用开发的范式;第二是这个范式之下所有要用到的AI工具链;第三是选择基础大模型;第四是合理选择底层的推理资源。这四件事组合在一起才是开发一个AI agent或者AI应用的充分且必要条件。

挑战存在于方方面面,但同时我也看到很多客户有独立的AI规划、AI预算,AI人才、AI办公室……这是非常好的现象。因为只有真正把AI做成一个企业的一把手工程、企业级战略项目,才有可能把AI真正跟企业完整融合在一起。

AI云,一个充满想象力的新时代

刘湘明:现在人们对于AI基础设施创新的关注度,远不及对大模型和生成式AI服务的关注,你怎么看?

刘伟光:关注大语言模型或者AI对基础设施的演变的,是非常小的一个客户群体,比如这个领域专业的工作者、观察者,或者是基础大模型的研发者。

更多人会关注AI应用,这很正常。就像人们戴个AI眼镜,关注的是它能实现什么功能,能翻译吗?能对话吗?而不会关注背后是用什么技术来实现的。但支撑这些AI应用创新的核心竞争力的基础设施技术是非常重要的,就像我们打开水龙头,不会关心它从哪个水厂流出来,但那个水厂的设备应该是最先进的。所以,当AI能力越来越强,提示词工程产生的效果越来越好、反应越来越快、对话越来越流畅的时候,实际上是因为背后的基础设施能力非常强,这两者是相辅相成的。

刘湘明:我们正站在一个拐点上,展望2025年,AI与云计算的结合将开启一个充满想象力的新时代,你预判未来的增长机会将发生在哪里?企业需要做好哪些准备?

刘伟光:我的想象力是无穷的,这来自于我的客户,我拜访了这么多客户,看到他们对AI未来发展感到兴奋。

AI和云的结合是云二次腾飞的关键。从云计算提出来到今天将近20年时间,是让全世界各种企业认识到云是先进技术的聚集地,云是让更多中小企业上云,能节省成本。同时能够把云不仅是资源,还是数字化生产力工具。

未来的所有基础设施的能力都会被AI冲击,这个过程就是能力的完全迭代、升级甚至重构,这是一个AI云的时代。我相信未来各行各业都会不断拥抱AI,基于大语言模型去构建的AI应用、AI agent会层出不穷,甚至可能会有专门的AI agent store,这会产生一个全新的世界。越来越多的客户正加速拥抱云的进程,而且这次拥抱云不是简简单单是对IaaS的拥抱,而是包含IaaS、PaaS、AI资源、大语言模型、AI应用、AI agent……是真正更加广义的全栈。

对于企业来讲,要进行更细分的资源规划,从AI的顶层设计,到IT层面的AI人才、AI资源,包括AI开发工具,都要进行全方位考量。今天所有企业都要为AI重新准备一套数字化工具或者AI工具链,这是企业应该做好的事情。

我非常相信中国在拥抱AI这件事情上,不会比其他国家慢。中国的创新能力将在AI应用时代爆发,这也是我所说的“希望”所在。

大语言模型应在适合的场景发挥效果,而非泛化到解决一切问题

右一为阿里云智能集团副总裁、公共云首席解决方案架构师韩鸿源;左一为钛媒体集团联合创始人、联席CEO刘湘明

刘湘明:在2024年与企业的交流中,你看到高频的问题或者关注点有哪些变化?这些高频词汇反映了企业在AI与云计算结合的新时代下,需求产生了什么变化?

韩鸿源:大语言模型的效果,还是要停留在其本身适合发挥的场景里讨论,而不是泛化到一个解决一切问题的大模型。今天我们在做的所有事情,还是希望大语言模型能够在业务里面发挥其支撑作用。

比如AI辅助写代码,这是所有大语言模型应用领域里面,经过了最充分的验证、最能体现出直接效果的场景。通过调研大互联网公司,我们看到绝大部分领先企业,已经有20%甚至30%的代码使用了AI辅助生成。通义灵码已经得到了比较广泛的应用。

有些大型企业客户会采购上万个座席的通义灵码使用权,小一些的企业可能采购几千个座席,这种情况现在已经非常常见。当客户使用了这个工具之后,他会持续使用下去,会提出更多的需求,迭代之后也会逐步发挥更大的作用。

另外我们看到,除了大语言模型本身的变化外,它还推动了底层基础设施的演进。许多客户开始更多地利用GPU资源进行业务创新,例如在搜索和推荐系统中引入GPU以提升性能。

企业落地生成式AI的普遍难点和解决方案

刘湘明:生成式AI在企业落地的环境准备、模型就绪、应用工程三个阶段中,企业普遍遇到了哪些难点?阿里云提供了哪些解决思路和方法?

韩鸿源:我从上往下说,先从应用工程开始,在选择合适的AI应用场景时,我们看到两个典型的做法。

一是构建全新的应用和业务系统时,希望引入AI或以AI为主构建。这种情况我们充分地分析能力,寻找适合的应用场景,并经过验证逐步迭代,最终使系统趋于完善。这种做法包袱比较小,见效快,但对现有业务的影响有限,依赖于新场景的需求。

另外一个是在既有应用里引入AI以提升效率。这是我们比较看好的方向。企业内部已有大量数字化系统支撑业务运转,这些系统在构建时AI尚未成熟,因此存在许多可以优化的点。例如,许多业务流程依赖文字处理,涉及大量重复性工作。如果引入机器语言理解技术,将大幅提升效率。

从全球化范围看,Salesforce等领先公司已经展示了这种潜力,将其Agentforce平台视为未来的增长点。

然而,这种潜力的释放的前置条件是:流程会被使用足够多的次数,否则改造成本有可能支持不了业务回报。

回到环境准备和模型就绪阶段,选择合适的模型及其运行方式至关重要。尤其在国内严格的合规要求下,通义提供了一个可靠的选择,它不仅在国内广泛使用,在海外也是最受欢迎的开源模型之一。

下一步是决定如何支持模型运行。最简单的方式是调用现成的模型服务。模型服务已成为云计算不可或缺的能力。用户可以选择直接使用模型的服务能力,或者根据特殊需求定制模型。

当模型规模化使用时,优化其运行环境变得非常关键。它直接涉及成本和生命周期管理,能否以低成本让客户持续有效地使用模型,发挥其最大价值,是一个重要挑战。

云为整个模型使用全生命周期提供了一个非常好的条件。不管是从用户的选择角度还是灵活性上,都提供了非常多可能性。

企业的AI应用部署范式

刘湘明:你觉得对于不同能力的企业,未来在模型的应用部署方式上面,他们的选择会有什么不同?

韩鸿源:如果想以最快的方式开展应用开发,模型服务可能是一个入手最简单的方式,而且这些模型本身经过的验证也比较多。

如果企业还是想要保留一部分知识产权,就会选择另外一条路:使用一些模型做调整,或者在不做调整的情况下,自己把推理设施建起来,最后调用这些模型服务,实现相对偏私有域的应用的使用方式,也是完全合理的需求。

通义千问会继续保持开源开放,客户完全可以选择自己搭建推理平台,把模型的调用变成自己内部的事情,不让别人介入到自己的模型调用过程中。

语言交互的推理有波峰波谷的效应,云提供了一个比较好的选择,大家在云上使用云的全球基础设施,也可以保持自己运行的相对独立性的情况下,保有自己的一些保密和隐私。

面向推理和多模态数据处理趋势

刘湘明:推理也是今年特别热的词。推理市场的繁荣将对于企业使用公共云有哪些影响?又对公共云提出了哪些新的要求?深度用云的企业有哪些关注点?

韩鸿源:我觉得其实训练是更吸引眼球的,但一个模型的训练过程不直接产生任何实际价值,模型真正要发挥作用是在推理阶段。训练投入会继续增长,但模型要重复使用才能释放价值,所以,未来推理投入占比可能会远远高于训练。

今天云上所有模型API服务本身就是一个推理,是包装一层API之后被用户去用,通义大模型本身会使用很大的推理资源来响应客户的需求。另一种,是客户不想用现成的API方式使用模型,选择自己去做推理。

通义系列模型在对外服务过程中积累了丰富的推理技术优化经验,使用户能够直接享受这些技术带来的红利。比如,阿里云会提供通义模型服务、会提供百炼上调整模型的方式和使用模型的方式,包括工具链,同时也会提供PAI平台去做更底层的能力承载,用户可以基于这些做相对更自由一些探索。最终,我们是希望能够去满足用户的全方位的需求。

刘湘明 :“多模态数据”也是今年的一大热词。您如何看待多模态数据处理的需求和发展趋势?在这个大趋势下,阿里云在多模态数据的统一存储、检索和管理方面有哪些优势?

韩鸿源:一方面模型提取非结构化数据的结构化信息能力在提升,视觉语言模型具备了自动化的信息提取的能力,可以更好地理解这些多模态数据,让以前无法有效使用的数据充分发挥作用。

另一方面,Agent和这些数据探索能力的结合蕴藏着巨大的潜力。以前,人们收集到的结构化和半结构化的数据需靠人去理解、探索,很多时候无法充分挖掘出数据的潜力。今天AI提供了自动化处理能力,结合大数据让AI探索数据会成为一个非常有潜力的发展方向。

对云计算而言,除了提供基础的资源供应,上层软件能力会变得越来越重要。

例如,将多模态数据管理能力被集中整合到特定产品中,实现对多种类型数据的统一管理。在RAG(检索增强)过程中,这些数据可以在模态之间无缝切换和使用,大大简化了客户的操作复杂度和数据管理难度,从而更顺畅地运行其业务流程。(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

0 阅读:3

钛媒体APP

简介:中国财经科技信息服务提供商。