随着大模型的火爆,有人说OpenAI和微软夺走了亚马逊云科技十多年积累的市场领导地位,而从2024 re:Invent现场的火爆和亚马逊云科技展示的硬核家底来看,处处都在彰显亚马逊云科技王者归来的底气。
今年,将近六万人亲临现场,还有四十万人在线参与。亚马逊云科技准备了1900场会议,几乎有3500名演讲者与大家互动。从基础设施到顶层应用,亚马逊云科技目不暇接的技术发布,让人不禁感叹:那个云计算的标杆如今又屹立在GenAI的赛道上。
继Peter DeSantis详细分享了亚马逊云科技从芯片到数据中心的创新之后,亚马逊云科技CEO Matt Garman继续围绕亚马逊云科技在云计算核心领域计算、存储、数据、模型推理的重大创新,以及生成式AI应用构建服务Amazon Bedrock、AI助手Amazon Q的重大发布。
“云计算教父”亚马逊CEO Andy Jassy再次现身re:Invent,伴随着欢呼声, Amazon Nova高调亮相,六大基础模型加上未来前沿方向,主打高智能、高性价比和多模态。
亚马逊云科技AI与数据副总裁Dr.Swami聚焦在Amazon SageMaker AI的品牌升级以及Amazon Bedrock的全面更新,包括Amazon Bedrock Marketplace的发布,都在证明亚马逊云科技加速GenAI 的落地的应用步伐。
从芯片到数据中心:全栈系统性创新
无论是大模型训练还是推理,都离不开强大的基础设施支持。这与云计算一脉相承,全方位的计算力服务能力是云厂商竞争力的基石。基础设施的使用效率,都会影响到云服务商的创新能力,云厂商在基础设施规模上的优势,使得他们可以有足够能力根据业务需求定制和优化自己的产品。
而在大模型时代,生成高质量的合成文本、图像和其他媒体内容需要庞大的数据集,处理数据集的模型在训练过程中通常涉及数十亿个参数,处理这些参数往往需要具备高性价比的:
加速计算能力(包括最新的GPU和专用ML芯片),以驱动大规模的生成式AI工作负载。高性能、低延迟的云存储,旨在保持加速器的高利用率。最具性能和最先进的技术、网络和系统,以支持生成式AI工作负载的基础设施。能够利用云服务进行构建,这些服务能够在生成式AI应用程序、工具和基础设施之间实现无缝集成。所以说,AI时代的基础架构比云计算时代更复杂, AI工作负载需要Scale-up的服务器支持更大的模型,同时还要优化Scale-out工具,当然还要面临构建AI网络的挑战。
这也意味着,AI时代比云计算时代更需要从芯片到数据中心的系统性创新。但这对于亚马逊云科技来说,这都不是问题,长久以来在基础设施的创新积累优势开始释放, 如定制芯片、Amazon Nitro System系统和数据库技术,在技术栈上的创新为客户创造了差异化的产品价值。
在Peter DeSantis发布在计算、网络、数据中心等领域的新产品后,亚马逊云科技CEO Matt Garman继续亮出AI基础设施全家福,计算、存储、数据库,几大版块都迎来一大波重要更新。
计算单元:发布基于英伟达的Blackwell芯片P6系列实例、P6实例将比当前GPU快2.5倍,并将广泛使用。
正式推出Amazon EC2 Trn2实例,相较GPU实例,Trn2实例的性价比高出30%至40%。Trn2实例集成16个Trainium2芯片,由高带宽低延迟的NeuronLink技术实现互连。单节点提供20.8 pFLOPS FP8算力,专为生成式AI训练和推理而构建。
存储单元:发布专为Iceberg设计的全新型存储Amazon S3 Tables,可提高所有Iceberg表的性能和可扩展性。针对存储在S3中的Parquet文件类型,可获得3倍的查询性能及每秒事务量10倍提升。
当达到PB或EB级别存储规模时,元数据(Metadata)就变得非常重要。亚马逊云科技正式发布Amazon S3 Metadata服务,可自动从对象中提取元数据,并近实时地将其存储在新的S3 Tables桶中(Iceberg表),以支持后续使用分析工具进行元数据查询。
数据库单元:发布Amazon Aurora DSQL,具有免运维体验的分布式SQL数据库,可在全球范围内实现跨区域部署,并无限扩展,是迄今为止最快的全球化部署的分布式SQL数据库。
而针对NoSQL数据库,发布了Amazon DynamoDB global tables的多区域强一致性功能,无论客户需要SQL还是NoSQL,亚马逊云科技都可以满足。
这里要特别说明的是,Matt宣布将在2025年推出Trainium3芯片,也是亚马逊云科技基于3纳米先进工艺制造的首款芯片,也继续证明长期在计算、存储、网络、数据库等不同领域的投入和创新从不动摇,以满足客户对弹性、安全、性能、成本、可靠性和可持续性的追求。这也是亚马逊云科技的价值主张。
从Amazon Nova到Amazon Bedrock:
选择权大于一切!
亚马逊CEO Andy Jassy的出场以及Amazon Nova无疑成为今年大会的一大热点,发布的Amazon Nova基础模型共包括四大模型:可用于简单任务的超高性价比文字处理Amazon Nova Micro模型;三种多模态模型——低成本的Amazon Nova Lite模型;兼具准确性、速度和成本的Amazon Nova Pro模型;用于复杂的推理任务同时也可进行蒸馏定制的Amazon Nova Premier模型。
Nova模型支持微调(Fine-tuning),蒸馏(Distillation)训练更小的模型。Nova模型与Amazon Bedrock知识库深度集成,可用于RAG,以根据自己的数据生成响应。
此外,亚马逊云科技还发布图像生成模型Amazon Nova Canvas和视频生成模型 Amazon Nova Reel。Andy Jassy介绍,明年亚马逊云科技将发布语音到语音的Amazon Nova Speech-to-Speech和多模态输入到多模态输出的前沿模型Amazon Nova Any-to-Any模型。
不仅如此,在周三的主题演讲中,Dr.Swami继续发布新的AI模型poolside Assistant、stability.ai 最新的文本转型图像的模型与视频生成模型Stable Diffusion 3.5和Luma AI将登录Amazon Bedrock。
面对这么多模型和选择,必须展开说说Amazon Bedrock的更新。Amazon Bedrock在去年re:Invent推出后就成为焦点,毕竟“并非所有人都只想使用单一的模型”。作为AI应用的中间层,这可是亚马逊云科技创造出的独特竞争优势,可以认为是与openAI展开竞争的关键层级。
运行这一年来,Amazon Bedrock解决了客户的五大问题:1)选模型的问题;2)成本的问题;3)集成业务问题;4)安全的问题;5)智能体协作的问题。在昨天Matt的主题演讲中,Amazon Bedrock升级新功能,包括提供模型蒸馏、多智能体协作和自动推理检查等,让客户构建更快、更具成本效益,更智能的模型。
Dr.Swami在今天的演讲中继续放招,发布Amazon Bedrock Marketplace。提供了来自领先供应商的100多个新兴和专业基础模型,为客户提供更多选择。
仅仅提供多种选择是不够的,为了让用户更快、更省钱、更智能地构建模型,Dr.Swami发布了新的功能:新发布提示词快速缓存功能(Amazon Bedrock Supports prompt caching),以及智能提示词路由功能(Amazon Bedrock Intelligent Prompt Routing)降低成本。
提示词快速缓存功能
(Amazon Bedrock Supports prompt caching)
智能提示词路由功能
(Amazon Bedrock Intelligent Prompt Routing)
发布针对自然语言检索(Amazon Kendra Generative AI Index),以及结构化数据检索功能(Amazon Bedrock Knowledge Bases supports structured data retrieval),加速开发。
自然语言检索
(Amazon Kendra Generative AI Index)
结构化数据检索功能
(Amazon Bedrock Knowledge Bases supports structured data retrieval)
发布支持图像内容RAG功能(Amazon Bedrock Knowledge Bases now support GraphRAG),数据自动化服务(Amazon Bedrock Data Automation,和升级安全防护功能Amazon Bedrock Guardrails Multimodal toxicity detection),帮助开发人员清除障碍。
数据自动化服务(Amazon Bedrock Data Automation)
安全防护功能
(Amazon Bedrock Guardrails Multimodal toxicity detection)
至此,亚马逊云科技在大模型领域打破竞争壁垒,迈进大模型第一梯队,实现跃升。Apple公司机器学习和人工智能高级总监Benoit Dupin来到现场,称Apple在iPad、Apple Music、Apple TV、新闻、App Store、Siri等产品和服务上都广泛使用了亚马逊云科技服务。
从Amazon SageMaker到Amazon Q:
化繁为简 开箱即用
无论是结构化还是非结构化数据,亚马逊云科技都有优秀的分析服务来帮助客户用简便的方法来理解所有数据,这些数据存储在Amazon S3、Amazon Redshift、Amazon Aurora以及第三方数据源中。客户希望通过亚马逊云科技数据管理功能,使用Amazon DataZone进行诸如目录、共享、类别共享和数据治理之类的操作。
这也是亚马逊云科技一直以来思考的问题,如何构建一个整合的体验,将数据、分析、人工智能及数据治理融为一体。在今年大会上,终于得到了答案。亚马逊云科技从产品和品牌层面重新定义Amazon SageMaker,将其定位为所有数据、分析和人工智能需求的中心。
为此,亚马逊云科技全新发布Amazon SageMaker Unified Studio提供整合的数据和人工智能开发环境,允许客户访问组织中的所有数据,并使用最适合的工具。它将目前亚马逊云科技各种服务:1)Amazon EMR、Amazon Glue、Amazon Redshift、Amazon Bedrock中独立的Studio,2)查询编辑器,3)各种可视化工具,整合到现存的Amazon SageMaker Studio中。
同时也全新发布面向应用程序的Zero-ETL,帮助客户无需构建和管理数据管道,便可分析存储在业界流行的第三方SaaS应用程序中的数据。并全新发布Amazon SageMaker Lakehouse,兼容Apache Iceberg,针对所有结构化和非结构化数据源提供单一界面,跨不同数据源提供简单统一的数据接入与访问控制。
事实证明,这两项发布仅仅是Amazon SageMaker升级的序言。Dr.Swami在今天继续诠释了亚马逊云科技依然是生成式AI路上的引路者。
新发布的Amazon SageMaker AI代表了数据和机器学习的创新融合。它是建立在几十年的神经网络研究之上的,以使深度学习首次变得更容易访问和可扩展,也是分布式系统和用户体验设计的突破和计算能力的顶峰。Amazon SageMaker AI为客户提供了工具和工作流程,消除了机器学习和分析生命周期中的繁重工作,从数据准备到修改模型,再到模型训练,Amazon SageMaker AI让分析工作化繁为简,一站式解决生成式AI全生命周期问题!
Dr.Swami随后更新的Amazon SageMaker功能包括Amazon SageMaker HyperPod flexible training plans、Amazon SageMaker HyperPod task governance、来自合作伙伴的AI Apps 可在Amazon SageMaker上访问。
在应用层:Amazon Q作为一个设计简洁、易于使用的应用层,为各种特定用例提供了开箱即用的生成式AI功能。例如,今天的Amazon Q已经能够应用于供应链或数据处理等领域。
目前,Amazon Q有两个版本。面向开发者的Amazon Q Developer全新推出三个Agent,用于生成单元测试、文档和代码审查,与Gitlab深度集成,升级的重点是超越代码完成,自动生成单元测试,覆盖更广的开发任务。据悉,Amazon Q Developer登顶SWE基准测试TOP1!55.8%的软件问题都可轻松解决,德甲、美国航空、英国电信都成为Amazon Q Developer的典型用户。
此外,大量的开发人员时间都花在维护、现代化和修补现有应用程序上。在此前发布的对于Java应用程序迁移的功能后,再次发布将.NET应用迁移为Linux应用,将VMWare工作负载迁移为云原生架构,以及IBM等大型机应用程序的迁移服务。
而针对企业级用户中的非开发人员,比如运营、IT人员,Amazon Q Business是一个极佳的选择。这次大会上亚马逊云科技宣布Amazon QuickSight和Amazon Q Business的数据整合到一起,可快速分析数据,加速商业智能与人工智能的融合。
通过全新的Amazon Q Business API,独立软件开发商可在自有软件中集成Amazon Q index,使得应用程序变得更强大、更个性化。目前,Asana, Zoom, PagerDuty等公司现已添加Amazon Q插件。
结 语
可以说,围绕大模型的全生命周期,亚马逊云科技都提供相应的产品和服务,同时亚马逊云科技也注重用户的使用技能,Dr.Swami 今天宣布亚马逊云科技已经为全球900万人提供了免费的云计算技能培训,提前达成2025年完成该目标的计划。
当然亚马逊云科技还继续表示将负责任的人工智能进行到底,为此发布新的教育平等计划(AWS Education Equity Initiative)来执行,该计划将在未来5年内投资高达一亿美元基金,并提供来自亚马逊云科技的专家的技术指导,为世界各地的学习者建立和扩展数字化学习解决方案。
回顾历史,亚马逊云科技的任何一项产品和服务均可拆解为独立组件(构建单元 building blocks),并在其特定领域表现出卓越的性能。亚马逊云科技始终聆听客户建议,从客户的真实业务挑战出发,持续创新和优化,更加贴近使用场景,让新技术得以应用并赋能业务,这种价值主张才是云计算叙事的源头,也是AI和大模型落地的根本。
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。