2024年3月初,Anthropic发布Claude3,官方公告中介绍了Claude3相较于GPT-4,在各项评分中都实现了超越。
3月底,Claude3旗下最强的Opus模型在Chatbot Arena榜单上超越了原来一直排在第一位的GPT-4,标志着ChatGPT遇到了自发布以来真正意义上可以匹敌的对手。
或许是亚马逊很满意Claude3的表现。差不多同一时间,亚马逊宣布向Anthropic追加27.5亿美元投资,加上去年已经投的12.5亿美元,总投资达40亿美元。
一直以来,尽管有一些专业的Benchmark方案,但用户的实际体验跟评分之间经常有不小差距。基于实际体验,很多人都将ChatGPT视为最强的聊天机器人。
而Chatbot Arena榜单是一个用人的主观判断来给模型打分的网站,在评判前用户不知道对面是哪个模型。用户对模型产出的结果做出主观判断后才能看到具体用的是哪个模型。
在Chatbot Arena榜单上打败GPT-4,一定程度上证明了Anthropic有着与OpenAI相近的实力。
而亚马逊对Anthropic的40亿美元投资,不仅战略上让亚马逊在生成式AI技术领域拿到了更多筹码,从实际发展来讲,对于其云计算业务的发展有不少积极意义。
眼下,很多人都意识到,人工智能技术这么发展下去,对算力资源的需求似乎是无穷无尽的,对于能源的需求也带来了很大挑战。
此前,有媒体报道称,OpenAI的CEO萨姆·奥特曼与一些投资者沟通,计划筹集7万亿美元做芯片,提高全球芯片产量,从而推动人工智能发展。
最近,有媒体报道说微软跟OpenAI要斥资1000亿美元打造名为Stargate星际之门的AI超算,兴建AI数据中心。
亚马逊也没闲着,计划未来15年要投资1500亿美元新建数据中心,以应对人工智能和其他数字服务需求的激增。
AI的发展也引发了科技公司对于能源问题的担忧,因为用电量太大,包括亚马逊、谷歌和微软等科技公司,也将目光投向包括核能和地热能在内的清洁能源。
此前,OpenAI CEO萨姆·奥特曼也说过,AI需要更多能源,可能需要核聚变技术或者太阳能存储技术上的突破。大型科技公司也投了很多能源创新企业,都在寻找技术突破。
从目前来看,云计算服务商在解决算力和能源短缺方面有先天优势,是大模型最合适的基础设施。
因为,云厂商不仅有数量庞大的数据中心资源,为了降低数据中心的运营成本,提高效率,云厂商在降低PUE和采用清洁能源上已经有了非常多的探索。
想必OpenAI选择与微软的合作会有这一方面的考虑,而Anthropic与亚马逊的合作也必然有同样的考虑。
为了迎接生成式AI技术浪潮,亚马逊做的准备远不止投资Anthropic。
2023年的re:Invent大会上,亚马逊云科技介绍了生成式AI相关的三层技术栈。
最底层是高性能基础设施,可以提供包括最新的英伟达GH200芯片在内的多种计算资源。同时,亚马逊也自研了Amazon Trainium训练芯片,为了提高训练效率,亚马逊云科技的UltralClusters集群支持让10万多个Amazon Trainium2芯片一起做并行训练。
中间层,亚马逊云科技通过Amazon Bedrock提供多种基础模型,其中包括知名的开源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非开源模型。
Amazon Bedrock托管了这些模型,用户可以直接通过API来调用,也可以在此基础上做一些定制开发。用户可以用它来创建知识库,可以开发各种Agent代理,落地负责任的AI,同时,还能帮助企业保持数据的安全性和合规。
亚马逊云科技大中华区产品部总经理 陈晓建表示,“从模型能力到真正的运营生产之间,企业还需要增加很多辅助能力。Amazon Bedrock提供一系列广泛的能力,这些工程化的能力是企业在真正上生产环境时一定会需要的。”
第三层则是一些开箱即用的SaaS化的服务,最有代表性的是对标微软Copilot的智能聊天机器人Amazon Q,这是一种专门为工作场景设计的ChatBot智能助手。此外,还有面向编程开发人员的平台Amazon CodeWhisperer等。
Anthropic与亚马逊的合作中,Anthropic将亚马逊云科技作为首选云服务提供商,利用底层提供的Amazon Trainium及Amazon Inferentia芯片构建模型。同时,利用Amazon Bedrock来为提供Claude3基础模型的长期访问权限。
Claude3刚发布的时候就上线到了Amazon Bedrock平台上,现在是Amazon Bedrock上最强的大模型。
Claude 3 包含Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus三个模型,Claude 3 Opus是最强大的,在各种评测指标上都表现出色,接近人类水平的理解和流畅度。Claude 3 Sonnet在能力和速度之间实现了一个平衡,Claude 3 Haiku最小,但速度最快。
Claude 3创造模型智能水平的新纪录——在数学问题、编程练习和科学推理等标准评估中超越了所有现有模型。而且,它本身就具有多模态能力,支持图像的输入,支持更长的上下文处理能力。而且,Claude 3能够降低幻觉,提升回答准确率。
彩蛋:本文的标题就是Claude 3的Sonnet生成的,略有调整。