阿里云何川:云计算,为数据基础设施的建设提速

中文科技资讯 2024-10-27 14:04:35

数据逐步融入生产生活和社会治理,成为推动数字经济发展的关键生产要素。党中央对推动释放数据要素价值高度重视,党的二十届三中全会审议通过的《中共中央关于进一步全面深化改革、推进中国式现代化的决定》对完善数据要素市场制度规则等作出了部署,提出“建设和运营国家数据基础设施,促进数据共享。加快建立数据产权归属认定、市场交易、权益分配、利益保护制度,提升数据安全治理监管能力,建立高效便利安全的数据跨境流动机制。”为推进数据领域的改革发展、进一步释放数据要素价值指明了方向。本期,我们邀请到阿里云弹性计算产品运营与生态合作负责人何川,围绕云计算如何加速数据基础设施建设及其未来发展趋势展开探讨。

2024年7月22日,在国务院新闻办公室举行的“推动高质量发展”系列主题新闻发布会上,国家数据局刘烈宏局长提出,要加快完善数据基础制度体系、加快推动数据基础设施布局、着力提升数据资源开发利用水平。随着“建设和运营国家数据基础设施,促进数据共享”指导思想的提出,我国正推进国家数据基础设施(NDI)建设,力图构建一个协同联动、规模流通、高效利用、规范可信的数据基础设施服务体系。

云计算作为新一代的IT基础设施,对于释放数据要素价值、提升数据流通和利用效能、推进数字经济高质量发展都具有重要价值与意义。

一、云计算的本质是在线化

云计算和传统数据中心的最大区别,在于任何人,无论学生、开发者、中小企业,还是大型公司,都可以无差别地通过网络随时随地获取先进、易用、普惠和完整的技术服务。大规模弹性,连续服务、易于集成和扩展、自助获取、不需要人工干预等特点,构成了云计算最核心的本质,那就是在线化。

在线化,可以提升数据的流通效率和利用效率

得益于我国在互联网应用创新和产业数字化转型上的积累,我们拥有极其丰富的数据资产。但当数据在一个个的孤岛中,并不能发挥其应有的价值。只有被用起来,被用好,数据才能真正产生价值。在线化的云计算,可以把离线的数据在线化,成为数据高效流通的天然载体。云计算提供的敏捷性,可以大幅提升数据的流通效率和利用效率。而随着云计算的成熟,云上也已经构建了一整套从硬件到软件的安全方案,来保障数据存储和流通过程中的安全性。

在线化,可以提升成本收益和服务的可靠性

云计算的运营,可以高度概括为资源的运营,包括计算资源、存储资源、网络资源等。但云计算绝不仅仅是一台台服务器的堆砌。一朵超大规模的云,是一个非常大的系统工程。不同用户、不同业务、不同时段对于资源、对于性能的要求不一样,只有通过科学的装箱和调度,在保留云计算弹性资源池的前提下,最大化资源利用率,才能达到成本收益的最大化。虚拟化技术、容器化技术和Serverless化技术的目的,在于不断降低用户的综合算力获取成本和资源运维成本。

云计算的稳定性对于业务的连续性至关重要。以x86服务器为例,业界标准是每天万分之三的宕机率。这意味着每一百万台服务器,每天都会有300台物理服务器出现宕机,数千个用户的业务会受到影响。在超大规模尺度下,再小概率的错误也会变成大问题。云计算的技术难度,在于通过专门优化的硬件、故障预测算法和热迁移系统,降低受影响的用户规模、减少用户被影响的程度和加快故障恢复的速度。

在线化,可以提升业务的创新和产业的发展

由于云计算全栈性的特点,用户可以一站式便捷地获取所需的技术,提升技术创新的敏捷性。而技术的创新,最终会带来产业的发展和突破。近年来,中国汽车产业快速发展,这得益于新能源产业政策的扶持,也来自智能驾驶等技术领域的创新。今天,中国70%的汽车企业在使用阿里云,云计算成熟的技术栈和即开即用的服务,为车企的业务创新提供了完善的技术能力支撑。

自2009年成立以来,阿里云经历了个人开发者的创新创业,消费互联网公司的蓬勃发展和千行百业的云上数字化转型。超过80%的科技型企业今天在使用阿里云。云计算不仅是技术型初创公司的孵化器,也成为了各类企业创新的引擎。

二、云计算的价值在于连接

先进的技术并不稀缺,稀缺的是如何让更多人、以更低门槛和更低成本获取技术。只有将边际成本降得足够低,技术才能够有效扩散,创造更大的价值。云计算是一个服务化的技术平台,能够让技术开箱即用,更容易获取,让每个人都能够连接最先进的技术。

数据与算力的连接

当人们提到云计算和大数据,往往把它们当作两个独立的词。实际上,云计算和大数据密不可分。过去几年,云计算的技术演进都是朝着超大规模数据处理的方向在优化。未来的IT基础设施不仅需要提供强劲的算力和大规模数据处理能力,还需要满足算力和数据之间更频繁、更快速的交互。

在刚刚过去的云栖大会上,阿里云发布了云基础设施处理器(CloudInfrastructureProcessingUnit)2.0版本的升级,几乎所有的升级都对数据密集型业务进行了优化,带宽从2*100Gbps提升到2*200Gbps,IO吞吐从100万IOPS提升到360万IOPS。智能计算灵骏能够支持20TB/s的超高吞吐的并行存储,GPU集群在万卡规模下的带宽利用率达到99%以上。

技术与业务的连接

技术只有服务业务,才能产生价值。云计算的普惠性,让技术不仅是大型公司的专属,同样可以惠及数以万计的中小企业。

阿里云2021年推出的计算巢,能够将一个传统软件以近乎零改造的方式变成SaaS服务。某款面向中小企业ERP软件,年新增客户超4000家。原本每个项目的交付成本是两周,通过软件云化,可以实现完全自动化交付。软件云化所产生的收益,不仅每年可以节省最多8000人周,160人年的重复工作,也可以实实在在降低中小企业数字化转型的成本和获取门槛。

现在与未来的连接

自ChatGPT发布以来,人工智能的热度持续高涨。人工智能并非是全新的话题。语音助手、人脸识别、搜索推荐这些人工智能成果,早已深深地改变了我们的生活。而随着大语言模型技术的应用,如代码助手、内容生成等,也开始成为日常的生产力工具。随着大模型和基于大模型的应用生态不断成熟,生成式AI对人们生产生活的影响会更加显现。

在互联网时代,所有的公司都在思考,如何利用数据创造价值。而现在,越来越多的公司开始思考如何利用人工智能创造价值,从思考数据驱动变成探索数据+人工智能驱动。2022年,阿里云提出模型即服务(ModelasaService),通过云计算让大模型以服务化的形式被调用,降低智能化创新的门槛,让未来更快地到来。

ScalingLaw(规模定律)是描述系统性能随着系统规模变化而变化的规律性数学表达。OpenAI在2020年发表的《ScalingLawsforNeuralLanguageModels》论文中首次提出了大模型的ScalingLaw。之后,仿佛ScalingLaw变成了LLM的专属名词。

然而,无论是在互联网浪潮、数字化浪潮,还是人工智能浪潮,云计算既是ScalingLaw的体现,也是ScalingLaw的实践者。随着云计算的采用度越来越高,其规模效应也越来越明显。规模化的云计算不仅让技术获取的边际成本降低到近乎为零,也让更多的创新开始在云上涌现。

何川,阿里云弹性计算产品运营与生态合作负责人。负责通用计算、加速计算、容器计算等产品线的商业化运营和生态建设。自2017年加入阿里云以来,负责了云服务器ECS、AlibabaCloudLinux、服务器迁移中心、计算巢服务等产品的设计和商业化。涉及IaaS、PaaS、操作系统和SaaS软件生态。产品服务于数百万客户、支撑数千家企业上云和数百家ISV软件云化。

0 阅读:2