CASTAI报告显示Kubernetes中主要云资源未被充分利用

拥抱科技有未来 2024-03-09 09:41:15

Kubernetes是一个用于自动化软件部署的开源容器编排系统,在全球的组织中得到了广泛的采用。然而,准确预测Kubernetes所需的资源通常具有挑战性,并且可能导致操作风险、过度供应、资源浪费和超支。

CAST AI是面向AWS、Azure和GCP客户的领先Kubernetes自动化平台,根据CAST AI的数据,对于包含50到1,000个CPU的集群,组织平均只使用13%的已配置CPU和20%左右的内存。

在今天发布的第二份年度Kubernetes成本基准报告中,基于对2023年运行AWS、Azure和GCP的4000个集群的分析,然后通过CAST AI的自动化平台进行优化。该报告提供了成本优化、云计算超支、资源浪费和其他参数的见解。

该报告的一个重要发现是,即使对于大型集群,CPU利用率仍然很低,这表明许多运行Kubernetes的公司仍处于优化的早期阶段。随着越来越多的公司采用Kubernetes,云浪费可能会继续增长。

CAST AI联合创始人兼首席运营官Laurent Gil表示:“今年的报告清楚地表明,在Kubernetes上运行应用程序的公司仍处于优化旅程的早期阶段,他们正在努力应对手动管理云原生基础设施的复杂性。”从2022年到2023年,已配置CPU和使用CPU之间的差距从37%扩大到43%,因此随着越来越多的公司采用Kubernetes,问题只会恶化。”

有趣的是,AWS和Azure的CPU利用率趋势几乎相同。它们的利用率都是已配置CPU的11%。谷歌的云计算浪费最低,为17%。

对于拥有30,000个CPU的大型集群,利用率显著提高,达到44%。这并不奇怪,因为这么大的集群往往会从管理它们的DevOps团队那里得到更多的关注。

随着云服务成本的不断上升,减少超支变得比以往任何时候都更加重要。Gartner预测,到2024年,全球最终用户在公共云服务上的支出将增长20.4%。

报告显示,超支的最大驱动因素包括过度配置,即集群提供的容量超过实际所需,以及内存请求设置高于Kubernetes应用程序所需。

超支的另一个主要原因是许多组织仍然不愿意使用Spot应用实例。2022年报告中的数字显示,Spot实例可能是一种快速而简单改进CPU优化的方法。

CAST AI建议使用自动化来提供适当大小、类型和数量的虚拟机(VM)。许多团队都犯了这样的错误,选择了他们以前知道并使用过的实例,后来才意识到他们没有充分利用所购买的资源。

在过度配置和不足配置之间有一个很好的平衡。如果团队资源配置不足,他们就会面临CPU节流和内存不足的问题,这可能导致应用程序性能不佳。这些问题可以通过自动调整工作负载大小来解决,以使实例类型和大小与工作负载性能和容量需求相匹配。

CAST AI的另一个建议是自动扩展节点以减少CPU浪费。虽然Kubernetes提供了自动调用功能来提高利用率和减少浪费,但这些工具的配置和管理通常具有挑战性。

根据该报告,使用CAST AI自动用新节点替换次优节点可以显著提高优化。最后,报告强调了使用Spot实例节省成本的好处。

使用Spot实例的主要问题是云提供商可以在短时间内回收它们,从而导致意外停机。这个问题使得Spot实例显得很危险。然而,CAST AI认为它们是稳定且具有成本效益的。只要您使用自动化来供应、管理和减少基础设施,那么在使用Spot实例时应该没有问题。

0 阅读:0

拥抱科技有未来

简介:感谢大家的关注