InfoQ 推荐 ( ) • 2024-03-27 19:10

摘要:

过度配置CPU和内存可以保持正常运行,但代价高昂。资源不足可能会导致CPU限制和内存不足,从而导致应用程序性能不佳甚至崩溃。根据CAST AI对4000个Kubernetes集群的分析,Kubernetes集群通常只使用13%的CPU和平均20%的内存,这表明存在严重的过度配置。

 

根据CAST AI"对4000个Kubernetes集群的分析,Kubernetes集群通常只使用13%的CPU和平均20%的内存,这表明存在严重的过度配置。

 

在分析了2023年1月至12月期间在AWS、Azure和GCP管理的Kubernetes服务上运行的客户后,该公司在今天的一份报告中指出,优化可以为首席信息官们(CIO)节省一大笔钱。

 

(Gartner预测,2024年公有云服务的支出将达到6780亿美元,而FinOps的议程将继续上升,因此避免在云服务上超支是许多首席信息官(CIO)和首席技术官(CTO)的首要任务。通过Kubernetes优化可以节省大量成本。例如,人工智能公司Anthropic去年使用Karpenter"将其AWS账单削减了40%。)

 

另见:人工智能公司Anthropic通过使用Karpenter将其AWS账单削减了40%"。

 

对CAST AI联合创始人兼首席人才官(CPO)Laurent Gil来说,调查结果表明,公司仍在“努力应对手动管理云原生基础设施的复杂性”——该公司的报告指出,在Kubernetes上,工作负载的大小是根据为CPU和内存设置的请求和限制来确定的:“优化它们就像走钢丝。”

 

“过度配置CPU和内存可以保持正常运行,但成本很高。”

 

“资源调配不足可能会导致CPU限制和内存不足,从而导致应用程序性能不佳甚至崩溃。当团队不完全了解其容器资源需求时,他们通常会谨慎行事,调配比所需更多的CPU和内存。”

 

“这就是自动化调整工作负载的用武之地。”他说到。(提供Kubernetes成本优化平台的CAST AI声称,开源替代方案为本已经很复杂的编排层增加了更多的配置复杂性,而其商业替代方案的即插即用功能是更简单的削减云支出的替代方案。)

 

另见:PlayStation希望让游戏服务器在Kubernetes上运行"。原因如下。

 

该报告的调查结果是基于CAST AI对2023年1月1日至12月31日期间在亚马逊网络服务(AWS)、谷歌云平台(GCP)和微软Azure(Azure)上运行的4000个集群的分析,之后这些集群由该公司的自动化平台进行优化。

 

它进一步指出,对于包含1000到30000个CPU的大型集群,组织平均仅使用17%的预配CPU。

 

简而言之,报告总结道,造成浪费的最大因素是:

 

过度配置:分配给应用程序或系统的计算资源超过了其所需的数量。豪无根据的余量:对CPU数量的请求设置得太高。Spot实例使用率低:由于担心不稳定,许多公司不愿意使用Spot实例。GKE上“自定义实例大小”的使用率较低:除非自定义实例的选择是动态且自动化的,否则很难选择最佳的CPU和内存比率。

 

完整的报告在这里"。

 

原文链接:

https://www.thestack.technology/kubernetes-clusters-are-typically-using-just-13-of-cpu-cios-could-save-a-fortune/"