腾讯云提高K8S集群资源利用率实践

腾讯云对K8S的改造以及如何提高资源利用率的实践。
为什么集群资源利用率不够高?

  • Node节点资源的碎片;
  • 大部分业务在创建Pod的时候,往往会设很大从而造成资源的浪费;
  • PorkLoad的副本数很多人不知道自己要设计多少才合适;
  • 业务的空闲时间;
展开查看详情

1.云+社区技术沙龙

2.腾讯云提高K8S集群资源利用率实践 庄鹏锐 腾讯云高级工程师

3.资源利用率分析 Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间

4.解决方案 Pod 动态 压缩 HPA 调度 Node VPA 碎片 超卖 处理

5.Pod 资源压缩 • MutatingAdmission Webhook

6.Node 超卖

7.HPAPlus

8.HPAPlus • 一个HPA一个goroutine • 支持 metric/custom.nerics/external.metrics • HPA对象级别同步时间 • HPA对象级别抑制时间 • requests 和 limits 两种资源计算方式 • CronHPA • HPA对象Enable 和 Disable • 动态调整 minRepliacs

9.VPAPlus • 动态调整Container Cgroup • requets 和 limit 比例设置 • Resource Range设置 • CheckPoint对象timeout时间 • Pod对象更新时间 ` • 资源合法性校验

10.T HANKS 关注云加社区公众号