kubelet快速异常优化
一、背景描述
k8s在一个节点异常后,不能快速迁移服务,导致对应用有较大影响。通过快速异常,使服务快速切换到其他节点。
二、方案设计
调整kubelet状态上报–node-status-update-frequency 4s
调整controller确认节点状态 –node-monitor-period 1s
调整controller容忍异常时长–node-monitor-grace-period 7s
调整controller驱逐pod时长–pod-eviction-timeout 5s
调整controller配置新增
- --leader-elect-lease-duration=5s
- --leader-elect-renew-deadline=3s
三、版本特性
节点断网、kubelet异常关闭、服务器关机等异常情况下,节点会在20s后notready
集群service的endpoint会剔除异常pod ip
四、自测方案
cat /etc/kubernetes/manifests/kube-controller-manager.yaml
节点断网、notready异常关闭、服务器关机,测试节点notready耗时在20S以内。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!