kubelet快速异常优化

一、背景描述

k8s在一个节点异常后,不能快速迁移服务,导致对应用有较大影响。通过快速异常,使服务快速切换到其他节点。

二、方案设计

调整kubelet状态上报–node-status-update-frequency 4s

调整controller确认节点状态 –node-monitor-period 1s

调整controller容忍异常时长–node-monitor-grace-period 7s

调整controller驱逐pod时长–pod-eviction-timeout 5s

调整controller配置新增
    - --leader-elect-lease-duration=5s
    - --leader-elect-renew-deadline=3s

三、版本特性

  • 节点断网、kubelet异常关闭、服务器关机等异常情况下,节点会在20s后notready

  • 集群service的endpoint会剔除异常pod ip

四、自测方案

cat /etc/kubernetes/manifests/kube-controller-manager.yaml

节点断网、notready异常关闭、服务器关机,测试节点notready耗时在20S以内。


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!