在 Kubernetes 中,当节点资源(如 CPU、内存等)不足时,会触发 Pod 驱逐机制,即根据一定的策略将某些 Pod 从当前节点中驱逐出去,以释放资源供其他 Pod 使用。Pod 驱逐机制是 Kubernetes 自我保护机制的一部分,旨在避免因资源耗尽导致整个集群崩溃。
Kubernetes 支持多种 Pod 驱逐策略,其中最常用的是基于优先级的策略。具体来说,在每个 Node 上都有一个叫做 kubelet-eviction-manager 的守护进程负责监控该 Node 上所有运行中的 Pod,并根据配置的优先级和条件来判断哪些 Pod 应该被驱逐。
在进行基于优先级的驱逐时,kubelet-eviction-manager 会根据下列原则进行判断:
- 优先保留有高优先级别需求的 Pod。
- 当同一 Namespace 下存在多个可被替代的 Pod 时,则保留“最少就绪时间”较长的那个。
- 如果没有可被替代的低优先级别 Pod,则考虑删除已经执行完成但未被标记为不可删除(非必要性)或者未设置 deadline 的低优先级别 Pod。
- 如果仍然无法满足需求,则依次判断同一 Node 上的其他 Pod,直到满足条件或者所有 Pod 都被判断过为止。
需要注意的是,Pod 的优先级别、资源限制和 QoS 等因素都会影响驱逐机制的决策结果。因此,在进行 Pod 调度和管理时,必须合理设置这些参数,并确保在出现资源不足时能够正确地进行 Pod 驱逐。同时,还应该定期监控集群中的资源使用情况,并及时采取措施以避免出现资源耗尽等问题。