1. 先搞清楚一个核心事实
在深入探讨之前,我们必须锚定一个核心事实:Kubernetes 本身并不会自动“迁移”Pod。
它的处理逻辑非常直接:删除 → 重建 → 再调度。一旦Pod被调度到某个节点,它就会“粘”在那里,不会被整体挪动。这跟虚拟机的热迁移完全是两码事,K8S的哲学就是这么简单直接。
2. 容器挂掉,会发生什么?
容器是由节点上的kubelet和容器运行时(比如containerd)直接管理的。那么,当容器内部的进程意外退出时,会发生什么呢?
关键点在于Pod的restartPolicy重启策略。对于最常见的由Deployment创建的Pod,默认策略是Always。这意味着,kubelet检测到容器退出后,会立刻在当前节点上尝试重启它。
结果是什么?其实就三点:
第一,容器只是在当前节点原地重启;第二,Pod对象本身并没有被删除;第三,因此,绝对不会触发跨节点的重新调度。
这时候你经常会在kubectl get pods命令里看到CrashLoopBackOff状态。很多人一看到这个状态就慌了,以为是调度失败,K8S在尝试给它换节点。其实不然,这个状态恰恰说明Pod还在原节点上,只是容器在反复启动、崩溃、再启动,陷入了循环。
3. 什么时候才会重新调度?
记住这个核心原则:只有Pod被删除,才会触发重新调度。 调度器(kube-scheduler)只负责为新建的Pod选择节点。我们来看几个典型的触发场景:
(1) 场景一:Node 宕机
这是最经典的场景。节点物理机宕机,kubelet进程停止,节点与控制平面的网络连接中断。控制平面(主要是Controller Manager)会发现该节点状态变为NotReady。等待一段时间(默认是5分钟)后,控制器会判定该节点上的Pod已失效,于是将其删除。紧接着,对应的控制器(如Deployment Controller)会立刻重建一个新的Pod副本,这个新建的Pod才会被调度器重新挑选一个健康的节点部署。这才是真正意义上的“重新调度”。
(2) 场景二:手动驱逐
这是运维中的常见操作,比如要对节点进行维护升级。执行kubectl drain node01 --ignore-daemonsets命令后,会发生两件事:首先,该节点会被标记为cordon(不可调度),阻止新Pod分配过来;其次,节点上现有的非DaemonSet Pod会被优雅地驱逐(即删除)。这些被删除的Pod,如果由控制器管理,同样会触发重建和重新调度的流程。
(3) 场景三:资源不足被驱逐
当节点资源紧张,比如内存不足、磁盘压力过大或PID耗尽时,kubelet为了保证节点稳定性,会主动驱逐一些Pod。被驱逐的Pod状态会变为Evicted。同样,控制器会检测到Pod的缺失,并创建新的Pod,新Pod自然需要调度器来安排新家。
(4) 场景四:手动删除 Pod
直接执行kubectl delete pod xxx。如果这个Pod隶属于某个控制器(如Deployment、ReplicaSet、StatefulSet),那么控制器会迅速介入,重建一个新Pod来满足副本数要求,这个新Pod的创建过程必然包含重新调度。但这里有个特例:如果是“裸Pod”(即没有控制器管理的独立Pod),你删了它就真的没了,既不会重建,更谈不上调度。

4. 面试标准回答模板
最后,我们来总结一个清晰、准确的回答模板,方便你在面试或向他人解释时使用:
容器挂掉,默认只会由节点上的kubelet根据重启策略在原地重启,不会触发跨节点的重新调度。只有当Pod被删除时——无论是由于节点宕机、资源不足被驱逐、手动驱逐还是直接删除——对应的控制器才会重建Pod,而这个新建的Pod才会经由调度器重新选择节点部署。简而言之,Kubernetes的调度发生在Pod创建时,而非运行时。
能把这段话讲清楚,对方基本就能判断你对Pod的生命周期和调度机制有了扎实的理解。
