故障一:Pod数量太多超出物理节点的限制
每一台Node节点中默认限制最多运行110个Pod资源,当一个应用程序有成百上千的Pod资源时,如果不扩容Node节点或者修改最大Pod数量限制,那么就会导致部分Pod资源无法正常运行,因为节点已经没有资源可以被调度了。
解决思路就是扩容Node节点数量或者修改Pod的数量限制。
故障二:Pod配置的资源限额超出物理节点的最大使用率
由于Node节点资源有限,当Pod设置的资源配额超出了Node节点所承受的极限,那么Pod将无法部署和运行,会报错没有合适的Node节点可调度。
解决思路就是对资源限方面重新调整,适当扩展节点资源。
故障描述:
Pod资源数量过多,超出节点调度Pod的数量