記一次Kubernetes排錯(cuò)實(shí)戰(zhàn)


背景
故障定位




操作

ceph?pg?repair?1.7c



Kubelet宿主機(jī)的Linux內(nèi)核過低 - Linux version 3.10.0-862.el7.x86_64
可以通過禁用kmem解決

kubectl?cordon?node02

kubectl?drain?node02?--delete-local-data?--ignore-daemonsets?--force
--delete-local-data 刪除本地?cái)?shù)據(jù),即使emptyDir也將刪除;
--ignore-daemonsets 忽略DeamonSet,否則DeamonSet被刪除后,仍會(huì)自動(dòng)重建;
--force 不加force參數(shù)只會(huì)刪除該Node節(jié)點(diǎn)上的ReplicationController,ReplicaSet,DaemonSet,StatefulSet or Job,加上后所有Pod都將刪除。



kubectl?uncordon?node02

反思
后期可以對(duì)部署Kubernetes集群內(nèi)核進(jìn)行升級(jí)。
集群內(nèi)可能Pod的異常,由于底層存儲(chǔ)或者其他原因?qū)е?,需要具體定位到問題進(jìn)行針對(duì)性修復(fù)。
(版權(quán)歸原作者所有,侵刪)
![]()

點(diǎn)擊下方“閱讀原文”查看更多
評(píng)論
圖片
表情
