運(yùn)維甩鍋高級(jí)指南
點(diǎn)擊上方藍(lán)字關(guān)注我們
大家好,我是熊哥。首先聲明,本文章只在針對(duì)故障中那些不愿承擔(dān)責(zé)任,而把鍋甩給運(yùn)維部門的人,如果討論故障的都是君子,那么本文并不建議使用,切記。
1,故障,故障,還是故障
任何一個(gè)故障發(fā)生時(shí),沒(méi)有任何一個(gè)人是無(wú)辜的,開(kāi)發(fā)的責(zé)任在于代碼的bug,測(cè)試的責(zé)任在于測(cè)試用例不健全,運(yùn)維的責(zé)任在于監(jiān)控不到位或者故障處理不給力,一般在故障定責(zé)中,聲音越大的一方,往往責(zé)任越大,所以在故障定責(zé)時(shí),要學(xué)會(huì)察言觀色,選擇主攻點(diǎn),不要廣撒網(wǎng),到處開(kāi)炮。
關(guān)于故障處理和故障定責(zé),這不是體現(xiàn)個(gè)人責(zé)任心和擔(dān)當(dāng)?shù)膱?chǎng)所,一定要分清哪些是自己的主職,哪些自己在協(xié)助幫忙,把故障一股腦攬?jiān)谧约荷砩希靡稽c(diǎn)的人會(huì)一時(shí)感激,但最后為了去掉不虧欠感以達(dá)到內(nèi)心的最終平和,就會(huì)找一大堆理由證明責(zé)任真的是你的,不巧的是,這些理由,一找一大把,因?yàn)檠┍罆r(shí),的確沒(méi)有一片雪花是無(wú)辜的。
所以,故障定責(zé)應(yīng)該遵循以下幾個(gè)原則:
1),首先,故障并非都是壞事,偶爾它是避免大故障發(fā)生的預(yù)警。
2),其次故障責(zé)任遵循是否引起還有是否有能力去改變兩個(gè)方面制定,責(zé)權(quán)一定要統(tǒng)一。
3),再次大故障盡量減少責(zé)任,小故障盡量增加責(zé)任,漏漏臉也好。
4),最后,老祖宗的名言,福兮禍所伏,禍兮福所倚,吃虧是福。

2,定責(zé)時(shí)一些方法和話術(shù)技巧
再次強(qiáng)調(diào)一遍,下面內(nèi)容只防小人,不防君子,不主動(dòng)欺負(fù)人,但別人欺負(fù)我,不行
1),言多必失
定責(zé)時(shí),一定要少說(shuō)話,簡(jiǎn)潔,說(shuō)話時(shí)要去抓住對(duì)方的漏洞,尤其是邏輯漏洞,尤其是攻擊對(duì)方的前提假設(shè)。
例如:
“你說(shuō)的太理想化了,我們實(shí)際情況是,……”
“你這個(gè)太不專業(yè)了,怎么可以這樣去做假設(shè)……”
同時(shí),只闡述事實(shí),并且和故障相關(guān),注意,不要用過(guò)多的主觀詞語(yǔ)字眼
“我覺(jué)得,我認(rèn)為,我想”這些都要少用甚至不用,我一般用的最多的字眼是“咱們,我們”。
比如一句話:
“我覺(jué)得,這次故障測(cè)試方出現(xiàn)了漏測(cè)的情況,是主因”,這樣說(shuō)就很不好,好的說(shuō)法是,“大家想法都是好的,咱們先擱置爭(zhēng)議,靜下來(lái)想一想,如果測(cè)試到位,是否這次故障就可以避免?”
2),找好自己的盟友
故障時(shí),往往是三國(guó)混戰(zhàn)或者多國(guó)混戰(zhàn),這時(shí)候要打一方,拉一方。
例如,拉開(kāi)發(fā),打測(cè)試,“大家有些搞混了,我們首先要找的是問(wèn)題根源是什么,是代碼bug啊”
再例如,拉測(cè)試,打開(kāi)發(fā),“細(xì)想想,測(cè)試同學(xué)也是很為難的,咱們生產(chǎn)環(huán)境那么復(fù)雜,開(kāi)發(fā)要保證第一道關(guān)的”
或者釋放善意,等著被拉
例如,“這次監(jiān)控做的很到位,大大減少了故障的定位時(shí)間”
3),情感公式,站在道德制高點(diǎn)
這是一個(gè)屢試不爽的方法
例如:
“你考慮問(wèn)題太狹窄了,應(yīng)該站在公司的層面去考慮”
“現(xiàn)在還沒(méi)到那個(gè)階段,不要回答how,要問(wèn)一下why”
“如果我來(lái)承擔(dān)責(zé)任,沒(méi)有問(wèn)題,但真的解決問(wèn)題了么,下次不會(huì)重復(fù)發(fā)生了么?”
“我當(dāng)然知道公司的實(shí)際是什么,但我們不是應(yīng)該朝對(duì)的方向前進(jìn)么?”
可以主動(dòng)示弱:
“有些故障,運(yùn)維也背了,例如xxx,但現(xiàn)在看起來(lái),效果并不好,團(tuán)結(jié)是有了,然而沒(méi)有真正解決問(wèn)題”
“為了做這個(gè)變更,我已經(jīng)特意選擇凌晨去做,已經(jīng)熬了好幾個(gè)通宵了”
4),不要直接回答問(wèn)題,記住,不要直接回答問(wèn)題
不直接回答問(wèn)題的好處有二,其一,顯得高級(jí),其二,給自己留出思考空間
方法一,反復(fù)對(duì)不起
“對(duì)不起,你說(shuō)的我不太明白,能再說(shuō)一遍么?”
“對(duì)不起,我不太清楚,了解一下再答復(fù)你?”
“對(duì)不起,剛才走神了,能再說(shuō)一遍么?”
這種方法尤其適合一個(gè)新員工參加故障討論會(huì)
方法二,提問(wèn)
“你說(shuō)的我沒(méi)法直接回答你,不過(guò),我想問(wèn)一下,你覺(jué)得你們團(tuán)隊(duì)問(wèn)題在哪里?”
“等一等,有個(gè)問(wèn)題,我不理解,你剛才所說(shuō)的前提是什么?”
方法三,重復(fù)或者翻譯別人的話,注意重復(fù)語(yǔ)氣要慢,有明顯漏洞的地方,要更慢
“剛才說(shuō)的話,我是不是可以這樣理解,……”

5),說(shuō)不通,那就換一種方式
方法一,直接說(shuō)結(jié)論
“ok,各位說(shuō)的都有道理,結(jié)論是不是這樣?”
方法二,迂回反復(fù)
“這個(gè)故障的確我這里有做的不好的地方,但是就算我改進(jìn)了,大家想一下,這個(gè)故障就能避免了么?”
方法三,拉人下水,有鍋一起背
“我再思考另外一個(gè)問(wèn)題,除了大家說(shuō)的之外,還有哪些我們能做的更好的呢?”
方法四,和事佬(一般到和事佬時(shí),基本上就贏了)
“二位說(shuō)的都有道理,的確各個(gè)團(tuán)隊(duì)都有做的不好的地方,大家覺(jué)得呢?”
6),千萬(wàn)不要挑戰(zhàn)別人的專業(yè),也不要陷進(jìn)別的專業(yè)
如果我們要想打敗泰森,肯定不是和他上擂臺(tái),而是要和他比說(shuō)中國(guó)話。
“我承認(rèn)你的領(lǐng)域我不太理解,但故障處理是一個(gè)軟件工程,從軟件工程角度來(lái)看,應(yīng)該是……”
“好,其實(shí)這里存在一個(gè)問(wèn)題,那就是,監(jiān)控是萬(wàn)能的么?或者說(shuō),為什么監(jiān)控做不到萬(wàn)能的?”
7),最后幾點(diǎn)
首先,千萬(wàn)不要急,不要急,不要急,一急你就輸了
其次,角度一定要新,不要說(shuō)別人都知道的事
再次,任何人說(shuō)的每一句話,都要打一個(gè)問(wèn)號(hào),不要輕易接受
最后,故障無(wú)小事,做好充足準(zhǔn)備,甚至有誰(shuí)會(huì)參加,他們什么背景和性格都要了解清楚。
運(yùn)維是一個(gè)很難說(shuō)清的事情,因?yàn)樘s,太廣,別人很可能一句,我覺(jué)得是網(wǎng)絡(luò)的問(wèn)題,就讓你忙活大半天,所以運(yùn)維人員一定要學(xué)會(huì)保護(hù)自己,鍋,該背的背,不能背的一定不背。
往期推薦
2024字節(jié)跳動(dòng)薪資改革,利好普通人入職?
我發(fā)現(xiàn)很多人對(duì)SRE工作有誤解,很簡(jiǎn)單嗎?
AiOps智能運(yùn)維技術(shù)領(lǐng)域2024年發(fā)展預(yù)測(cè)
點(diǎn)擊下方“閱讀原文”查看 SRE學(xué)習(xí)路線圖
