史上增長最快的SaaS公司-Slack的混沌工程實(shí)踐 | IDCF

來源:混沌工程實(shí)踐 首發(fā):slack.engineering
作者:Richard Crowley 譯者:龍塢道長
標(biāo)題:Disasterpiece Theater: Slack’s process for approachable Chaos Engineering
引 子

開發(fā)環(huán)境成為一個(gè)對(duì)容錯(cuò)測(cè)試更有信心的地方 ; 測(cè)試所有系統(tǒng)(不僅僅是新系統(tǒng)) ; 不能造成影響用戶的事件,所做的測(cè)試都必須安全 ; 不要虛假的信心,所做的一切都需要在生產(chǎn)中進(jìn)行 。
識(shí)別可能發(fā)生的故障; 確保服務(wù)能夠容忍這些故障; 故意在生產(chǎn)中引入這些故障。
演練準(zhǔn)備

災(zāi)難來襲


找到問題根源和解決問題的時(shí)間點(diǎn); 是否有用戶已經(jīng)注意到這個(gè)問題; 是否需要人工干預(yù)這個(gè)問題; 這個(gè)問題的嚴(yán)重程度; 演練計(jì)劃的文檔是否有差錯(cuò); Grafana中的儀表板是否已過時(shí)。
演練結(jié)果

未來展望


評(píng)論
圖片
表情

