第一次接到凌晨三點的告警電話時,我慌了十分鐘才想起 應變手冊 放在哪裡。那一晚之後,我對系統維運的理解完全不一樣。
第一件事:告警一定要可行動。不能修的告警只會消耗人,該砍就砍。第二件事:應變手冊 要寫給睡眼惺忪的自己看,不要有隱含的步驟。第三件事:事後一定要寫 事後檢討,不是為了檢討誰,而是為了不再重演。
半夜爬起來處理事故沒人喜歡,但它確實是讓系統變穩的最快方式——如果你願意從每一次事故裡學東西的話。

第一次接到凌晨三點的告警電話時,我慌了十分鐘才想起 應變手冊 放在哪裡。那一晚之後,我對系統維運的理解完全不一樣。
第一件事:告警一定要可行動。不能修的告警只會消耗人,該砍就砍。第二件事:應變手冊 要寫給睡眼惺忪的自己看,不要有隱含的步驟。第三件事:事後一定要寫 事後檢討,不是為了檢討誰,而是為了不再重演。
半夜爬起來處理事故沒人喜歡,但它確實是讓系統變穩的最快方式——如果你願意從每一次事故裡學東西的話。
發佈留言