<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          慘!一個(gè) rm -rf 把公司整個(gè)數(shù)據(jù)庫(kù)刪沒(méi)了...

          共 4279字,需瀏覽 9分鐘

           ·

          2021-03-26 08:35



          點(diǎn)擊關(guān)注上方“SQL數(shù)據(jù)庫(kù)開(kāi)發(fā)”,

          設(shè)為“置頂或星標(biāo)”,第一時(shí)間送達(dá)干貨

          SQL專(zhuān)欄

          SQL基礎(chǔ)知識(shí)第二版
          SQL高級(jí)知識(shí)第二版

          作者:zhouyu

          鏈接:cnblogs.com/zhouyu629/p/3734494.html


          經(jīng)歷了兩天不懈努力,終于恢復(fù)了一次誤操作刪除的生產(chǎn)服務(wù)器數(shù)據(jù)。

          對(duì)本次事故過(guò)程和解決辦法記錄在此,警醒自己,也提示別人莫犯此錯(cuò)。

          也希望遇到問(wèn)題的朋友能找到一絲靈感解決問(wèn)題。


          事故背景


          安排一個(gè)同事在一臺(tái)生產(chǎn)服務(wù)器上安裝 Oracle,同事邊研究邊安裝,感覺(jué)裝的不對(duì),準(zhǔn)備卸載重新安裝。


          從網(wǎng)上找到卸載方法,其中要執(zhí)行一行命令刪除 Oracle 的安裝目錄,命令如下:
          rm -rf $ORACLE_BASE/*


          如果 ORACLE_BASE 這個(gè)變量沒(méi)有賦值,那命令就變成了:
          rm -rf /*


          等等,同事使用的可是 Root 賬戶(hù)啊。就這樣,把整個(gè)盤(pán)的文件全部刪除了,包括應(yīng)用 Tomcat、MySQL 數(shù)據(jù)庫(kù) and so on......



          MySQL 數(shù)據(jù)庫(kù)不是在運(yùn)行嗎?Linux 能刪除正在執(zhí)行的文件?反正是徹底刪除了,最后還剩一個(gè) Tomcat 的 Log 文件,估計(jì)是文件過(guò)大,一時(shí)沒(méi)有刪除成功。


          看著同事自責(zé)的眼神,又是因?yàn)檫@事是我安排做的,也沒(méi)有跟講清厲害關(guān)系,沒(méi)有任何培訓(xùn),責(zé)任只能一個(gè)人背了,況且怎么能讓同事背負(fù)這個(gè)責(zé)任呢?


          打電話到機(jī)房,將盤(pán)掛到另一臺(tái)服務(wù)器上,SSH 上去查看文件全部被清,這臺(tái)服務(wù)器運(yùn)行的可是一個(gè)客戶(hù)的生產(chǎn)系統(tǒng)啊,已經(jīng)運(yùn)行大半年了,得盡快恢復(fù)啊。


          于是找來(lái)脫機(jī)備份的數(shù)據(jù)庫(kù),發(fā)現(xiàn)備份文件只有 1KB,里面只有幾行熟悉的 mysqldump 注釋?zhuān)y道是 Crontab 執(zhí)行的備份腳本有問(wèn)題),最接近的備份也是 2013 年 12 月份的了,真是屋漏偏逢連夜雨啊。


          想起來(lái)一位領(lǐng)導(dǎo)說(shuō)過(guò)的案例:當(dāng)一個(gè)生產(chǎn)系統(tǒng)掛掉以后,發(fā)現(xiàn)所有備份都有問(wèn)題,刻錄的光盤(pán)也有劃痕,磁帶機(jī)也壞了(一個(gè)業(yè)界前輩,估計(jì)以前還用光盤(pán)做備份了),沒(méi)想到今天真的應(yīng)驗(yàn)到我的身上了,怎么辦?


          部門(mén)領(lǐng)導(dǎo)知道情況后,已經(jīng)做了最壞的 B 計(jì)劃:領(lǐng)導(dǎo)親自帶隊(duì)和產(chǎn)品 AA 周日趕到客戶(hù)所在的地市,星期一去領(lǐng)導(dǎo)層溝通;BB 和 CC 去客戶(hù)管理員那邊想辦法說(shuō)服客戶(hù)......

          救命稻草:ext3grep


          趕快到網(wǎng)上去查資料進(jìn)行誤刪數(shù)據(jù)恢復(fù),還真找到一款 ext3grep 能夠恢復(fù)通過(guò) rm -rf 刪除的文件,我們磁盤(pán)也是 ext3 格式,且網(wǎng)上有不少的成功案例。


          于是燃起了一絲希望,趕快對(duì)盤(pán) umount,防止重新寫(xiě)入補(bǔ)刪文件扇區(qū)。下載 ext3grep,安裝(編譯安裝過(guò)程艱辛?xí)呵也槐恚?/span>


          先執(zhí)行掃描文件名命令
          ext3grep /dev/vgdata/LogVol00 --dump-names


          打印出了所有被刪除文件及路徑,心中狂喜,不用執(zhí)行 B 計(jì)劃了,文件都在呢。


          這款軟件不能按目錄恢復(fù)文件,只能執(zhí)行恢復(fù)全部命令:
          ext3grep /dev/vgdata/LogVol00 --restore-all


          結(jié)果當(dāng)前盤(pán)空間不足,沒(méi)辦法只能恢復(fù)文件,嘗試了幾個(gè)文件,居然部分成功部分失?。?/span>
          ext3grep /dev/vgdata/LogVol00 --restore-file var/lib/mysql/aqsh/tb_b_attench.MYD


          心里不禁一涼,難道是刪除磁盤(pán)上被寫(xiě)過(guò)文件了?恢復(fù)機(jī)率不大了啊,能恢復(fù)幾個(gè)算幾個(gè)吧,說(shuō)不定重要數(shù)據(jù)文件剛好在能恢復(fù)的 MYD 文件中。


          于是先將所有文件名重定向到一個(gè)文件文件中:
          ext3grep /dev/vgdata/LogVol00 --dump-names >/usr/allnames.txt


          過(guò)濾出來(lái)所有 MySQL 數(shù)據(jù)庫(kù)的文件名存成 mysqltbname.txt。


          編寫(xiě)腳本恢復(fù)文件:
          while read LINE
          do
              echo "begin to restore file " $LINE
              ext3grep /dev/vgdata/LogVol00 --restore-file $LINE
              if [ $? != 0 ]
              then
                  echo "restore failed, exit"
                 # exit 1
              fi
          done < ./mysqltbname.txt


          執(zhí)行,大概運(yùn)行了 20 分鐘,恢復(fù)了 40 多個(gè)文件,但不夠啊,我們將近 100 張表,每張表 frm,myd,myi 三個(gè)文件,怎么說(shuō)也有 300 多個(gè)左右?。?/span>


          將找回來(lái)的文件附到現(xiàn)有數(shù)據(jù)庫(kù)上,更要文件權(quán)限為 777 后,重啟 MySQL,也算是找回一部分?jǐn)?shù)據(jù)了,但客戶(hù)重要的考勤簽到數(shù)據(jù)、手機(jī)端上報(bào)數(shù)據(jù)(據(jù)說(shuō)客戶(hù)按這些數(shù)據(jù)做員工績(jī)效的)還沒(méi)找回來(lái)啊。


          咋辦?中間又試了另一款工具 extundelete,跟 ext3grep 語(yǔ)法基本一致,原理應(yīng)該也一樣了,但是據(jù)說(shuō)能按目錄恢復(fù)。


          好吧,試一試:
          extundelete /dev/vgdata/LogVol00 --restore-directory var/lib/mysql/aqsh


          果然不出所料,恢復(fù)不出來(lái)!?。。。。。?!那些文件已被破壞了。跟領(lǐng)導(dǎo)匯報(bào),執(zhí)行 B 計(jì)劃吧......無(wú)奈之下下班回家。(周末了,回去休息一下,想想辦法吧)

          靈機(jī)一動(dòng):Binlog


          第二天早晨一早就醒了(心里有事?。?,背上電腦,去公司(這個(gè)周末算是報(bào)銷(xiāo)了,不挨批,通報(bào),罰款,開(kāi)除就不錯(cuò)了,還過(guò)什么周末?。?。


          依舊運(yùn)行 ext3grep,extundelete,也就那幾招啊,把系統(tǒng)架到測(cè)試服務(wù)器上,看看數(shù)據(jù)能不能想辦法補(bǔ)一補(bǔ)吧。


          在測(cè)試服務(wù)器上進(jìn)行 mysqldump,恢復(fù)文件,覆蓋恢復(fù)回來(lái)的文件,給文件加權(quán)限,重啟 MySQL。


          Wait,Wait,不是有 Binlog 嗎?我們服務(wù)都要求開(kāi)啟 Binlog,說(shuō)不定能通過(guò) Binlog 里恢復(fù)數(shù)據(jù)呢?


          于是從 Dump 出來(lái)的文件名里找到 Binlog 的文件,一共三個(gè):
          • mysql-binlog0001
          • mysql-bin.000009
          • mysql-bin.000010


          恢復(fù)一下 0001:
          ext3grep /dev/vgdata/LogVol00 --restore-file var/lib/mysql/mysql-bin.000001


          居然失敗了......再看另兩個(gè)文件,mysql-bin.000010 大概幾百 MB,應(yīng)該靠譜一點(diǎn),執(zhí)行還原命令,居然成功了!


          趕快 SCP 到測(cè)試服務(wù)器。執(zhí)行 Binlog 還原:
          mysqlbinlog /usr/mysql-bin.000010 | mysql -uroot -p


          輸入密碼,卡住了(好現(xiàn)象),經(jīng)過(guò)漫長(zhǎng)的等待,終于結(jié)束了。打開(kāi)應(yīng)用,哦,感謝 CCTV,MTV,數(shù)據(jù)回來(lái)了!

          后記



          也希望謹(jǐn)記此次事故,以后不再犯同樣的錯(cuò)誤。事故反思如下:

          • 本次安排 MM 進(jìn)行服務(wù)器維護(hù)時(shí)沒(méi)有提前對(duì)她進(jìn)行說(shuō)明厲害情況,自己也未重視,管理混亂,流程混亂。一個(gè)在線的生產(chǎn)系統(tǒng),任何一個(gè)改動(dòng)一定要先謀而后動(dòng)。
          • 自動(dòng)備份出現(xiàn)問(wèn)題,沒(méi)有任何人檢查。脫機(jī)備份人員每次從服務(wù)器上下載 1K 的文件卻從未重視。需要明確大家在工作崗位上的責(zé)任。
          • 事故發(fā)生后,沒(méi)有及時(shí)發(fā)現(xiàn),造成部分?jǐn)?shù)據(jù)寫(xiě)入磁盤(pán),造成不可恢復(fù)問(wèn)題。需要編寫(xiě)應(yīng)用監(jiān)控程序,服務(wù)一旦有異常,短信告警相關(guān)責(zé)任人。
          • 根據(jù)評(píng)論提醒,再加一條:不能使用 Root 用戶(hù)來(lái)操作。應(yīng)該在服務(wù)器上開(kāi)設(shè)不同權(quán)限級(jí)別的用戶(hù)。


          通過(guò)本次事故
          分享下本文所用到的工具鏈接:

          1.https://code.google.com/p/ext3grep/
          2.http://extundelete.sourceforge.net/

          功能跟 ext3grep 差不多,原理應(yīng)該也差不多。編譯安裝依賴(lài)包比較多,可以到網(wǎng)上搜索如何安裝?!究上У氖亲髡呓o出的 howto 被墻了,我 FQ 將 howto 的 pdf 文檔下載下來(lái)了,讀完后你將會(huì)對(duì) Linux 的文件系統(tǒng)有進(jìn)一步的認(rèn)識(shí)。】


          這個(gè)工具有一個(gè) Bug,出錯(cuò)后不會(huì)向下執(zhí)行:
          ext3grep: init_directories.cc:534: void init_directories(): Assertion `lost_plus_found_directory_iter != all_directories.end()' failed.


          最后希望各位同行的小伙伴們能謹(jǐn)記本文事件,開(kāi)心敲代碼,永遠(yuǎn)不出錯(cuò)~

          你呢,有什么類(lèi)似經(jīng)歷嗎?

          最后給大家分享我寫(xiě)的SQL兩件套:《SQL基礎(chǔ)知識(shí)第二版》《SQL高級(jí)知識(shí)第二版》的PDF電子版。里面有各個(gè)語(yǔ)法的解釋、大量的實(shí)例講解和批注等等,非常通俗易懂,方便大家跟著一起來(lái)實(shí)操。


          有需要的讀者可以下載學(xué)習(xí),在下面的公眾號(hào)「數(shù)據(jù)前線」(非本號(hào))后臺(tái)回復(fù)關(guān)鍵字:SQL,就行

          數(shù)據(jù)前線


          后臺(tái)回復(fù)關(guān)鍵字:1024,獲取一份精心整理的技術(shù)干貨

          后臺(tái)回復(fù)關(guān)鍵字:進(jìn)群,帶你進(jìn)入高手如云的交流群

          記得幫忙點(diǎn)「」和「在看」↓

          謝謝啦

          瀏覽 58
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧美亚洲国产日韩 | 就爱搞AⅤ | 天天爽天天日天天射天天舔天天操天天射天天搞 | 亚洲无 码A片在线 | 99在线观看 |