記一次線上問(wèn)題排查與解決

文 |?極光
來(lái)源:Python 技術(shù)「ID: pythonall」

最近開發(fā)中遇到個(gè)小問(wèn)題,因?yàn)闃I(yè)務(wù)上的設(shè)計(jì)存在問(wèn)題,導(dǎo)致數(shù)據(jù)庫(kù)表總是被鎖,而且是不定期的鎖定,導(dǎo)致服務(wù)器運(yùn)行異常,最后經(jīng)過(guò)排查原因是多線程同時(shí)更新同一表中同一條記錄導(dǎo)致問(wèn)題。今天就來(lái)跟大家說(shuō)說(shuō)該如何避免這種問(wèn)題。
問(wèn)題描述
最近因?yàn)楣緲I(yè)務(wù)需要,產(chǎn)品設(shè)計(jì)了一套業(yè)務(wù)系統(tǒng),據(jù)說(shuō)會(huì)有很多內(nèi)部和外部人員使用,拿到系統(tǒng)說(shuō)明我們研發(fā)部門拼命加班趕時(shí)間,經(jīng)歷了兩個(gè)月的后終于把系統(tǒng)上線運(yùn)行。
剛開始用的人少,并沒(méi)有出現(xiàn)什么問(wèn)題,感覺(jué)系統(tǒng)還是很穩(wěn)定,隨著后來(lái)用的人越來(lái)越多,系統(tǒng)就開始出現(xiàn)一些莫名其妙的問(wèn)題,其中就有某些業(yè)務(wù)信息在更新的時(shí)候總是報(bào)錯(cuò),查日志就發(fā)現(xiàn)是表記錄被鎖定導(dǎo)致更新失敗。
找到錯(cuò)誤問(wèn)題后我們就開始一遍遍的翻日志,各種分析查找到底是什么原因?qū)е铝吮碛涗洷绘i。最后發(fā)現(xiàn)這個(gè)表的狀態(tài)字段,存在多個(gè)接口方法同時(shí)更新的情況,而且經(jīng)常是同時(shí)操作的。也就是數(shù)據(jù)庫(kù)中存在多個(gè)會(huì)話同時(shí)操作同一表中同一行記錄,從而導(dǎo)致表記錄被鎖。
問(wèn)題分析
那定位到問(wèn)題,要如何解決呢?這里我們先了解兩個(gè)名詞:
悲觀鎖(Pessimistic Lock):簡(jiǎn)單解釋就是很悲觀,每次去拿數(shù)據(jù)的時(shí)候都認(rèn)為別人會(huì)修改,所以每次在修改數(shù)據(jù)的時(shí)候都會(huì)上鎖,這樣別人想修改這個(gè)數(shù)據(jù)就會(huì)等待一直到它能拿到鎖。
樂(lè)觀鎖(Optimistic Lock):這個(gè)正好相反,就是很樂(lè)觀,每次去修改數(shù)據(jù)的時(shí)候都認(rèn)為別人不會(huì)修改,所以不會(huì)上鎖,但是在提交更新的時(shí)候會(huì)判斷一下在此期間別人有沒(méi)有去更新這個(gè)數(shù)據(jù)。樂(lè)觀鎖適用于讀多寫少的應(yīng)用場(chǎng)景,這樣可以提高吞吐量。
通過(guò)這兩種方式就能解決問(wèn)題,不過(guò)選哪種比較好,我們來(lái)簡(jiǎn)單分析下:
悲觀鎖 通過(guò) “select …… for update” 實(shí)現(xiàn),就是在更新表前先對(duì)這條記錄進(jìn)行上鎖,然后下面再執(zhí)行更新語(yǔ)句。不過(guò)這種方式有些太重,畢竟加鎖還是需要很大時(shí)間成本的,不符合業(yè)務(wù)的需要,直接pass掉。
樂(lè)觀鎖 相對(duì)就要輕量很多,它的主要實(shí)現(xiàn)就是通過(guò)在表中多增加一個(gè)記錄版本的字段,比如 version 。然后每次查詢記錄要更新時(shí),where 后面都要加上 version=? ,這樣當(dāng)你查詢拿到 version 后,如果有其他會(huì)話更新了這個(gè)字段,那這個(gè) version 就會(huì)和你現(xiàn)在拿的不一樣,從而會(huì)使你這次的更新失效,需要重新獲取最新 version 后再次執(zhí)行 update 語(yǔ)句。
問(wèn)題解決
好了,經(jīng)過(guò)以上分析,已經(jīng)有了比較清晰的解決思路,剩下就是碼代碼了:
????/**
?????*?樂(lè)觀鎖更新
?????*?@param?id
?????*?@return
?????*/
????public?boolean?update(int?id){
????????int?cnt?=?0;
????????while?(cnt?==?0)?{
????????????USER?user?=?query("SELECT?*?FROM?table_user?WHERE?id?=?#{id}",?id);
????????????cnt?=?update("UPDATE?table_user?SET?version=version?+?1,?status?=?2?WHERE?id=#{id}?AND?version=#{version}",?id,?user.version());
????????????if(cnt?>?0){
???????????????//?返回更新成功
????????????????return?true;
????????????}
????????}
????????return?false;
????}
總結(jié)
這里只是基于 Mysql 自身特性解決這個(gè)問(wèn)題,當(dāng)然還有很多其他的方式可以解決,例如通過(guò) Redis 或者 MQ 消息隊(duì)列等,如果大家感興趣我們可以以后再介紹。OK,這次就聊這些,如果你喜歡記得點(diǎn) 在看。
PS:公號(hào)內(nèi)回復(fù)「Python」即可進(jìn)入Python 新手學(xué)習(xí)交流群,一起 100 天計(jì)劃!
老規(guī)矩,兄弟們還記得么,右下角的 “在看” 點(diǎn)一下,如果感覺(jué)文章內(nèi)容不錯(cuò)的話,記得分享朋友圈讓更多的人知道!


【代碼獲取方式】
