往期熱門文章:
1、《往期精選優(yōu)秀博文都在這里了!》
2、接口的冪等性的N種考慮,你知道嗎?
3、如果程序員和產(chǎn)品經(jīng)理都用凡爾賽文學(xué)對(duì)話......
4、Spring Boot 2.4.0正式發(fā)布,全新的配置文件加載機(jī)制(不向下兼容)
5、Insert into select語(yǔ)句引發(fā)的生產(chǎn)事故!
今天分享一下以前入職現(xiàn)在公司第一次發(fā)布項(xiàng)目遇到的一個(gè)問(wèn)題,一個(gè)數(shù)據(jù)庫(kù)讀寫分離的坑。前言
事情是這樣的,剛?cè)肼毜臅r(shí)候接到了這樣的一個(gè)業(yè)務(wù)需求:每個(gè)支付通道支付失敗的時(shí)候都會(huì)返回特定的錯(cuò)誤碼,業(yè)務(wù)內(nèi)部需要將通道特定的錯(cuò)誤碼轉(zhuǎn)義成內(nèi)部的錯(cuò)誤碼,這樣對(duì)外就可以統(tǒng)一返回我們自己的錯(cuò)誤碼。這個(gè)需求其實(shí)不難,當(dāng)時(shí)設(shè)計(jì)的系統(tǒng)架構(gòu)如下:新增規(guī)則的流程簡(jiǎn)單分為三步:- 業(yè)務(wù)人員通過(guò)管理后臺(tái)新增映射規(guī)則
- 數(shù)據(jù)庫(kù)新增、修改這條映射規(guī)則
這里之所以增加緩存,是因?yàn)檫@個(gè)場(chǎng)景每次支付都需要使用,使用緩存可以避免每次都去數(shù)據(jù)庫(kù)讀取,增加讀取速度。后續(xù)支付請(qǐng)求業(yè)務(wù)流程如下:
數(shù)據(jù)庫(kù)讀寫分離-用戶操作當(dāng)緩存內(nèi)映射規(guī)則不存在的時(shí)候,將會(huì)查詢數(shù)據(jù)庫(kù),然后加載到緩存中。如果緩存內(nèi)映射規(guī)則已存在,將會(huì)直接使用緩存內(nèi)映射規(guī)則。這個(gè)業(yè)務(wù)流程其實(shí)比較簡(jiǎn)單,當(dāng)時(shí)在測(cè)試環(huán)境測(cè)試也沒問(wèn)題,后續(xù)發(fā)布線上環(huán)境的卻碰到奇怪的問(wèn)題。「新增規(guī)則之后,一段時(shí)間內(nèi),映射規(guī)則并沒有生效。查看日志發(fā)現(xiàn),查詢數(shù)據(jù)庫(kù)的時(shí)候,沒有數(shù)據(jù)。」這就很奇怪了,日志顯示新增是成功,但是查詢卻沒有數(shù)據(jù)。但是過(guò)了一段時(shí)間,再次查詢卻又有了數(shù)據(jù)。走查了下代碼,發(fā)現(xiàn)并沒有什么問(wèn)題,第二天上班的時(shí)候請(qǐng)教了一下同事,才知道問(wèn)題的原因:原來(lái)線上的數(shù)據(jù)庫(kù)采用主從架構(gòu),數(shù)據(jù)讀寫分離,數(shù)據(jù)查詢走的是從庫(kù)。數(shù)據(jù)寫入都是直接操作主庫(kù),后續(xù)再同步到從庫(kù)。「由于數(shù)據(jù)庫(kù)同步存在延時(shí),這就導(dǎo)致數(shù)據(jù)同步的這段時(shí)間,主從數(shù)據(jù)將會(huì)不一致,從庫(kù)無(wú)法查詢到最新的數(shù)據(jù)。」如果你之前的數(shù)據(jù)庫(kù)系統(tǒng)架構(gòu)是單庫(kù)或者主備結(jié)構(gòu),當(dāng)你第一次轉(zhuǎn)到數(shù)據(jù)讀寫分離架構(gòu),這個(gè)坑大概率也會(huì)踩到。數(shù)據(jù)庫(kù)系統(tǒng)架構(gòu)發(fā)展
下面我們首先了解一下數(shù)據(jù)庫(kù)系統(tǒng)架構(gòu),最后再來(lái)看下如何解決主從同步延時(shí)的導(dǎo)致數(shù)據(jù)不一致。主備架構(gòu)
業(yè)務(wù)發(fā)展的前期,數(shù)據(jù)訪問(wèn)量小,這時(shí)我們可以直接采用單庫(kù)的架構(gòu)。不過(guò)我們一般不使用的上面的架構(gòu),因?yàn)榇嬖趩吸c(diǎn)的問(wèn)題。若數(shù)據(jù)庫(kù)出現(xiàn)故障,這段期間業(yè)務(wù)將會(huì)不可用。我們除了等待重啟,其他沒什么解決辦法。所以我們會(huì)增加一個(gè)備庫(kù),實(shí)時(shí)同步主庫(kù)的數(shù)據(jù)。
主備架構(gòu)一旦「主庫(kù)」出了故障,通過(guò)人工的方式,手動(dòng)的將「主機(jī)」踢下線,將「?jìng)錂C(jī)」改為「主機(jī)」來(lái)繼續(xù)提供服務(wù)。這種架構(gòu),部署維護(hù)簡(jiǎn)單,業(yè)務(wù)開發(fā)也無(wú)需任何改造。不過(guò)缺點(diǎn)也很明顯,備庫(kù)只有在主庫(kù)有問(wèn)題的時(shí)候才會(huì)被啟用,存在一定的資源浪費(fèi)的情況。主從架構(gòu)
隨著業(yè)務(wù)發(fā)展,請(qǐng)求量不斷變大,數(shù)據(jù)量也不斷變大,業(yè)務(wù)變得更加復(fù)雜,很快數(shù)據(jù)將會(huì)到達(dá)瓶頸。由于大多數(shù)業(yè)務(wù)都是讀多寫少,所以數(shù)據(jù)庫(kù)讀的最容易成為系統(tǒng)瓶頸。這時(shí)候我們可以提高讀的性能,這時(shí)我們的可以采用的方案,增加從實(shí)例,主從同步,數(shù)據(jù)讀寫分離。可以看到這個(gè)架構(gòu)與主備沒什么區(qū)別,主要區(qū)別在于主從架構(gòu)下,從庫(kù)與主庫(kù)一樣,時(shí)刻需要干活,主庫(kù)提供寫服務(wù),從庫(kù)只提供讀服務(wù)。如果后續(xù)讀的壓力還是太大,我們還可以增加從庫(kù)的數(shù)量,水平擴(kuò)充讀的能力。雖然主從架構(gòu)幫我們解決讀的瓶頸,但是由于主從之間需要數(shù)據(jù)同步,這天然就存在一定延時(shí)。在這延時(shí)窗口期內(nèi),從庫(kù)的讀只能讀到一個(gè)舊數(shù)據(jù),這也是上面案例問(wèn)題的真正的原因。接下來(lái)我們來(lái)看下有什么辦法可以優(yōu)化這種情況。主從延時(shí)解決辦法
忍受大法
第一種解決辦法,很簡(jiǎn)單,無(wú)他,不管他,沒有讀到也沒事。這時(shí)業(yè)務(wù)不需要任何改造,你好,我好,她也好~如果業(yè)務(wù)對(duì)于數(shù)據(jù)一致性要求不高,我們就可以采用這種方案。數(shù)據(jù)同步寫方案
主從數(shù)據(jù)同步方案,一般都是采用的異步方式同步給備庫(kù)。我們可以將其修改為同步方案,主從同步完成,主庫(kù)上的寫才能返回。 
- 業(yè)務(wù)系統(tǒng)發(fā)起寫操作,數(shù)據(jù)寫主庫(kù)
- 數(shù)據(jù)讀從庫(kù),主從同步完成就能讀到最新數(shù)據(jù)
這種方案,我們只需要修改數(shù)據(jù)庫(kù)之間同步配置即可,業(yè)務(wù)層無(wú)需修改,相對(duì)簡(jiǎn)單。「不過(guò),由于主庫(kù)寫需要等待主從完成,寫請(qǐng)求的時(shí)延將會(huì)增加,吞吐量將會(huì)降低。」這一點(diǎn)對(duì)于現(xiàn)在在線業(yè)務(wù),可能無(wú)法接受。選擇性強(qiáng)制讀主
對(duì)于需要強(qiáng)一致的場(chǎng)景,我們可以將其的讀請(qǐng)求都操作主庫(kù),這樣「讀寫都在主庫(kù)」,就沒有不一致的情況。這種方案業(yè)務(wù)層需要改造一下,將其強(qiáng)制性讀主,相對(duì)改造難度較低。不過(guò)這種方案相對(duì)于浪費(fèi)了另一個(gè)數(shù)據(jù)庫(kù),增加主庫(kù)的壓力。中間件選擇路由法
這種方案需要使用一個(gè)中間件,所有數(shù)據(jù)庫(kù)操作都先發(fā)到中間件,由中間件再分發(fā)到相應(yīng)的數(shù)據(jù)庫(kù)。- 寫請(qǐng)求,中間件將會(huì)發(fā)到主庫(kù),同時(shí)記錄一下此時(shí)寫請(qǐng)求的 key(操作表加主鍵等)
- 讀請(qǐng)求,如果此時(shí) key 存在,將會(huì)路由到主庫(kù)
- 一定時(shí)間后(經(jīng)驗(yàn)值),中間件認(rèn)為主從同步完成,刪除這個(gè) key,后續(xù)讀將會(huì)讀從庫(kù)
這種方案,可以保持?jǐn)?shù)據(jù)讀寫的一致。但是系統(tǒng)架構(gòu)增加了一個(gè)中間件,整體復(fù)雜度變高,業(yè)務(wù)開發(fā)也變得復(fù)雜,學(xué)習(xí)成本也比較高。緩存路由大法
這種方案與中間件的方案流程比較類似,不過(guò)改造成本相對(duì)較低,不需要增加任何中間件。- 寫請(qǐng)求發(fā)往主庫(kù),同時(shí)緩存記錄操作的 key,緩存的失效時(shí)間設(shè)置為主從的延時(shí)
- 若存在,代表剛發(fā)生過(guò)寫操作,讀請(qǐng)求操作主庫(kù)
- 若不存在,代表近期沒發(fā)生寫操作,讀請(qǐng)求操作從庫(kù)
這種方案相對(duì)中間件的方案成本較低,但是呢我們此時(shí)又引入一個(gè)緩存組件,所有讀寫之間就又多了一步緩存操作。總結(jié)
我們引入主從架構(gòu),數(shù)據(jù)讀寫分離,目的是為了解決業(yè)務(wù)快速發(fā)展,請(qǐng)求量變大,并發(fā)量變大,從而引發(fā)的數(shù)據(jù)庫(kù)的讀瓶頸。不過(guò)當(dāng)引入新一個(gè)架構(gòu)解決問(wèn)題時(shí),勢(shì)必會(huì)帶來(lái)另外一個(gè)問(wèn)題,數(shù)據(jù)庫(kù)讀寫分離之后,主從延遲從而導(dǎo)致數(shù)據(jù)不一致的情況。,為了解決主從延遲,數(shù)據(jù)不一致的情況,我們可以采用以下這幾種方案:
上面的方案都有各自的優(yōu)點(diǎn),當(dāng)然也有相應(yīng)的缺點(diǎn),我們需要根據(jù)自己的業(yè)務(wù)情況,選擇相應(yīng)的解決方案。