<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          好好的系統(tǒng),為什么要分庫(kù)分表?

          共 7791字,需瀏覽 16分鐘

           ·

          2022-11-24 16:33

          大家好,我是小富~ ? ??

          說(shuō)在前邊

          今天是《分庫(kù)分表 ShardingSphere 原理與實(shí)戰(zhàn)》系列的開篇文章,之前寫過(guò)幾篇關(guān)于分庫(kù)分表的文章反響都還不錯(cuò),到現(xiàn)在公眾號(hào):程序員小富后臺(tái)不斷的有人留言、咨詢分庫(kù)分表的問題。

          我也沒想到大家對(duì)于分庫(kù)分表的話題會(huì)這么感興趣,可能很多人的工作內(nèi)容業(yè)務(wù)量較小很難接觸到這方面的技能。這個(gè)系列在我腦子里籌劃了挺久的,奈何手說(shuō)啥也不干活,就一直拖到了現(xiàn)在。

          92440e2fcee3fc5b9a0f5c425dcea9ee.webp

          其實(shí)網(wǎng)上關(guān)于分庫(kù)分表相關(guān)的文章很多,但我還是堅(jiān)持出這個(gè)系列,主要是自己學(xué)習(xí)研究,順便給分享,對(duì)于一個(gè)知識(shí),不同的人從不同的角度理解的不盡相同。

          網(wǎng)上的資料看似很多,不過(guò)值得學(xué)有價(jià)值的得仔細(xì)挑,很多時(shí)候在篩選甄別的過(guò)程中,逐漸的磨滅了本就不高的學(xué)習(xí)熱情。搬運(yùn)抄襲雷同的東西太多,而且知識(shí)點(diǎn)又都比較零碎,很少有細(xì)致的原理實(shí)戰(zhàn)案例。對(duì)新手來(lái)說(shuō)妥妥的從入門到放棄,即便有成體系的基本上幾篇后就斷更了(希望我不會(huì)吧!)。

          我不太喜歡堆砌名詞概念,熟悉我的朋友不難發(fā)現(xiàn),我的文章從來(lái)都是講完原理緊跟著來(lái)一波實(shí)戰(zhàn)操作。學(xué)習(xí)技術(shù)原理必須配合實(shí)操鞏固一下,不然三天半不到忘得干干凈凈,純純的經(jīng)驗(yàn)之談。

          a79f92636768351e03e7caa89b3e3573.webpShardingSphere知識(shí)點(diǎn)梳理

          上圖是我初步羅列的ShardingSphere提綱,在官網(wǎng)文檔基礎(chǔ)上補(bǔ)充了很多基礎(chǔ)知識(shí),這個(gè)系列會(huì)用幾十篇文章,詳細(xì)的梳理分庫(kù)分表基礎(chǔ)理論,手把手的實(shí)戰(zhàn)ShardingSphere 5.X框架的功能和解讀源碼,以及開發(fā)中容易踩坑的點(diǎn),每篇附帶代碼案例demo,旨在讓新手也能看的懂,后續(xù)系列完結(jié)全部?jī)?nèi)容會(huì)整理成PDF分享給大家,期待一下吧!

          d4e3be41c4f4db8230fb5aa53a1a7795.webp

          話不多說(shuō),咱們這就進(jìn)入正題~

          不急于上手實(shí)戰(zhàn)ShardingSphere框架,先來(lái)復(fù)習(xí)下分庫(kù)分表的基礎(chǔ)概念,技術(shù)名詞大多晦澀難懂,不要死記硬背理解最重要,當(dāng)你捅破那層窗戶紙,發(fā)現(xiàn)其實(shí)它也就那么回事。

          什么是分庫(kù)分表

          分庫(kù)分表是在海量數(shù)據(jù)下,由于單庫(kù)、表數(shù)據(jù)量過(guò)大,導(dǎo)致數(shù)據(jù)庫(kù)性能持續(xù)下降的問題,演變出的技術(shù)方案。

          分庫(kù)分表是由分庫(kù)分表這兩個(gè)獨(dú)立概念組成的,只不過(guò)通常分庫(kù)與分表的操作會(huì)同時(shí)進(jìn)行,以至于我們習(xí)慣性的將它們合在一起叫做分庫(kù)分表。

          ed7b86e52cf36b68d5e69b5e0c2c8992.webp

          通過(guò)一定的規(guī)則,將原本數(shù)據(jù)量大的數(shù)據(jù)庫(kù)拆分成多個(gè)單獨(dú)的數(shù)據(jù)庫(kù),將原本數(shù)據(jù)量大的表拆分成若干個(gè)數(shù)據(jù)表,使得單一的庫(kù)、表性能達(dá)到最優(yōu)的效果(響應(yīng)速度快),以此提升整體數(shù)據(jù)庫(kù)性能。

          為什么分庫(kù)分表

          單機(jī)數(shù)據(jù)庫(kù)的存儲(chǔ)能力、連接數(shù)是有限的,它自身就很容易會(huì)成為系統(tǒng)的瓶頸。當(dāng)單表數(shù)據(jù)量在百萬(wàn)以里時(shí),我們還可以通過(guò)添加從庫(kù)、優(yōu)化索引提升性能。

          一旦數(shù)據(jù)量朝著千萬(wàn)以上趨勢(shì)增長(zhǎng),再怎么優(yōu)化數(shù)據(jù)庫(kù),很多操作性能仍下降嚴(yán)重。為了減少數(shù)據(jù)庫(kù)的負(fù)擔(dān),提升數(shù)據(jù)庫(kù)響應(yīng)速度,縮短查詢時(shí)間,這時(shí)候就需要進(jìn)行分庫(kù)分表。

          為什么需要分庫(kù)?

          容量

          我們給數(shù)據(jù)庫(kù)實(shí)例分配的磁盤容量是固定的,數(shù)據(jù)量持續(xù)的大幅增長(zhǎng),用不了多久單機(jī)的容量就會(huì)承載不了這么多數(shù)據(jù),解決辦法簡(jiǎn)單粗暴,加容量!

          連接數(shù)

          單機(jī)的容量可以隨意擴(kuò)展,但數(shù)據(jù)庫(kù)的連接數(shù)卻是有限的,在高并發(fā)場(chǎng)景下多個(gè)業(yè)務(wù)同時(shí)對(duì)一個(gè)數(shù)據(jù)庫(kù)操作,很容易將連接數(shù)耗盡導(dǎo)致too many connections報(bào)錯(cuò),導(dǎo)致后續(xù)數(shù)據(jù)庫(kù)無(wú)法正常訪問。

          可以通過(guò)max_connections查看MySQL最大連接數(shù)。

                
                show?variables?like?'%max_connections%'
          5f816a99dd2d5b40d01cd986ee1bd027.webp

          將原本單數(shù)據(jù)庫(kù)按不同業(yè)務(wù)拆分成訂單庫(kù)、物流庫(kù)、積分庫(kù)等不僅可以有效分?jǐn)倲?shù)據(jù)庫(kù)讀寫壓力,也提高了系統(tǒng)容錯(cuò)性。

          為什么需要分表?

          做過(guò)報(bào)表業(yè)務(wù)的同學(xué)應(yīng)該都體驗(yàn)過(guò),一條SQL執(zhí)行時(shí)間超過(guò)幾十秒的場(chǎng)景。

          導(dǎo)致數(shù)據(jù)庫(kù)查詢慢的原因有很多,SQL沒命中索引、like掃全表、用了函數(shù)計(jì)算,這些都可以通過(guò)優(yōu)化手段解決,可唯獨(dú)數(shù)據(jù)量大是MySQL無(wú)法通過(guò)自身優(yōu)化解決的。慢的根本原因是InnoDB存儲(chǔ)引擎,聚簇索引結(jié)構(gòu)的 B+tree 層級(jí)變高,磁盤IO變多查詢性能變慢,詳細(xì)原理自行查找一下,這里不用過(guò)多篇幅說(shuō)明。

          阿里的開發(fā)手冊(cè)中有條建議,單表行數(shù)超500萬(wàn)行或者單表容量超過(guò)2GB,就推薦分庫(kù)分表,然而理想和實(shí)現(xiàn)總是有差距的,阿里這種體量的公司不差錢當(dāng)然可以這么用,實(shí)際上很多公司單表數(shù)據(jù)幾千萬(wàn)、億級(jí)別仍然不選擇分庫(kù)分表。

          a5f3026f87e976f3773673578e227b03.webp

          什么時(shí)候分庫(kù)分表

          技術(shù)群里經(jīng)常會(huì)有小伙伴問,到底什么情況下會(huì)用分庫(kù)分表呢?

          分庫(kù)分表要解決的是現(xiàn)存海量數(shù)據(jù)訪問的性能瓶頸,對(duì)持續(xù)激增的數(shù)據(jù)量所做出的架構(gòu)預(yù)見性。

          是否分庫(kù)分表的關(guān)鍵指標(biāo)是數(shù)據(jù)量,我們以fire100.top這個(gè)網(wǎng)站的資源表 t_resource為例,系統(tǒng)在運(yùn)行初始的時(shí)候,每天只有可憐的幾十個(gè)資源上傳,這時(shí)使用單庫(kù)、單表的方式足以支持系統(tǒng)的存儲(chǔ),數(shù)據(jù)量小幾乎沒什么數(shù)據(jù)庫(kù)性能瓶頸。

          但某天開始一股神秘的流量進(jìn)入,系統(tǒng)每日產(chǎn)生的資源數(shù)據(jù)量暴增至十萬(wàn)甚至上百萬(wàn)級(jí)別,這時(shí)資源表數(shù)據(jù)量到達(dá)千萬(wàn)級(jí),查詢響應(yīng)變得緩慢,數(shù)據(jù)庫(kù)的性能瓶頸逐漸顯現(xiàn)。

          以MySQL數(shù)據(jù)庫(kù)為例,單表的數(shù)據(jù)量在達(dá)到億條級(jí)別,通過(guò)加索引、SQL調(diào)優(yōu)等傳統(tǒng)優(yōu)化策略,性能提升依舊微乎其微時(shí),就可以考慮做分庫(kù)分表了。

          既然MySQL存儲(chǔ)海量數(shù)據(jù)時(shí)會(huì)出現(xiàn)性能瓶頸,那么我們是不是可以考慮用其他方案替代它?比如高性能的非關(guān)系型數(shù)據(jù)庫(kù)MongoDB

          可以,但要看存儲(chǔ)的數(shù)據(jù)類型!

          現(xiàn)在互聯(lián)網(wǎng)上大部分公司的核心數(shù)據(jù)幾乎是存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)(MySQL、Oracle等),因?yàn)樗鼈冇兄?code style="font-size:14px;background-color:rgba(27,31,35,.05);font-family:'Operator Mono', Consolas, Monaco, Menlo, monospace;color:rgb(239,112,96);">NoSQL如法比擬的穩(wěn)定性和可靠性,產(chǎn)品成熟生態(tài)系統(tǒng)完善,還有核心的事務(wù)功能特性,也是其他存儲(chǔ)工具不具備的,而評(píng)論、點(diǎn)贊這些非核心數(shù)據(jù)還是可以考慮用MongoDB的。

          如何分庫(kù)分表

          分庫(kù)分表的核心就是對(duì)數(shù)據(jù)的分片(Sharding)并相對(duì)均勻的路由在不同的庫(kù)、表中,以及分片后對(duì)數(shù)據(jù)的快速定位與檢索結(jié)果的整合。

          分庫(kù)與分表可以從:垂直(縱向)和 水平(橫向)兩種緯度進(jìn)行拆分。下邊我們以經(jīng)典的訂單業(yè)務(wù)舉例,看看如何拆分。

          ae40166c0d8ed046cf9d965bd89fdc4a.webp

          垂直拆分

          1、垂直分庫(kù)

          垂直分庫(kù)一般來(lái)說(shuō)按照業(yè)務(wù)和功能的維度進(jìn)行拆分,將不同業(yè)務(wù)數(shù)據(jù)分別放到不同的數(shù)據(jù)庫(kù)中,核心理念 專庫(kù)專用

          按業(yè)務(wù)類型對(duì)數(shù)據(jù)分離,剝離為多個(gè)數(shù)據(jù)庫(kù),像訂單、支付、會(huì)員、積分相關(guān)等表放在對(duì)應(yīng)的訂單庫(kù)、支付庫(kù)、會(huì)員庫(kù)、積分庫(kù)。不同業(yè)務(wù)禁止跨庫(kù)直連,獲取對(duì)方業(yè)務(wù)數(shù)據(jù)一律通過(guò)API接口交互,這也是微服務(wù)拆分的一個(gè)重要依據(jù)。

          bd65c536ade2f13015853b7fc558278a.webp垂直分庫(kù)

          垂直分庫(kù)很大程度上取決于業(yè)務(wù)的劃分,但有時(shí)候業(yè)務(wù)間的劃分并不是那么清晰,比如:電商中訂單數(shù)據(jù)的拆分,其他很多業(yè)務(wù)都依賴于訂單數(shù)據(jù),有時(shí)候界線不是很好劃分。

          垂直分庫(kù)把一個(gè)庫(kù)的壓力分?jǐn)偟蕉鄠€(gè)庫(kù),提升了一些數(shù)據(jù)庫(kù)性能,但并沒有解決由于單表數(shù)據(jù)量過(guò)大導(dǎo)致的性能問題,所以就需要配合后邊的分表來(lái)解決。

          2、垂直分表

          垂直分表針對(duì)業(yè)務(wù)上字段比較多的大表進(jìn)行的,一般是把業(yè)務(wù)寬表中比較獨(dú)立的字段,或者不常用的字段拆分到單獨(dú)的數(shù)據(jù)表中,是一種大表拆小表的模式。

          例如:一張t_order訂單表上有幾十個(gè)字段,其中訂單金額相關(guān)字段計(jì)算頻繁,為了不影響訂單表t_order的性能,就可以把訂單金額相關(guān)字段拆出來(lái)單獨(dú)維護(hù)一個(gè)t_order_price_expansion擴(kuò)展表,這樣每張表只存儲(chǔ)原表的一部分字段,通過(guò)訂單號(hào)order_no做關(guān)聯(lián),再將拆分出來(lái)的表路由到不同的庫(kù)中。

          9d3e38959be026ab38051d8e332d5063.webp

          數(shù)據(jù)庫(kù)它是以行為單位將數(shù)據(jù)加載到內(nèi)存中,這樣拆分以后核心表大多是訪問頻率較高的字段,而且字段長(zhǎng)度也都較短,因而可以加載更多數(shù)據(jù)到內(nèi)存中,減少磁盤IO,增加索引查詢的命中率,進(jìn)一步提升數(shù)據(jù)庫(kù)性能。

          水平拆分

          上邊垂直分庫(kù)、垂直分表后還是會(huì)存在單庫(kù)、表數(shù)據(jù)量過(guò)大的問題,當(dāng)我們的應(yīng)用已經(jīng)無(wú)法在細(xì)粒度的垂直切分時(shí),依舊存在單庫(kù)讀寫、存儲(chǔ)性能瓶頸,這時(shí)就要配合水平分庫(kù)、水平分表一起了。

          1、水平分庫(kù)

          水平分庫(kù)是把同一個(gè)表按一定規(guī)則拆分到不同的數(shù)據(jù)庫(kù)中,每個(gè)庫(kù)可以位于不同的服務(wù)器上,以此實(shí)現(xiàn)水平擴(kuò)展,是一種常見的提升數(shù)據(jù)庫(kù)性能的方式。

          8ee202a0f3c8e4e1e9182f06124ca9f1.webp

          例如:db_orde_1db_order_2兩個(gè)數(shù)據(jù)庫(kù)內(nèi)有完全相同的t_order表,我們?cè)谠L問某一筆訂單時(shí)可以通過(guò)對(duì)訂單的訂單編號(hào)取模的方式 訂單編號(hào) mod 2 (數(shù)據(jù)庫(kù)實(shí)例數(shù)) ,指定該訂單應(yīng)該在哪個(gè)數(shù)據(jù)庫(kù)中操作。

          這種方案往往能解決單庫(kù)存儲(chǔ)量及性能瓶頸問題,但由于同一個(gè)表被分配在不同的數(shù)據(jù)庫(kù)中,數(shù)據(jù)的訪問需要額外的路由工作,因此系統(tǒng)的復(fù)雜度也被提升了。

          2、水平分表

          水平分表是在同一個(gè)數(shù)據(jù)庫(kù)內(nèi),把一張大數(shù)據(jù)量的表按一定規(guī)則,切分成多個(gè)結(jié)構(gòu)完全相同表,而每個(gè)表只存原表的一部分?jǐn)?shù)據(jù)。

          例如:一張t_order訂單表有900萬(wàn)數(shù)據(jù),經(jīng)過(guò)水平拆分出來(lái)三個(gè)表,t_order_1t_order_2t_order_3,每張表存有數(shù)據(jù)300萬(wàn),以此類推。

          d11ec230dc56ad0affd4f0b5530b1716.webp

          水平分表盡管拆分了表,但子表都還是在同一個(gè)數(shù)據(jù)庫(kù)實(shí)例中,只是解決了單一表數(shù)據(jù)量過(guò)大的問題,并沒有將拆分后的表分散到不同的機(jī)器上,還在競(jìng)爭(zhēng)同一個(gè)物理機(jī)的CPU、內(nèi)存、網(wǎng)絡(luò)IO等。要想進(jìn)一步提升性能,就需要將拆分后的表分散到不同的數(shù)據(jù)庫(kù)中,達(dá)到分布式的效果。

          22f461f9f24bd02618030a559cc17467.webp

          數(shù)據(jù)存在哪個(gè)庫(kù)的表

          分庫(kù)分表以后會(huì)出現(xiàn)一個(gè)問題,一張表會(huì)出現(xiàn)在多個(gè)數(shù)據(jù)庫(kù)里,到底該往哪個(gè)庫(kù)的哪個(gè)表里存呢?

          上邊我們多次提到過(guò)一定規(guī)則 ,其實(shí)這個(gè)規(guī)則它是一種路由算法,決定了一條數(shù)據(jù)具體應(yīng)該存在哪個(gè)數(shù)據(jù)庫(kù)的哪張表里。

          常見的有 取模算法范圍限定算法范圍+取模算法預(yù)定義算法

          1、取模算法

          關(guān)鍵字段取模(對(duì)hash結(jié)果取余數(shù) hash(XXX) mod N),N為數(shù)據(jù)庫(kù)實(shí)例數(shù)或子表數(shù)量)是最為常見的一種路由方式。

          t_order訂單表為例,先給數(shù)據(jù)庫(kù)從 0 到 N-1進(jìn)行編號(hào),對(duì) t_order訂單表中order_no訂單編號(hào)字段進(jìn)行取模hash(order_no) mod N,得到余數(shù)ii=0存第一個(gè)庫(kù),i=1存第二個(gè)庫(kù),i=2存第三個(gè)庫(kù),以此類推。

          f0bac412bbb36f923f57ca8f45ddf69e.webp

          同一筆訂單數(shù)據(jù)會(huì)落在同一個(gè)庫(kù)、表里,查詢時(shí)用相同的規(guī)則,用t_order訂單編號(hào)作為查詢條件,就能快速的定位到數(shù)據(jù)。

          優(yōu)點(diǎn)

          實(shí)現(xiàn)簡(jiǎn)單,數(shù)據(jù)分布相對(duì)比較均勻,不易出現(xiàn)請(qǐng)求都打到一個(gè)庫(kù)上的情況。

          缺點(diǎn)

          取模算法對(duì)集群的伸縮支持不太友好,集群中有N個(gè)數(shù)據(jù)庫(kù)實(shí)·hash(user_id) mod N,當(dāng)某一臺(tái)機(jī)器宕機(jī),本應(yīng)該落在該數(shù)據(jù)庫(kù)的請(qǐng)求就無(wú)法得到處理,這時(shí)宕掉的實(shí)例會(huì)被踢出集群。

          此時(shí)機(jī)器數(shù)減少算法發(fā)生變化hash(user_id) mod N-1,同一用戶數(shù)據(jù)落在了在不同數(shù)據(jù)庫(kù)中,等這臺(tái)機(jī)器恢復(fù),用user_id作為條件查詢用戶數(shù)據(jù)就會(huì)少一部分。

          2、范圍限定算法

          范圍限定算法以某些范圍字段,如時(shí)間ID區(qū)拆分。

          用戶表t_user被拆分成t_user_1t_user_2t_user_3三張表,后續(xù)將user_id范圍為1 ~ 1000w的用戶數(shù)據(jù)放入t_user_1,1000~ 2000w放入t_user_2,2000~3000w放入t_user_3,以此類推。按日期范圍劃分同理。

          da82a7dccf4c6ca7ab0202477663f83d.webp

          優(yōu)點(diǎn)

          • 單表數(shù)據(jù)量是可控的
          • 水平擴(kuò)展簡(jiǎn)單只需增加節(jié)點(diǎn)即可,無(wú)需對(duì)其他分片的數(shù)據(jù)進(jìn)行遷移

          缺點(diǎn)

          • 由于連續(xù)分片可能存在數(shù)據(jù)熱點(diǎn),比如按時(shí)間字段分片時(shí),如果某一段時(shí)間(雙11等大促)訂單驟增,存11月數(shù)據(jù)的表可能會(huì)被頻繁的讀寫,其他分片表存儲(chǔ)的歷史數(shù)據(jù)則很少被查詢,導(dǎo)致數(shù)據(jù)傾斜,數(shù)據(jù)庫(kù)壓力分?jǐn)偛痪鶆颉?/li>

          3、范圍 + 取模算法

          為了避免熱點(diǎn)數(shù)據(jù)的問題,我們可以對(duì)上范圍算法優(yōu)化一下

          這次我們先通過(guò)范圍算法定義每個(gè)庫(kù)的用戶表t_user只存1000w數(shù)據(jù),第一個(gè)db_order_1庫(kù)存放userId從1 ~ 1000w,第二個(gè)庫(kù)1000~2000w,第三個(gè)庫(kù)2000~3000w,以此類推。

          2cf5fb7fcd33a71c6901f72aea0cffaf.webp

          每個(gè)庫(kù)里再把用戶表t_user拆分成t_user_1t_user_2t_user_3等,對(duì)userd進(jìn)行取模路由到對(duì)應(yīng)的表中。

          有效的避免數(shù)據(jù)分布不均勻的問題,數(shù)據(jù)庫(kù)水平擴(kuò)展也簡(jiǎn)單,直接添加實(shí)例無(wú)需遷移歷史數(shù)據(jù)。

          4、地理位置分片

          地理位置分片其實(shí)是一個(gè)更大的范圍,按城市或者地域劃分,比如華東、華北數(shù)據(jù)放在不同的分片庫(kù)、表。

          5、預(yù)定義算法

          預(yù)定義算法是事先已經(jīng)明確知道分庫(kù)和分表的數(shù)量,可以直接將某類數(shù)據(jù)路由到指定庫(kù)或表中,查詢的時(shí)候亦是如此。

          分庫(kù)分表出來(lái)的問題

          了解了上邊分庫(kù)分表的拆分方式不難發(fā)現(xiàn),相比于拆分前的單庫(kù)單表,系統(tǒng)的數(shù)據(jù)存儲(chǔ)架構(gòu)演變到現(xiàn)在已經(jīng)變得非常復(fù)雜。看幾個(gè)具有代表性的問題,比如:

          分頁(yè)、排序、跨節(jié)點(diǎn)聯(lián)合查詢

          分頁(yè)、排序、聯(lián)合查詢,這些看似普通,開發(fā)中使用頻率較高的操作,在分庫(kù)分表后卻是讓人非常頭疼的問題。把分散在不同庫(kù)中表的數(shù)據(jù)查詢出來(lái),再將所有結(jié)果進(jìn)行匯總合并整理后提供給用戶。

          比如:我們要查詢11、12月的訂單數(shù)據(jù),如果兩個(gè)月的數(shù)據(jù)是分散到了不同的數(shù)據(jù)庫(kù)實(shí)例,則要查詢兩個(gè)數(shù)據(jù)庫(kù)相關(guān)的數(shù)據(jù),在對(duì)數(shù)據(jù)合并排序、分頁(yè),過(guò)程繁瑣復(fù)雜。

          059a02e3887c27261c12ff4d21bf7215.webp

          事務(wù)一致性

          分庫(kù)分表后由于表分布在不同庫(kù)中,不可避免會(huì)帶來(lái)跨庫(kù)事務(wù)問題。后續(xù)會(huì)分別以阿里的Seata和MySQL的XA協(xié)議實(shí)現(xiàn)分布式事務(wù),用來(lái)比較各自的優(yōu)勢(shì)與不足。

          全局唯一的主鍵

          分庫(kù)分表后數(shù)據(jù)庫(kù)表的主鍵ID業(yè)務(wù)意義就不大了,因?yàn)闊o(wú)法在標(biāo)識(shí)唯一一條記錄,例如:多張表t_order_1t_order_2的主鍵ID全部從1開始會(huì)重復(fù),此時(shí)我們需要主動(dòng)為一條記錄分配一個(gè)ID,這個(gè)全局唯一的ID就叫分布式ID,發(fā)放這個(gè)ID的系統(tǒng)通常被叫發(fā)號(hào)器。

          多數(shù)據(jù)庫(kù)高效治理

          對(duì)多個(gè)數(shù)據(jù)庫(kù)以及庫(kù)內(nèi)大量分片表的高效治理,是非常有必要,因?yàn)橄衲硨氝@種大廠一次大促下來(lái),訂單表可能會(huì)被拆分成成千上萬(wàn)個(gè)t_order_n表,如果沒有高效的管理方案,手動(dòng)建表、排查問題是一件很恐怖的事。

          歷史數(shù)據(jù)遷移

          分庫(kù)分表架構(gòu)落地以后,首要的問題就是如何平滑的遷移歷史數(shù)據(jù),增量數(shù)據(jù)和全量數(shù)據(jù)遷移,這又是一個(gè)比較麻煩的事情,后邊詳細(xì)講。

          分庫(kù)分表架構(gòu)模式

          分庫(kù)分表架構(gòu)主要有兩種模式:client客戶端模式和proxy代理模式

          客戶模式

          client模式指分庫(kù)分表的邏輯都在你的系統(tǒng)應(yīng)用內(nèi)部進(jìn)行控制,應(yīng)用會(huì)將拆分后的SQL直連多個(gè)數(shù)據(jù)庫(kù)進(jìn)行操作,然后本地進(jìn)行數(shù)據(jù)的合并匯總等操作。

          b1d7eb76dbee3d783675b508b48f6e13.webp

          代理模式

          proxy代理模式將應(yīng)用程序與MySQL數(shù)據(jù)庫(kù)隔離,業(yè)務(wù)方的應(yīng)用不在需要直連數(shù)據(jù)庫(kù),而是連接proxy代理服務(wù),代理服務(wù)實(shí)現(xiàn)了MySQL的協(xié)議,對(duì)業(yè)務(wù)方來(lái)說(shuō)代理服務(wù)就是數(shù)據(jù)庫(kù),它會(huì)將SQL分發(fā)到具體的數(shù)據(jù)庫(kù)進(jìn)行執(zhí)行,并返回結(jié)果。該服務(wù)內(nèi)有分庫(kù)分表的配置,根據(jù)配置自動(dòng)創(chuàng)建分片表。

          00651ff6f42ff916a3392e5cba7d00d0.webp

          如何抉擇

          如何選擇client模式和proxy模式,我們可以從以下幾個(gè)方面來(lái)簡(jiǎn)單做下比較。

          1、性能

          性能方面client模式表現(xiàn)的稍好一些,它是直接連接MySQL執(zhí)行命令;proxy代理服務(wù)則將整個(gè)執(zhí)行鏈路延長(zhǎng)了,應(yīng)用->代理服務(wù)->MySQL,可能導(dǎo)致性能有一些損耗,但兩者差距并不是非常大。

          2、復(fù)雜度

          client模式在開發(fā)使用通常引入一個(gè)jar可以;proxy代理模式則需要搭建單獨(dú)的服務(wù),有一定的維護(hù)成本,既然是服務(wù)那么就要考慮高可用,畢竟應(yīng)用的所有SQL都要通過(guò)它轉(zhuǎn)發(fā)至MySQL。

          3、升級(jí)

          client模式分庫(kù)分表一般是依賴基礎(chǔ)架構(gòu)團(tuán)隊(duì)的Jar包,一旦有版本升級(jí)或者Bug修改,所有應(yīng)用到的項(xiàng)目都要跟著升級(jí)。小規(guī)模的團(tuán)隊(duì)服務(wù)少升級(jí)問題不大,如果是大公司服務(wù)規(guī)模大,且涉及到跨多部門,那么升級(jí)一次成本就比較高;

          proxy模式在升級(jí)方面優(yōu)勢(shì)很明顯,發(fā)布新功能或者修復(fù)Bug,只要重新部署代理服務(wù)集群即可,業(yè)務(wù)方是無(wú)感知的,但要保證發(fā)布過(guò)程中服務(wù)的可用性。

          4、治理、監(jiān)控

          client模式由于是內(nèi)嵌在應(yīng)用內(nèi),應(yīng)用集群部署不太方便統(tǒng)一處理;proxy模式在對(duì)SQL限流、讀寫權(quán)限控制、監(jiān)控、告警等服務(wù)治理方面更優(yōu)雅一些。

          結(jié)束語(yǔ)

          本文主要是回顧一下分庫(kù)分表的一些基礎(chǔ)概念,為大家在后續(xù)ShardingSphere實(shí)踐中更好上手理解,內(nèi)容里很多概念一筆帶過(guò)沒詳細(xì)展開,接下來(lái)的篇幅會(huì)逐一解讀。

          下一篇預(yù)告《分庫(kù)分表ShardingSphere的基礎(chǔ)知識(shí)點(diǎn)梳理》

          歡迎關(guān)注 公眾號(hào):程序員小富,咱們下期再見!

          ··········? END? ··············

          在看 點(diǎn)贊 轉(zhuǎn)發(fā) ,是對(duì)我最大的鼓勵(lì)
          技術(shù)書籍公眾號(hào)內(nèi)回復(fù)[? pdf ?] Get。
          面試筆記、springcloud進(jìn)階實(shí)戰(zhàn)PDF,公眾號(hào)內(nèi)回復(fù)[? 1222 ?]?Get

          有幾個(gè) 技術(shù)群 ,想進(jìn)的同學(xué)可以加我好友,備注: 進(jìn)群 ,一起成長(zhǎng)。
          瀏覽 65
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  黄色的A片 | 青娱乐人操 | 少妇逼| 韩国三级毛片 | 亚洲视频欧美视频日韩视频 |