<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          MySQL 分庫分表及其平滑擴(kuò)容方案

          共 4418字,需瀏覽 9分鐘

           ·

          2022-07-26 02:40

          作者:王克鋒 出處:https://kefeng.wang/2018/07/22/mysql-sharding/

          眾所周知,數(shù)據(jù)庫很容易成為應(yīng)用系統(tǒng)的瓶頸。單機(jī)數(shù)據(jù)庫的資源和處理能力有限,在高并發(fā)的分布式系統(tǒng)中,可采用分庫分表突破單機(jī)局限。本文總結(jié)了分庫分表的相關(guān)概念、全局ID的生成策略、分片策略、平滑擴(kuò)容方案、以及流行的方案。

          1 分庫分表概述

          在業(yè)務(wù)量不大時(shí),單庫單表即可支撐。當(dāng)數(shù)據(jù)量過大存儲(chǔ)不下、或者并發(fā)量過大負(fù)荷不起時(shí),就要考慮分庫分表。

          1.1 分庫分表相關(guān)術(shù)語

          • 讀寫分離: 不同的數(shù)據(jù)庫,同步相同的數(shù)據(jù),分別只負(fù)責(zé)數(shù)據(jù)的讀和寫;
          • 分區(qū): 指定分區(qū)列表達(dá)式,把記錄拆分到不同的區(qū)域中(必須是同一服務(wù)器,可以是不同硬盤),應(yīng)用看來還是同一張表,沒有變化;
          • 分庫:一個(gè)系統(tǒng)的多張數(shù)據(jù)表,存儲(chǔ)到多個(gè)數(shù)據(jù)庫實(shí)例中;
          • 分表: 對于一張多行(記錄)多列(字段)的二維數(shù)據(jù)表,又分兩種情形:(1) 垂直分表: 豎向切分,不同分表存儲(chǔ)不同的字段,可以把不常用或者大容量、或者不同業(yè)務(wù)的字段拆分出去;(2) 水平分表(最復(fù)雜): 橫向切分,按照特定分片算法,不同分表存儲(chǔ)不同的記錄。

          1.2 真的要采用分庫分表?

          需要注意的是,分庫分表會(huì)為數(shù)據(jù)庫維護(hù)和業(yè)務(wù)邏輯帶來一系列復(fù)雜性和性能損耗,除非預(yù)估的業(yè)務(wù)量大到萬不得已,切莫過度設(shè)計(jì)、過早優(yōu)化。規(guī)劃期內(nèi)的數(shù)據(jù)量和性能問題,嘗試能否用下列方式解決:

          • 當(dāng)前數(shù)據(jù)量:如果沒有達(dá)到幾百萬,通常無需分庫分表;
          • 數(shù)據(jù)量問題:增加磁盤、增加分庫(不同的業(yè)務(wù)功能表,整表拆分至不同的數(shù)據(jù)庫);
          • 性能問題:升級CPU/內(nèi)存、讀寫分離、優(yōu)化數(shù)據(jù)庫系統(tǒng)配置、優(yōu)化數(shù)據(jù)表/索引、優(yōu)化 SQL、分區(qū)、數(shù)據(jù)表的垂直切分;
          • 如果仍未能奏效,才考慮最復(fù)雜的方案:數(shù)據(jù)表的水平切分。

          2 全局ID生成策略

          2.1 自動(dòng)增長列

          優(yōu)點(diǎn):數(shù)據(jù)庫自帶功能,有序,性能佳。缺點(diǎn):單庫單表無妨,分庫分表時(shí)如果沒有規(guī)劃,ID可能重復(fù)。解決方案:

          2.1.1 設(shè)置自增偏移和步長
          ### 假設(shè)總共有 10 個(gè)分表
          ### 級別可選: SESSION(會(huì)話級), GLOBAL(全局)
          SET @@SESSION.auto_increment_offset = 1; ### 起始值, 分別取值為 1~10
          SET @@SESSION.auto_increment_increment = 10; ### 步長增量

          如果采用該方案,在擴(kuò)容時(shí)需要遷移已有數(shù)據(jù)至新的所屬分片。

          2.1.2 全局ID映射表

          在全局 Redis 中為每張數(shù)據(jù)表創(chuàng)建一個(gè) ID 的鍵,記錄該表當(dāng)前最大 ID;每次申請 ID 時(shí),都自增 1 并返回給應(yīng)用;Redis 要定期持久至全局?jǐn)?shù)據(jù)庫。

          2.2 UUID(128位)

          在一臺(tái)機(jī)器上生成的數(shù)字,它保證對在同一時(shí)空中的所有機(jī)器都是唯一的。通常平臺(tái)會(huì)提供生成UUID的API。UUID 由4個(gè)連字號(-)將32個(gè)字節(jié)長的字符串分隔后生成的字符串,總共36個(gè)字節(jié)長。形如:550e8400-e29b-41d4-a716-446655440000。UUID 的計(jì)算因子包括:以太網(wǎng)卡地址、納秒級時(shí)間、芯片ID碼和許多可能的數(shù)字。UUID 是個(gè)標(biāo)準(zhǔn),其實(shí)現(xiàn)有幾種,最常用的是微軟的 GUID(Globals Unique Identifiers)。

          優(yōu)點(diǎn):簡單,全球唯一;缺點(diǎn):存儲(chǔ)和傳輸空間大,無序,性能欠佳。

          2.3 COMB(組合)

          參考資料:The Cost of GUIDs as Primary Keys 組合 GUID(10字節(jié)) 和時(shí)間(6字節(jié)),達(dá)到有序的效果,提高索引性能。

          2.4 Snowflake(雪花) 算法

          參考資料:twitter/snowflake,Snowflake 算法詳解 Snowflake 是 Twitter 開源的分布式 ID 生成算法,其結(jié)果為 long(64bit) 的數(shù)值。其特性是各節(jié)點(diǎn)無需協(xié)調(diào)、按時(shí)間大致有序、且整個(gè)集群各節(jié)點(diǎn)單不重復(fù)。該數(shù)值的默認(rèn)組成如下(符號位之外的三部分允許個(gè)性化調(diào)整):

          圖片
          • 1bit: 符號位,總是 0(為了保證數(shù)值是正數(shù))。
          • 41bit: 毫秒數(shù)(可用 69 年);
          • 10bit: 節(jié)點(diǎn)ID(5bit數(shù)據(jù)中心 + 5bit節(jié)點(diǎn)ID,支持 32 * 32 = 1024 個(gè)節(jié)點(diǎn))
          • 12bit: 流水號(每個(gè)節(jié)點(diǎn)每毫秒內(nèi)支持 4096 個(gè) ID,相當(dāng)于 409萬的 QPS,相同時(shí)間內(nèi)如 ID 遇翻轉(zhuǎn),則等待至下一毫秒)

          3 分片策略

          3.1 連續(xù)分片

          根據(jù)特定字段(比如用戶ID、訂單時(shí)間)的范圍,值在該區(qū)間的,劃分到特定節(jié)點(diǎn)。優(yōu)點(diǎn):集群擴(kuò)容后,指定新的范圍落在新節(jié)點(diǎn)即可,無需進(jìn)行數(shù)據(jù)遷移。缺點(diǎn):如果按時(shí)間劃分,數(shù)據(jù)熱點(diǎn)分布不均(歷史數(shù)冷當(dāng)前數(shù)據(jù)熱),導(dǎo)致節(jié)點(diǎn)負(fù)荷不均。

          3.3 ID取模分片

          缺點(diǎn):擴(kuò)容后需要遷移數(shù)據(jù)。

          3.2 一致性Hash算法

          優(yōu)點(diǎn):擴(kuò)容后無需遷移數(shù)據(jù)。

          3.4 Snowflake 分片

          優(yōu)點(diǎn):擴(kuò)容后無需遷移數(shù)據(jù)。

          4 分庫分表引入的問題

          4.1 分布式事務(wù)

          參見 分布式事務(wù)的解決方案 由于兩階段/三階段提交對性能損耗大,可改用事務(wù)補(bǔ)償機(jī)制。

          4.2 跨節(jié)點(diǎn) JOIN

          對于單庫 JOIN,MySQL 原生就支持;對于多庫,出于性能考慮,不建議使用 MySQL 自帶的 JOIN,可以用以下方案避免跨節(jié)點(diǎn) JOIN:

          • 全局表: 一些穩(wěn)定的共用數(shù)據(jù)表,在各個(gè)數(shù)據(jù)庫中都保存一份;
          • 字段冗余: 一些常用的共用字段,在各個(gè)數(shù)據(jù)表中都保存一份;
          • 應(yīng)用組裝:應(yīng)用獲取數(shù)據(jù)后再組裝。

          另外,某個(gè) ID 的用戶信息在哪個(gè)節(jié)點(diǎn),他的關(guān)聯(lián)數(shù)據(jù)(比如訂單)也在哪個(gè)節(jié)點(diǎn),可以避免分布式查詢。

          4.3 跨節(jié)點(diǎn)聚合

          只能在應(yīng)用程序端完成。但對于分頁查詢,每次大量聚合后再分頁,性能欠佳。

          4.4 節(jié)點(diǎn)擴(kuò)容

          節(jié)點(diǎn)擴(kuò)容后,新的分片規(guī)則導(dǎo)致數(shù)據(jù)所屬分片有變,因而需要遷移數(shù)據(jù)。

          5 節(jié)點(diǎn)擴(kuò)容方案

          相關(guān)資料: 數(shù)據(jù)庫秒級平滑擴(kuò)容架構(gòu)方案

          5.1 常規(guī)方案

          如果增加的節(jié)點(diǎn)數(shù)和擴(kuò)容操作沒有規(guī)劃,那么絕大部分?jǐn)?shù)據(jù)所屬的分片都有變化,需要在分片間遷移:

          • 預(yù)估遷移耗時(shí),發(fā)布停服公告;
          • 停服(用戶無法使用服務(wù)),使用事先準(zhǔn)備的遷移腳本,進(jìn)行數(shù)據(jù)遷移;
          • 修改為新的分片規(guī)則;
          • 啟動(dòng)服務(wù)器。

          5.2 免遷移擴(kuò)容

          采用雙倍擴(kuò)容策略,避免數(shù)據(jù)遷移。擴(kuò)容前每個(gè)節(jié)點(diǎn)的數(shù)據(jù),有一半要遷移至一個(gè)新增節(jié)點(diǎn)中,對應(yīng)關(guān)系比較簡單。具體操作如下(假設(shè)已有 2 個(gè)節(jié)點(diǎn) A/B,要雙倍擴(kuò)容至 A/A2/B/B2 這 4 個(gè)節(jié)點(diǎn)):

          • 無需停止應(yīng)用服務(wù)器;
          • 新增兩個(gè)數(shù)據(jù)庫 A2/B2 作為從庫,設(shè)置主從同步關(guān)系為:A=>A2、B=>B2,直至主從數(shù)據(jù)同步完畢(早期數(shù)據(jù)可手工同步);
          • 調(diào)整分片規(guī)則并使之生效:原 ID%2=0 => A 改為 ID%4=0 => A, ID%4=2 => A2;原 ID%2=1 => B 改為 ID%4=1 => B, ID%4=3 => B2。
          • 解除數(shù)據(jù)庫實(shí)例的主從同步關(guān)系,并使之生效;
          • 此時(shí),四個(gè)節(jié)點(diǎn)的數(shù)據(jù)都已完整,只是有冗余(多存了和自己配對的節(jié)點(diǎn)的那部分?jǐn)?shù)據(jù)),擇機(jī)清除即可(過后隨時(shí)進(jìn)行,不影響業(yè)務(wù))。

          6 分庫分表方案

          6.1 代理層方式

          部署一臺(tái)代理服務(wù)器偽裝成 MySQL 服務(wù)器,代理服務(wù)器負(fù)責(zé)與真實(shí) MySQL 節(jié)點(diǎn)的對接,應(yīng)用程序只和代理服務(wù)器對接。對應(yīng)用程序是透明的。比如 MyCAT,官網(wǎng),源碼,參考文檔:MyCAT+MySQL 讀寫分離部署 MyCAT 后端可以支持 MySQL, SQL Server, Oracle, DB2, PostgreSQL等主流數(shù)據(jù)庫,也支持MongoDB這種新型NoSQL方式的存儲(chǔ),未來還會(huì)支持更多類型的存儲(chǔ)。MyCAT 不僅僅可以用作讀寫分離,以及分表分庫、容災(zāi)管理,而且可以用于多租戶應(yīng)用開發(fā)、云平臺(tái)基礎(chǔ)設(shè)施,讓你的架構(gòu)具備很強(qiáng)的適應(yīng)性和靈活性。

          6.2 應(yīng)用層方式

          處于業(yè)務(wù)層和 JDBC 層中間,是以 JAR 包方式提供給應(yīng)用調(diào)用,對代碼有侵入性。主要方案有:(1)淘寶網(wǎng)的 TDDL: 已于 2012 年關(guān)閉了維護(hù)通道,建議不要使用。(2)當(dāng)當(dāng)網(wǎng)的 Sharding-JDBC: 仍在活躍維護(hù)中:是當(dāng)當(dāng)應(yīng)用框架 ddframe 中,從關(guān)系型數(shù)據(jù)庫模塊 dd-rdb 中分離出來的數(shù)據(jù)庫水平分片框架,實(shí)現(xiàn)透明化數(shù)據(jù)庫分庫分表訪問,實(shí)現(xiàn)了 Snowflake 分片算法;Sharding-JDBC定位為輕量Java框架,使用客戶端直連數(shù)據(jù)庫,無需額外部署,無其他依賴,DBA也無需改變原有的運(yùn)維方式。Sharding-JDBC分片策略靈活,可支持等號、between、in等多維度分片,也可支持多分片鍵。SQL解析功能完善,支持聚合、分組、排序、limit、or等查詢,并支持Binding Table以及笛卡爾積表查詢。

          Sharding-JDBC直接封裝JDBC API,可以理解為增強(qiáng)版的JDBC驅(qū)動(dòng),舊代碼遷移成本幾乎為零:

          • 可適用于任何基于Java的ORM框架,如JPA、Hibernate、Mybatis、Spring JDBC Template或直接使用JDBC。
          • 可基于任何第三方的數(shù)據(jù)庫連接池,如DBCP、C3P0、 BoneCP、Druid等。
          • 理論上可支持任意實(shí)現(xiàn)JDBC規(guī)范的數(shù)據(jù)庫。雖然目前僅支持MySQL,但已有支持Oracle、SQLServer等數(shù)據(jù)庫的計(jì)劃。
          我們創(chuàng)建了一個(gè)高質(zhì)量的技術(shù)交流群,與優(yōu)秀的人在一起,自己也會(huì)優(yōu)秀起來,趕緊點(diǎn)擊加群,享受一起成長的快樂。另外,如果你最近想跳槽的話,年前我花了2周時(shí)間收集了一波大廠面經(jīng),節(jié)后準(zhǔn)備跳槽的可以點(diǎn)擊這里領(lǐng)取!

          推薦閱讀

          ··································

          你好,我是程序猿DD,10年開發(fā)老司機(jī)、阿里云MVP、騰訊云TVP、出過書創(chuàng)過業(yè)、國企4年互聯(lián)網(wǎng)6年。從普通開發(fā)到架構(gòu)師、再到合伙人。一路過來,給我最深的感受就是一定要不斷學(xué)習(xí)并關(guān)注前沿。只要你能堅(jiān)持下來,多思考、少抱怨、勤動(dòng)手,就很容易實(shí)現(xiàn)彎道超車!所以,不要問我現(xiàn)在干什么是否來得及。如果你看好一個(gè)事情,一定是堅(jiān)持了才能看到希望,而不是看到希望才去堅(jiān)持。相信我,只要堅(jiān)持下來,你一定比現(xiàn)在更好!如果你還沒什么方向,可以先關(guān)注我,這里會(huì)經(jīng)常分享一些前沿資訊,幫你積累彎道超車的資本。

          點(diǎn)擊領(lǐng)取2022最新10000T學(xué)習(xí)資料
          瀏覽 28
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  婷婷骚逼电影导航 | 一起操在线| Riri成人网站下载 | 午夜无码人妻AV大片 | 美女尻屄网站 |