<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          為什么阿里巴巴規(guī)定禁止超過三張表 join?

          共 2838字,需瀏覽 6分鐘

           ·

          2022-07-17 16:12

          本周贈(zèng)書《性能之巔》第2版

          前段時(shí)間在跟其他公司DBA交流時(shí)談到了mysql跟PG之間在多表關(guān)聯(lián)查詢上的一些區(qū)別,相比之下mysql只有一種表連接類型:嵌套循環(huán)連接(nested-loop),不支持排序-合并連接(sort-merge join)與散列連接(hash join),而PG是都支持的,而且mysql是往簡(jiǎn)單化方向去設(shè)計(jì)的,如果多個(gè)表關(guān)聯(lián)查詢(超過3張表)效率上是比不上PG的。

          1. 摘要

          • 不超過3層是為了效率。
          • 更通用 ,更好為了分布式做準(zhǔn)備。

          下面也對(duì)mysql多表關(guān)聯(lián)這個(gè)特性簡(jiǎn)單探討下~


          2. 多表關(guān)聯(lián)

          MySQL多表關(guān)聯(lián)查詢效率高點(diǎn)還是多次單表查詢效率高?

          A,B兩個(gè)表數(shù)據(jù)規(guī)模十幾萬,數(shù)據(jù)規(guī)模都不大,單機(jī)MySQL夠用了,在單機(jī)的基礎(chǔ)上要關(guān)聯(lián)兩表的數(shù)據(jù),先說一個(gè)極端情況,A,B兩個(gè)表都沒有索引,并且關(guān)聯(lián)是笛卡爾積,那關(guān)聯(lián)結(jié)果會(huì)爆炸式增長,可能到億級(jí)別,這個(gè)時(shí)候網(wǎng)絡(luò)IO成了瓶頸,這個(gè)時(shí)候兩次十萬行結(jié)果集的拉去可能遠(yuǎn)小于1次億級(jí)別的結(jié)果集的拉取,那么將關(guān)聯(lián)合并拉到service層做更快。


          但實(shí)際業(yè)務(wù)中一般不會(huì)有這么蠢的行為,一般關(guān)聯(lián)會(huì)有連接條件,并且連接條件上會(huì)有索引,一般是有一個(gè)結(jié)果集比較小,拿到這個(gè)結(jié)果集去另一張表去關(guān)聯(lián)出其它信息。

          如果放到service層去做,最快的方式是,先查A表,得到一個(gè)小的結(jié)果集,一次rpc,再根據(jù)結(jié)果集,拼湊出B表的查詢條件,去B表查到一個(gè)結(jié)果集,再一次rpc,再把結(jié)果集拉回service層,再一次rpc,然后service層做合并,3次rpc。

          如果用數(shù)據(jù)庫的join,關(guān)聯(lián)結(jié)果拉回來,一次rpc,幫你省了兩次rpc,當(dāng)然數(shù)據(jù)庫上做關(guān)聯(lián)更快,對(duì)應(yīng)到數(shù)據(jù)庫就是一次blk nested loop join,這是業(yè)務(wù)常用情況。

          但是確實(shí)大多數(shù)業(yè)務(wù)都會(huì)考慮把這種合并操作放到service層,一般是有以下幾方面考慮:

          第一

          單機(jī)數(shù)據(jù)庫計(jì)算資源很貴,數(shù)據(jù)庫同時(shí)要服務(wù)寫和讀,都需要消耗CPU,為了能讓數(shù)據(jù)庫的吞吐變得更高,而業(yè)務(wù)又不在乎那幾百微妙到毫秒級(jí)的延時(shí)差距,業(yè)務(wù)會(huì)把更多計(jì)算放到service層做,畢竟計(jì)算資源很好水平擴(kuò)展,數(shù)據(jù)庫很難啊,所以大多數(shù)業(yè)務(wù)會(huì)把純計(jì)算操作放到service層做,而將數(shù)據(jù)庫當(dāng)成一種帶事務(wù)能力的kv系統(tǒng)來使用,這是一種重業(yè)務(wù),輕DB的架構(gòu)思路

          第二

          ** **

          很多復(fù)雜的業(yè)務(wù)可能會(huì)由于發(fā)展的歷史原因,一般不會(huì)只用一種數(shù)據(jù)庫,一般會(huì)在多個(gè)數(shù)據(jù)庫上加一層中間件,多個(gè)數(shù)據(jù)庫之間就沒辦法join了,自然業(yè)務(wù)會(huì)抽象出一個(gè)service層,降低對(duì)數(shù)據(jù)庫的耦合。

          第三

          對(duì)于一些大型公司由于數(shù)據(jù)規(guī)模龐大,不得不對(duì)數(shù)據(jù)庫進(jìn)行分庫分表,對(duì)于分庫分表的應(yīng)用,使用join也受到了很多限制,除非業(yè)務(wù)能夠很好的根據(jù)sharding key明確要join的兩個(gè)表在同一個(gè)物理庫中。而中間件一般對(duì)跨庫join都支持不好。

          舉一個(gè)很常見的業(yè)務(wù)例子,在分庫分表中,要同步更新兩個(gè)表,這兩個(gè)表位于不同的物理庫中,為了保證數(shù)據(jù)一致性,一種做法是通過分布式事務(wù)中間件將兩個(gè)更新操作放到一個(gè)事務(wù)中,但這樣的操作一般要加全局鎖,性能很捉急,而有些業(yè)務(wù)能夠容忍短暫的數(shù)據(jù)不一致,怎么做?

          讓它們分別更新唄,但是會(huì)存在數(shù)據(jù)寫失敗的問題,那就起個(gè)定時(shí)任務(wù),掃描下A表有沒有失敗的行,然后看看B表是不是也沒寫成功,然后對(duì)這兩條關(guān)聯(lián)記錄做訂正,這個(gè)時(shí)候同樣沒法用join去實(shí)現(xiàn),只能將數(shù)據(jù)拉到service層應(yīng)用自己來合并了。

          到這里答案就很清楚了~

          對(duì)關(guān)聯(lián)查詢進(jìn)行分解

          很多高性能的應(yīng)用都會(huì)對(duì)關(guān)聯(lián)查詢進(jìn)行分解。


          簡(jiǎn)單地,可以對(duì)每個(gè)表進(jìn)行一次單表查詢,然后將結(jié)果在應(yīng)用程序中進(jìn)行關(guān)聯(lián)。例如,下面這個(gè)查詢:

          select * from tag
          join tag_post on tag_post.tag_id=tag.id
          join post on tag_post.post_id=post.id
          where tag.tag=’mysql’;

          可以分解成下面這些查詢來代替:

          Select * from tag where tag=’mysql’;
          Select * from tag_post where tag_id=1234;
          Select * from post where id in(123,456,567,9989,8909);

          為什么會(huì)這樣做呢?原本一條查詢,這里卻變成了多條查詢,返回結(jié)果又是一模一樣。

          事實(shí)上,用分解關(guān)聯(lián)查詢的方式重構(gòu)查詢具有如下優(yōu)勢(shì):

          • 讓緩存的效率更高。
          • 許多應(yīng)用程序可以方便地緩存單表查詢對(duì)應(yīng)的結(jié)果對(duì)象。另外對(duì)于MySQL的查詢緩存來說,如果關(guān)聯(lián)中的某個(gè)表發(fā)生了變化,那么就無法使用查詢緩存了,而拆分后,如果某個(gè)表很少改變,那么基于該表的查詢就可以重復(fù)利用查詢緩存結(jié)果了。
          • 將查詢分解后,執(zhí)行單個(gè)查詢可以減少鎖的競(jìng)爭(zhēng)。
          • 在應(yīng)用層做關(guān)聯(lián),可以更容易對(duì)數(shù)據(jù)庫進(jìn)行拆分,更容易做到高性能和可擴(kuò)展。
          • 查詢本身效率也可能會(huì)有所提升
          • 可以減少冗余記錄的查詢。
          • 更進(jìn)一步,這樣做相當(dāng)于在應(yīng)用中實(shí)現(xiàn)了哈希關(guān)聯(lián),而不是使用MySQL的嵌套環(huán)關(guān)聯(lián),某些場(chǎng)景哈希關(guān)聯(lián)的效率更高很多。

          3. 解釋

          RPC(Remote Procedure Call):遠(yuǎn)程過程調(diào)用,它是一種通過網(wǎng)絡(luò)從遠(yuǎn)程計(jì)算機(jī)程序上請(qǐng)求服務(wù),而不需要了解底層網(wǎng)絡(luò)技術(shù)的思想

          來源:blog.csdn.net/NumberOneStudent/article/details/102776289

          我們創(chuàng)建了一個(gè)高質(zhì)量的技術(shù)交流群,與優(yōu)秀的人在一起,自己也會(huì)優(yōu)秀起來,趕緊點(diǎn)擊加群,享受一起成長的快樂。另外,如果你最近想跳槽的話,年前我花了2周時(shí)間收集了一波大廠面經(jīng),節(jié)后準(zhǔn)備跳槽的可以點(diǎn)擊這里領(lǐng)取

          推薦閱讀

          ··································

          你好,我是程序猿DD,10年開發(fā)老司機(jī)、阿里云MVP、騰訊云TVP、出過書創(chuàng)過業(yè)、國企4年互聯(lián)網(wǎng)6年從普通開發(fā)到架構(gòu)師、再到合伙人。一路過來,給我最深的感受就是一定要不斷學(xué)習(xí)并關(guān)注前沿。只要你能堅(jiān)持下來,多思考、少抱怨、勤動(dòng)手,就很容易實(shí)現(xiàn)彎道超車!所以,不要問我現(xiàn)在干什么是否來得及。如果你看好一個(gè)事情,一定是堅(jiān)持了才能看到希望,而不是看到希望才去堅(jiān)持。相信我,只要堅(jiān)持下來,你一定比現(xiàn)在更好!如果你還沒什么方向,可以先關(guān)注我,這里會(huì)經(jīng)常分享一些前沿資訊,幫你積累彎道超車的資本。

          點(diǎn)擊領(lǐng)取2022最新10000T學(xué)習(xí)資料
          瀏覽 75
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  久久丝袜足交视频 | 激情毛片网 | 成人女人18女人毛片 | 99国产在线视频 | 国产九色视频 |