<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          為什么代碼規(guī)范要求SQL語句不要過多的join?

          共 2571字,需瀏覽 6分鐘

           ·

          2021-08-31 01:30

          來源:juejin.im/post/5e0443ae6fb9a0162277a2c3

          送分題

          面試官:有操作過Linux嗎?

          :有的呀

          面試官:我想查看內(nèi)存的使用情況該用什么命令

          free 或者 top

          面試官:那你說一下用free命令都可以看到啥信息

          :那,如下圖所示 可以看到內(nèi)存以及緩存的使用情況

          • total 總內(nèi)存
          • used 已用內(nèi)存
          • free 空閑內(nèi)存
          • buff/cache 已使用的緩存
          • avaiable 可用內(nèi)存
          img

          面試官:那你知道怎么清理已使用的緩存嗎(buff/cache)

          :em... 不知道

          面試官sync; echo 3 > /proc/sys/vm/drop_caches就可以清理buff/cache了,你說說我在線上執(zhí)行這條命令做好不好?

          img

          :(送分題,內(nèi)心大喜)好處大大的有,清理出緩存我們就有更多可用的內(nèi)存空間, 就跟pc上面xx衛(wèi)士的小火箭一樣,點(diǎn)一下,就釋放出好多的內(nèi)存

          面試官:em...., 回去等通知吧

          再談SQL Join

          面試官:換個話題,談?wù)勀銓oin的理解

          :好的(再答錯就徹底完了,把握住機(jī)會)

          回顧

          SQL中的join可以根據(jù)某些條件把指定的表給結(jié)合起來并將數(shù)據(jù)返回給客戶端

          join的方式有

          • inner join  內(nèi)連接
          img
          • left join 左連接
          img
          • right join 右連接
          img
          • full join 全連接
          img

          以上圖片源自這里

          面試官:在項(xiàng)目開發(fā)中如果需要使用join語句,如何優(yōu)化提升性能?

          :分為兩種情況,數(shù)據(jù)規(guī)模小的,數(shù)據(jù)規(guī)模大的。

          面試官:  然后?

          :對于

          • 數(shù)據(jù)規(guī)模較小 全部干進(jìn)內(nèi)存就完事了嗷
          • 數(shù)據(jù)規(guī)模較大

          可以通過增加索引來優(yōu)化join語句的執(zhí)行速度 可以通過冗余信息來減少join的次數(shù) 盡量減少表連接的次數(shù),一個SQL語句表連接的次數(shù)不要超過5次

          面試官:可以總結(jié)為join語句是相對比較耗費(fèi)性能,對嗎?

          :是的

          面試官: 為什么?

          緩沖區(qū)

          : 在執(zhí)行join語句的時(shí)候必然要有一個比較的過程

          面試官: 是的

          :逐條比較兩個表的語句是比較慢的,因此我們可以把兩個表中數(shù)據(jù)依次讀進(jìn)一個內(nèi)存塊中, 以MySQL的InnoDB引擎為例,使用以下語句我們必然可以查到相關(guān)的內(nèi)存區(qū)域show variables like '%buffer%'

          img

          如下圖所示join_buffer_size的大小將會影響我們join語句的執(zhí)行性能

          面試官: 除此之外呢?

          一個大前提

          :任何項(xiàng)目終究要上線,不可避免的要產(chǎn)生數(shù)據(jù),數(shù)據(jù)的規(guī)模又不可能太小

          面試官: 是這樣的

          :大部分?jǐn)?shù)據(jù)庫中的數(shù)據(jù)最終要保存到硬盤上,并且以文件的形式進(jìn)行存儲。

          以MySQL的InnoDB引擎為例

          • InnoDB以(page)為基本的IO單位,每個頁的大小為16KB
          • InnoDB會為每個表創(chuàng)建用于存儲數(shù)據(jù)的.ibd文件
          img

          驗(yàn)證

          img

          :這意味著我們有多少表要連接就需要讀多少個文件,雖然可以利用索引,但還是免不了頻繁的移動硬盤的磁頭

          面試官:也就是說頻繁的移動磁頭會影響性能對吧

          :是的,現(xiàn)在的開源框架不都喜歡說自己通過順序讀寫大大的提升了性能嗎,比如hbasekafka

          面試官:說的沒錯,那你認(rèn)為Linux有對此做出優(yōu)化嗎?提示,你可以再執(zhí)行一次free命令看一下

          :奇怪緩存怎么占用了1.2G多

          img
          img

          圖片來源這里

          面試官: 你有沒有想過

          • buff/cache 里面存的是什么,?
          • 為什么buff/cache 占了那么多內(nèi)存,可用內(nèi)存即availlable還有1.1G
          • 為什么你可以通過兩條命令來清理buff/cache占用的內(nèi)存,而想要釋放used只能通過結(jié)束進(jìn)程來實(shí)現(xiàn)?

          品,你細(xì)品

          思考了幾分鐘后

          img

          :這么隨便就釋放了buff/cache所占用的內(nèi)存,說明它就不重要, 清除它不會對系統(tǒng)的運(yùn)行造成影響

          面試官: 不完全對

          :難道是?想起來《CSAPP》(深入理解計(jì)算機(jī)系統(tǒng))里面說過一句話

          存儲器層次結(jié)構(gòu)的本質(zhì)是,每一層存儲設(shè)備都是較低一層設(shè)備的緩存

          img

          翻譯成人話,就是說Linux會把內(nèi)存當(dāng)作是硬盤的高速緩存

          相關(guān)資料 tldp.org/LDP/sag/htm…

          面試官:現(xiàn)在知道那道送分題應(yīng)該怎么回答了吧

          :我....

          img

          Join算法

          面試官:再給你個機(jī)會,如果讓你來實(shí)現(xiàn)Join算法你會怎么做?

          :無索引的話,嵌套循環(huán)就完事了嗷。有索引的話,則可以利用索引來提升性能.

          面試官:說回join_buffer 你認(rèn)為join_buffer里面存儲的是什么?

          :在掃描過程中,數(shù)據(jù)庫會選擇一個表把他要返回以及需要進(jìn)行和其他表進(jìn)行比較的數(shù)據(jù)放進(jìn)join_buffer

          面試官:有索引的情況下是怎么處理的?

          :這個就比較簡單了,直接讀取兩個表的索引樹進(jìn)行比較就完事了嗷,我這邊介紹一下無索引的處理方式

          Nested Loop Join

          img

          嵌套循環(huán),每次只讀取表中的一行數(shù)據(jù),也就是說如果outerTable有10萬行數(shù)據(jù), innerTable有100行數(shù)據(jù),需要讀取10000000次(假設(shè)這兩個表的文件沒有被操作系統(tǒng)給緩存到內(nèi)存, 我們稱之為冷數(shù)據(jù)表)

          當(dāng)然現(xiàn)在沒啥數(shù)據(jù)庫引擎使用這種算法(太慢了)

          Block nested loop

          img

          Block 塊,也就是說每次都會取一塊數(shù)據(jù)到內(nèi)存以減少I/O的開銷

          當(dāng)沒有索引可以使用的時(shí)候,MySQL InnoDB 就會使用這種算法

          考慮以下兩個表 t_at_b

          img

          當(dāng)無法使用索引執(zhí)行join操作的時(shí)候,InnoDB會自動使用Block nested loop 算法

          img

          總結(jié)

          上學(xué)時(shí),數(shù)據(jù)庫老師最喜歡考數(shù)據(jù)庫范式,直到上班才學(xué)會一切以性能為準(zhǔn),能冗余就冗余,實(shí)在冗余不了的就join如果join真的影響到性能。試著調(diào)大你的join_buffer_size, 或者換固態(tài)硬盤。

          分享一下我寫的《10萬字Springboot經(jīng)典學(xué)習(xí)筆記》中,點(diǎn)擊下面小卡片,進(jìn)入【Java禿頭哥】,回復(fù):筆記,即可免費(fèi)獲取。

          點(diǎn)贊是最大的支持 

          瀏覽 26
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧洲A级成人淫片免费看 | 日韩熟女在线 | 五月天婷婷激情网 | 逼特逼免费视频 | 色多多在线网址 |