<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          如何用 Redis 統(tǒng)計(jì)獨(dú)立用戶訪問量?

          共 1421字,需瀏覽 3分鐘

           ·

          2021-01-14 12:58

          文章來源:https://url.cn/5tQPEQg


          今天來聊一聊拼多多的一道后臺(tái)面試真題,是一道簡單的架構(gòu)類的題目:拼多多有數(shù)億的用戶,那么對(duì)于某個(gè)網(wǎng)頁,怎么使用Redis來統(tǒng)計(jì)一個(gè)網(wǎng)站的用戶訪問數(shù)呢?

          使用Hash

          哈希是Redis的一種基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),Redis底層維護(hù)的是一個(gè)開散列,會(huì)把不同的key映射到哈希表上,如果是遇到關(guān)鍵字沖突,那么就會(huì)拉出一個(gè)鏈表出來。

          當(dāng)一個(gè)用戶訪問的時(shí)候,如果用戶登陸過,那么我們就使用用戶的id,如果用戶沒有登陸過,那么我們也能夠前端頁面隨機(jī)生成一個(gè)key用來標(biāo)識(shí)用戶,當(dāng)用戶訪問的時(shí)候,我們可以使用HSET命令,key可以選擇URI與對(duì)應(yīng)的日期進(jìn)行拼湊,field可以使用用戶的id或者隨機(jī)標(biāo)識(shí),value可以簡單設(shè)置為1。

          當(dāng)我們要統(tǒng)計(jì)某一個(gè)網(wǎng)站某一天的訪問量的時(shí)候,就可以直接使用HLEN來得到最終的結(jié)果了。

          優(yōu)點(diǎn):簡單,容易實(shí)現(xiàn),查詢也是非常方便,數(shù)據(jù)準(zhǔn)確性非常高。

          缺點(diǎn):占用內(nèi)存過大,。隨著key的增多,性能也會(huì)下降。小網(wǎng)站還行,拼多多這種數(shù)億PV的網(wǎng)站肯定受不了

          使用Bitset

          我們知道,對(duì)于一個(gè)32位的int,如果我們只用來記錄id,那么只能夠記錄一個(gè)用戶,但如果我們轉(zhuǎn)成2進(jìn)制,每位用來表示一個(gè)用戶,那么我們就能夠一口氣表示32個(gè)用戶,空間節(jié)省了32倍!對(duì)于有大量數(shù)據(jù)的場(chǎng)景,如果我們使用bitset,那么,可以節(jié)省非常多的內(nèi)存。對(duì)于沒有登陸的用戶,我們也可以使用哈希算法,把對(duì)應(yīng)的用戶標(biāo)識(shí)哈希成一個(gè)數(shù)字id。bitset非常的節(jié)省內(nèi)存,假設(shè)有1億個(gè)用戶,也只需要100000000/8/1024/1024約等于12兆內(nèi)存。

          Redis已經(jīng)為我們提供了SETBIT的方法,使用起來非常的方便,我們可以看看下面的例子,我們?cè)趇tem頁面可以不停地使用SETBIT命令,設(shè)置用戶已經(jīng)訪問了該頁面,也可以使用GETBIT的方法查詢某個(gè)用戶是否訪問。最后我們通過BITCOUNT可以統(tǒng)計(jì)該網(wǎng)頁每天的訪問數(shù)量。

          優(yōu)點(diǎn)占用內(nèi)存更小,查詢方便,可以指定查詢某個(gè)用戶,數(shù)據(jù)可能略有瑕疵,對(duì)于非登陸的用戶,可能不同的key映射到同一個(gè)id,否則需要維護(hù)一個(gè)非登陸用戶的映射,有額外的開銷。

          缺點(diǎn)如果用戶非常的稀疏,那么占用的內(nèi)存可能比方法一更大。

          使用概率算法

          對(duì)于拼多多這種多個(gè)頁面都可能非常多訪問量的網(wǎng)站,如果所需要的數(shù)量不用那么準(zhǔn)確,可以使用概率算法,事實(shí)上,我們對(duì)一個(gè)網(wǎng)站的UV的統(tǒng)計(jì),1億跟1億零30萬其實(shí)是差不多的。在Redis中,已經(jīng)封裝了HyperLogLog算法,他是一種基數(shù)評(píng)估算法。這種算法的特征,一般都是數(shù)據(jù)不存具體的值,而是存用來計(jì)算概率的一些相關(guān)數(shù)據(jù)。

          當(dāng)用戶訪問網(wǎng)站的時(shí)候,我們可以使用PFADD命令,設(shè)置對(duì)應(yīng)的命令,最后我們只要通過PFCOUNT就能順利計(jì)算出最終的結(jié)果,因?yàn)檫@個(gè)只是一個(gè)概率算法,所以可能存在0.81%的誤差。

          優(yōu)點(diǎn)占用內(nèi)存極小,對(duì)于一個(gè)key,只需要12kb。對(duì)于拼多多這種超多用戶的特別適用。

          缺點(diǎn)查詢指定用戶的時(shí)候,可能會(huì)出錯(cuò),畢竟存的不是具體的數(shù)據(jù)。總數(shù)也存在一定的誤差。

          END



          關(guān)注武哥聊編程

          每天進(jìn)步一點(diǎn)點(diǎn)



          點(diǎn)贊是最大的支持?

          瀏覽 61
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产伦精品一区二区三区竹菊视频 | 91精品系列 | 三级激情网站 | 国产精品高潮呻吟 | 日本精品一区二区三区视频 |