導語 | Redis 大家用的不少,但是我們大多數(shù)人可能都只是關(guān)注業(yè)務(wù)本身,對于底層的細節(jié)則經(jīng)常忽略,久而久之,對個人的成長幫助甚少。本文為大家總結(jié)了關(guān)于 Redis 常見用法的進階指南,希望幫助大家加深對這門技術(shù)的理解。文章作者:何永康,騰訊 CSIG 后臺研發(fā)工程師。
一、Redis 基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)
Redis 里的字符串是動態(tài)字符串,會根據(jù)實際情況動態(tài)調(diào)整。類似于 Go 里面的切片-slice,如果長度不夠則自動擴容。至于如何擴容,方法大致如下:當 length 小于 1M 的時候,擴容規(guī)則將目前的字符串翻倍;如果 length 大于 1M 的話,則每次只會擴容 1M,直到達到 512M。
Redis 里的 List 是一個鏈表,由于鏈表本身插入和刪除比較塊,但是查詢的效率比較低,所以常常被用做異步隊列。Redis 里的 List 設(shè)計非常牛,當數(shù)據(jù)量比較小的時候,數(shù)據(jù)結(jié)構(gòu)是壓縮鏈表,而當數(shù)據(jù)量比較多的時候就成為了快速鏈表。可運用的場景:在業(yè)務(wù)中異步隊列使用 rpush/lpush 操作隊列,使用 lpop 和 rpop 出隊列,具體結(jié)構(gòu)如下圖所示:Redis 中的 set 是一個無序 Map,由于 Go 中沒有 set 結(jié)構(gòu),所以這里只能類比 Java 中的 HashSet 概念。Redis 的 set 底層也是一個 Map 結(jié)構(gòu),不同于 Java 的是:alue 是一個 NULL。由于 set 的特性,它可以用于去重邏輯,這一點在 Java 中也經(jīng)常使用。Redis 中的字典類型大家不陌生,也許其他語言都有這種結(jié)構(gòu)(python,Java,Go), hash 的擴容 rehash 過程和 Go 里面的設(shè)計頗有類似,也就是維護了兩個 hash 結(jié)構(gòu),如果需要擴容的時候,就把新的數(shù)據(jù)寫入新字典中,然后后端起一個線程來逐步遷移,總體上來說就是采用了空間換時間的思想。可運用場景:記錄業(yè)務(wù)中的不同用戶/不同商品/不同場景的信息:如某個用戶的名稱,或者用戶的歷史行為。
Redis 中的 zset 是一個比較特殊的數(shù)據(jù)結(jié)構(gòu)(跳躍列表),也就是我們了解到的跳表,底層由于 set 的特性保證了 value 唯一,同時也給了 value 一個得分,所謂的有序其實就是根據(jù)這個得分來排序。至于跳躍表如何插入,其實內(nèi)部采用了一個隨機策略:L0:100%-L2:50%-L3:25%-....Ln:(n-1)value/2%。
1. 布隆過濾器
Redis 在 4.0 以后支持布隆過濾(準確的來說是支持了布隆過濾器的插件),給 Redis 提供了強大的去重功能。在業(yè)務(wù)中,我們可能需要查詢數(shù)據(jù)庫判斷歷史數(shù)據(jù)是否存在,如果數(shù)據(jù)庫的并發(fā)能力有限,這個時候我們可以采用 Redis 的 set 做去重。如果緩存的數(shù)據(jù)過大,這個時候就需要遍歷所有緩存數(shù)據(jù),另外如果我們的歷史數(shù)據(jù)緩存寫不下了,終究要去查詢數(shù)據(jù)庫,這個時候就可以使用布隆過濾器。當然布隆過濾器精確度不是 100% 準確(如果對數(shù)據(jù)準確度要求很高的話,這里不建議使用),因為對于存在的數(shù)據(jù)也許這個值不一定存在,當然如果不存在,那肯定 100% 不存在了。(1)命令使用
bf.add #添加元素bf.exists #判斷元素是否存在bf.madd #批量添加bf.mexists #批量判斷是否存在
(2)原理
布隆過濾的組成可以當作一個位數(shù)組和幾個計算結(jié)果比較均勻的 hash 函數(shù),每次添加 key 的時候,會把 key 通過多次 hash 來計算所得到的位置,如果當前位置不是 0 則表示存在。可以看到,這樣的計算存在一定誤差,這也正是它的不準確性問題的由來。
2. 分布式鎖
大家對分布式鎖也許也不會陌生,現(xiàn)在市面上主流的實現(xiàn)分布鎖的技術(shù)有 ZK 和 Redis;下文為大家簡單介紹一下 Redis 如何實現(xiàn)分布式鎖。命令
setnx lock:mutex ture del lock:mutex
實現(xiàn)分布式鎖的核心就是:請求的時候 Set 這個 key,如果其他請求設(shè)置失敗的時候,即拿不到鎖。但是存在一個問題:如果業(yè)務(wù) panic 或者忘記調(diào)用 del 的話,就會產(chǎn)生死鎖,這個時候大家很容易能想到:我們可以 expire 一個過期時間,這樣就可以保證請求不會一直獨占鎖且無法釋放鎖的邏輯了。但是假設(shè)業(yè)務(wù)存在這樣一種情況:A 請求在獲取鎖后處理邏輯,由于邏輯過長,這個時候鎖到期釋放了,A 這個時候剛剛處理完成,而 B 又去改了這個數(shù)據(jù),這就存在一個鎖失效的問題。解決這種問題參考 CAS 的方式,對鎖設(shè)置一個隨機數(shù),可以理解為版本號,如果釋放的時候版本號不一致,則表示數(shù)字已經(jīng)在釋放那一刻改掉了。
1. IO模型
Redis 是單線程模型(這里的單線程指的是 IO 和鍵值對的讀寫是一個線程完成的),當然如果嚴謹?shù)膩碚f還是可以理解為是多線程,不過這樣的多線程不過是在數(shù)據(jù)備份的時候會 fork 一個子進程對數(shù)據(jù)進行從磁盤讀取數(shù)據(jù)并組裝 RDB,然后同步給 slaver 節(jié)點的操作,當然包括備份和持久化也都是通過另外起線程完成的,所以我們可以把 Redis 認作為一個單線程模型。那么問題來了,為什么單線程的模型能這么快?原因很簡單,因為 Redis 本身就是在內(nèi)存中運算,而對于上游的客戶端請求,采用了多路復用的原理。Redis 會給每一個客戶端套接字都關(guān)聯(lián)一個指令隊列,客戶端的指令隊列通過隊列排隊來進行順序處理,同時 Reids 給每一個客戶端的套件字關(guān)聯(lián)一個響應隊列,Redis 服務(wù)器通過響應隊列來將指令的接口返回給客戶端。
Redis IO 處理模型
2. 通信協(xié)議
Redis 采用了 Gossip 協(xié)議作為通信協(xié)議。Gossip 是一種傳播消息的方式,可以類比為瘟疫或者流感的傳播方式,使用 Gossip 協(xié)議的有:Redis Cluster、Consul、Apache Cassandra 等。Gossip 協(xié)議類似病毒擴散的方式,將信息傳播到其他的節(jié)點,這種協(xié)議效率很高,只需要廣播到附近節(jié)點,然后被廣播的節(jié)點繼續(xù)做同樣的操作即可。當然這種協(xié)議也有一個弊端就是:會存在浪費,哪怕一個節(jié)點之前被通知到了,下次被廣播后仍然會重復轉(zhuǎn)發(fā)。
3. 持久化
(1)RDB
RDB 是對當前 Redis 的存儲數(shù)據(jù)進行一次快照(具體原理和如何做,限于篇幅這里不做過多復述了)。
(2)AOF
日志只記錄 Redis 對內(nèi)存修改的指令記錄,Redis 提供了一個 bgrewriteaif 的指令對 AOF 進行壓縮。原理就是:開辟一個子進程對內(nèi)存進行遍歷后,轉(zhuǎn)換成一系列對 Redis 的操作指令,序列化到一個新的 AOF 日志文件中。系列化完成后再將發(fā)送的增量 AOF 日志追加到這個新的 AOF 日志中,追加完成后用新的 AOF 日志代替舊的。(3)混合持久化
由于單純 RDB 的話,可能存在數(shù)據(jù)的丟失,而頻繁的 AOF 又會影響了性能,在 Redis 4.0 之后,支持了混合持久化,也就是每次啟動時候通過 RDB+增量的 AOF 文件來進行回復,由于增量的 AOF 僅記錄了開始持久化到持久化結(jié)束期間發(fā)生的增量,這樣日志不會太大,性能相對較高。4. 主從同步
Redis 的同步方式有:主從同步、從從同步(由于全部都由 master 同步的話,會損耗性能,所以部分的 slave 會通過 slave 之間進行同步)。同步過程:
5. Sentinel
Redis 的主從切換是通過哨兵來解決的。這里哨兵主要解決的問題就是:當 master 掛了的情況下,如果在短時間內(nèi)重新選舉出一個新的 master 。Sentinel 集群是一個由 3-5 個(可以更多)節(jié)點組成的,用來監(jiān)聽整個 Redis 的集群,如果發(fā)現(xiàn) master 不可用的時候,會關(guān)閉和斷開全部的與 master 相連的舊鏈接。這個時候 Sentinel 會完成選舉和故障轉(zhuǎn)移,新的請求則會轉(zhuǎn)到新到 master 中。6. Redis集群工作原理
Redis 集群通過槽指派機制來決定寫命令應該被分配到那個節(jié)點。整個集群對應的槽是由 16384 大小的二進制數(shù)組組成,集群中每個主節(jié)點分配一部分槽,每條寫命令落到二進制數(shù)組中的某個位置,該位置被分配給了哪個節(jié)點,則對應的命令就由該節(jié)點去執(zhí)行。槽指派對應的二進制數(shù)組如下圖所示:從上圖可以看到:節(jié)點 1 只負責 執(zhí)行 0 - 4999 的槽位,而節(jié)點 2 負責執(zhí)行 5000 - 9999,節(jié)點 3 執(zhí)行 9999- 16383 。當進行寫的時候:命令通過 CRC16(key) & 16383 = 6789(假設(shè)結(jié)果),由于節(jié)點 2 負責 5000~9999 的槽位,則該命令的結(jié)果 6789 最終由節(jié)點 2 執(zhí)行。當然如果在節(jié)點 2 執(zhí)行一條命令時,假設(shè)通過 CRC 計算后得到的值為 567,則其應該由節(jié)點 1 執(zhí)行,此時命令會進行轉(zhuǎn)向操作,將要執(zhí)行的命令流轉(zhuǎn)到節(jié)點 1 上去執(zhí)行。
集群中每個主節(jié)點都會定時發(fā)送信息到其他主節(jié)點進行同步,如果其他主節(jié)點在規(guī)定時間內(nèi)響應了發(fā)送消息的主節(jié)點,則發(fā)送消息的主節(jié)點認為響應了消息的主節(jié)點正常,反之則認為響應消息的主節(jié)點疑似下線,則發(fā)送消息的主節(jié)點在其節(jié)點上將其標記“疑似下線”。當集群中超過一半以上的節(jié)點認為某個主節(jié)點被標記為“疑似下線”,則其中某個主節(jié)點將疑似下線節(jié)點標記為下線狀態(tài),并向集群廣播一條下線消息,當下線節(jié)點對應的從節(jié)點接收到該消息時,則從從節(jié)點中選舉出一個節(jié)點作為主節(jié)點繼續(xù)對外提供服務(wù)。
業(yè)務(wù)場景中,不知道大家是否碰到過 Redis 變慢的情況:
原因分析
查看慢查詢,由于筆者本身機器沒有慢查詢,所以這里看到是空(實在尷尬,這里沒有可用的例子~~)
默認會監(jiān)聽 6379 端口,最好在 Redis 的配置文件中指定監(jiān)聽的 IP 地址,更進一步還可以增加 Redis 的 ACL 訪問控制,對客戶指定群組,并限限制用戶對數(shù)據(jù)的讀寫權(quán)限。
訪問 Redis 盡量走公司代理,由于 Redis 本身不支持 SSL 的鏈接,所以走公司代理可以保證安全。客戶端登陸 Redis 必須設(shè)置 Auth 秘密登陸。