知識分享，以技會友。大家好，我是Tom哥。閱讀本文大約需要 15 分鐘。

緩存設(shè)計可謂老生常談了，早些時候都是采用memcache，現(xiàn)在大家更多傾向使用redis，除了知曉常用的數(shù)據(jù)存儲類型，結(jié)合業(yè)務(wù)場景有針對性選擇，好像其他也沒有什么大的難點。

工程中引入Redis Client二方包，初始化一個Bean實例RedisTemplate ，一切搞定，so easy。

如果是幾十、幾百并發(fā)的業(yè)務(wù)場景，緩存設(shè)計可能并不需要考慮那么多，但如果是億級的系統(tǒng)呢？

首先，先了解緩存知識圖譜

早期的緩存用于加速CPU數(shù)據(jù)交換的RAM。隨著互聯(lián)網(wǎng)的快速發(fā)展，緩存的應(yīng)用更加寬泛，用于數(shù)據(jù)高速交換的存儲介質(zhì)都稱之為緩存。

使用緩存時，我們要關(guān)注哪些指標(biāo)？緩存有哪些應(yīng)用模式？以及緩存設(shè)計時有哪些Tip技巧？一圖勝千言，如下：

七大經(jīng)典問題

緩存在使用過程不可避免會遇到一些問題，對于高頻的問題我們大概歸為了7類。具體內(nèi)容下面我們一一道來

1、緩存集中失效

當(dāng)業(yè)務(wù)系統(tǒng)查詢數(shù)據(jù)時，首先會查詢緩存，如果緩存中數(shù)據(jù)不存在，然后查詢DB再將數(shù)據(jù)預(yù)熱到Cache中，并返回。緩存的性能比 DB 高 50~100 倍以上。

很多業(yè)務(wù)場景，如：秒殺商品、微博熱搜排行、或者一些活動數(shù)據(jù)，都是通過跑任務(wù)方式，將DB數(shù)據(jù)批量、集中預(yù)熱到緩存中，緩存數(shù)據(jù)有著近乎相同的過期時間。

當(dāng)過這批數(shù)據(jù)過期時，會一起過期，此時，對這批數(shù)據(jù)的所有請求，都會出現(xiàn)緩存失效，從而將壓力轉(zhuǎn)嫁到DB，DB的請求量激增，壓力變大，響應(yīng)開始變慢。

那么有沒有解呢？

當(dāng)然有了。

我們可以從緩存的過期時間入口，將原來的固定過期時間，調(diào)整為過期時間=基礎(chǔ)時間+隨機時間，讓緩存慢慢過期，避免瞬間全部過期，對DB產(chǎn)生過大壓力。

2、緩存穿透

不是所有的請求都能查到數(shù)據(jù)，不論是從緩存中還是DB中。

假如黑客攻擊了一個論壇，用了一堆肉雞訪問一個不存的帖子id。按照常規(guī)思路，每次都會先查緩存，緩存中沒有，接著又查DB，同樣也沒有，此時不會預(yù)熱到Cache中，導(dǎo)致每次查詢，都會cache miss。

由于DB的吞吐性能較差，會嚴(yán)重影響系統(tǒng)的性能，甚至影響正常用戶的訪問。

解決方案：

方案一：查存DB 時，如果數(shù)據(jù)不存在，預(yù)熱一個特殊空值到緩存中。這樣，后續(xù)查詢都會命中緩存，但是要對特殊值，解析處理。
方案二：構(gòu)造一個BloomFilter過濾器，初始化全量數(shù)據(jù)，當(dāng)接到請求時，在BloomFilter中判斷這個key是否存在，如果不存在，直接返回即可，無需再查詢緩存和DB

3、緩存雪崩

緩存雪崩是指部分緩存節(jié)點不可用，進而導(dǎo)致整個緩存體系甚至服務(wù)系統(tǒng)不可用的情況。

分布式緩存設(shè)計一般選擇一致性Hash，當(dāng)有部分節(jié)點異常時，采用 rehash 策略，即把異常節(jié)點請求平均分散到其他緩存節(jié)點。但是，當(dāng)較大的流量洪峰到來時，如果大流量 key 比較集中，正好在某 1～2 個緩存節(jié)點，很容易將這些緩存節(jié)點的內(nèi)存、網(wǎng)卡過載，緩存節(jié)點異常 Crash，然后這些異常節(jié)點下線，這些大流量 key 請求又被 rehash 到其他緩存節(jié)點，進而導(dǎo)致其他緩存節(jié)點也被過載 Crash，緩存異常持續(xù)擴散，最終導(dǎo)致整個緩存體系異常，無法對外提供服務(wù)。

解決方案：

方案一：增加實時監(jiān)控，及時預(yù)警。通過機器替換、各種故障自動轉(zhuǎn)移策略，快速恢復(fù)緩存對外的服務(wù)能力
方案二：緩存增加多個副本，當(dāng)緩存異常時，再讀取其他緩存副本。為了保證副本的可用性，盡量將多個緩存副本部署在不同機架上，降低風(fēng)險。

4、緩存熱點

對于突發(fā)事件，大量用戶同時去訪問熱點信息，這個突發(fā)熱點信息所在的緩存節(jié)點就很容易出現(xiàn)過載和卡頓現(xiàn)象，甚至 Crash，我們稱之為緩存熱點。

這個在新浪微博經(jīng)常遇到，某大V明星出軌、結(jié)婚、離婚，瞬間引發(fā)數(shù)百千萬的吃瓜群眾圍觀，訪問同一個key，流量集中打在一個緩存節(jié)點機器，很容易打爆網(wǎng)卡、帶寬、CPU的上限，最終導(dǎo)致緩存不可用。

解決方案：

首先能先找到這個熱key來，比如通過Spark實時流分析，及時發(fā)現(xiàn)新的熱點key。
將集中化流量打散，避免一個緩存節(jié)點過載。由于只有一個key，我們可以在key的后面拼上有序編號，比如key#01、key#02。。。key#10多個副本，這些加工后的key位于多個緩存節(jié)點上。
每次請求時，客戶端隨機訪問一個即可

可以設(shè)計一個緩存服務(wù)治理管理后臺，實時監(jiān)控緩存的SLA，并打通分布式配置中心，對于一些hot key可以快速、動態(tài)擴容。

5、緩存大Key

當(dāng)訪問緩存時，如果key對應(yīng)的value過大，讀寫、加載很容易超時，容易引發(fā)網(wǎng)絡(luò)擁堵。另外緩存的字段較多時，每個字段的變更都會引發(fā)緩存數(shù)據(jù)的變更，頻繁的讀寫，導(dǎo)致慢查詢。如果大key過期被緩存淘汰失效，預(yù)熱數(shù)據(jù)要花費較多的時間，也會導(dǎo)致慢查詢。

所以我們在設(shè)計緩存的時候，要注意緩存的粒度，既不能過大，如果過大很容易導(dǎo)致網(wǎng)絡(luò)擁堵；也不能過小，如果太小，查詢頻率會很高，每次請求都要查詢多次。

解決方案：

方案一：設(shè)置一個閾值，當(dāng)value的長度超過閾值時，對內(nèi)容啟動壓縮，降低kv的大小
方案二：評估大key所占的比例，由于很多框架采用池化技術(shù)，如：Memcache，可以預(yù)先分配大對象空間。真正業(yè)務(wù)請求時，直接拿來即用。
方案三：顆粒劃分，將大key拆分為多個小key，獨立維護，成本會降低不少
方案四：大key要設(shè)置合理的過期時間，盡量不淘汰那些大key

6、緩存數(shù)據(jù)一致性

緩存是用來加速的，一般不會持久化儲存。所以，一份數(shù)據(jù)通常會存在DB和緩存中，由此會帶來一個問題，如何保證這兩者的數(shù)據(jù)一致性。另外，緩存熱點問題會引入多個副本備份，也可能會發(fā)生不一致現(xiàn)象。

解決方案：

方案一：當(dāng)緩存更新失敗后，進行重試，如果重試失敗，將失敗的key寫入MQ消息隊列，通過異步任務(wù)補償緩存，保證數(shù)據(jù)的一致性。
方案二：設(shè)置一個較短的過期時間，通過自修復(fù)的方式，在緩存過期后，緩存重新加載最新的數(shù)據(jù)

7、數(shù)據(jù)并發(fā)競爭預(yù)熱

互聯(lián)網(wǎng)系統(tǒng)典型的特點就是流量大，一旦緩存中的數(shù)據(jù)過期、或因某些原因被刪除等，導(dǎo)致緩存中的數(shù)據(jù)為空，大量的并發(fā)線程請求（查詢同一個key）就會一起并發(fā)查詢數(shù)據(jù)庫，數(shù)據(jù)庫的壓力陡然增加。

如果請求量非常大，全部壓在數(shù)據(jù)庫，可能把數(shù)據(jù)庫壓垮，進而導(dǎo)致整個系統(tǒng)的服務(wù)不可用。

解決方案：

方案一：引入一把全局鎖，當(dāng)緩存未命中時，先嘗試獲取全局鎖，如果拿到鎖，才有資格去查詢DB，并將數(shù)據(jù)預(yù)熱到緩存中。雖然，client端發(fā)起的請求非常多，但是由于拿不到鎖，只能處于等待狀態(tài)，當(dāng)緩存中的數(shù)據(jù)預(yù)熱成功后，再從緩存中獲取

為了便于理解，簡單畫了個流程圖。這里面特別注意一個點，由于有一個并發(fā)時間差，所以會有一個二次check緩存是否有值的校驗，防止緩存預(yù)熱重復(fù)覆蓋。

方案二：緩存數(shù)據(jù)創(chuàng)建多個備份，當(dāng)一個過期失效后，可以訪問其他備份。

寫在最后

緩存設(shè)計時，有很多技巧，優(yōu)化手段也是千變?nèi)f化，但是我們要抓住核心要素。那就是，讓訪問盡量命中緩存，同時保持?jǐn)?shù)據(jù)的一致性。

關(guān)于我：前阿里架構(gòu)師，出過專利，競賽拿過獎，CSDN博客專家，負(fù)責(zé)過電商交易、社區(qū)、營銷、金融等業(yè)務(wù)，多年團隊管理經(jīng)驗，愛思考，喜歡結(jié)交朋友

「關(guān)注」↓↓↓ 二維碼，拉你進群，一線大廠技術(shù)交流

億級系統(tǒng)的Redis緩存如何設(shè)計？？？

首先，先了解緩存知識圖譜

七大經(jīng)典問題

緩存在使用過程不可避免會遇到一些問題，對于高頻的問題我們大概歸為了7類。具體內(nèi)容下面我們一一道來

1、緩存集中失效

2、緩存穿透

3、緩存雪崩

4、緩存熱點

5、緩存大Key

6、緩存數(shù)據(jù)一致性

7、數(shù)據(jù)并發(fā)競爭預(yù)熱

寫在最后

「關(guān)注」↓↓↓ 二維碼，拉你進群，一線大廠技術(shù)交流