91色蝌蚪,国产91人妻,手机毛片在线播放,黄色在线免费一级视频,三级aV成人,在线日屄,夜夜天天干,大鸡吧视频在线观看

緩存能夠有效地加速應(yīng)用的讀寫速度，同時也可以降低后端負載，對日常應(yīng)用的開發(fā)至關(guān)重要。下面會介紹緩存使用技巧和設(shè)計方案，包含如下內(nèi)容：緩存的收益和成本分析、緩存更新策略的選擇和使用場景、緩存粒度控制方法、穿透問題優(yōu)化、無底洞問題優(yōu)化、雪崩問題優(yōu)化、熱點key重建優(yōu)化。

1）緩存的收益和成本分析

下圖左側(cè)為客戶端直接調(diào)用存儲層的架構(gòu)，右側(cè)為比較典型的緩存層+存儲層架構(gòu)。

下面分析一下緩存加入后帶來的收益和成本。

收益：

①加速讀寫：因為緩存通常都是全內(nèi)存的，而存儲層通常讀寫性能不夠強悍（例如MySQL），通過緩存的使用可以有效地加速讀寫，優(yōu)化用戶體驗。

②降低后端負載：幫助后端減少訪問量和復(fù)雜計算（例如很復(fù)雜的SQL語句），在很大程度降低了后端的負載。

成本：

①數(shù)據(jù)不一致性：緩存層和存儲層的數(shù)據(jù)存在著一定時間窗口的不一致性，時間窗口跟更新策略有關(guān)。

②代碼維護成本：加入緩存后，需要同時處理緩存層和存儲層的邏輯，增大了開發(fā)者維護代碼的成本。

③運維成本：以Redis Cluster為例，加入后無形中增加了運維成本。

緩存的使用場景基本包含如下兩種：

①開銷大的復(fù)雜計算：以MySQL為例子，一些復(fù)雜的操作或者計算（例如大量聯(lián)表操作、一些分組計算），如果不加緩存，不但無法滿足高并發(fā)量，同時也會給MySQL帶來巨大的負擔(dān)。

②加速請求響應(yīng)：即使查詢單條后端數(shù)據(jù)足夠快（例如select*from table where id=），那么依然可以使用緩存，以Redis為例子，每秒可以完成數(shù)萬次讀寫，并且提供的批量操作可以優(yōu)化整個IO鏈的響應(yīng)時間。

2）緩存更新策略

緩存中的數(shù)據(jù)會和數(shù)據(jù)源中的真實數(shù)據(jù)有一段時間窗口的不一致，需要利用某些策略進行更新，下面會介紹幾種主要的緩存更新策略。

①LRU/LFU/FIFO算法剔除：剔除算法通常用于緩存使用量超過了預(yù)設(shè)的最大值時候，如何對現(xiàn)有的數(shù)據(jù)進行剔除。例如Redis使用maxmemory-policy這個配置作為內(nèi)存最大值后對于數(shù)據(jù)的剔除策略。

②超時剔除：通過給緩存數(shù)據(jù)設(shè)置過期時間，讓其在過期時間后自動刪除，例如Redis提供的expire命令。如果業(yè)務(wù)可以容忍一段時間內(nèi)，緩存層數(shù)據(jù)和存儲層數(shù)據(jù)不一致，那么可以為其設(shè)置過期時間。在數(shù)據(jù)過期后，再從真實數(shù)據(jù)源獲取數(shù)據(jù)，重新放到緩存并設(shè)置過期時間。例如一個視頻的描述信息，可以容忍幾分鐘內(nèi)數(shù)據(jù)不一致，但是涉及交易方面的業(yè)務(wù)，后果可想而知。

③主動更新：應(yīng)用方對于數(shù)據(jù)的一致性要求高，需要在真實數(shù)據(jù)更新后，立即更新緩存數(shù)據(jù)。例如可以利用消息系統(tǒng)或者其他方式通知緩存更新。

三種常見更新策略的對比：

有兩個建議：

①低一致性業(yè)務(wù)建議配置最大內(nèi)存和淘汰策略的方式使用。

②高一致性業(yè)務(wù)可以結(jié)合使用超時剔除和主動更新，這樣即使主動更新出了問題，也能保證數(shù)據(jù)過期時間后刪除臟數(shù)據(jù)。

3）緩存粒度控制

緩存粒度問題是一個容易被忽視的問題，如果使用不當(dāng)，可能會造成很多無用空間的浪費，網(wǎng)絡(luò)帶寬的浪費，代碼通用性較差等情況，需要綜合數(shù)據(jù)通用性、空間占用比、代碼維護性三點進行取舍。

緩存比較常用的選型，緩存層選用Redis，存儲層選用MySQL。

4）穿透優(yōu)化

緩存穿透是指查詢一個根本不存在的數(shù)據(jù)，緩存層和存儲層都不會命中，通常出于容錯的考慮，如果從存儲層查不到數(shù)據(jù)則不寫入緩存層。

通常可以在程序中分別統(tǒng)計總調(diào)用數(shù)、緩存層命中數(shù)、存儲層命中數(shù)，如果發(fā)現(xiàn)大量存儲層空命中，可能就是出現(xiàn)了緩存穿透問題。造成緩存穿透的基本原因有兩個。第一，自身業(yè)務(wù)代碼或者數(shù)據(jù)出現(xiàn)問題，第二，一些惡意攻擊、爬蟲等造成大量空命中。下面我們來看一下如何解決緩存穿透問題。

①緩存空對象：如圖下所示，當(dāng)?shù)?步存儲層不命中后，仍然將空對象保留到緩存層中，之后再訪問這個數(shù)據(jù)將會從緩存中獲取，這樣就保護了后端數(shù)據(jù)源。

緩存空對象會有兩個問題：第一，空值做了緩存，意味著緩存層中存了更多的鍵，需要更多的內(nèi)存空間（如果是攻擊，問題更嚴重），比較有效的方法是針對這類數(shù)據(jù)設(shè)置一個較短的過期時間，讓其自動剔除。第二，緩存層和存儲層的數(shù)據(jù)會有一段時間窗口的不一致，可能會對業(yè)務(wù)有一定影響。例如過期時間設(shè)置為5分鐘，如果此時存儲層添加了這個數(shù)據(jù)，那此段時間就會出現(xiàn)緩存層和存儲層數(shù)據(jù)的不一致，此時可以利用消息系統(tǒng)或者其他方式清除掉緩存層中的空對象。

②布隆過濾器攔截

如下圖所示，在訪問緩存層和存儲層之前，將存在的key用布隆過濾器提前保存起來，做第一層攔截。例如：一個推薦系統(tǒng)有4億個用戶id，每個小時算法工程師會根據(jù)每個用戶之前歷史行為計算出推薦數(shù)據(jù)放到存儲層中，但是最新的用戶由于沒有歷史行為，就會發(fā)生緩存穿透的行為，為此可以將所有推薦數(shù)據(jù)的用戶做成布隆過濾器。如果布隆過濾器認為該用戶id不存在，那么就不會訪問存儲層，在一定程度保護了存儲層。

緩存空對象和布隆過濾器方案對比

另：布隆過濾器簡單說明：

如果想判斷一個元素是不是在一個集合里，一般想到的是將集合中所有元素保存起來，然后通過比較確定。鏈表、樹、散列表（又叫哈希表，Hash table）等等數(shù)據(jù)結(jié)構(gòu)都是這種思路。但是隨著集合中元素的增加，我們需要的存儲空間越來越大。同時檢索速度也越來越慢。

Bloom Filter 是一種空間效率很高的隨機數(shù)據(jù)結(jié)構(gòu)，Bloom filter 可以看做是對 bit-map 的擴展, 它的原理是：

當(dāng)一個元素被加入集合時，通過 K 個 Hash 函數(shù)將這個元素映射成一個位陣列（Bit array）中的 K 個點，把它們置為 1。檢索時，我們只要看看這些點是不是都是 1 就（大約）知道集合中有沒有它了：

如果這些點有任何一個 0，則被檢索元素一定不在；如果都是 1，則被檢索元素很可能在。

5）無底洞優(yōu)化

為了滿足業(yè)務(wù)需要可能會添加大量新的緩存節(jié)點，但是發(fā)現(xiàn)性能不但沒有好轉(zhuǎn)反而下降了。用一句通俗的話解釋就是，更多的節(jié)點不代表更高的性能，所謂“無底洞”就是說投入越多不一定產(chǎn)出越多。但是分布式又是不可以避免的，因為訪問量和數(shù)據(jù)量越來越大，一個節(jié)點根本抗不住，所以如何高效地在分布式緩存中批量操作是一個難點。

無底洞問題分析：

①客戶端一次批量操作會涉及多次網(wǎng)絡(luò)操作，也就意味著批量操作會隨著節(jié)點的增多，耗時會不斷增大。

②網(wǎng)絡(luò)連接數(shù)變多，對節(jié)點的性能也有一定影響。

如何在分布式條件下優(yōu)化批量操作？我們來看一下常見的IO優(yōu)化思路：

命令本身的優(yōu)化，例如優(yōu)化SQL語句等。
減少網(wǎng)絡(luò)通信次數(shù)。
降低接入成本，例如客戶端使用長連/連接池、NIO等。

這里我們假設(shè)命令、客戶端連接已經(jīng)為最優(yōu)，重點討論減少網(wǎng)絡(luò)操作次數(shù)。下面我們將結(jié)合Redis Cluster的一些特性對四種分布式的批量操作方式進行說明。

①串行命令：由于n個key是比較均勻地分布在Redis Cluster的各個節(jié)點上，因此無法使用mget命令一次性獲取，所以通常來講要獲取n個key的值，最簡單的方法就是逐次執(zhí)行n個get命令，這種操作時間復(fù)雜度較高，它的操作時間=n次網(wǎng)絡(luò)時間+n次命令時間，網(wǎng)絡(luò)次數(shù)是n。很顯然這種方案不是最優(yōu)的，但是實現(xiàn)起來比較簡單。

②串行IO：Redis Cluster使用CRC16算法計算出散列值，再取對16383的余數(shù)就可以算出slot值，同時Smart客戶端會保存slot和節(jié)點的對應(yīng)關(guān)系，有了這兩個數(shù)據(jù)就可以將屬于同一個節(jié)點的key進行歸檔，得到每個節(jié)點的key子列表，之后對每個節(jié)點執(zhí)行mget或者Pipeline操作，它的操作時間=node次網(wǎng)絡(luò)時間+n次命令時間，網(wǎng)絡(luò)次數(shù)是node的個數(shù)，整個過程如下圖所示，很明顯這種方案比第一種要好很多，但是如果節(jié)點數(shù)太多，還是有一定的性能問題。

③并行IO：此方案是將方案2中的最后一步改為多線程執(zhí)行，網(wǎng)絡(luò)次數(shù)雖然還是節(jié)點個數(shù)，但由于使用多線程網(wǎng)絡(luò)時間變?yōu)?/span>O（1），這種方案會增加編程的復(fù)雜度。

④hash_tag實現(xiàn)：Redis Cluster的hash_tag功能，它可以將多個key強制分配到一個節(jié)點上，它的操作時間=1次網(wǎng)絡(luò)時間+n次命令時間。

四種批量操作解決方案對比

6）雪崩優(yōu)化

緩存雪崩：由于緩存層承載著大量請求，有效地保護了存儲層，但是如果緩存層由于某些原因不能提供服務(wù)，于是所有的請求都會達到存儲層，存儲層的調(diào)用量會暴增，造成存儲層也會級聯(lián)宕機的情況。

預(yù)防和解決緩存雪崩問題，可以從以下三個方面進行著手：

①保證緩存層服務(wù)高可用性。如果緩存層設(shè)計成高可用的，即使個別節(jié)點、個別機器、甚至是機房宕掉，依然可以提供服務(wù)，例如前面介紹過的Redis Sentinel和Redis Cluster都實現(xiàn)了高可用。

②依賴隔離組件為后端限流并降級。在實際項目中，我們需要對重要的資源（例如Redis、MySQL、HBase、外部接口）都進行隔離，讓每種資源都單獨運行在自己的線程池中，即使個別資源出現(xiàn)了問題，對其他服務(wù)沒有影響。但是線程池如何管理，比如如何關(guān)閉資源池、開啟資源池、資源池閥值管理，這些做起來還是相當(dāng)復(fù)雜的。

③提前演練。在項目上線前，演練緩存層宕掉后，應(yīng)用以及后端的負載情況以及可能出現(xiàn)的問題，在此基礎(chǔ)上做一些預(yù)案設(shè)定。

7）熱點key重建優(yōu)化

開發(fā)人員使用“緩存+過期時間”的策略既可以加速數(shù)據(jù)讀寫，又保證數(shù)據(jù)的定期更新，這種模式基本能夠滿足絕大部分需求。但是有兩個問題如果同時出現(xiàn)，可能就會對應(yīng)用造成致命的危害：

當(dāng)前key是一個熱點key（例如一個熱門的娛樂新聞），并發(fā)量非常大。
重建緩存不能在短時間完成，可能是一個復(fù)雜計算，例如復(fù)雜的SQL、多次IO、多個依賴等。在緩存失效的瞬間，有大量線程來重建緩存，造成后端負載加大，甚至可能會讓應(yīng)用崩潰。

要解決這個問題也不是很復(fù)雜，但是不能為了解決這個問題給系統(tǒng)帶來更多的麻煩，所以需要制定如下目標：

減少重建緩存的次數(shù)
數(shù)據(jù)盡可能一致。
較少的潛在危險

①互斥鎖：此方法只允許一個線程重建緩存，其他線程等待重建緩存的線程執(zhí)行完，重新從緩存獲取數(shù)據(jù)即可，整個過程如圖所示。

下面代碼使用Redis的setnx命令實現(xiàn)上述功能：

1）從Redis獲取數(shù)據(jù)，如果值不為空，則直接返回值；否則執(zhí)行下面的2.1）和2.2）步驟。

2.1）如果set（nx和ex）結(jié)果為true，說明此時沒有其他線程重建緩存，那么當(dāng)前線程執(zhí)行緩存構(gòu)建邏輯。

2.2）如果set（nx和ex）結(jié)果為false，說明此時已經(jīng)有其他線程正在執(zhí)行構(gòu)建緩存的工作，那么當(dāng)前線程將休息指定時間（例如這里是50毫秒，取決于構(gòu)建緩存的速度）后，重新執(zhí)行函數(shù)，直到獲取到數(shù)據(jù)。

②永遠不過期

“永遠不過期”包含兩層意思：