Redis 的字符串是如何實(shí)現(xiàn)的?

東邊日出西邊雨,道是無晴卻有晴。
本篇會(huì)講以下內(nèi)容:
Redis字符串的實(shí)現(xiàn) Redis字符串的性能優(yōu)勢(shì)
Redis字符串的實(shí)現(xiàn)
Redis雖然是用C語(yǔ)言寫的,但卻沒有直接用C語(yǔ)言的字符串,而是自己實(shí)現(xiàn)了一套字符串。目的就是為了提升速度,提升性能,可以看出Redis為了高性能也是煞費(fèi)苦心。
Redis構(gòu)建了一個(gè)叫做簡(jiǎn)單動(dòng)態(tài)字符串(Simple Dynamic String),簡(jiǎn)稱SDS
1.SDS 代碼結(jié)構(gòu)
struct?sdshdr{
????//??記錄已使用長(zhǎng)度
????int?len;
????//?記錄空閑未使用的長(zhǎng)度
????int?free;
????//?字符數(shù)組
????char[]?buf;
};
SDS ?什么鬼?可能對(duì)此陌生的朋友對(duì)這個(gè)名稱有疑惑。只是個(gè)名詞而已不必在意,我們要重點(diǎn)欣賞借鑒Redis的設(shè)計(jì)思路。下面畫個(gè)圖來說明,一目了然。image
Redis的字符串也會(huì)遵守C語(yǔ)言的字符串的實(shí)現(xiàn)規(guī)則,即最后一個(gè)字符為空字符。然而這個(gè)空字符不會(huì)被計(jì)算在len里頭。
2.SDS 動(dòng)態(tài)擴(kuò)展特點(diǎn)
SDS的最厲害最奇妙之處在于它的Dynamic。動(dòng)態(tài)變化長(zhǎng)度。舉個(gè)例子

如上圖所示剛開始s1 只有5個(gè)空閑位子,后面需要追加' world' 6個(gè)字符,很明顯是不夠的。那咋辦?Redis會(huì)做以下三個(gè)操作:
計(jì)算出大小是否足夠 開辟空間至滿足所需大小 開辟與已使用大小len相同長(zhǎng)度的空閑free空間(如果len < 1M)開辟1M長(zhǎng)度的空閑free空間(如果len >= 1M)
看到這兒為止有沒有朋友覺得這個(gè)實(shí)現(xiàn)跟Java的列表List實(shí)現(xiàn)有點(diǎn)類似呢?看完后面的會(huì)覺得更像了。
Redis字符串的性能優(yōu)勢(shì)
快速獲取字符串長(zhǎng)度 避免緩沖區(qū)溢出 降低空間分配次數(shù)提升內(nèi)存使用效率
1.快速獲取字符串長(zhǎng)度
再看下上面的SDS結(jié)構(gòu)體:
struct?sdshdr{
????//??記錄已使用長(zhǎng)度
????int?len;
????//?記錄空閑未使用的長(zhǎng)度
????int?free;
????//?字符數(shù)組
????char[]?buf;
};
由于在SDS里存了已使用字符長(zhǎng)度len,所以當(dāng)想獲取字符串長(zhǎng)度時(shí)直接返回len即可,時(shí)間復(fù)雜度為O(1)。如果使用C語(yǔ)言的字符串的話它的字符串長(zhǎng)度獲取函數(shù)時(shí)間復(fù)雜度為O(n),n為字符個(gè)數(shù),因?yàn)樗菑念^到尾(到空字符'\0')遍歷相加。
2.避免緩沖區(qū)溢出
對(duì)一個(gè)C語(yǔ)言字符串進(jìn)行strcat追加字符串的時(shí)候需要提前開辟需要的空間,如果不開辟空間的話可能會(huì)造成緩沖區(qū)溢出,而影響程序其他代碼。如下圖,有一個(gè)字符串s1="hello" 和 字符串s2="baby",現(xiàn)在要執(zhí)行strcat(s1,"world"),并且執(zhí)行前未給s1開辟空間,所以造成了緩沖區(qū)溢出。

而對(duì)于Redis而言由于每次追加字符串時(shí)都會(huì)檢查空間是否夠用,所以不會(huì)存在緩沖區(qū)溢出問題。每次追加操作前都會(huì)做如下操作:
計(jì)算出大小是否足夠 開辟空間至滿足所需大小
3.降低空間分配次數(shù)提升內(nèi)存使用效率
字符串的追加操作會(huì)涉及到內(nèi)存分配問題,然而內(nèi)存分配問題會(huì)牽扯內(nèi)存劃分算法以及系統(tǒng)調(diào)用所以如果頻繁發(fā)生的話影響性能,所以對(duì)于性能至上的Redis來說這是萬萬不能忍受的。所以采取了以下兩種優(yōu)化措施
空間與分配 惰性空間回收
1. 空間預(yù)分配
對(duì)于追加操作來說,Redis不僅會(huì)開辟空間至夠用而且還會(huì)預(yù)分配未使用的空間(free)來用于下一次操作。至于未使用的空間(free)的大小則由修改后的字符串長(zhǎng)度決定。
當(dāng)修改后的字符串長(zhǎng)度len < 1M,則會(huì)分配與len相同長(zhǎng)度的未使用的空間(free)
當(dāng)修改后的字符串長(zhǎng)度len >= 1M,則會(huì)分配1M長(zhǎng)度的未使用的空間(free)
有了這個(gè)預(yù)分配策略之后會(huì)減少內(nèi)存分配次數(shù),因?yàn)榉峙渲皶?huì)檢查已有的free空間是否夠,如果夠則不開辟了~
2. 惰性空間回收
與上面情況相反,惰性空間回收適用于字符串縮減操作。比如有個(gè)字符串s1="hello world",對(duì)s1進(jìn)行sdstrim(s1," world")操作,執(zhí)行完該操作之后Redis不會(huì)立即回收減少的部分,而是會(huì)分配給下一個(gè)需要內(nèi)存的程序。當(dāng)然,Redis也提供了回收內(nèi)存的api,可以自己手動(dòng)調(diào)用來回收縮減部分的內(nèi)存。
到此為止結(jié)束了~

