漫畫:什么是JVM的垃圾回收?


————— 第二天 —————





————————————





下面我們一起來研究這三個(gè)問題。
問題1:哪些是需要回收的?
首先我們需要知道如何哪些垃圾需要回收?判斷對(duì)象是否需要回收有兩種算法。一種是引用計(jì)數(shù)算法、一種是可達(dá)性分析算法。
引用計(jì)數(shù)算法
引用計(jì)數(shù)算法很簡(jiǎn)單,它通過記錄對(duì)象被引用的次數(shù)從而判斷該對(duì)象的重要程度。如果該對(duì)象被其它對(duì)象引用,則它的引用計(jì)數(shù)加一,如果刪除對(duì)該對(duì)象的引用,那么它的引用計(jì)數(shù)就減一,當(dāng)該對(duì)象的引用計(jì)數(shù)為0時(shí),那么該對(duì)象就會(huì)被回收。


引用計(jì)數(shù)存在什么問題呢?當(dāng)有兩個(gè)對(duì)象相互引用時(shí),由于它們互相引用對(duì)方所以計(jì)數(shù)都不為零,這就會(huì)導(dǎo)致這兩個(gè)對(duì)象無法回收。
所以,Java虛擬機(jī)采用的是另一種方法來判斷對(duì)象是否存活,它就是可達(dá)性分析算法。


可達(dá)性分析算法
可達(dá)性分析算法,首先要確定一系列根對(duì)象(GC Roots),并從根對(duì)象為起點(diǎn)根據(jù)對(duì)象之間的引用關(guān)系搜索出一條引用鏈(Reference Chain),在引用鏈的對(duì)象就存活,而不在引用鏈的對(duì)象就認(rèn)定為可回收對(duì)象。
有一個(gè)比喻十分恰當(dāng):可達(dá)性分析算法就好比是在清洗葡萄串,我們可以從一根枝提起一大串葡萄,他們就像一串引用鏈,而沒有和引用鏈相連的對(duì)象就像是散落在池子里的葡萄,可以回收。


虛擬機(jī)棧中引用的對(duì)象(正在運(yùn)行的方法使用到的變量、參數(shù)等)
方法區(qū)中類靜態(tài)屬性引用的對(duì)象(static關(guān)鍵字聲明的字段)
方法區(qū)中常量引用的對(duì)象,(也就是final關(guān)鍵字聲明的字段)
本地方法棧中引用的對(duì)象(native方法)
Java虛擬機(jī)內(nèi)部的引用。(系統(tǒng)內(nèi)部的東西當(dāng)然能作為根了)
問題2:有哪些重要的垃圾回收算法?
學(xué)會(huì)判斷內(nèi)存中哪些垃圾需要回收后,我們就需要掌握幾個(gè)重要的垃圾回收算法。
標(biāo)記-清除算法
標(biāo)記-清除法是最基本的一種垃圾回收算法,總的來說分為兩步:
標(biāo)記

標(biāo)記所有需要回收的對(duì)象(灰色),也就是在做垃圾的判定。
清除

將標(biāo)記為灰色的部分,清除掉。
需要注意的是:所謂的清除,并不需要真正地把整個(gè)內(nèi)存的字節(jié)進(jìn)行清零操作,只需要把空閑對(duì)象的起始結(jié)束地址記錄下來放入空閑列表里,表示這段內(nèi)存是空閑的就行。


優(yōu)點(diǎn)速度快,只需要做個(gè)標(biāo)記就能知道哪一塊需要被回收,但是他的缺點(diǎn)也是致命的。
他的主要缺點(diǎn)有兩個(gè):一是執(zhí)行效率不穩(wěn)定,二是會(huì)涉及到內(nèi)存碎片化的問題。
可能有人會(huì)問,碎片化是什么意思呢?上面所描述的這個(gè)棧,通過標(biāo)記清除法雖然是清除了空間,但是清除出來的內(nèi)存是大量的不連續(xù)內(nèi)存碎片,像下面的這塊對(duì)象,明明整體都有位,卻因?yàn)椴贿B續(xù)無法放入,這是標(biāo)記-清除算法最大的缺點(diǎn)。



所謂標(biāo)記復(fù)制算法和標(biāo)記整理算法,都是對(duì)標(biāo)記清除算法缺點(diǎn)的改進(jìn),所以才說標(biāo)記清除算法是最基礎(chǔ)的方式。
標(biāo)記-整理算法
與標(biāo)記-清除算法不同,標(biāo)記-整理算法是移動(dòng)式的。他會(huì)讓所以存活的對(duì)象都向內(nèi)存空間一端移動(dòng),然后清除到邊界以外的內(nèi)存。
標(biāo)記

移動(dòng)



是什么樣的弊端呢?標(biāo)記-整理算法涉及到了對(duì)象的移動(dòng),在整理階段,由于移動(dòng)了可用對(duì)象,需要去更新引用。效率就低了。
標(biāo)記-復(fù)制算法
標(biāo)記-復(fù)制算法,相比前面的比較不同,他將內(nèi)存空間分為兩塊,在垃圾回收時(shí)將正在使用的內(nèi)存中的存活對(duì)象復(fù)制到未被使用的內(nèi)存塊中,然后呢再清除正在使用的內(nèi)存塊中的所有對(duì)象。最后再交換兩個(gè)內(nèi)存的角色,最后完成垃圾回收。
大體來看可以分為 這么幾個(gè)步驟:
復(fù)制

清空

易位

不難看出,標(biāo)記復(fù)制算法不需要標(biāo)記算是提升了效率。此外他也不會(huì)參數(shù)碎片問題。
但是。標(biāo)記復(fù)制算法的缺點(diǎn)也是十分明顯的,它需要雙倍空間。

問題3:垃圾回收的具體流程是怎樣的?
既然說JVM虛擬機(jī)不會(huì)單獨(dú)采用某種算法,而是會(huì)結(jié)合三種算法讓他們協(xié)同工作,其具體的實(shí)現(xiàn)就是java虛擬機(jī)里的分代垃圾回收機(jī)制。



上圖所示,就是Java堆內(nèi)存的劃分。為什么需要這么劃分區(qū)域呢?那是因?yàn)槲覀兊膉ava對(duì)象壽命都是不同的,有的可能需要長(zhǎng)時(shí)間使用,而有的可能用完就可以丟去。于是我們可以根據(jù)其生命周期的不同特點(diǎn),進(jìn)行不同的垃圾回收策略。
總的來說,新生代的垃圾回收比較頻繁,老年代很久才觸發(fā)一次垃圾回收。新生代處理的都是一些朝生夕死的對(duì)象,而老年代回收的是更有價(jià)值的,會(huì)長(zhǎng)時(shí)間存活的對(duì)象。
舉個(gè)很好理解的例子:新生代處理垃圾,就像是處理生活日用垃圾,而老年代處理的垃圾,更像是過年大掃除,家里實(shí)在太多垃圾了來一次重清理。大掃除清理的垃圾,都是在家中存放時(shí)間較長(zhǎng)的,往往可能曾經(jīng)很受用,如今退役了先放著過年再打掃清除掉。


每一次,我們創(chuàng)建一個(gè)對(duì)象,都會(huì)在伊甸園區(qū)占據(jù)一定內(nèi)存大小,漸漸地伊甸園就滿了。當(dāng)我們?cè)僖獎(jiǎng)?chuàng)建對(duì)象時(shí),就會(huì)發(fā)現(xiàn)空間不夠了。

這時(shí),就會(huì)觸發(fā)一次垃圾回收,新生代觸發(fā)的垃圾回收有個(gè)稱呼叫做MinorGC。
MinorGC觸發(fā)后,伊甸園區(qū)就會(huì)對(duì)各個(gè)對(duì)象進(jìn)行可達(dá)性分析,從而知道哪些對(duì)象應(yīng)該作為垃圾被清理。
MinorGC在這里采取的是標(biāo)記復(fù)制算法,它將有用的對(duì)象存放到幸存區(qū)to,然后把伊甸園中的對(duì)象清除掉。

進(jìn)入幸存區(qū)的幸運(yùn)兒,將會(huì)被標(biāo)記上一個(gè)“幸運(yùn)值”,代表他們抗住了多少次清理。

最后,幸存區(qū)to和幸存區(qū)from還需要交互一下位置,這里不是指物理位置交換,而是說,它倆的定義發(fā)生了交換,下次就是左邊那個(gè)為幸存區(qū)to,右邊的為幸存區(qū)from了。
換句話說,幸存區(qū)to始終是空的。
我們?cè)倌M多幾次,加深一下印象:
假如又進(jìn)來了不少對(duì)象,伊甸園又滿了!

那就會(huì)觸發(fā)一次MinorGC,把幸存者移步到幸存區(qū)to,其他一律清空。

最后別忘了,幸存區(qū)from和幸存區(qū)to又要再交換一下”位置“。

...














歡迎關(guān)注微信公眾號(hào):互聯(lián)網(wǎng)全棧架構(gòu),收取更多有價(jià)值的信息。
