面試時(shí)常問的HashMap數(shù)據(jù)結(jié)構(gòu)知識點(diǎn)
點(diǎn)擊上方"程序IT圈",?右上角選擇“設(shè)為星標(biāo)”
精品技術(shù)文章準(zhǔn)時(shí)送上!
來源:
https://www.cnblogs.com/Young111/p/11519952.html
1.HashMap 的數(shù)據(jù)結(jié)構(gòu)?
A:哈希表結(jié)構(gòu)(鏈表散列:數(shù)組+鏈表)實(shí)現(xiàn),結(jié)合數(shù)組和鏈表的優(yōu)點(diǎn)。當(dāng)鏈表長度超過 8 時(shí),鏈表轉(zhuǎn)換為紅黑樹。
transient?Node<K,V>\[\]?table;
2.HashMap 的工作原理?
HashMap 底層是 hash 數(shù)組和單向鏈表實(shí)現(xiàn),數(shù)組中的每個(gè)元素都是鏈表,由 Node 內(nèi)部類(實(shí)現(xiàn) Map.Entry
存儲對象時(shí),將 K/V 鍵值傳給 put() 方法:
①、調(diào)用 hash(K) 方法計(jì)算 K 的 hash 值,然后結(jié)合數(shù)組長度,計(jì)算得數(shù)組下標(biāo);
②、調(diào)整數(shù)組大小(當(dāng)容器中的元素個(gè)數(shù)大于 capacity * loadfactor 時(shí),容器會進(jìn)行擴(kuò)容resize 為 2n);
③、i.如果 K 的 hash 值在 HashMap 中不存在,則執(zhí)行插入,若存在,則發(fā)生碰撞;
ii.如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 返回 true,則更新鍵值對;
iii. 如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 返回 false,則插入鏈表的尾部(尾插法)或者紅黑樹中(樹的添加方式)。(JDK 1.7 之前使用頭插法、JDK 1.8 使用尾插法)(注意:當(dāng)碰撞導(dǎo)致鏈表大于 TREEIFY_THRESHOLD = 8 時(shí),就把鏈表轉(zhuǎn)換成紅黑樹)
獲取對象時(shí),將 K 傳給 get() 方法:①、調(diào)用 hash(K) 方法(計(jì)算 K 的 hash 值)從而獲取該鍵值所在鏈表的數(shù)組下標(biāo);②、順序遍歷鏈表,equals()方法查找相同 Node 鏈表中 K 值對應(yīng)的 V 值。
hashCode 是定位的,存儲位置;equals是定性的,比較兩者是否相等。
3.當(dāng)兩個(gè)對象的 hashCode 相同會發(fā)生什么?
因?yàn)?hashCode 相同,不一定就是相等的(equals方法比較),所以兩個(gè)對象所在數(shù)組的下標(biāo)相同,"碰撞"就此發(fā)生。又因?yàn)?HashMap 使用鏈表存儲對象,這個(gè) Node 會存儲到鏈表中。
4.你知道 hash 的實(shí)現(xiàn)嗎?為什么要這樣實(shí)現(xiàn)?
5.為什么要用異或運(yùn)算符??
6.HashMap 的 table 的容量如何確定?loadFactor 是什么?該容量如何變化?這種變化會帶來什么問題?
①、table 數(shù)組大小是由 capacity 這個(gè)參數(shù)確定的,默認(rèn)是16,也可以構(gòu)造時(shí)傳入,最大限制是1<<30;
②、loadFactor 是裝載因子,主要目的是用來確認(rèn)table 數(shù)組是否需要?jiǎng)討B(tài)擴(kuò)展,默認(rèn)值是0.75,比如table 數(shù)組大小為 16,裝載因子為 0.75 時(shí),threshold 就是12,當(dāng) table 的實(shí)際大小超過 12 時(shí),table就需要?jiǎng)討B(tài)擴(kuò)容;
③、擴(kuò)容時(shí),調(diào)用 resize() 方法,將 table 長度變?yōu)樵瓉淼膬杀叮ㄗ⒁馐?table 長度,而不是 threshold)
④、如果數(shù)據(jù)很大的情況下,擴(kuò)展時(shí)將會帶來性能的損失,在性能要求很高的地方,這種損失很可能很致命。
7.HashMap中put方法的過程?
8.數(shù)組擴(kuò)容的過程?
創(chuàng)建一個(gè)新的數(shù)組,其容量為舊數(shù)組的兩倍,并重新計(jì)算舊數(shù)組中結(jié)點(diǎn)的存儲位置。結(jié)點(diǎn)在新數(shù)組中的位置只有兩種,原下標(biāo)位置或原下標(biāo)+舊數(shù)組的大小。
9.拉鏈法導(dǎo)致的鏈表過深問題為什么不用二叉查找樹代替,而選擇紅黑樹?為什么不一直使用紅黑樹?
之所以選擇紅黑樹是為了解決二叉查找樹的缺陷,二叉查找樹在特殊情況下會變成一條線性結(jié)構(gòu)(這就跟原來使用鏈表結(jié)構(gòu)一樣了,造成很深的問題),遍歷查找會非常慢。
而紅黑樹在插入新數(shù)據(jù)后可能需要通過左旋,右旋、變色這些操作來保持平衡,引入紅黑樹就是為了查找數(shù)據(jù)快,解決鏈表查詢深度的問題,我們知道紅黑樹屬于平衡二叉樹,但是為了保持“平衡”是需要付出代價(jià)的,但是該代價(jià)所損耗的資源要比遍歷線性鏈表要少,所以當(dāng)長度大于8的時(shí)候,會使用紅黑樹,如果鏈表長度很短的話,根本不需要引入紅黑樹,引入反而會慢。
10.說說你對紅黑樹的見解?
每個(gè)節(jié)點(diǎn)非紅即黑 根節(jié)點(diǎn)總是黑色的 如果節(jié)點(diǎn)是紅色的,則它的子節(jié)點(diǎn)必須是黑色的(反之不一定) 每個(gè)葉子節(jié)點(diǎn)都是黑色的空節(jié)點(diǎn)(NIL節(jié)點(diǎn)) 從根節(jié)點(diǎn)到葉節(jié)點(diǎn)或空子節(jié)點(diǎn)的每條路徑,必須包含相同數(shù)目的黑色節(jié)點(diǎn)(即相同的黑色高度)
11.jdk8中對HashMap做了哪些改變?
在java 1.8中,如果鏈表的長度超過了8,那么鏈表將轉(zhuǎn)換為紅黑樹。(桶的數(shù)量必須大于64,小于64的時(shí)候只會擴(kuò)容)
發(fā)生hash碰撞時(shí),java 1.7 會在鏈表的頭部插入,而java 1.8會在鏈表的尾部插入
在java 1.8中,Entry被Node替代(換了一個(gè)馬甲)。
12.HashMap,LinkedHashMap,TreeMap 有什么區(qū)別?
HashMap 參考其他問題;
LinkedHashMap 保存了記錄的插入順序,在用 Iterator 遍歷時(shí),先取到的記錄肯定是先插入的;遍歷比 HashMap 慢;
TreeMap 實(shí)現(xiàn) SortMap 接口,能夠把它保存的記錄根據(jù)鍵排序(默認(rèn)按鍵值升序排序,也可以指定排序的比較器)
13.HashMap & TreeMap & LinkedHashMap 使用場景?
一般情況下,使用最多的是 HashMap。
HashMap:在 Map 中插入、刪除和定位元素時(shí);
TreeMap:在需要按自然順序或自定義順序遍歷鍵的情況下;
LinkedHashMap:在需要輸出的順序和輸入的順序相同的情況下。
14.HashMap 和 HashTable 有什么區(qū)別?
①、HashMap 是線程不安全的,HashTable 是線程安全的;
②、由于線程安全,所以 HashTable 的效率比不上 HashMap;
③、HashMap最多只允許一條記錄的鍵為null,允許多條記錄的值為null,而 HashTable不允許;
④、HashMap 默認(rèn)初始化數(shù)組的大小為16,HashTable 為 11,前者擴(kuò)容時(shí),擴(kuò)大兩倍,后者擴(kuò)大兩倍+1;
⑤、HashMap 需要重新計(jì)算 hash 值,而 HashTable 直接使用對象的 hashCode
15.Java 中的另一個(gè)線程安全的與 HashMap 極其類似的類是什么?同樣是線程安全,它與 HashTable 在線程同步上有什么不同?
ConcurrentHashMap 類(是 Java并發(fā)包 java.util.concurrent 中提供的一個(gè)線程安全且高效的 HashMap 實(shí)現(xiàn))。
HashTable 是使用 synchronize 關(guān)鍵字加鎖的原理(就是對對象加鎖);
而針對 ConcurrentHashMap,在 JDK 1.7 中采用 分段鎖的方式;JDK 1.8 中直接采用了CAS(無鎖算法)+ synchronized。
16.HashMap & ConcurrentHashMap 的區(qū)別?
除了加鎖,原理上無太大區(qū)別。另外,HashMap 的鍵值對允許有null,但是ConCurrentHashMap 都不允許。
17.為什么 ConcurrentHashMap 比 HashTable 效率要高?
JDK 1.7 中使用分段鎖(ReentrantLock + Segment + HashEntry),相當(dāng)于把一個(gè) HashMap 分成多個(gè)段,每段分配一把鎖,這樣支持多線程訪問。鎖粒度:基于 Segment,包含多個(gè) HashEntry。 JDK 1.8 中使用 CAS + synchronized + Node + 紅黑樹。鎖粒度:Node(首結(jié)點(diǎn))(實(shí)現(xiàn) Map.Entry )。鎖粒度降低了。
18.針對 ConcurrentHashMap 鎖機(jī)制具體分析(JDK 1.7 VS JDK 1.8)?
JDK 1.7 中,采用分段鎖的機(jī)制,實(shí)現(xiàn)并發(fā)的更新操作,底層采用數(shù)組+鏈表的存儲結(jié)構(gòu),包括兩個(gè)核心靜態(tài)內(nèi)部類 Segment 和 HashEntry。
①、Segment 繼承 ReentrantLock(重入鎖) 用來充當(dāng)鎖的角色,每個(gè) Segment 對象守護(hù)每個(gè)散列映射表的若干個(gè)桶;
②、HashEntry 用來封裝映射表的鍵-值對;
③、每個(gè)桶是由若干個(gè) HashEntry 對象鏈接起來的鏈表
JDK 1.8 中,采用Node + CAS + Synchronized來保證并發(fā)安全。取消類 Segment,直接用 table 數(shù)組存儲鍵值對;當(dāng) HashEntry 對象組成的鏈表長度超過 TREEIFY_THRESHOLD 時(shí),鏈表轉(zhuǎn)換為紅黑樹,提升性能。底層變更為數(shù)組 + 鏈表 + 紅黑樹。
19.ConcurrentHashMap 在 JDK 1.8 中,為什么要使用內(nèi)置鎖 synchronized 來代替重入鎖 ReentrantLock?
①、粒度降低了;
②、JVM 開發(fā)團(tuán)隊(duì)沒有放棄 synchronized,而且基于 JVM 的 synchronized 優(yōu)化空間更大,更加自然。
③、在大量的數(shù)據(jù)操作下,對于 JVM 的內(nèi)存壓力,基于 API 的 ReentrantLock 會開銷更多的內(nèi)存。
20.ConcurrentHashMap 簡單介紹?
①、重要的常量:
private transient volatile int sizeCtl;
當(dāng)為負(fù)數(shù)時(shí),-1 表示正在初始化,-N 表示 N - 1 個(gè)線程正在進(jìn)行擴(kuò)容;
當(dāng)為 0 時(shí),表示 table 還沒有初始化;
當(dāng)為其他正數(shù)時(shí),表示初始化或者下一次進(jìn)行擴(kuò)容的大小。
②、數(shù)據(jù)結(jié)構(gòu):
Node 是存儲結(jié)構(gòu)的基本單元,繼承 HashMap 中的 Entry,用于存儲數(shù)據(jù);
TreeNode 繼承 Node,但是數(shù)據(jù)結(jié)構(gòu)換成了二叉樹結(jié)構(gòu),是紅黑樹的存儲結(jié)構(gòu),用于紅黑樹中存儲數(shù)據(jù);
TreeBin 是封裝 TreeNode 的容器,提供轉(zhuǎn)換紅黑樹的一些條件和鎖的控制。
③、存儲對象時(shí)(put() 方法):
如果沒有初始化,就調(diào)用 initTable() 方法來進(jìn)行初始化;
如果沒有 hash 沖突就直接 CAS 無鎖插入;
如果需要擴(kuò)容,就先進(jìn)行擴(kuò)容;
如果存在 hash 沖突,就加鎖來保證線程安全,兩種情況:一種是鏈表形式就直接遍歷到尾端插入,一種是紅黑樹就按照紅黑樹結(jié)構(gòu)插入;
如果該鏈表的數(shù)量大于閥值 8,就要先轉(zhuǎn)換成紅黑樹的結(jié)構(gòu),break 再一次進(jìn)入循環(huán)
如果添加成功就調(diào)用 addCount() 方法統(tǒng)計(jì) size,并且檢查是否需要擴(kuò)容。
④、擴(kuò)容方法 transfer():默認(rèn)容量為 16,擴(kuò)容時(shí),容量變?yōu)樵瓉淼膬杀丁?/p>
helpTransfer():調(diào)用多個(gè)工作線程一起幫助進(jìn)行擴(kuò)容,這樣的效率就會更高。
⑤、獲取對象時(shí)(get()方法):
計(jì)算 hash 值,定位到該 table 索引位置,如果是首結(jié)點(diǎn)符合就返回;
如果遇到擴(kuò)容時(shí),會調(diào)用標(biāo)記正在擴(kuò)容結(jié)點(diǎn) ForwardingNode.find()方法,查找該結(jié)點(diǎn),匹配就返回;
以上都不符合的話,就往下遍歷結(jié)點(diǎn),匹配就返回,否則最后就返回 null。
21.ConcurrentHashMap 的并發(fā)度是什么?
程序運(yùn)行時(shí)能夠同時(shí)更新 ConccurentHashMap 且不產(chǎn)生鎖競爭的最大線程數(shù)。默認(rèn)為 16,且可以在構(gòu)造函數(shù)中設(shè)置。
當(dāng)用戶設(shè)置并發(fā)度時(shí),ConcurrentHashMap 會使用大于等于該值的最小2冪指數(shù)作為實(shí)際并發(fā)度(假如用戶設(shè)置并發(fā)度為17,實(shí)際并發(fā)度則為32)
推薦閱讀:
最近面試BAT,整理一份面試資料《Java面試BAT通關(guān)手冊》,覆蓋了Java核心技術(shù)、JVM、Java并發(fā)、SSM、微服務(wù)、數(shù)據(jù)庫、數(shù)據(jù)結(jié)構(gòu)等等。
獲取方式:點(diǎn)“在看”,關(guān)注公眾號并回復(fù)?666?領(lǐng)取,更多內(nèi)容陸續(xù)奉上。
明天見(??ω??)??
