<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          蔚來一面:HashMap 的 hash 方法原理是什么?

          共 6814字,需瀏覽 14分鐘

           ·

          2021-09-13 22:14

          Warning:這是《Java 程序員進(jìn)階之路》專欄的第 55 篇。那天,小二去蔚來面試,面試官老王一上來就問他:HashMap 的 hash 方法的原理是什么?當(dāng)時就把裸面的小二給蚌埠住了。

          回來后小二找到了我,于是我就寫下了這篇文章丟給他,并嚴(yán)厲地告訴他:再搞不懂就別來找我。聽到這句話,心頭一陣酸,小二繃不住差點(diǎn)要哭 ??。

          PS:本文 GitHub 上已同步,有 GitHub 賬號的小伙伴,記得看完后給二哥安排一波 star 呀!沖一波 GitHub 的 trending 榜單,求求各位了。

          GitHub 地址:https://github.com/itwanger/toBeBetterJavaer
          在線閱讀地址:https://itwanger.gitee.io/tobebetterjavaer


          來看一下 hash 方法的源碼(JDK 8 中的 HashMap):

          static final int hash(Object key) {
              int h;
              return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
          }

          這段代碼究竟是用來干嘛的呢?

          我們都知道,key.hashCode() 是用來獲取鍵位的哈希值的,理論上,哈希值是一個 int 類型,范圍從-2147483648 到 2147483648。前后加起來大概 40 億的映射空間,只要哈希值映射得比較均勻松散,一般是不會出現(xiàn)哈希碰撞的。

          但問題是一個 40 億長度的數(shù)組,內(nèi)存是放不下的。HashMap 擴(kuò)容之前的數(shù)組初始大小只有 16,所以這個哈希值是不能直接拿來用的,用之前要和數(shù)組的長度做取模運(yùn)算,用得到的余數(shù)來訪問數(shù)組下標(biāo)才行。

          取模運(yùn)算有兩處。

          取模運(yùn)算(“Modulo Operation”)和取余運(yùn)算(“Remainder Operation ”)兩個概念有重疊的部分但又不完全一致。主要的區(qū)別在于對負(fù)整數(shù)進(jìn)行除法運(yùn)算時操作不同。取模主要是用于計算機(jī)術(shù)語中,取余則更多是數(shù)學(xué)概念。

          一處是往 HashMap 中 put 的時候(putVal 方法中):

          final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
               HashMap.Node<K,V>[] tab; HashMap.Node<K,V> p; int n, i;
               if ((tab = table) == null || (n = tab.length) == 0)
                   n = (tab = resize()).length;
               if ((p = tab[i = (n - 1) & hash]) == null)
                   tab[i] = newNode(hash, key, value, null);
          }

          一處是從 HashMap 中 get 的時候(getNode 方法中):

          final Node<K,V> getNode(int hash, Object key) {
               Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
               if ((tab = table) != null && (n = tab.length) > 0 &&
                      (first = tab[(n - 1) & hash]) != null) {}
          }

          其中的 (n - 1) & hash 正是取模運(yùn)算,就是把哈希值和(數(shù)組長度-1)做了一個“與”運(yùn)算。

          可能大家在疑惑:取模運(yùn)算難道不該用 % 嗎?為什么要用 &?

          這是因?yàn)?& 運(yùn)算比 % 更加高效,并且當(dāng) b 為 2 的 n 次方時,存在下面這樣一個公式。

          a % b = a & (b-1)

          替換下 b 就是:

          a % = a & ( -1)

          我們來驗(yàn)證一下,假如 a = 14,b = 8,也就是 ,n=3。

          14%8,14 的二進(jìn)制為 1110,8 的二進(jìn)制 1000,8-1 = 7 的二進(jìn)制為 0111,1110&0111=0110,也就是 0* +1* +1* +0* =0+2+4+0=6,14%8 剛好也等于 6。

          這也正好解釋了為什么 HashMap 的數(shù)組長度要取 2 的整次方。

          因?yàn)椋〝?shù)組長度-1)正好相當(dāng)于一個“低位掩碼”——這個掩碼的低位最好全是 1,這樣 & 操作才有意義,否則結(jié)果就肯定是 0,那么 & 操作就沒有意義了。

          a&b 操作的結(jié)果是:a、b 中對應(yīng)位同時為 1,則對應(yīng)結(jié)果位為 1,否則為 0

          2 的整次冪剛好是偶數(shù),偶數(shù)-1 是奇數(shù),奇數(shù)的二進(jìn)制最后一位是 1,保證了 hash &(length-1) 的最后一位可能為 0,也可能為 1(這取決于 h 的值),即 & 運(yùn)算后的結(jié)果可能為偶數(shù),也可能為奇數(shù),這樣便可以保證哈希值的均勻性。

          & 操作的結(jié)果就是將哈希值的高位全部歸零,只保留低位值,用來做數(shù)組下標(biāo)訪問。

          假設(shè)某哈希值為 10100101 11000100 00100101,用它來做取模運(yùn)算,我們來看一下結(jié)果。HashMap 的初始長度為 16(內(nèi)部是數(shù)組),16-1=15,二進(jìn)制是 00000000 00000000 00001111(高位用 0 來補(bǔ)齊):

            10100101 11000100 00100101
          & 00000000 00000000 00001111
          ----------------------------------
            00000000 00000000 00000101

          因?yàn)?15 的高位全部是 0,所以 & 運(yùn)算后的高位結(jié)果肯定是 0,只剩下 4 個低位 0101,也就是十進(jìn)制的 5,也就是將哈希值為 10100101 11000100 00100101 的鍵放在數(shù)組的第 5 位。

          明白了取模運(yùn)算后,我們再來看 put 方法的源碼:

          public V put(K key, V value) {
              return putVal(hash(key), key, value, falsetrue);
          }

          以及 get 方法的源碼:

          public V get(Object key) {
              HashMap.Node<K,V> e;
              return (e = getNode(hash(key), key)) == null ? null : e.value;
          }

          它們在調(diào)用 putVal 和 getNode 之前,都會先調(diào)用 hash 方法:

          static final int hash(Object key) {
              int h;
              return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
          }

          那為什么取模運(yùn)算之前要調(diào)用 hash 方法呢?

          看下面這個圖。

          某哈希值為 11111111 11111111 11110000 1110 1010,將它右移 16 位(h >>> 16),剛好是 00000000 00000000 11111111 11111111,再進(jìn)行異或操作(h ^ (h >>> 16)),結(jié)果是 11111111 11111111 00001111 00010101

          異或(^)運(yùn)算是基于二進(jìn)制的位運(yùn)算,采用符號 XOR 或者^來表示,運(yùn)算規(guī)則是:如果是同值取 0、異值取 1

          由于混合了原來哈希值的高位和低位,所以低位的隨機(jī)性加大了(摻雜了部分高位的特征,高位的信息也得到了保留)。

          結(jié)果再與數(shù)組長度-1(00000000 00000000 00000000 00001111)做取模運(yùn)算,得到的下標(biāo)就是 00000000 00000000 00000000 00000101,也就是 5。

          還記得之前我們假設(shè)的某哈希值 10100101 11000100 00100101 嗎?在沒有調(diào)用 hash 方法之前,與 15 做取模運(yùn)算后的結(jié)果也是 5,我們不妨來看看調(diào)用 hash 之后的取模運(yùn)算結(jié)果是多少。

          某哈希值 00000000 10100101 11000100 00100101(補(bǔ)齊 32 位),將它右移 16 位(h >>> 16),剛好是 00000000 00000000 00000000 10100101,再進(jìn)行異或操作(h ^ (h >>> 16)),結(jié)果是 00000000 10100101 00111011 10000000

          結(jié)果再與數(shù)組長度-1(00000000 00000000 00000000 00001111)做取模運(yùn)算,得到的下標(biāo)就是 00000000 00000000 00000000 00000000,也就是 0。

          綜上所述,hash 方法是用來做哈希值優(yōu)化的,把哈希值右移 16 位,也就正好是自己長度的一半,之后與原哈希值做異或運(yùn)算,這樣就混合了原哈希值中的高位和低位,增大了隨機(jī)性。

          說白了,hash 方法就是為了增加隨機(jī)性,讓數(shù)據(jù)元素更加均衡的分布,減少碰撞

          參考鏈接:

          https://blog.csdn.net/lonyw/article/details/80519652 >https://zhuanlan.zhihu.com/p/91636401 >https://www.zhihu.com/question/20733617


          點(diǎn)擊下方的名片,回復(fù)關(guān)鍵字「03」 就可以獲取《Java 程序員進(jìn)階之路》的 PDF 版了。

          點(diǎn)擊閱讀原文也可以跳轉(zhuǎn)到在線閱讀地址,我們下期見(記得給二哥 star 哦)~

          瀏覽 36
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  久久久久久高清毛片一级 | 啪啪啪啪xxxx欧美 | 日本久久不卡 | 日本A视频 . | 中文字幕在线观看欧美 |