面試題:重寫equals方法為什么通常會(huì)重寫hashcode方法?
最近在面試的時(shí)候,當(dāng)問完了HashMap的數(shù)據(jù)結(jié)構(gòu)之后,通常會(huì)再多問一個(gè)問題,就是:重寫equals方法時(shí)通常為什么也要重寫一下hashcode方法?
其實(shí)這個(gè)問題,本質(zhì)上又回到HashMap的應(yīng)用場(chǎng)景了,就是想看一下面試者是否真的融會(huì)貫通。今天這篇文章就帶大家了解一下equals方法和hashcode方法之間的關(guān)系,以及相關(guān)的知識(shí)點(diǎn)。
equals與hashcode的存在
其實(shí)每個(gè)類都有一個(gè)equals方法和hashcode方法。因?yàn)樗械念惗祭^承自O(shè)bject類。Object類中定義如下:
public boolean equals(Object obj) {
return (this == obj);
}
public native int hashCode();
直觀上可以看到equals方法默認(rèn)比較的是對(duì)象的引用,直接用“==”進(jìn)行比較。而hashCode方法是一個(gè)native方法,返回值為整型。
而這兩個(gè)方法都未被final修飾,都是可以進(jìn)行重寫的。
對(duì)于我們經(jīng)常使用的比如String 、Math、Integer、Double等類,都進(jìn)行了equals()和hashCode()方法的重寫。
equals()方法
equals()方法是用來判斷兩個(gè)對(duì)象是否相等。Object默認(rèn)實(shí)現(xiàn)了equals方法,但很明顯不太符合個(gè)性化的需求,因此往往需要進(jìn)行重寫。比如常用的String類,重寫的equals方法如下:
// 重寫equals方法
public boolean equals(Object anObject) {
if (this == anObject) {
return true;
}
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
while (n-- != 0) {
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
這里的比較已不再是單純的地址比較了。首先通過地址進(jìn)行比較,如果地址相同那么肯定是相同的對(duì)象。如果地址不同就再拿char數(shù)組的內(nèi)容進(jìn)行比較,完全相等則返回true。
equals()方法的特質(zhì)
在Object類的equals方法上有注釋說明了equals()方法需滿足的一些特性:
自反性(reflexive)。對(duì)于任意不為null的引用值x,x.equals(x)一定是true; 對(duì)稱性(symmetric)。對(duì)于任意不為null的引用值x和y,當(dāng)且僅當(dāng)x.equals(y)是true時(shí),y.equals(x)也是true; 傳遞性(transitive)。對(duì)于任意不為null的引用值x、y和z,如果x.equals(y)是true,同時(shí)y.equals(z)是true,那么x.equals(z)一定是true; 一致性(consistent)。對(duì)于任意不為null的引用值x和y,如果用于equals比較的對(duì)象信息沒有被修改的話,多次調(diào)用時(shí)x.equals(y)要么一致地返回true要么一致地返回false; 對(duì)于任意不為null的引用值x,x.equals(null)返回false;
對(duì)照上面特質(zhì),我們發(fā)現(xiàn)Object方法直接比較的是兩個(gè)引用地址,只有兩個(gè)地址相同才相等,也就是說是差別可能性最大的等價(jià)關(guān)系。
而String的equals方法,不僅包含應(yīng)用地址相同這種情況,還包括里面所存儲(chǔ)的字符串值相同的情況。也就是說雖然是兩個(gè)String對(duì)象,但是它們的字符串值相等,那么equals方法返回的結(jié)果就是true。這也正是大多數(shù)情況下我們所說的“equals方法比較的是值”。
由于Object的equals方法的默認(rèn)特例存在,因此在沒有自定義equals方法時(shí),我們不能一概的說equals方法比較的是具體的值,而“==”比較的是引用。
hashCode()方法
hashCode()方法返回對(duì)象的一個(gè)hash code值。該方法被用于hash tables,如HashSet、HashMap。
hashCode()是一個(gè)native方法,返回值類型是整形,并且可以被重寫。
Object中的native hashCode()方法將對(duì)象在內(nèi)存中的地址作為哈希碼返回,可以保證不同對(duì)象的返回值不同。
還以String類為例,它的hashCode方法為:
// 重寫hashCode方法
public int hashCode() {
int h = hash;
if (h == 0 && value.length > 0) {
char val[] = value;
for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}
上述hash值的計(jì)算注釋中有說明,基本公式為:s[0]*31^(n-1) + s[1]*31^(n-2) + … + s[n-1]。
其中, s[i]是字符串的第i個(gè)字符,n是字符串的長度,^表示求冪(空字符串的哈希碼為0)。
計(jì)算過程中使用數(shù)字31,主要有以下原因:
1、由于質(zhì)數(shù)的特性,它與其他數(shù)字相乘之后,計(jì)算結(jié)果唯一的概率更大,哈希沖突的概率更小。
2、使用的質(zhì)數(shù)越大,哈希沖突的概率越小,但是計(jì)算的速度也越慢;31是哈希沖突和性能的折中,實(shí)際上是實(shí)驗(yàn)觀測(cè)的結(jié)果。
3、JVM會(huì)自動(dòng)對(duì)31進(jìn)行優(yōu)化:31 * i == (i << 5) - i;
hashCode()方法的作用
前面提到hashCode()方法主要用于hash表中,比如HashSet、HashMap等。
我們先來看一下ArrayList,它的底層是數(shù)組,每個(gè)數(shù)據(jù)往底層的數(shù)組中存取即可,數(shù)據(jù)不需要判斷是否重復(fù)。
集合Set中的元素是無序不可重復(fù)的,那么如何確保存入的元素不重復(fù)呢?逐個(gè)調(diào)用equals()方法進(jìn)行比較?數(shù)據(jù)量少的時(shí)候還可以,但數(shù)據(jù)量大了時(shí)間復(fù)雜度基本上是O(n),會(huì)出現(xiàn)性能問題。
Java中采用哈希算法來解決這個(gè)問題,將對(duì)象(或數(shù)據(jù))依特定算法直接映射到一個(gè)地址上,這樣時(shí)間復(fù)雜度趨于O(1),對(duì)象的存取效率大大提高。
集合Set添加某元素時(shí),先調(diào)用hashCode()方法,定位到此元素實(shí)際存儲(chǔ)位置,如果這個(gè)位置沒有元素,說明是第一次存儲(chǔ);若此位置有對(duì)象存在,調(diào)用equals()進(jìn)行比較,相等就舍棄此元素不存,不等則散列到其他地址。
上面的示例也說明了為什么equals()相等,則hashCode()必須相等,進(jìn)而當(dāng)重寫了equals方法,也要對(duì)hashCode()方法進(jìn)行重寫。
HashMap的基本處理機(jī)制與HashSet很類似,只不過底層的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)有所不同而已。
簡而言之,在集合查找時(shí),hashcode能極大的降低對(duì)象比較次數(shù),提高查找效率。
hashCode()方法的性質(zhì)
hashCode的實(shí)現(xiàn)也有一定的要求,相關(guān)英文說明在Object的equals方法注解上:
在一個(gè)Java應(yīng)用的執(zhí)行期間,如果一個(gè)對(duì)象提供給equals做比較的信息沒有被修改的話,該對(duì)象多次調(diào)用hashCode()方法,該方法必須始終如一返回同一個(gè)integer。 如果兩個(gè)對(duì)象根據(jù)equals(Object)方法是相等的,那么調(diào)用二者各自的hashCode()方法必須產(chǎn)生同一個(gè)integer結(jié)果。 并不要求根據(jù)equals(java.lang.Object)方法不相等的兩個(gè)對(duì)象,調(diào)用二者各自的hashCode()方法必須產(chǎn)生不同的integer結(jié)果。但對(duì)于不同的對(duì)象產(chǎn)生不同的integer結(jié)果,有可能會(huì)提高h(yuǎn)ash table的性能。
如何重寫hashCode()
《Effective Java》中提供了一種簡單通用的hashCode算法。
A、初始化一個(gè)整形變量,為此變量賦予一個(gè)非零的常數(shù)值,比如int result = 17;
B、選取equals方法中用于比較的所有域(之所以只選擇equals()中使用的域,是為了保證上述原則的第1條),然后針對(duì)每個(gè)域的屬性進(jìn)行計(jì)算:
(1) 如果是boolean值,則計(jì)算f ? 1:0 (2) 如果是byte\char\short\int,則計(jì)算(int)f (3) 如果是long值,則計(jì)算(int)(f ^ (f >>> 32)) (4) 如果是float值,則計(jì)算Float.floatToIntBits(f) (5) 如果是double值,則計(jì)算Double.doubleToLongBits(f),然后返回的結(jié)果是long,再用規(guī)則(3)去處理long,得到int (6) 如果是對(duì)象應(yīng)用,如果equals方法中采取遞歸調(diào)用的比較方式,那么hashCode中同樣采取遞歸調(diào)用hashCode的方式。否則需要為這個(gè)域計(jì)算一個(gè)范式,比如當(dāng)這個(gè)域的值為null的時(shí)候,那么hashCode 值為0 (7) 如果是數(shù)組,那么需要為每個(gè)元素當(dāng)做單獨(dú)的域來處理。java.util.Arrays.hashCode方法包含了8種基本類型數(shù)組和引用數(shù)組的hashCode計(jì)算,算法同上。
C、最后,把每個(gè)域的散列碼合并到對(duì)象的哈希碼中。
小結(jié)
關(guān)于equals方法很明確的是用于比較兩個(gè)對(duì)象是否相等。而對(duì)于hashCode方法重點(diǎn)是為了在類似HashMap場(chǎng)景下提升效率,只算是技術(shù)要求。
在集合中通常通過equals方法來比較對(duì)象是否相等,通過hashCode方法來解決大數(shù)據(jù)量時(shí)會(huì)發(fā)生的性能問題。
在實(shí)踐中我們很少使用Object對(duì)象來作為Map的key,也是因?yàn)槿绻鸒bject對(duì)象的屬性變了,會(huì)導(dǎo)致hashCode變化,進(jìn)而可能會(huì)導(dǎo)致找不到對(duì)應(yīng)值,而String是不可變的對(duì)象,作為key就很適合。
參考文章:
https://www.cnblogs.com/kismetv/p/7191736.html
https://www.iteye.com/blog/kakajw-935226
https://www.iteye.com/blog/bijian1013-1972404
往期推薦
如果你覺得這篇文章不錯(cuò),那么,下篇通常會(huì)更好。添加微信好友,可備注“加群”(微信號(hào):zhuan2quan)。
和花一輩子都看不清的人,
注定是截然不同的搬磚生涯。



