HashCode和hashMap、hashTable

KristeenWte 8年前

来自： http://my.oschina.net/yongqingfan/blog/628174

什么是哈希码(HashCode)

在Java中，哈希码代表对象的特征。

例如对象 String str1 = “aa”, str1.hashCode= 3104

String str2 = “bb”, str2.hashCode= 3106

String str3 = “aa”, str3.hashCode= 3104

根据HashCode由此可得出str1!=str2,str1==str3

下面给出几个常用的哈希码的算法。

1：Object类的hashCode.返回对象的内存地址经过处理后的结构，由于每个对象的内存地址都不一样，所以哈希码也不一样。

2：String类的hashCode.根据String类包含的字符串的内容，根据一种特殊算法返回哈希码，只要字符串所在的堆空间相同，返回的哈希码也相同。

3：Integer类，返回的哈希码就是Integer对象里所包含的那个整数的数值，例如Integer i1=new Integer(100),i1.hashCode的值就是100 。由此可见，2个一样大小的Integer对象，返回的哈希码也一样。

HashSet和HashMap一直都是JDK中最常用的两个类，HashSet要求不能存储相同的对象，HashMap要求不能存储相同的键。

那么Java运行时环境是如何判断HashSet中相同对象、HashMap中相同键的呢？当存储了“相同的东西”之后Java运行时环境又将如何来维护呢？

在研究这个问题之前，首先说明一下JDK对equals(Object obj)和hashcode()这两个方法的定义和规范：

在Java中任何一个对象都具备equals(Object obj)和hashcode()这两个方法，因为他们是在Object类中定义的。

equals(Object obj)方法用来判断两个对象是否“相同”，如果“相同”则返回true，否则返回false。

hashcode()方法返回一个int数，在Object类中的默认实现是“将该对象的内部地址转换成一个整数返回”。

接下来有两个个关于这两个方法的重要规范(我只是抽取了最重要的两个,其实不止两个)：

规范1：若重写equals(Object obj)方法，有必要重写hashcode()方法，确保通过equals(Object obj)方法判断结果为true的两个对象具备相等的hashcode()返回值。说得简单点就是：“如果两个对象相同，那么他们的hashcode应该相等”。不过请注意：这个只是规范，如果你非要写一个类让equals(Object obj)返回true而hashcode()返回两个不相等的值，编译和运行都是不会报错的。不过这样违反了Java规范，程序也就埋下了BUG。

规范2：如果equals(Object obj)返回false，即两个对象“不相同”，并不要求对这两个对象调用hashcode()方法得到两个不相同的数。说的简单点就是：“如果两个对象不相同，他们的hashcode可能相同”。

根据这两个规范，可以得到如下推论：

1、如果两个对象equals，Java运行时环境会认为他们的hashcode一定相等。

2、如果两个对象不equals，他们的hashcode有可能相等。

3、如果两个对象hashcode相等，他们不一定equals。

4、如果两个对象hashcode不相等，他们一定不equals。

这样我们就可以推断Java运行时环境是怎样判断HashSet和HastMap中的两个对象相同或不同了。我的推断是：先判断hashcode是否相等，再判断是否equals。

测试程序如下：首先我们定义一个类，重写hashCode()和equals(Object obj)方法

 class A {                 @Override           public boolean equals(Object obj) {                   System.out.println("判断equals");                    return false;                }                 @Override            public int hashCode() {               System.out.println("判断hashcode");                        return 1;                    }             }

然后写一个测试类，代码如下：

public class Test {                  public static void main(String[] args) {                Map<A,Object> map = new HashMap<A, Object>();           map.put(new A(), new Object());           map.put(new A(), new Object());                         System.out.println(map.size());        }  }

运行之后打印结果是：

判断hashcode

判断equals

HashCode的作用

首先，想要明白hashCode的作用，你必须要先知道Java中的集合。
　　总的来说，Java中的集合（Collection）有两类，一类是List，再有一类是Set。你知道它们的区别吗？前者集合内的元素是有序的，元素可以重复；后者元素无序，但元素不可重复。那么这里就有一个比较严重的问题了：要想保证元素不重复，可两个元素是否重复应该依据什么来判断呢？这就是Object.equals方法了。但是，如果每增加一个元素就检查一次，那么当元素很多时，后添加到集合中的元素比较的次数就非常多了。也就是说，如果集合中现在已经有1000个元素，那么第1001个元素加入集合时，它就要调用1000次equals方法。这显然会大大降低效率。
    于是，Java采用了哈希表的原理。哈希（Hash）实际上是个人名，由于他提出一哈希算法的概念，所以就以他的名字命名了。哈希算法也称为散列算法，是将数据依特定算法直接指定到一个地址上。如果详细讲解哈希算法，那需要更多的文章篇幅，我在这里就不介绍了。初学者可以这样理解，hashCode方法实际上返回的就是对象存储的物理地址（PS：这是一种算法，数据结构里面有提到。在某一个地址上（对应一个哈希值，该值并不特指内存地址），存储的是一个链表。在put一个新值时，根据该新值计算出哈希值，找到相应的位置，发现该位置已经蹲了一个，则新值就链接到旧值的下面，由旧值指向（next）它（也可能是倒过来指。。。）。可以参考HashMap）。
    这样一来，当集合要添加新的元素时，先调用这个元素的hashCode方法，就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素，它就可以直接存储在这个位置上，不用再进行任何比较了；如果这个位置上已经有元素了，就调用它的equals方法与新元素进行比较，相同的话就不存了，不相同就散列其它的地址。所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了，几乎只需要一两次。
    所以，Java对于eqauls方法和hashCode方法是这样规定的：
1、如果两个对象相同，那么它们的hashCode值一定要相同；
2、如果两个对象的hashCode相同，它们并不一定相同
    上面说的对象相同指的是用eqauls方法比较。
    你当然可以不按要求去做了，但你会发现，相同的对象可以出现在Set集合中。同时，增加新元素的效率会大大下降。

怎么重写HashCode?

下面介绍如何来重写hashCode()方法。通常重写hashCode()方法按以下设计原则实现。

（1）把某个非零素数，例如17，保存在int型变量result中。

（2）对于对象中每一个关键域f（指equals方法中考虑的每一个域）参照以下原则处理。

boolean型，计算（f?0:1)。

byte、char和short型，计算(int)f。

long型，计算(int)(f^(f>>32))。

float型，计算Float.floatToIntBits(f)。

double型，计算Double.doubleToLongBits(f)得到一个long，再执行long型的处理。

对象引用，递归调用它的hashCode()方法。

数组域，对其中的每个元素调用它的hashCode()方法。

（3）将上面计算得到的散列码保存到int型变量c，然后执行result = 37 * result + c。

（4）返回result。

类 HashMap<K,V>

java.lang.Object    java.util.AbstractMap<K,V>            java.util.HashMap<K,V>

类型参数：
K - 此映射所维护的键的类型
V - 所映射值的类型
基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作，并允许使用 null 值和null 键。（除了非同步和允许使用 null 之外，HashMap 类与 Hashtable 大致相同。）此类不保证映射的顺序，特别是它不保证该顺序恒久不变。

HashCode和HashMap之间的关系

先如下代码:

import java.util.HashMap;    public class Test {            //重写Equals不重写HashCode        static class Key {            private Integer id;            private String value;                        public Key(Integer id, String value) {                super();                this.id = id;                this.value = value;            }            @Override            public boolean equals(Object o) {                if(o == null || !(o instanceof Key)) {                    return false;                }else {                    return this.id.equals(((Key)o).id);                }            }        }        //重写Equals也重写HashCode            static class Key_ {                private Integer id;                private String value;                                public Key_(Integer id, String value) {                    super();                    this.id = id;                    this.value = value;                }                @Override                public boolean equals(Object o) {                    if(o == null || !(o instanceof Key_)) {                        return false;                    }else {                        return this.id.equals(((Key_)o).id);                    }                }                @Override                public int hashCode() {                     return id.hashCode();                }                             }        public static void main(String[] args) {            //test hashcode            HashMap<Object, String> values = new HashMap<Object, String>(5);            Test.Key key1 =   new Test.Key(1, "one");            Test.Key key2 =   new Test.Key(1, "one");            System.out.println(key1.equals(key2));            values.put(key1, "value 1");            System.out.println(values.get(key2));                        Test.Key_ key_1 =   new Test.Key_(1, "one");            Test.Key_ key_2 =   new Test.Key_(1, "one");            System.out.println(key_1.equals(key_2));            System.out.println(key_1 == key_2);            values.put(key_1, "value 1");            System.out.println(values.get(key_2));        }    }

输出如下:由上述例子可见:只重写了equasl方法的Key类在用做Hash中的键值的时候两个equasl为true的对象不能获取相应的Value的而重写了hashCode方法和equals方法的key_类两个相等的对象可以获取同一个Value的,这样更符合生活中的逻辑HashMap对象是根据Key的hashCode来获取对应的Vlaue 因而两个HashCode相同的对象可以获取同一个Value

<span style="color:#cc66cc;">    </span>

HashCode和hashMap、hashTable

相关经验

目录