【数据结构与算法】HashTable相关操作实现 -- 基于Java的实现

会有一股神秘感。 提交于 2020-01-22 00:09:58
哈希表
    哈希表又叫散列表,是实现字典操作的一种有效数据结构。哈希表的查询效率极高,在理想情况下,查找一个元素的平均时间为O(1)。
哈希表就是描述key—value对的映射问题的数据结构,即在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使每个关键字与哈希表中唯一一个存储位置相对应。我们称这个对应关系f为哈希函数,这个存储结构即为哈希表。
直接寻址表
    当关键字的全域U比较小时,直接寻址是一种简单而有效的技术,它的哈希函数很简单:f(key) = key,即关键字大小直接与元素所在的位置序号相等。另外,如果关键字不是自然数,我们需要通过某种手段将其转换为自然数,比如可以将字符关键字转化为其在字母表中的序号作为关键字。直接寻址法不会出现两个关键字对应到同一个地址的情况,既不会出现f(key1) = f(key2)的情况,因此不用处理冲突,这便是其优点所在。
散列表
    直接寻址的缺点非常明显,如果全域U很大,则在一台标准的计算机可用内存容量中,要存储大小为U的一张表也许不太实际,而且,实际需要存储的关键字集合K可能相对U来说很小,这时散列表需要的存储空间要比直接表少很多。散列表通过散列函数f计算出关键字key在槽的位置。散列函数f将关键字域U映射到散列表T[0...m-1]的槽位上。但是这里会存在一个问题:若干个关键字可能映射到了表的同一个位置处(算法导论上名其曰“槽”),我们称这种情形为冲突。当然理想的方法是尽量避免冲突,我们可以尽可能将关键字通过f随即地映射到散列表的每个位置上。
哈希函数
    哈希函数的构造方法很多,最好的情况是:对于关键字结合中的任一个关键字,经哈希函数映射到地址集合中任何一个地址的概率相等,也就是说,关键字经过哈希函数得到一个随机的地址,以便使一组关键字的哈希地址均匀分布在整个地址空间中,从而减少冲突。同样,由于多数哈希函数都是假定关键字的全域为自然数集N={0、1、2....},因此所给关键字如果不是自然数,就要先想办法将其转换为自然数。下面我们就来看常用的哈希函数。
 
直接定址法
    对应前面的直接寻址表,关键字与哈希表中的地址有着一一对应关系,因此不需要处理冲突。
 
  除法散列法
    哈希函数如下:
 
f(key)= key%m 
 
    即对所给关键字key取余,这里m必须不能大于哈希表的长度len,通常m取一个不太接近2的整数次幂的素数是一个较好的选择。
 
乘法散列法
    用关键字key先乘上A(0<A<1),取出其小数部分,然后用m乘以这个值,再向下取整,该哈希函数为:
 
f(key)= floor(m*(key*A%1))
 
    通常,A=(sqrt(5)-1)/2 = 0.6180339877...(黄金分割点)是个比较理想的值。
 
    其他还有一些,诸如数字分析法、折叠法、全域散列法等,这里不再一一介绍,有兴趣了解的可以参考相关书籍(其实我们一般用的比较多的可能也就是除法散列法和乘法散列法)。
冲突处理
    我们前面提到,为了节省空间,表中槽的数目应该是小于关键字的数目的,因此完全避免冲突是不可能的。下面介绍两种解决冲突的方法:链接法和开放定址法。
 
链接法
    链接法的思路很简单:如果多个关键字映射到了哈希表的同一个位置处,则将这些关键字记录在同一个线性链表中,挂在该位置处。
 
 
 
另外,为了更快地删除某个元素,可以将链表设计为双向链表。后面的代码中我们采用的是单向链表。
开放定址法
    在开放定址法中,所有的元素都存放在散列表中,也即是说,每个表项或包含动态集合的一个元素,或为空。该方法采用如下公式记性再散列:
F(key,i) = (f(key) + i)%len
 
    其中,f(key)为哈希函数,len为哈希表长,i为增量序列,它可能有如下三种情况:
 
    1)i = 1,2,3...m-1
 
    2)i = 1,-1,4,-4,9,-9...k^2,-k^2
 
    3)i为伪随机序列
    采用第一种序列的叫做线性探测再散列,采用第二种序列的叫做二次探测再散列,采用第三种序列的叫做随机探测再散列。说白了,就是在发生冲突时,将关键字应该放入的位置向前或向后移动若干位置,比如采取第一种序列时,如果遇到冲突,就向后移动一个位置来检测,如果还发生冲突,继续向后移动,直到遇到一个空槽,则将该关键字插入到该位置处。
  线性探测比较容易实现,但是它存在一个问题,称为一次群集。随着连续被占用的槽不断增加,平均查找时间也随之不断增加,群集现象很容易出现,这是因为当一个空槽前有i个满槽时,该空槽为下一个将被占用的概率为(i+1)len。
   同样采用二次探测的方法,会产生二次群集,因为每次遇到冲突时,寻找插入位置时都是在跳跃性前进或后退,因此这个相对于一次群集来说,比较轻度。
 
 
 
 
Java的实现源码:
package com.xforg.dataStructure;/** * Created by Administrator on 2016/9/6. * By XFORG */class Node{    int val;    Node next;}class HashNode{       Node first;}public class HashTable {           static Node node = new Node();           static HashNode hashNode = new HashNode();        public HashTable[] creat_HashTable(int n){                HashTable[] t = new HashTable[n];            for(int i = 0; i<n;i++){                t[i].hashNode.first = null;            }            return t;        }       public static Node search_HashTable(HashTable[] hashTable, int data){                        if(hashTable == null)                            return null;                        Node pCur = hashTable[data % 10].hashNode.first;                        while(pCur != null && pCur.val != data){                              pCur=pCur.next;                        }           return pCur;       }    static boolean  insert_HashTable(HashTable[] hashTable, int data){               if(search_HashTable(hashTable,data)!= null)                   return false;               Node pCur = new Node();               pCur.val = data;               pCur.next = null;          Node pnode = hashTable[data%10].hashNode.first;          if(pnode == null){              hashTable[data%10].hashNode.first = pCur;          }else{               while(pnode.next != null)                     pnode=pnode.next;               pnode.next =pCur;          }          return true;      }    static boolean dele_HashTable(HashTable[] hashTable, int data){        if(search_HashTable(hashTable,data) == null)            return false;        Node pCur = hashTable[data%10].hashNode.first;        Node pPre = pCur;        if(pCur.val == data){            hashTable[data%10].hashNode.first = pCur.next;        }else{            while(pCur != null && pCur.val != data){                pPre = pCur;                pCur=pCur.next;            }            pPre.next = pCur.next;        }        return true;    }    public static void main(String[] args){        int len = 10;        HashTable[] hs = new HashTable[len];        if(insert_HashTable(hs,2))            System.out.println("成功插入2");        if(insert_HashTable(hs,3))            System.out.println("成功插入3");        if(insert_HashTable(hs,4))            System.out.println("成功插入4");        if(insert_HashTable(hs,3))            System.out.println("插入3失败");        if(search_HashTable(hs,4)!= null)            System.out.println("search");        if(insert_HashTable(hs,8))            System.out.println("成功插入8");        if(dele_HashTable(hs,2))            System.out.print("成功删除2");    }}


易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!