hash-1.hash表和hash算法

hash-1.hash表和hash算法

1、hash表
哈希表，也叫散列表,是根据关键码（Key）而直接访问的数据结构，也就是它把Key映射到表中
一个位置来访问记录，即，把key计算成hashcode，把hashcode存到表中。这个把key映射成hashcode的函数
叫做散列函数，存放记录的数组叫做散列表。
2.Hash table是数组
3.给定表M，存在函数f(key)，对任意给定的关键字值key，代入函数后若能得到包含该关键字的记录在表中的地址，
则称表M为哈希(Hash）表，函数f(key)为哈希(Hash) 函数。
4.散列函数常用方法：
（1）直接寻址法：取关键字或关键字的某个线性函数值为散列地址。即H(key)=key或H(key) = a·key + b，
其中a和b为常数（这种散列函数叫做自身函数）。若其中H(key）中已经有值了，就往下一个找，直到H(key）
中没有值了，就放进去。
（2）数字分析法：分析一组数据，比如一组员工的出生年月日，
这时我们发现出生年月日的前几位数字大体相同，这样的话，出现冲突的几率就会很大，
但是我们发现年月日的后几位表示月份和具体日期的数字差别很大，如果用后面的数字来构成散列地址，
则冲突的几率会明显降低。因此数字分析法就是找出数字的规律，
尽可能利用这些数据来构造冲突几率较低的散列地址。
（3）平方取中法：当无法确定关键字中哪几位分布较均匀时，
可以先求出关键字的平方值，然后按需要取平方值的中间几位作为哈希地址。
这是因为：平方后中间几位和关键字中每一位都相关，故不同关键字会以较高的概率产生不同的哈希地址。
（4）折叠法：将关键字分割成位数相同的几部分，最后一部分位数可以不同，
然后取这几部分的叠加和（去除进位）作为散列地址。数位叠加可以有移位叠加和间界叠加两种方法。
移位叠加是将分割后的每一部分的最低位对齐，然后相加；间界叠加是从一端向另一端沿分割界来回折叠，
然后对齐相加。
（5）随机数法：选择一随机函数，取关键字的随机值作为散列地址，通常用于关键字长度不同的场合。
5.碰撞
对不同的关键字可能得到同一散列地址，即k1≠k2，而f(k1)=f(k2)，这种现象称为碰撞（英语：Collision）。
具有相同函数值的关键字对该散列函数来说称做同义词
（6）除留余数法：取关键字被某个不大于散列表表长m的数p除后所得的余数为散列地址。
即 H(key) = key MOD p,p<=m。不仅可以对关键字直接取模，
也可在折叠、平方取中等运算之后取模。对p的选择很重要，一般取素数或m，若p选的不好，容易产生同义词
相关阅读:
NC_6_TREE_MAX_PATH
NC_12_reConstructBinaryTree
NC_15_levelOrder
NC_7_MAXPROFIT
NC_9_HAS_PATH_SUM
NC_8_BINARYTREE_SUMPATH
NC_13_MAX_DEPTH
IDEA的基本使用：让你的IDEA有飞一般的感觉
 Java获取当前系统事件System.currentTimeMillis()方法，获取当前时间戳10位 1665291145 转为时间字符串 yyyMMdd
JAVA中计算两个日期时间的差值竟然也有这么多门道
原文地址：https://www.cnblogs.com/fubaizhaizhuren/p/hash.html