# hash方法 # 底层数据结构基于hash值寻址的优化操作 # hash是一个算法 # 能把一个要存在内存里面的值经过一系列的值 # 不同值的hash结果是不一样的 # 对同一个值多次执行python代码的hash是不一样的 # 但是对同一个值,在一次执行python代码的时候hash值永远不变 print(hash("abc")) print(hash("abc")) # -6417301309113939838 # -6417301309113939838 在一次执行中hash值不变 # 字典的寻址 # ["key","value"] 先对key做一个hash得到一个地址,再把value 放入这个地址,当字典取址时,再对key做一个hash,通过这个hash直接 #找到地址,取出地址里面的内容,所以字典不会收到数据量大小的影响 # set集合 se = {1,2,3,4,5,6,"a",1,2,3} print(hash(1)) # 一般情况下数字的hash就是其本身 # 但是hash不是万能的,假设两个和复杂的字符串(这里的字符串是计算hash值的字符串)hash值恰好相等(可能性很小很小),如果后面一个的值(指的是进行hash的值)和前面相等则覆盖,如果不相等,后面一个二次寻址 # 为什么需要先比较hash值而不是先比较值,因为效率问题,如果数据量很大,最后一个数据需要和前面所有值比较一便才能存储,效率低下。如果先执行hash,极其偶然情况下这个地址有值,才再比较 print(se) d = {"key":"v1","key":"v20"} # 都是key进行hash print(d) # {'key': 'v20'}