一.字典中键值对的存储方式
再理解键值对的存储原理之前,首先我们先来了解一下什么是Hash:
散列函数(或散列算法,又称哈希函数)是一种从任何一种数据中创建小的数字‘‘指纹’’的方法。散列函数
把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来。该函数将数据打乱混合,重新创建一个叫做散列值的指纹,散列值通常用来代表一个短的随机字母和数字组成的字符串。好的散列函数再输入域很少出现散列冲突。再散列表和数据处理中,不抑制冲突来区别数据,会使得数据库记录更难找到。
首先看下图:
如图:
在创建字典时,python调用内部的散列函数,将键(key)作为参数进行转换,得到一个唯一的地址(这也解释了为什么给相同的键赋值会直接覆盖的原因,因为相同的键转换后的地址是一样的),然后将值(Value)存放到该地址中。
因此我们可以推导出,对于python来说,键(key)必须是可哈希(即可以调用散列函数)的,换句话说就是要可以通过调用散列函数计算出唯一地址的。
所以:列表,字典,集合这些可变数据类型都不能作为键(key)来使用。
那元组呢?虽然元组是不可变的,但如果元组里面的元素有不可变数据类型时,也不可作为字典中的键(key),即必须对元组做出限制。
PS:另外要注意的是,python的哈希算法对相同的值计算得到的结果是一样,也就是123和123.0的值相同,他们被认为是相同的键(key)