由于cache命中率的原因,哈希表的性能通常好于红黑树。即使只有32个元素,也要进行5次随机内存访问。随机内存访问对cpu cache是不友好的。
hash表最大的缺陷是当数据量难以估计时,没法设置合适的bucket,元素可能是10个也可能是10000个
这里有几种思路:
1. 设置缺省bucket值为100左右,然后让hash表自动扩容,缺点是扩容的时候性能要受到影响。
2. 结合业务,每次给10000的bucket,缺点是浪费内存,而且无法处理100W这样的极端情况。
3. 把hash表的list变成哈希表,缺点是结构复杂,多次哈希速度慢。综合来看方案一是比较好的这种。