1、一致性哈希。在分布式系统用途广泛。
2、局部敏感哈希LSH:simhash和minhash。可以用于相似度检测等。谷歌有篇文章利用LSH进行网页去重。
3、布隆过滤器。判断一个元素是否在一个集合中。
4、在数据流算法中哈希算法应用更是广泛。比如数据流中独立元素计数等。
5、特征哈希。近几年在nips等机器学习会议上,将特征使用minhash进行压缩,降低数据量。这里可以对minhash进行改进,比如b-bit minhash。
1、一致性哈希。在分布式系统用途广泛。
2、局部敏感哈希LSH:simhash和minhash。可以用于相似度检测等。谷歌有篇文章利用LSH进行网页去重。
3、布隆过滤器。判断一个元素是否在一个集合中。
4、在数据流算法中哈希算法应用更是广泛。比如数据流中独立元素计数等。
5、特征哈希。近几年在nips等机器学习会议上,将特征使用minhash进行压缩,降低数据量。这里可以对minhash进行改进,比如b-bit minhash。