大量的URL 字符串，如何从中去除重复的，优化时间空间复杂度

大量的URL 字符串，如何从中去除重复的，优化时间空间复杂度

1、内存够用，将URL存入hash链表，每个URL读入到hash链表中，遇到重复的就舍弃，否则加入到链表里面，最后遍历得到所有不重复的URL。

2、如果受内存限制，构造一个hash函数，把url适当散列到若干个比如1000个小文件中，然后在每个小文件中去除重复的url，再把他们合并。

原理是相同的url，hash之后的散列值仍然是相同的。
相关阅读:
spring boot中创建ElasticSearch索引
 spring boot项目16：ElasticSearch-基础使用
 spring cloud项目07：网关（Gateway）（2）
spring cloud项目06：网关（Gateway）（1）
Ubuntu上MySQL多实例部署
 MySQL常用命令、配置汇总
 spring boot项目15：安全-基础使用（2）
spring boot项目14：安全-基础使用（1）
docker-compose mongodb 副本
 关于golang slice切片的一个问题
原文地址：https://www.cnblogs.com/Yanss/p/12963708.html