2G的文件,里面有两列,一列是用户id,另一列是该用户的粉丝id,如12345 56321就是说56321是12345的粉丝,求互粉的用户。
解法:1.脑子要马上反应到两列都是数字,既然是数字就有50%的几率要用到排序。
2.把文件拷贝一份,列互换,然后两个文件都排序(外排序),然后类似于双指针,挪动,如果有相同的则记录下来。
2G的文件,里面有两列,一列是用户id,另一列是该用户的粉丝id,如12345 56321就是说56321是12345的粉丝,求互粉的用户。
解法:1.脑子要马上反应到两列都是数字,既然是数字就有50%的几率要用到排序。
2.把文件拷贝一份,列互换,然后两个文件都排序(外排序),然后类似于双指针,挪动,如果有相同的则记录下来。