大题倒数第二题:
优酷是中国第一的视频网站,每天有上亿的视频被观看,现在公司请研发人员找出最热门的视频。
该问题的输入可以简化为一个字符串文件,么一行都表示一个视频id,然后要找出出现次数最多的前100个视频id,将其输出,同时输出该视频的出现次数。
1.假设每天的视频播放次数为3亿次,被观看的视频数量为一百万个,每个视频ID的长度为20字节,限定使用的内存为1G。请简述做法,再写代码。
2.假设每个月的视频播放次数为100亿次,被观看的视频数量为1亿,每个视频ID的长度为20字节,一台机器被限定使用的内存为1G。
那么相像找这个月被播放次数最多的前100个视频,应该怎么做?请描述清楚可能的办法。
这一道题论坛上讨论地热火朝天 http://bbs.byr.cn/#!article/ACM_ICPC/63812 ,看着一众大家的评论,顿时感觉无比羞愧,因为自己完全一点边都没有摸到,前方路很远,要努力了!
倒数第一题:
有n-1个1到n的整数,乱序排列,问如何在线性时间内找到缺的那个整数。
网上找到了一个此类问题的文章:http://hi.baidu.com/zhzehong/item/6ecd32e820ae33205b7cfbe2
今晚有点困,先把问题放这里。。。