题目:
数组 A 由 1000 万个随机正整数 (int) 组成,设计算法,给定整数 n,在 A 中找出 a 和 b,使其符合如下等式:
n = a + b
解题思路:
1. 1000w个随机正整数占用空间大概38-40MB,并不是很大,但是仍需要考虑如果数量级继续增大的情况。最好找到不用把数组加载到内存的方法。
2. 若n给定,则数组中大于n的数都没有用,有用的只是那些处于0和n之间的数字,所以1000w个数字其实可以缩减为长度为n的数组,但是n也可能比1000w大。这并不是解决问题的思路。
3. 考虑用bit记录数值大小来减少内存需求:每个数组按照位进行存储,假设数组长度(包括n)在int(32位)范围内,则最多需要2^31-1 = 2147483647个位,折合内存200M。(这里的200M只取决于数组元素的取值范围,跟数组的长度没有任何关系,这也是位集的缺点之一,如果数据比较稀疏,而且每个元素数值范围又比较大的时候,位集占用的空间将是一种严重的浪费)。
4. 创建一个大小为n的位集,遍历数组A,若元素a出现,则设置第a位为1。
5. 从第0位开始遍历,如果第i位和第n-i位都为1,这说明二者都出现过,且相加为n,符合条件,算法结束!