剑指 Offer 03. 数组中重复的数字

剑指 Offer 03. 数组中重复的数字
【题目来源】

https://leetcode-cn.com/problems/shu-zu-zhong-zhong-fu-de-shu-zi-lcof/

【题目内容】

【解题思路】

思路一：遍历(超出时间限制)
- 将数组中的每一个数字和后面的所有数字进行比较，当发现相等时，即为结果。
```
int findRepeatNumber(int* nums, int numsSize){
    // 遍历
    for (int i = 0; i < numsSize - 1; i++) {
        for (int j = i + 1; j < numsSize; j++) {
            if (nums[i] == nums[j]) {
                return nums[i];
            }
        }
    }
    return 0;
}
```
思路二：排序 + 遍历(执行用时：92 ms 内存消耗：10.8 MB)
- 排序后能保证重复的数字连续分布，这样遍历时只需要比较当前数字和下一个数字是否相同即可。
```
int compareNums(const void *a, const void *b)
{
    int a1 = *(int*)a;
    int b1 = *(int*)b;
    return a1 - b1;
}

int findRepeatNumber(int* nums, int numsSize){
    // 排序
    qsort(nums, numsSize, sizeof(int), compareNums);
    // 遍历
    for (int i = 0; i < numsSize - 1; i++) {
        if (nums[i] == nums[i + 1]) {
            return nums[i];
        }
    }
    return 0;
}
```
思路三：哈希查找(执行用时：40 ms 内存消耗：10.2 MB)
- 创建哈希数组（key:数字，value:出现次数），遍历时先检查当前索引对应的数字是否已经出现，出现则返回结果，否则更新该数字出现次数。
```
#define NUMS_SIZE 100000

int findRepeatNumber(int* nums, int numsSize){
    // 哈希
    int numsHash[NUMS_SIZE] = {0};
    for (int i = 0; i < numsSize; i++) {
        if (numsHash[nums[i]] > 0) {
            return nums[i];
        }
        numsHash[nums[i]]++;
    }
    return 0;
}
```
思路四：原地排序(执行用时：36 ms 内存消耗：10.4 MB)
- 借用输入数组，将当前索引对应的数字，替换到对应的数字索引下，保证索引和数字相等。如果出现替换时，索引和数字已经相等时，说明该数字重复，返回结果。相比于思路三的优点是不需要申请额外的空间存放Hash表。执行过程如下图。
```
int findRepeatNumber(int* nums, int numsSize){
    // 原地排序
    int cur = 0;
    int tmp = 0;
    while (cur < numsSize) {
        if (nums[nums[cur]] != nums[cur]) {
            tmp = nums[cur];
            nums[cur] = nums[tmp];
            nums[tmp] = tmp;
            continue;
        }
        if (cur == nums[cur]) {
            cur++;
            continue;
        }
        return nums[cur];
    }
    return 0;
}
```
思路五：二分法(解答错误)
- 根据题目发现答案在[0, n-1]中, left = 0, right = n - 1, mid = (left + right) / 2，先计算整个数组中[left, mid]范围内的数的数量，如果大于(mid - left)，说明左侧有重复数字，right = mid，否则，left = mid，继续基于新的left, right二分。该种思路无法解决场景[0, 1, 2, 0, 4, 5, 6, 7, 8, 9]。
```
int Count(int* nums, int numsSize, int a, int b)
{
    int cnt = 0;
    int cur = 0;
    while (cur < numsSize) {
        if (nums[cur] >= a && nums[cur] <= b) {
            cnt++;
        }
        cur++;
    }
    return cnt;
}

int findRepeatNumber(int* nums, int numsSize){
    // 二分法 无法解决场景：[0, 1, 2, 0, 4, 5, 6, 7, 8, 9]
    int left = 0;
    int right = numsSize - 1;
    int mid, count;
    while (left < right - 1) {
        mid = (left + right) / 2;
        count = Count(nums, numsSize, left, mid);
        if (count > mid + 1 - left) {
            right = mid;
            continue;
        }
        left = mid;
    }
    if (Count(nums, numsSize, left, left) > 1) {
        return left;
    }
    return right;
}
```
【学习小结】

数组比Hash性能更好

相比于HashSet，使用数组绝对会有性能的提高，主要表现在如下的两个方面：

哈希表 (HashSet) 底层是使用数组 + 链表或者红黑树组成的，而且它的数组也是用不满的，有加载因子的。所以使用数组来代替哈希表，能节省空间

哈希表在判重的时候需要经过哈希计算，还可能存在哈希冲突的情况，而使用数组则可以直接计算得到 index 的内存位置，所以使用数组访问性能更好。

链接：https://leetcode-cn.com/problems/shu-zu-zhong-zhong-fu-de-shu-zi-lcof/solution/duo-chong-jie-fa-xun-xu-jian-jin-yi-zhi-dao-zui-yo/

调整执行顺序，性能提升

判断场景先执行nums[nums[cur]]，再执行nums[cur]，触发预取，提高性能。

将满足条件概率更大的条件放到前面，可以避免大量无效判断，提高性能。
剑指 Offer
相关阅读:
线程之间通信等待（wait）和通知（notify）
python输出所有三位数的回文数
 python之1100之间的总和，奇数和，偶数和
 python之九九乘法表
 数据类型
 python之判断闰年
 python的下载与安装
 pycharm的下载与安装
 Windows Phone 7 学习流程攻略（二）
Windows Phone 7 学习流程攻略（三）
原文地址：https://www.cnblogs.com/kunlingou/p/14696725.html

剑指 Offer 03. 数组中重复的数字

【题目来源】

【题目内容】

【解题思路】

思路一：遍历(超出时间限制)

思路二：排序 + 遍历(执行用时：92 ms 内存消耗：10.8 MB)

思路三：哈希查找(执行用时：40 ms 内存消耗：10.2 MB)

思路四：原地排序(执行用时：36 ms 内存消耗：10.4 MB)

思路五：二分法(解答错误)

【学习小结】

数组比Hash性能更好

调整执行顺序，性能提升