• 剑指 Offer 03. 数组中重复的数字


    【题目来源】

    https://leetcode-cn.com/problems/shu-zu-zhong-zhong-fu-de-shu-zi-lcof/

    【题目内容】

    【解题思路】

    思路一:遍历(超出时间限制)

    • 将数组中的每一个数字和后面的所有数字进行比较,当发现相等时,即为结果。
    int findRepeatNumber(int* nums, int numsSize){
        // 遍历
        for (int i = 0; i < numsSize - 1; i++) {
            for (int j = i + 1; j < numsSize; j++) {
                if (nums[i] == nums[j]) {
                    return nums[i];
                }
            }
        }
        return 0;
    }
    

    思路二:排序 + 遍历(执行用时:92 ms 内存消耗:10.8 MB)

    • 排序后能保证重复的数字连续分布,这样遍历时只需要比较当前数字和下一个数字是否相同即可。
    int compareNums(const void *a, const void *b)
    {
        int a1 = *(int*)a;
        int b1 = *(int*)b;
        return a1 - b1;
    }
    
    int findRepeatNumber(int* nums, int numsSize){
        // 排序
        qsort(nums, numsSize, sizeof(int), compareNums);
        // 遍历
        for (int i = 0; i < numsSize - 1; i++) {
            if (nums[i] == nums[i + 1]) {
                return nums[i];
            }
        }
        return 0;
    }
    

    思路三:哈希查找(执行用时:40 ms 内存消耗:10.2 MB)

    • 创建哈希数组(key:数字,value:出现次数),遍历时先检查当前索引对应的数字是否已经出现,出现则返回结果,否则更新该数字出现次数。
    #define NUMS_SIZE 100000
    
    int findRepeatNumber(int* nums, int numsSize){
        // 哈希
        int numsHash[NUMS_SIZE] = {0};
        for (int i = 0; i < numsSize; i++) {
            if (numsHash[nums[i]] > 0) {
                return nums[i];
            }
            numsHash[nums[i]]++;
        }
        return 0;
    }
    

    思路四:原地排序(执行用时:36 ms 内存消耗:10.4 MB)

    • 借用输入数组,将当前索引对应的数字,替换到对应的数字索引下,保证索引和数字相等。如果出现替换时,索引和数字已经相等时,说明该数字重复,返回结果。相比于思路三的优点是不需要申请额外的空间存放Hash表。执行过程如下图。

    int findRepeatNumber(int* nums, int numsSize){
        // 原地排序
        int cur = 0;
        int tmp = 0;
        while (cur < numsSize) {
            if (nums[nums[cur]] != nums[cur]) {
                tmp = nums[cur];
                nums[cur] = nums[tmp];
                nums[tmp] = tmp;
                continue;
            }
            if (cur == nums[cur]) {
                cur++;
                continue;
            }
            return nums[cur];
        }
        return 0;
    }
    

    思路五:二分法(解答错误)

    • 根据题目发现答案在[0, n-1]中, left = 0, right = n - 1, mid = (left + right) / 2,先计算整个数组中[left, mid]范围内的数的数量,如果大于(mid - left),说明左侧有重复数字,right = mid,否则,left = mid,继续基于新的left, right二分。该种思路无法解决场景[0, 1, 2, 0, 4, 5, 6, 7, 8, 9]。
    int Count(int* nums, int numsSize, int a, int b)
    {
        int cnt = 0;
        int cur = 0;
        while (cur < numsSize) {
            if (nums[cur] >= a && nums[cur] <= b) {
                cnt++;
            }
            cur++;
        }
        return cnt;
    }
    
    int findRepeatNumber(int* nums, int numsSize){
        // 二分法 无法解决场景:[0, 1, 2, 0, 4, 5, 6, 7, 8, 9]
        int left = 0;
        int right = numsSize - 1;
        int mid, count;
        while (left < right - 1) {
            mid = (left + right) / 2;
            count = Count(nums, numsSize, left, mid);
            if (count > mid + 1 - left) {
                right = mid;
                continue;
            }
            left = mid;
        }
        if (Count(nums, numsSize, left, left) > 1) {
            return left;
        }
        return right;
    }
    

    【学习小结】

    数组比Hash性能更好

    相比于HashSet,使用数组绝对会有性能的提高,主要表现在如下的两个方面:

    哈希表 (HashSet) 底层是使用数组 + 链表或者红黑树组成的,而且它的数组也是用不满的,有加载因子的。所以使用数组来代替哈希表,能节省空间

    哈希表在判重的时候需要经过哈希计算,还可能存在哈希冲突的情况,而使用数组则可以直接计算得到 index 的内存位置,所以使用数组访问性能更好。

    链接:https://leetcode-cn.com/problems/shu-zu-zhong-zhong-fu-de-shu-zi-lcof/solution/duo-chong-jie-fa-xun-xu-jian-jin-yi-zhi-dao-zui-yo/

    调整执行顺序,性能提升

    判断场景先执行nums[nums[cur]],再执行nums[cur],触发预取,提高性能。

    将满足条件概率更大的条件放到前面,可以避免大量无效判断,提高性能。

    剑指 Offer
  • 相关阅读:
    线程之间通信 等待(wait)和通知(notify)
    python输出所有三位数的回文数
    python之1100之间的总和,奇数和,偶数和
    python之九九乘法表
    数据类型
    python之判断闰年
    python的下载与安装
    pycharm的下载与安装
    Windows Phone 7 学习流程攻略(二)
    Windows Phone 7 学习流程攻略(三)
  • 原文地址:https://www.cnblogs.com/kunlingou/p/14696725.html
Copyright © 2020-2023  润新知