• 力扣398-随机数索引-(蓄水池抽样算法)


    https://leetcode-cn.com/problems/random-pick-index/

    给定一个可能含有重复元素的整数数组,要求随机输出给定的数字的索引。 您可以假设给定的数字一定存在于数组中。

    注意:
    数组大小可能非常大。 使用太多额外空间的解决方案将不会通过测试。

    示例:

    int[] nums = new int[] {1,2,3,3,3};
    Solution solution = new Solution(nums);

    // pick(3) 应该返回索引 2,3 或者 4。每个索引的返回概率应该相等。
    solution.pick(3);

    // pick(1) 应该返回 0。因为只有nums[0]等于1。
    solution.pick(1);

    重述题意:求一个数a在数组中等可能出现的下标idx是多少?

    (1)竞赛思维

    追求时间不追求空间,对每一个开一个可变长数组来存储,例如C++中的vector(如果a太大,用map映射到邻接表的一维下标,数组长度总不可能超过map的大小),存储a的各个出现的下标,然后rand()%length即所求的下标。概率是相等的。

    效率分析:预处理时间复杂度0(n),空间复杂度O(n),对于多个pick操作都可以在O(1)求得。

    (2)面试思维

    本题追求空间不追求时间,每遇见一个a,计数cnt+1,然后判断随机数r%cnt是否等于0,如果等于就把答案idx赋值为当前答案。这就是所谓的蓄水池抽样算法,验证一下概率的等可能性。

    • 如果只有1个数,概率是1
    • 如果只有2个数,概率是1/2
    • 如果只有3个数,概率是1/3
    • ...
    • 如果只有(n-1)个数,概率是1/(n-1)
    • 如果只有n个数,概率是1/n

    从第n个等于a的数逆推

    • 遇到第n个数时,cnt加到n了,r%n==0的概率是1/n,第n个idx被选中的概率是1/n
    • 回溯到第n-1个数时,cnt=n-1,r%(n-1)==0的概率是1/(n-1),判断第n-1个idx被选中的概率是1/(n-1)
    • ...
    • 回溯到第2个数时,cnt=2,r%2==0的概率是1/2,判断第2个idx被选中的概率是1/2
    • 回溯到第1个数时,cnt=2,r%1==0的概率是1,判断第1个数idx被选中的概率是1

    把前m个数和第m+1个数分离,前m个数自己去算概率,遇到第m+1个数时,只要求第m+1个数的概率。

    效率分析:空间复杂度O(1),每次pick的时间复杂度是0(n),如果有m个pick操作,时间复杂度是O(n*m)

    class Solution {
        static int[] nums;
        public Solution(int[] nums) {
            this.nums=nums;
        }
        
        public int pick(int a) {
            Random r=new Random();
            int cnt=0;
            int ans=-1;
            for(int i=0;i<nums.length;i++){
                if(a==nums[i]){
                    cnt++;
                    if(r.nextInt()%cnt==0)
                        ans=i;
                }
            }
            return ans;
        }
    }
    
    /**
     * Your Solution object will be instantiated and called as such:
     * Solution obj = new Solution(nums);
     * int param_1 = obj.pick(target);
     */

     

  • 相关阅读:
    MangoDB相关文档阅读小结
    《算法导论》图相关算法小结
    关于GC(下):CMS和G1GC的比较
    《深入理解Java虚拟机》并发(第12~13章)笔记
    关于GC(中):Java垃圾回收相关基础知识
    关于GC(上):Apache的POI组件导致线上频繁FullGC问题排查及处理全过程
    远程调用代码封装杂谈
    深入理解Java的switch...case...语句
    [留档]阿里云主机使用笔记
    企业架构设计之IFW实践回顾
  • 原文地址:https://www.cnblogs.com/shoulinniao/p/12870980.html
Copyright © 2020-2023  润新知