• 解题思路:蓄水池问题


    在面美团实习的时候,面试官问了这道蓄水池问题:给定一个链表,长度未知(但是大于k),你只能遍历一次,要求随机挑出k个节点。

    刚听完题目的我是一脸蒙蔽的,what is the fuck? 长度未知?遍历一遍?那每个节点被挑选的概率如何计算?

    我当时的答案是遍历两遍链表。

    后来想想这样的确很蠢,蓄水池问题的一个变种:有一个网络数据流,要你随机抓一个包,所有包被抓到的概率要求相等。

    如果用我的遍历两遍链表的方法肯定不行!

    然后我google了一下,发现了神奇的蓄水池解法:

      对于链表随机挑k个节点,先把前k个节点作为已经选定的节点,从第k+1个节点开始,每个节点以1/(k+1)的概率被选中,并从选定的节点中随机挑选一个替换它,成为新的候选节点。

    vector<int> vec(k,0);
    int num  = k,curlen  = k+1;
    
    while(num--){
         vec[k-num] = head->val;
         head = head->next;
    }
    
    while(head){
         int m = rand()%curlen;
         if(m < k) swap(vec[m],head->val);
         head = head->next;
         curlen++;
    }
    

      这样一来,第i个节点被选中的概率为1/i。而它之前的节点i-1被选中的概率为 1/(i-1)*(1-1/i) = 1/i。满足题意。这个思路实在是666。

  • 相关阅读:
    Kaggle 神器 xgboost
    改善代码可测性的若干技巧
    IDEA 代码生成插件 CodeMaker
    Elasticsearch 使用中文分词
    Java性能调优的11个实用技巧
    Lucene 快速入门
    Java中一个字符用unicode编码为什么不是两字节
    lucene 的评分机制
    面向对象设计的 10 条戒律
    2019.10.23-最长全1串(双指针)
  • 原文地址:https://www.cnblogs.com/unclelin/p/6565389.html
Copyright © 2020-2023  润新知