• 算法备忘录按权重选取数据


    今天看到一段Javascirpt 代码,其功能是按数据权重(weight)来显示广告.
    基本算法描述如下:
    给每个数据(节点)指定一个权重.
    1.将各节点的权重求和得到总数sum.
    2.采用随机函数(js中为 Math.round(Math.random() *sum) )生成一个取值范围在[1~sum]之间的值ranSum.
    3.接着遍历所有数据(节点),访问顺序可以随意.将当前节点的权重值加上前面访问的各节点权重值得curSum,判断curSum >= ranSum,如果条件成立则返回当前节点,如果不是则继续累加下一节点. 直到符合上面的条件,由于ranSum<=sum 因此一定存在curSum >=ranSum.

    说明:
    假设有这么一组数据: A4,A5,A3,A1,A2 其对应的权重为 10,20,40,20,10 现在我们要从这5个值中按他们的权重取数据,
    那么每100次取值应该有10次能取到A4,40次能取到A3等等,现在根据下面的表示,并考虑上面的算法
    0--A4---A5------------A3-------A1--A2>100
    每次取值时的遍历操作按A4,A5,A3,A1,A2的顺序访问,按上面的条件,ranSum的范围应该在1-100,对于A4按上面的算法在ranSum取1-10时都符合条件,因此每100次取值应该有10次被取到的机会,对于A3它的范围应该是31-70(a4+a5,a4+a5+a3),那么ranSum为31到70之间数值的可能性为每100次里有40次.由上面过程我们可以看到数据被获取的概率只跟其权重有关,跟算法中数据访问顺序无关.

    代码(C#伪代码)
    class Node
    {
      public int Weight=0;
      public string Data;
    }

    public Node GetNode(IList<Node> nodes){
     int sum=GetSum(nodes);
     int ranSum=GetRandom(sum); //获取1到sum之间的随机数
     int curSum=0;
     foreach(Node node in Nodes){
        curSum +=node.Weight;
        if(curSum >= ranSum) return node;
     }
     return null;
    }


  • 相关阅读:
    cuda9.0 中不存在libnppi.so
    深度学习训练踩坑记
    采用代理之后,pip 运行报错socks
    摄像机模型
    段错误:使用opencv打开视频流
    ffmpeg+cuda+opencv
    pip install xxx -i https://pypi.tuna.tsinghua.edu.cn/simple
    【TCP/IP详解】BOOTP:引导程序协议
    【TCP/IP详解】TFTP:简单文件传送协议
    【TCP/IP详解】IGMP Internet组管理协议
  • 原文地址:https://www.cnblogs.com/wdfrog/p/994963.html
Copyright © 2020-2023  润新知