融合排序的快速调参实验

融合排序的快速调参实验
问题背景

在平安的时候会经常对比多个模型的效果，也会加很多规则系数做模型排序，做推荐的时候粗排需要对多个维度进行打分，
例如 score = 模型1 * 0.5 + 模型2 * 0.3 + 模型3 * 0.2
similar = 年龄 * 0.2 + 性别 * 0.1 + 地区 * 0.5
搜索结果pair得分 = es_score * 0.3 + ann_score * 0.5 + edit_distance * 0.1 + svd_score * 0.1
其中feature的系数冷启动很难设置，需要多次ABTest实验确定参数，而ABTest实验参数比较多、配置复杂

解决方案

使用一套语法来描述各种特征之间的关系，适合冷启动、多实验并行、可扩展
套路：设计一种新的描述语言，通过json配置化做实验
```
   Example 1:
   x := if (y < z) y + 3;

   Example 2:
   x := if (y < z)
        {
          y + 3
        }
   Example 3:
   # 推荐视频单条视频得分
   score_pair_similar := if ($user_area=$item_area or $user_area='北京')
               {
                   $score1 *= 0.3 
               }
              if($user_age < 20)
               {
                   $score2 = min($score_21, $score_22)
               }
               if($user_type = new or $item_tyep = new)
               {
                  $score3 *= 1.5
               }
               return $score1 + $score2 + $score3
   total_score := $score_pair_similar + $score5
```
```
   test_a : {
        条件：hash($user_id) % 100 < 50
        key1 : $score1
        key2 : $score2
   }
   test_b: {
        条件：$user_area = ‘北京’
        key1: $score1
        key2: $score2
   }
```
最后根据条件对用户进行分桶实验并埋点，确定最优系数组合
目前公司有内部项目同时进行数万ab实验，github也有很多开源项目，例如：https://github.com/ArashPartow/exprtk
时间会记录下一切。
相关阅读:
猴子得到一堆桃，当天吃了一半之后，又多吃了1个。以后每天，猴子都吃了剩余的一半桃子之>后，又多吃一个。在第10天，只剩下1个桃子。输出这堆桃最初有多少个。
打印9 9乘法表
 尝试实现一个管理系统, 名字和电话号分别用两个列表存储 =======通讯录管理系统======= 1.增加姓名和手机 2.删除姓名 3.修改手机 4.查询所有用户 5.根据姓名查找手机号 6.退出
 求结果
 背景流动
 1
zuoye
假期作业1220
python1217作业
 pythonzuoye20181212
原文地址：https://www.cnblogs.com/bincoding/p/15543578.html

最新文章
2018-12-10丛晓强作业
 2018-12-6作业
 作业2018-12-5
作业1
面试题
 20181223作业
 20181222作业
 20181216作业
 20181212作业
 20181211作业

融合排序的快速调参实验

问题背景

解决方案