• DIN


    1. DIN(Deep Interest Network)优点

      使用用户兴趣分布来表示用户多种多样的兴趣爱好。

      使用Attention机制来实现Local Activation,局部激活相关的历史兴趣信息,与当前候选Ad相关性越高的历史行为,会获得更高的Attention Score。

      针对模型训练,提出Dice激活函数,自适应正则,显著提升模型性能与收敛速度。

    2. 整体网络结构

      

      利用Goods与Ads之间的相关性,引入注意力机制。DIN模型的输入分为2个部分:用户特征和广告(商品)特征。用户特征由用户历史行为的不同实体ID序列组成。在对用户的表示计算上引入了attention network 。DIN把用户特征、

    用户历史行为特征进行embedding操作,视为对用户兴趣的表示,之后通过attention network,对每个兴趣表示赋予不同的权值。这个权值是由用户的兴趣和待估算的广告进行匹配计算得到的,如此模型结构符合了之前的两个观察:

    用户兴趣的多峰分布以及部分对应。Attention network 的计算公式如下:

                                  

    其中,[公式] 代表用户表示向量, [公式] 是用户行为 [公式] 的embedding向量,[公式]代表广告的表示向量。核心在于用户的表示向量不仅仅取决于用户的历史行为,而且还与待评估的广告有直接的关联。

    3. 数据自适应激活函数

      PReLU

      

    其中为指示函数,PReLU函数不适用每层输入为不同分布时的情况。

      自适应激活函数

      

     其中在训练阶段,分别为每个mini-batch的均值和方差。

      

     4. 评价指标

      

     其中为用户数,为第个用户的权重和AUC的值。

    5. 参考博客

      https://www.cnblogs.com/rongyux/p/8026323.html

      https://www.jianshu.com/p/a356a135a0d2

  • 相关阅读:
    Kruskal算法
    拓扑排序
    邻接表有向图
    邻接矩阵的有向图
    邻接表无向图
    邻接矩阵无向图
    斐波那契堆
    二项堆
    斜堆(待补充)
    项目中maven依赖无法自动下载
  • 原文地址:https://www.cnblogs.com/LuckPsyduck/p/12000858.html
Copyright © 2020-2023  润新知