1. 概述
召回是指从全量信息集合中触发尽可能多的正确结果,并将返回结果给“排序”;排序是对所有召回的内容进行打分排序,选出得分最高的几个结果推荐给用户。
2. 召回策略
常用的主要有协同过滤、向量化召回和深度树匹配模型。
2.1 协同过滤
协同过滤主要分为基于物品的协同过滤、基于用户的协同过滤和基于模型的协同过滤。
①基于物品的协同过滤
给用户推荐那些和他们之前喜欢的物品相似的物品。
②基于用户的协同过滤
当召回用户A的候选集时,可以先找到和他有相似兴趣的其他用户,然后把那些用户喜欢的、而用户A未交互的物品作为候选集。
③基于模型的协同过滤
矩阵分解
总结:协同过滤方法通过在用户历史行为里面找相似的物品和用户,保证了基础的相关性,但是并不能真正的面向全部商品库做检索,使得整个推荐结果的多样性和发现性比较差。
2.2 向量化召回
向量化召回时通过模型学习用户和物品的兴趣向量,并通过内积来计算用户和物品之间的相似度,从而得到最终的候选集。
①Youtube召回模型
构建Pair对,计算相似度,取TopN。
②局部敏感哈希
对原始数据空间中的向量进行Hash映射,得到Hash Table,使得原始数据空间中两个相邻向量通过相同的Hash变换后,被映射到同一个桶的概率很大,而不相邻的向量被映射到同一个桶的概率很小。所以在召回阶段,
将所有的物品兴趣向量映射到不同的桶内,然后将用户兴趣向量映射到桶内,只需要将用户向量与该桶内的物品向量求内积即可。
总结:向量召回化要求模型围绕着用户和向量的Embedding展开,同时在顶层进行呢及运算得到相似度。
2.3 深度树匹配模型
构建通用推荐算法框架,允许任意形式的模型,不限定形式,其核心是构造一棵兴趣树,叶子结点是全量的物品,每一层表示一种细分的兴趣。
3. 参考博客
https://www.jianshu.com/p/ef3caa5672c8