推荐系统对于资讯媒体网站来说至关重要,推荐系统可以根据用户的使用行为推荐相关内容,提高用户的粘性和停留时间。
相关推荐是推荐系统的形势之一,如下图是推荐展示的效果。
推荐系统的架构:
- 日志收集系统
- 召回系统:基于用户行为的协同过滤(CF),基于内容相似度的内容召回(CB),地域召回,热文兜底,编辑入库
- 排序系统:利用机器学习算法对点击率进行预估
- 过滤系统:文本以及图像重复判断,敏感词过滤
用到的算法:
- 文章关键词提取
- word2vec:特征词向语义空间转换 用于相似度计算
- 感知哈希算法:用于相同内容的滤重