说明:最近在读《Data Minning Guide》这本书。接下来的几篇是读书笔记。
本书的第一章针对下面这个问题展开:
如何预测用户对给定物品的打分?
作者从下面几个方面作了回答:
一、基于用户协同
--方法--1:用户之间的距离/相似度(K近邻算法)
二、基于物品协同
--方法1--:物品之间的相似度(修正的余弦相似度)
--方法2--:物品之间的差异值(加权Slope One算法)
由于使用的是用户产生的各种数据,因此又称为社会化过滤算法。
协同过滤会遇到的种种问题,包括数据的稀疏性和算法的可扩展性。此外,协同过滤算法倾向于推荐那些已经很流行的物品。
这类推荐系统会让流行的物品更为流行,冷门的物品更无人问津。
-- Daniel Fleder & Kartik Hosanagar 2009 《 推荐系统对商品分类的影响》