http://blog.csdn.net/lidoublewen/article/details/6606197
推荐系统中经常会遇到一个问题-特定用户的品味跟大众品味的相似程度(众口味程度),比如说要预测movielens(如下图所示)中用户给电影的打分情况(满分5颗星,也可以选择半颗星),我们就可以通过计算用户评分偏离平均评分1.5颗星所占比率(computed the proportion p of their ratings that deviated by 1.5 units from the movie’s average rating)去衡量用户的众口味程度。比率越靠近0说明这个用户的口味跟大众口味就越相似,越靠近1说明这个用户跟大众口味越不同。
p:众口味程度
假设我们定义:如果0 ≤ p < 0.3 的用户就是跟大众口味比较相似的用户,而0.3 ≤ p的用户就是跟大众口味不相似的用户。
实验结果如下图所示:在这里我们只需要关心红色那条曲线
可以发现MovieLens推荐系统对0 ≤ p < 0.3的用户的预测效果要优于0.3 ≤ p的用户。
上述实验表明:我们在设计推荐系统,应该考虑将用户分类进行预测,比如说可以根据用户的众口味程度进行聚类,然后在各个聚类上设计不同的个性化预测。
PS:详细说明可以看看这篇论文:Who predicts Better? – Results from an Online Study Comparing Humans and an Online Recommender System