机器学习：推荐算法之基于用户、基于物品和Slope One

引言

之前有段时间研究过推荐算法，倒不是科研需要，是觉得很想弄明白每天淘宝的时候那些猜你喜欢的东西是怎么冒出来的，还有最近很火的网易云音乐以及虾米音乐的推荐算法，这里很高兴的就是网易云音乐已经被我调教的很棒了，真开心

后来了解到那些企业做的推荐算法多是混合推荐，而我只了解了基础的三种，不过相信万变不离其宗，很多基础的东西还是很重要的，所以对这三种推荐算法进行了整理，最后因为之前自己用Python参照着github上一个人的代码自己也尝试着实现了一下该推荐系统，主要是基于用户的推荐，这里贴出来供大家一起学习

三种推荐算法

推荐算法主要有：User-based Recommender, Item-based Recommender和Slope-One Recommender。

1. User-based Recommender

该算法的主要思想是：与用户u最相似的用户喜欢的商品有很大可能也是用户u喜欢的商品。

1 对于用户u的每一个没有preference的商品i
2 对于每一个对商品i有preference的用户v
3 计算用户u与v的相似性s//实际上无需在线计算，可以事先计算好存储起来
4 将用户v对于商品i的preference，乘以s，加到用户u对商品i的预测preference的平均值
5 返回用户u的平均值最高的几个商品作为推荐商品。

上述算法需要穷举每个商品i，导致计算非常非常慢。可以实现计算好某个用户u的所有的邻居(记为集合n)，然后，再为用户u做推荐时，只需要考虑用户u的邻居的所有有preference的商品即可，而无需考虑所有商品，算法如下：

1 对于每个其他的用户w
2 计算用户u与用户w之间的相似度s
3 返回用户u的相似度最高的几个用户，记为用户u的邻居n
4 //上述步骤可以离线完成，类似于索引
5 对于用户u的每个u本身没有preference，但是u的邻居n中某个用户有preference的商品i
6 对于每个对商品i有preference的用户u的邻居v
7 计算用户u与v的相似度//其实无需在线计算，可以提前计算好，存储起来
8 将用户v对于商品i的preference，乘以s，加到用户u对商品i的预测preference的平均值

2. Item-based Recommender

该算法的主要思想是：喜欢商品i的用户u，有很大可能性会喜欢和商品i很相似的其他商品

1 对于用户u的每个没有preference的商品i
2 对于每个用户u有preference的商品j
3 计算商品i与j的相似度s
4 把用户u对商品j的preference，乘以s，加到用户u对商品i的preference的平均值
5 返回用户u的平均值最高的几个商品作为推荐商品

3. Slope-One Recommender

首先Slope one是一种基于项目的协同过滤算法（Item-based Recommendation）

首先计算每两个商品之间preference差值的平均值

1 对于某个商品i
2 对于某个商品j
3 对于每个对商品i和j都有preference的用户u
4 将用户u对商品i和商品j的preference的差值加到所有用户对商品i和商品j的差值的平均值当中去