基于矩阵分解的推荐算法，简单入门

摘自：http://www.cnblogs.com/kobedeshow/p/3651833.html

本文将要讨论基于矩阵分解的推荐算法，这一类型的算法通常会有很高的预测精度，也活跃于各大推荐系统竞赛上面，前段时间的百度电影推荐最终结果的前10名貌似都是把矩阵分解作为一个单模型，最后各种ensemble，不知道正在进行的阿里推荐比赛(http://102.alibaba.com/competition/addDiscovery/index.htm)，会不会惊喜出现。。。。好了，闲话不扯了，本文打算写一篇该类型推荐算法的入门篇

一，基于矩阵分解的推荐算法相关理论介绍

我们知道，要做推荐系统，最基本的一个数据就是，用户-物品的评分矩阵，如下图1所示

图1

矩阵中，描述了5个用户(U1,U2,U3,U4 ,U5)对4个物品(D1,D2,D3,D4)的评分(1-5分)，- 表示没有评分，现在目的是把没有评分的给预测出来，然后按预测的分数高低，给用户进行推荐。

如何预测缺失的评分呢？对于缺失的评分，可以转化为基于机器学习的回归问题，也就是连续值的预测，对于矩阵分解有如下式子，R是类似图1的评分矩阵，假设N*M维(N表示行数，M表示列数)，可以分解为P跟Q矩阵，其中P矩阵维度N*K，P矩阵维度K*M。

式子1

对于P,Q矩阵的解释，直观上，P矩阵是N个用户对K个主题的关系，Q矩阵是K个主题跟M个物品的关系，至于K个主题具体是什么，在算法里面K是一个参数，需要调节的，通常10~100之间。

式子2

对于式子2的左边项，表示的是R^ 第i行，第j列的元素值，对于如何衡量，我们分解的好坏呢，式子3，给出了衡量标准，也就是损失函数，平方项损失，最后的目标，就是每一个元素(非缺失值)的e(i,j)的总和最小

式子3

OK，目前现在评分矩阵有了，损失函数也有了，该优化算法登场了，下面式子4是，基于梯度下降的优化算法，p,q里面的每个元素的更新方式

式子4

然而，机器学习算法都喜欢加一个正则项，这里面对式子3稍作修改，得到如下式子5，beita 是正则参数

式子5

相应的p,q矩阵各个元素的更新也换成了如下方式

式子6

至此，P,Q矩阵元素求出来了之后，计算某个用户i对某个物品j的评分计算就是p(i,1)*q(1,j)+p(i,2)*q(2,j)+....+p(i,k)*q(k,j)。

相关阅读:
个人作业——软件工程实践总结&个人技术博客
个人作业——软件评测
结对第二次作业——某次疫情统计可视化的实现
结对第一次—疫情统计可视化（原型设计）
软工实践寒假作业（2/2）
软工实践寒假作业（1/2）
个人技术总结 (vex-table)
个人作业——软件工程实践总结&个人技术博客
个人作业——软件评测
结对第二次作业——疫情统计可视化的实现

原文地址：https://www.cnblogs.com/bonelee/p/7126144.html