推荐系统_七月算法4月机器学习班第9次课程笔记

2016/5/21 星期六 21:38

	desc
关于矩阵分解	LSA pLSA LDA 本质都是矩阵分解 1. LSA 的奇异值分解 A = S·Σ·D，分解得到的是三个矩阵，操作一下，就是 S' = S·Σ D' = Σ·D 此时 S' · D' 仍旧能够得到近似原始矩阵的值 # 或者这里的 Σ 全部取 Σ' 即：Σ' = sqrt( Σ ) 这样的话，乘完毕以后还能得到原始的矩阵 A 这个 trick 将分解为三个矩阵转换为分解为两个矩阵 2. pLSA 通过引入 topic A = B·C 两个矩阵 3. MF 矩阵分解的方法，与 pLSA 的问题相同，但是不是用 EM算法，而是数值解法，去逼近直接得到 A = P·Q 4. 而你想要的是 GloVec 的方法，即 input 矩阵是一个方阵，是对称方阵然后希望 get 一个矩阵（list of vector）这些 vector 两两相乘可以逼近原始对称方阵其实这部分的代码与 MF 的代码相似 summary 矩阵分解的方法【观点】 · EM 算法的方法 · 数值逼近的方法 cost · LDA 吉布斯采样 · SVD 分解
矩阵分解的 tool	libSVD libMF libFM svd feature 都可以做矩阵分解
冷启动的概念：	1. 冷启动就是没有用户的历史行为数据，如何给用户做推荐遇到问题新加入用户或商品因为没有历史数据所以很难做推荐 2. 只要是推荐系统都会遇到这个问题，no matter CF or content based
推荐的本质与假设不要本末倒置	推荐的根本是：满足用户的需求，是挖掘用户的需求再推，这是核心现在的几个假设：（不一定真） · 相似，买过A，可能还会买与A相似的A'，基于此，才会找相似 · 搭配是用户需求的补充淘宝现在是，看过的就会推其实这就是：相似法和搭配法方法的PK 经过内部实验，发现：虽然搭配推荐看似好，但是对于转化率来说，不如传统的相似推荐所以现在的淘宝还是以基于相似的方法为主
搭配推荐的思路	1. 基于模型的推荐：learning2rank 使用待搭配item 的特征向量的融合（拼接，相加，笛卡尔积），然后输入排序模型，得到分值 2. 可以用是关联规则，基于规则
阿里面试的问题，现在才有观点啊	· 推荐中相似度的计算方法 · 协同过滤推荐的基本思路 · 机器学习的一般流程而这三个你都没有回答上来【观点】
看待RNN 的角度	· 二叉树形状的网络结构 · 各个不同的门，其实就是：多个 feature map【观点】
推荐系统与产品	1. 增加推荐理由，会很大提高卖出率 eg：你的 5 个朋友有4个买了这个书我知道你最近买了A，建议你买B，这个是A 的补 2. 一个app 着重做这两个点，推荐系统中的新颖度（他们不知道的）和惊喜度（不相似但满意）这两个指标如果这两个做得好，那么这个 app 会很快火起来
工业上的推荐系统	都是多个方法的 merge word2vec MF CF learning2rank 而不是单一的一个模型的综合因为在乎稳定性
推荐中的评价指标	RMSE 中文是均方根误差 root mean square error
利用word2vec	1. 使用用户的行为序列，即次次点击的商品item 序列然后对item 进行 word2vec 尝试，然后将每个商品 vector 化从而基于第一类假设，可以有相似的商品来进行跑排序，以进行推荐 2. word2vec 本身已经体现了序列的学习，即 next word 优点：解决的问题是， CF找回不够，因为：使用协同过滤的时候每个商品id，其实就是太离散了，所以用低维度向量表示每个商品，那么相当于降维
推荐系统选取的各个feature 的评价
与搜索引擎的关系	对搜索引擎的两个角度的改善 1. QA，不返回页面，而是具体答案 2. 推荐系统，直接给出猜你想看的所以 QA，推荐系统，CTR ，都依赖于搜索引擎的原理
提高覆盖率	就是防止马太效应即越热越推，越推越热
提高多样性	就是：给用户更多的选择推荐100件衬衫也是只能买一件
对于打分的预处理需要注意：	每行去均值，再去相似度比较去均值其实就是因为有人偏向高分低分，是为了消除用户的【评分尺度】
item CF > user CF	工业界：一般用于 item Collaborative filtering 因为： 1. 用户量> 商品量：比如电影一共就几万部 2. 稳定度高：即两本书的相似度持久两本书的相似度今年和去年一半一样而 user 的相似度会变化
商品关联	两个角度 1. 在电商领域有很多同款但不完全一样的商品，会当成两个item 所以需要提前做好关联其实就是降低稀疏性，合并相似的 2. 如果 A、B 用户不能计算相似度，但是 AC 可以，BC 可以，那么就可以间接得到 AB 的相似度
关于冷启动问题的解决	1.对于新用户用户注册的时候就要提供信息，或者使用互动的方式进行用户信息的获取社交数据或者标签数据 2. 对于新商品根据商品的属性，可以基于规则给出与其它商品的相似度，然后再基于 item based CF 推荐
推荐系统的观点	input 一个不满的矩阵 output 缺失的值因为是矩阵，所以才有很多与矩阵相关的操作
基于矩阵分解必须要正则化	因为要防止过拟合，否则拟合出来还是 0
打分系统如果增加偏置的化，可能效果会好	关于矩阵分解，因为有打分体系，所以特别指出：要加上偏置对于每一个拟合的值多加了 μ整体平均，和 user 与 item 的各自偏置
wordvec经验	一般上 300~ 500 维度才是好的
矩阵拟合的代码	#简单的张量分解进行打分和推荐 #要用到numpy模块 import numpy #手写矩阵分解 #现在有很多很方便对高维矩阵做分解的package，比如libmf, svdfeature等 def matrix_factorization(R, P, Q, K, steps=5000, alpha=0.0002, beta=0.02): Q = Q.T for step in xrange(steps): for i in xrange(len(R)): for j in xrange(len(R[i])): if R[i][j] > 0: eij = R[i][j] - numpy.dot(P[i,:],Q[:,j]) for k in xrange(K): P[i][k] = P[i][k] + alpha * (2 * eij * Q[k][j] - beta * P[i][k]) Q[k][j] = Q[k][j] + alpha * (2 * eij * P[i][k] - beta * Q[k][j]) eR = numpy.dot(P,Q) e = 0 for i in xrange(len(R)): for j in xrange(len(R[i])): if R[i][j] > 0: e = e + pow(R[i][j] - numpy.dot(P[i,:],Q[:,j]), 2) for k in xrange(K): e = e + (beta/2) * (pow(P[i][k],2) + pow(Q[k][j],2)) if e < 0.001: break return P, Q.T

相关阅读:
angularjs select
DataInputStream和DataOutputStream
Linux gcc编译器
 Linux 网络配置
 Linux 实用工具vi
Linux 文件系统
 Linux Linux系统管理命令
 Linux Linux常用命令二
 Linux Linux常用命令一
 数据结构排序（归并排序）
原文地址：https://www.cnblogs.com/jianzhitanqiao/p/5528040.html

最新文章
初识echarts
response与文件下载
 二分算法的应用——最大化平均值 POJ 2976 Dropping tests
二分算法的应用——最大化最小值 POJ2456 Aggressive cows
考研计划
 机器学习算法整理（六）— 贝叶斯算法_实现垃圾邮件过滤
 用Python来进行词频统计
 机器学习算法整理（六）— 贝叶斯算法_实现拼写检查器
 第八届蓝桥杯c/c++省赛题目整理
 在服务器搭建Jupyter notebook