转自:http://www.cnblogs.com/wentingtu/archive/2012/05/28/2521166.html
推荐中对graph model的研究主要有两个方面,一个是如何构图,另一个是如何在图上做ranking。
关于构图问题,取决于数据,首先考虑如果我们只有user item的数据,那么最简单的方法就是构造二分图,两类节点,user节点和item节点,如果user喜欢item,就在他们中间连一条边。
如果我们有了用户的profile信息,和item的content信息,这个时候又有了很多构图的方法。一种方法是用这些信息计算出user-user相似度和item-item相似度,然后把这些相似度作为权重,来给user节点之间,和item节点之间加边,这个称为two-layer graph model。相关的可以参考下面两篇论文:
1. A graph-based recommender system for digital library
2. A graph model for E-commerce recommender systems
当然,如果这些额外信息比较单一,比如我们有tag信息,我们可以构造一个3分图,加入tag节点,如果一个item有某个tag,那么他们之间有边,如果一个user用过某个tag,那么他们之间也有边。 如果是社会网络信息,我们可以直接将社会网络关系加入到user-user之间。如果我们有user参加某些group的信息,我们可以加入一类group节点,如果一个user参加过一个group,在中间就会有一条边。
基本的构图思想就是上面这些,下面讨论图的rank问题。
图上的rank,分为三大类:
一类是基于图上的随机游走,一般用迭代法,速度很快,相关的论文有:
1.Topic-Sensitive PageRank
2.TrustWalker: a random walk model for combining trust-based and item-based recommendation
还有周涛发表的一些论文,二分图上的扩散等
另一类是把推荐的问题看做一个半监督学习的问题,从而用传播的算法,最经典的是下面这篇博士论文
Semi-Supervised Learning with Graphs
这篇文章的作者是用图做半监督学习的权威
最好一类是用图的Laplacian矩阵来度量图中顶点的相似度,最经典的工作是下面这篇论文:
Random-Walk Computation of Similarities between Nodes of a Graph with Application to Collaborative Recommendation
上面仅仅列举了graph model中最经典的一些算法,如果深入研究这些论文,可以对graph model有个大概的认识。