PeopleRank:基于PageRank的理论,以每个微博账户的“关注”为链出链接,“粉丝”为链入链接的这种以人为核心的关系。
PeopleRank假设条件:
– 数量假设:如果一个用户节点接收到的其他用户“关注”的数量越多,那么这个用户越重要。
– 质量假设:用户A的“粉丝”质量丌同,质量高的“粉丝”会通“关注”接向其他用户传递更多的权重。所以越是质量高的“用户”关注用户A,则用户A越重要。
衡量PeopleRank的3个指标:
– 粉丝数
– 粉丝是否有较高PeopleRank值
– 粉丝关注了多少人
pagerank原理:
PageRank算法建立在随机冲浪者模型上,其基本思想是:网页的重要性排序是由网页间的链接关系所决定的,算法是依靠网页间的链接结构来评价每个页面的等级和重要性,一个网页的PR值丌仅考虑指向它的链接网页数,还有指向’指向它的网页的其他
网页本身的重要性。
PageRank具有两大特性:
– PR值的传递性:网页A指向网页B时,A的PR值也部分传递给B
– 重要性的传递性:一个重要网页比一个丌重要网页传递的权重要多
模型:
PR(pi): pi页面的PageRank值
n: 所有页面的数量
pi: 不同的网页p1,p2,p3
M(i): pi链入网页的集合
L(j): pj链出网页的数量
d:阻尼系数, 任意时刻,用户到达某页面后并继续向后浏览的概率。
(1-d=0.15) :表示用户停止点击,随机跳到新URL的概率
值范围: 0 < d ≤ 1, Google设为0.85