初学推荐系统相关内容,写写自己读《推荐系统实践》的读书笔记。
推荐系统:
对用户来说推荐系统帮助用户发现自己想要的商品,对于商品来说找到对其感兴趣的用户,前者例如电影,歌曲的推荐,后者例如广告推送。
产生推荐系统主要是因为信息过载,用户难以从大量信息中发现自己想要的信息。
对于物品来说,在线上购物网站可以包含大量的商品,如何发觉长尾商品,并且将这些长尾商品推荐给用户,是推荐系统的重要作用。
个性化推荐系统主要以下场景:
电子商务,例如亚马逊,淘宝。
商品推荐页主要包括的内容有(1)推荐结果的标题,缩略图以及其他内容属性,(2)推荐结果的评分(3)推荐理由。
亚马逊的推荐有以下三种:(1)基于用户之前的行为,例如购买过武侠小说,会继续推荐别的武侠小说。
(2)基于用户的好友关系,例如亚马逊拿到用户的Facebook的好友,然后向用户推荐他的好友都买了啥
(3)基于物品的相似度,例如购买了该商品的用户还买了哪些商品。
电影和视频推荐:
这种和电子商务不太一样,这种用户通常只是想看电影,但是并没有很明确的需求要看那部电影甚至是哪种类型的电影。
从Netflix的推荐理由来看,它们的算法和亚马逊的算法类似,也是基于物品的推荐算法,即给用户推荐和他们曾经喜欢的电影相似的电影。
音乐电台:
个性化推荐的成功应用需要两个条件。第一是存在信息过载,因为如果用户可以很容易地从所有物品中找到喜欢的物品,就不需要个性化推荐了。第二是用户大部分时候没有特别明确的需求,因为用户如果有明确的需求,可以直接通过搜索引擎找到感兴趣的物品。
Pandora会根据专家标注的基因计算歌曲的相似度,并给用户推荐和他之前喜欢的音乐在基因上相似的其他音乐。
Last.fm于2002年在英国成立。Last.fm记录了所有用户的听歌记录以及用户对歌曲的反馈,在这一基础上计算出不同用户在歌曲上的喜好相似度,从而给用户推荐和他有相似听歌爱好的其他 用户喜欢的歌曲。
演讲人总结了音乐推荐的如下特点。
物品空间大 物品数很多,物品空间很大,这主要是相对于书和电影而言。
消费每首歌的代价很小 对于在线音乐来说,音乐都是免费的,不需要付费。
物品种类丰富 音乐种类丰富,有很多的流派。
听一首歌耗时很少 听一首音乐的时间成本很低,不太浪费用户的时间,而且用户大都
把音乐作为背景声音,同时进行其他工作。
物品重用率很高 每首歌用户会听很多遍,这和其他物品不同,比如用户不会反复看一
个电影,不会反复买一本书。
用户充满激情 用户很有激情,一个用户会听很多首歌。
上下文相关 用户的口味很受当时上下文的影响,这里的上下文主要包括用户当时的心
情(比如沮丧的时候喜欢听励志的歌曲)和所处情境(比如睡觉前喜欢听轻音乐)。
次序很重要 用户听音乐一般是按照一定的次序一首一首地听。
很多播放列表资源 很多用户都会创建很多个人播放列表。
不需要用户全神贯注 音乐不需要用户全神贯注地听,很多用户将音乐作为背景声音。
高度社会化 用户听音乐的行为具有很强的社会化特性,比如我们会和好友分享自己喜欢的音乐。
社交网络:
社交网络中的个性化推荐技术主要应用在3个方面:
利用用户的社交网络信息对用户进行个性化的物品推荐;
信息流的会话推荐;
给用户推荐好友
个性化阅读 :
Google Reader是一款流行的社会化阅读工具。它允许用户关注自己感兴趣的人,然后看到所关注用户分享的文章。
个性化阅读工具Zite则是收集用户对文章的偏好信息,给用户推荐之前看过的,喜欢的类别的文章。
Digg首先根据用户的Digg历史计算用户之间的兴趣相似度,然后给用户推荐和他兴趣相似的用户喜欢的文章。
基于位置的服务 :
个性化邮件 :
个性化广告 :
个性化广告投放和狭义个性化推荐的区别是,个性化推荐着重于帮助用户找到可能令他们感 兴趣的物品,而广告推荐着重于帮助广告找到可能对它们感兴趣的用户,即一个是以用户为核心, 而另一个以广告为核心。目前的个性化广告投放技术主要分为3种。
上下文广告 通过分析用户正在浏览的网页内容,投放和网页内容相关的广告。代表系 统是谷歌的Adsense。
搜索广告 通过分析用户在当前会话中的搜索记录,判断用户的搜索目的,投放和用户 目的相关的广告。
个性化展示广告 我们经常在很多网站看到大量展示广告(就是那些大的横幅图片),它 们是根据用户的兴趣,对不同用户投放不同的展示广告。雅虎是这方面研究的代表。