• reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering


    中英译本及下载:http://blog.sina.com.cn/s/blog_586631940100pduh.html

    以下是摘要笔记:

     算法应当结合用户的习惯,用户特点的分类

    观影习惯是比较单一 还是比较分散

    这是不同的

    一、推荐的宗旨:推荐应该要帮助顾客找到和发现新的、相关的、有趣的商品。

    Recommendations should help a customer find and discover new, relevant, and interesting items.

    二、解决推荐问题有三个通常的途径:传统的协同过滤,聚类模型,以及基于搜索的方法。

    推荐算法
    大多数推荐算法,都始于先找出一个顾客集合,他们买过和评级过的商品,与当前用户买过和评级过的商品有重叠。算法把来自这些相似顾客的商品聚集起来,排除该用户已经购买过或评级过的商品,并向该用户推荐其余的商品。

    这些算法有两个最常见的版本:协同过滤聚类模型。其他算法——包括基于搜索的方法以及我们自己的商品到商品协同过滤——都集中于寻找相似的商品,而不是相似的顾客。针对用户所购买和评级的每一件商品,算法试图找到相似的产品,然后聚集这些相似的商品,并给予推荐。 

    1.传统的协同过滤

    利用协同过滤来产生推荐,很耗计算,如果降维,则会影响品质。

    2.聚类模型

    算法的目标是,把该用户分配到含有最相似顾客的细分人群里,然后,算法再利用该细分顾客人群的购买和评级,来生成推荐。

    较之协同过滤,聚类模型有更好的在线可扩展性和性能、复杂和昂贵的聚类计算会离线运行。然而,推荐品质却是低的

    3.基于搜索的方法
    基于搜索或内容的方法,将推荐问题视为相关商品的搜索,如果该用户只有少数购买或评级,基于搜索的推荐算法在计算量和性能上都不错。然而,对于有数千次购买的用户,要以针对所有商品的查询为基础也不太可行,若使用子集则又降低了品质。

    三、电子商务推荐算法的环境挑战:
    • 大型零售商有海量的数据,以千万计的顾客,以及数以百万计的登记在册的不同商品。
    • 许多应用要求结果实时返回,在半秒之内,还要产生高质量的推荐。
    • 新顾客很典型,他们的信息很有限,只能以少量购买或产品评级为基础。
    • 较老的顾客信息丰沛,以大量的购买和评级为基础。
    • 顾客数据不稳定:每一次交互都可提供有价值的顾客数据,算法必须立即对新的信息作出响应。

    商品到商品的协同过滤

    把推荐作为一种定向营销工具。(每有一个用户,就有一个用户的个性化商店)

    它如何工作

    协同过滤的变种,将商品分类,而不是用户

    对于非常大的数据集,一个可扩展的推荐算法必须离线运行最昂贵的计算。而现有方法达不到这样的要求:
    • 传统的协同过滤只做很少或不做离线计算,其在线计算量取决于顾客和登记在册商品的数量。在大数据集的情况下,这样的算法不可行,除非使用维度降低、抽样或区隔——所有这些都降低了推荐的品质。
    • 聚类模型能离线运行大量的计算,但推荐品质相对较差。出于改进,可以增加人群细分的数量,但这会使在线的用户-细分人群的分类变得昂贵。
    • 基于搜索的模型离线建立起关键词、范畴、作者索引,但不能提供符合兴趣、定向内容的推荐。对于购买和评级很多的顾客来说,这些算法的扩展性不佳。
    商品到商品协同过滤的可扩展性和性能的关键是,它离线建立耗时巨大的相似商品表格。该算法的在线部分——针对当前用户的购买和评级来寻找相似的商品——计算量独立于商品目录的规模或顾客的总数;仅仅取决于该用户买过或评级过多少个商品。因此,甚至是对于超大数据集,算法也很快速。由于该算法能推荐高度关联的相似商品,推荐的品质就很出色10。与传统的协同过滤不同,该算法在用户数据有限的情况下也能运行良好,在少至2到3件商品的基础上,产生高品质的推荐。

     连接:

    http://blog.sina.com.cn/s/blog_586631940100pduh.html

    http://www.xysay.com/amazon-item-to-item-collaborative-filtering-207.html

  • 相关阅读:
    正则 不匹配某个单词
    希赛 系统架构设计师教程 勘误
    QQ 快速登录中获取用户信息
    requests 配置tor代理后提示'Failed to establish a new connection: [Errno -2] Name or service not known'
    xadmin choice filter 多选
    kali linux 热点 无法获取IP
    windows10 输入法添加小鹤双拼
    del: recycle for linux
    安装WSL2
    cmake(转载)
  • 原文地址:https://www.cnblogs.com/lance-/p/3935327.html
Copyright © 2020-2023  润新知