引
随着网络零售业被消费者认同的程度逐渐加大,规模不断扩张,一个零售网站上面的商品种类也越来越丰富,这时顾客所需要处理的信息量就会急剧增加。
Phillips(2005)的研究表明,当顾客面对种类繁多的商品时,并不会因为可选择的丰富多样性而得到更多的满足,但是他们能够因为卖家对其商品选择的引导而感到满意。对于零售购物网站来说,引导顾客的一个有效的办法就是合理的网页布局,就是说,哪些商品应该放置在一起,哪些商品应该被放置在醒目的位置,或进行推荐。
顾客的购买行为是一种整体行为,他们很少单买一种商品,而往往是多种商品的组合,而这些商品是密切相关的。一件商品的买与不买,买多与买少,都会直接影响其他商品的购买,影响每个购物篮的利润。因此,消费者的购物篮隐含着重要并且有价值的信息,等待人们去发掘。如商家可以通过购物篮分析来了解消费者的购买习惯、产品偏好、品牌忠诚度等。
目标
做产品的关联推荐,希望通过DM来找出产品购物潜在的关系,向用户推荐同时购买机率大的产品,促进关联产品的销售,提供整体的销售量
问题定义
根据过往的订单记录,对于当前用户浏览的产品,向其推荐10件相关的产品
数据样本
对2009年12月15日的xxx条记录作为样本进行分析(未进行去躁处理),这xxx条记录来自YYYY个订单
工具
Orange需要的py库比较多,由于要下对版本,单独安装比较繁琐,还好它提供了打包的版本,大家可以看一下
Official site: http://www.ailab.si/orange
Snapshot of Orange with Python 2.5 and required libraries
2.5的版本是稳定版本,还有一个不稳定的2.6版本
如果你之前有装其它版本的python需要做一下处理,在要更改环境变量到合适的版本
术
主要利用Orange进行Association Rules的使用,有一个比较担心的问题是,数据库大了之后会吃不住,因为使用的是APRIORI algorithm
反正是做demo,follow me.
代码参见此处
https://code.google.com/p/cntheone/wiki/OrangeAssocationRuleUsage