个性化推荐系统由亚马逊电子商务公司、Netflix电影租赁公司,在线上业务大力使用推荐系统,并大力通过文章、竞赛形式宣传推荐系统。使得个性化推荐系统在电商领域及其受欢迎,并且个性化推荐技术应用到线上个频道,相比于运营配置产品数据,uv、pv、gmv点击转化、订单转化均是大涨个别业务接入个性化推荐系统后数据涨幅高达400%-500%。
个性化技术在线上商品业务上效果明显,也加速个性化推荐技术使用的深度、广度。
商品推荐特征明显,商品本身和文章、新闻存在较大差异,本身存在交易属性。 如果推荐不准确用户很难去点击、去浏览、去购买。购买本身比新闻、文章转化成本高很多,所以准确性对于商品推荐极其重要。
商品推荐一般基于用户偏好模型,用户偏好模型根据用户历史浏览、下订单、加购物车、搜索、点赞、收藏、评论等行为,通过逻辑回归LR模型离线训练构成用户离线偏好模型,离线模型一般通过map reduce计算。
为了对用户在线实时操作进行反馈,用户实时浏览、点击、加购物车等操作用过用户客户端上报,storm或spark steaming流式计算生成实时用户偏好。
商品信息有别于文章、新闻等,有明显分类信息,就是商品品类。商品偏好信息是关于用户与二级品类、三级品类关系,这样用户与商品关系抽象为与品类关系。可以减少很多计算,试想几亿用户、几亿商品关系计算将需要耗费多少时间,时间计算还好,现在有分布式系统。对于商品、用户关系进行存储更是极大难题,一是存储空间巨大,一是访问不满足线上服务性能需要。
实际线上商品推荐系统,根据实际离线品类偏好、实时品类偏好。根据偏好拉取商品品类下商品,商品要进行已购买品类过滤。
素材如果不够就要进行补充,怎么补充补充什么素材就很重要。一种思路是补充热门素材信息、热门素材信息对相当一部分人都有很大吸引力。另一种是补充降价促销力度大商品,降价力度越大对用户吸引越大。并且素材信息要不断进行更新,以保证降价信息、是否有货信息准确无误,避免用户点击后信息不存在。
根据商品、素材拉取用户特征、品类特征、素材特征、用户素材交互特征、上下文特征、用户手机信息、地理位置等多个维度30几个特征,传入训练出来GBDT模型,进行线上点击量预估,估计用户对于素材点击量几率,根据几率排序商品。
对于用户返回要进行过滤,一是曝光过滤给用户展示过得,不要在进行展示,避免浪费位置。一是过滤用户已购买,用户已购买商品品类要进行过滤,避免已购买商品推荐,会给用户感觉很烦,并且感觉系统总是推荐购买物品,用户会对推荐失去信心。再有就是无货过滤,要增加GMV转化,那么推出产品用户点击查看后,想要购买商品没有那也浪费曝光,并且对用户很不友好。
模型排序出素材,直接返回。可能会出现6个手机、5双鞋连在一起,用户体验差也会严重影响用户体验。也会降低用户点击率、加购率、订单转化率等指标。通过算法按三级品类、二级品类进行隔断开这是一种品类隔断方式。另一种是根据用户偏好商品品类信息,对多个品类进行轮询,每个品类选一个素材,执行多轮直到选够一次返回素材。
通过这一系列复杂逻辑,终于完成一次用户商品推荐。
微信搜索:mydevclub