一、摘要
本文提出一种方法,将神经语言模型应用在用户购买时间序列上,将产品嵌入到低维向量空间中。结果,具有相似上下文(即,其周围购买)的产品被映射到嵌入空间中附近的向量。
二、模型:
低维项目向量表示:
1、prod2vec:
给定当前产品pi,观察到邻居产品p i+j的概率为P(p i+j | pi)。
其中,vp和vp'是产品p的输入和输出向量表示。c是产品序列的上下文长度。P是字典中不重复产品的数量。S为产品实体集合。
为了考虑到同时买多个产品,提出以下模型
2、bagged-prod2vec:
产品到产品的预测模型:
1、prod2vec-topK:
给定已经购买的产品,然后在所有的产品中计算相似度,推荐前k个相似的产品。
2、prod2vec-cluster:
将相似产品进行聚类,然后从聚类的产品中进行产品推荐。
用户到产品的预测模型:
1、user2vec:
给定一个用户,找到联合表征向量空间中的前K个相近的产品。
训练数据集分为用户购买顺序S,即给定用户un,其按照时间来排序的已经购买的产品。un = (pn1, pn2, . . . pnUn),Un表示用户un的项目购买数量。