1、和目标有关的用户数据
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,使用【封闭性的分类方式】。
如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;
用户分三类,高价值用户,中价值用户,低价值用户;
产品生命周期分为,投入期、成长期、成熟期、衰退期…
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。
另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
用户数据可以划分为静态信息数据、动态信息数据两大类。
3、静态信息数据
用户相对稳定的信息,这类信息自成标签。
如:人口属性、商业属性等方面数据。
如果企业有这类信息则无需过多建模预测,更多的是数据清洗工作。
4、动态信息数据
用户不断变化的行为信息,即用户轨迹。
当行为集中到互联网,乃至电商,用户行为就会聚焦很多,
如:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。
等等均可看作互联网用户行为。