用户画像就是根据用户的特征对用户的数学建模,可以用许多标签来表示,标签就是特征空间的维度
一、用户画像的作用
1.用户精细化运营
2.商户精细化运营支持
3.个性化
4.大数据报告
5.趋势预测
二。用户画像处理流程
1.明确问题和了解数据
*需求和数据的匹配
*明确需求
分类、聚类、推荐和其他
*数据的规模和重要特征的覆盖度
. 2.数据预处理
*数据集成、数据冗余、数值冲突
*数据采样
*数据清洗、缺失值处理与噪声数据
3.特征工程的含义
数据和特征决定了机器学习的上限,模型和算法只是逼近这个上限
特征:对所需解决问题有用的属性
特征的提取、选择和构造
针对所解决的问题选择最有用的特征集合
通过相关系数等方式来计算特征的重要性
人工筛选
有些算法输出特性:Random Forest
维度过多,PCA自动降维
4.特征工程内容
特征提取
业务日志
WEB公开数据抓取
第三方合作
特征处理
特征清洗
特征预处理:值处理、特征选择、特征组合、降维
商业加工
特征监控
指标:时效性、覆盖率和异常值
可视化&预警
5.模型与算法
三、用户画像架构
数据采集-------------->数据预处理--------->数据建模------------->数据的展示