打标签对于分类问题是很重要的
比如对于银行理财产品营销建模,不能粗暴地把买过理财产品的定义为1,没卖过的定义为0。
这样的定义下,标签0下的客户是很多误定的,因为其中有很多客户根本不知道理财产品,如果知道,他们是会买的。
所以,如果要使用监督式学习,需要知道客户是否知道该产品,只用知道产品的客户的数据建模。
银行理财产品被用户知道的途径有:
1.上银行办业务,业务员推荐 可记录
2.打电话营销 可记录
3.其他方式(包括朋友推荐,上网浏览到等) 不可记录
实际业务中,(1)往往不会记录 (2)也往往那个没有记录,因此做监督式学习的数据条件是不具备的。
使用基于相似度的方法,会更加适合