赛题地址:http://bdc.saikr.com/vse/bdc/2017
代码及详细思路PPT见:https://github.com/zle1992/2017-Big-Data-Challenge
1 引言
本次大赛以某人机验证产品采集的鼠标轨迹脱敏数据为基础,期望用机器学习算法来提高人机验证中各种机器行为的检出率,其中包括对抗过程中出现的新的攻击手段的检测。
2 初赛:
特征:
画出轨迹后,对机器轨迹与正常轨迹进行对比,提取了如下特征:
模型:
3复赛:
我们队主要分为了五个不同的预测结果,包括四个GBDT模型及特征和一条规则,具体为:
模型: