海量数据的特征工程中,
如果数据特征维度达到几千乃至上万
常规的lasso很容易失效
这里介绍几种泛义lasso,是在实际数据处理中常用的
迭代与分块思路/分组的使用(有兴趣的同学可自行实践一下)
1. 迭代lasso
2. 分组/聚类lasso
3. 分组与降维结合lasso
另外在<<高维数据统计方法、理论与应用>> 一书中介绍了很多lasso方法,其中有广义group lasso的方法也很值得借鉴
海量数据的特征工程中,
如果数据特征维度达到几千乃至上万
常规的lasso很容易失效
这里介绍几种泛义lasso,是在实际数据处理中常用的
迭代与分块思路/分组的使用(有兴趣的同学可自行实践一下)
1. 迭代lasso
2. 分组/聚类lasso
3. 分组与降维结合lasso
另外在<<高维数据统计方法、理论与应用>> 一书中介绍了很多lasso方法,其中有广义group lasso的方法也很值得借鉴