1.xlnet原理学习
https://zhuanlan.zhihu.com/p/70257427 学习一下这个,但是好多理论,看不下去。
2.chrome下载文件时出现了,网络失败,已被禁用
https://www.cnblogs.com/SHGF/p/6558227.html 然后根据这个设置了一下,居然神奇地ok了,也是牛。。。
3.数据不平衡
https://blog.csdn.net/songhk0209/article/details/71484469 讲了数据不平衡所会产生的问题,就会导致模型的recall或者precision下降。
其中有一个办法,层级化集成,我倒觉得这个可以试试。
那就把五折中dev都预测错的放在一起,然后去训练2号模型,但是后来用分类不一致的数据训练L3,但是L1和L2中分类一致不就是这两个模型都分错了吗?为什么不用这个分类一致的去训练L3呢??
https://zhuanlan.zhihu.com/p/32940093 微调的文章,待看,关于数据不平衡的
4.什么比例的数据会被认为是不平衡的呢?
https://sunjunee.github.io/2018/02/01/biased-data-processing/ 这里面说是在10:1,100:1,1000:1的时候才考虑不平衡,那我这3:1还要考虑数据不平衡吗?
https://www.jiqizhixin.com/articles/2016-08-30 这里面说:是10-20%的,那我这16%的其实也算是不平衡了。
可以处理一下,有思路了。
5.kaggle模型集成教程
https://mlwave.com/kaggle-ensembling-guide/ 继续学习一下这个模型集成。
2020-4-6周一
1.这两个roberta有什么区别?
感觉好像都是一样的模型啊,模型大小也差不多。。。。也都是roberta啊。