动手学深度学习 | 数据增广

动手学深度学习 | 数据增广 | 35
目录
数据增广

数据增广的话就不局限于图片，对文本、语音等都可以进行增广，这里主要是针对图片的技术。

代码

简简单单一个左右翻转的图像增广，就可以有效缓解让cifar10的过拟合情况。

其实不要奇怪，在ImageNet上，如果数据增广做的比较狠的话，经常是可以看到test acc高于train acc的，是因为测试环境不会对图片做数据增广，而训练环境把图片都增广（一堆鬼样子）。

QA
1. 理论上，是不是原始样本足够多，就不用做增广了？
是的，但是这样的情况很难发生。

还有图片多，并不代表数据集的多样性好。

还有就是真正应用的时候，其实还有可能会出现更加奇怪的图片。
1. num_worker的值是不是根据机器GPU性能而设定？
不是GPU，是CPU...

如果你CPU是双核的，那么num_worker就取2。

虽然我们说深度学习拼的GPU，但是CPU也不能太差，否则数据预处理的时候就会非常的拉跨。（CPU至少要个8核吧）
1. 测试一般怎么做增广呢？
测试集一般是不做增广的。

但是如果是输入的一张随机图片，那么就会保留短边，然后按照比例去resize成(224*224)。
1. 关于cifar10的训练
cifar10的测试精度是可以很高的，可以到95%，大概需要200个epoch。

但是trian acc和test acc之间的gap是不会减少的，一般也很少减少，最终train acc可以达到100%。
1. 图片增广后需要人工一张张的确认效果吗？
不用一张张，但是要大致看一下，保证不要太奇怪就行了。
相关阅读:
一个案例
 Python Qt 简介
 【第二】用QtDesigner设计第一个界面
 【第一节】QtDesigner安装
 【第十二节】PyQt5俄罗斯方块
 【第十一节】PyQt5自定义控件
 【第十节】PyQt5绘图
 【第九节】PyQt 拖拽
 【第八节】PyQt5控件(II)
【第七节】PyQt5控件
原文地址：https://www.cnblogs.com/Rowry/p/15365972.html