题目1:如何应对图像光照变化大?
1、直方图均衡化
2、对比度拉伸,或者调节
3、若受光源影响,使得图片整体色彩往一方面移动,用白平衡算法进行修正,使其发黄、发蓝、发红的照片更加趋于自然光下的图像
4、若是过爆或者过暗,可是设计阈值函数,不用全局阈值,对特定区域进行特定阈值分割。
5、若是太暗,可以采用对数变化,对数图像增强是图像增强的一种常见方法,其公式为:S = c log (r+1),对数使亮度比较低的像素转换成亮度比较高的,而亮度较高的像素则几乎没有变化,这样就使图片整体变亮。
6、采用拉普拉斯算子增强 , filter2D (src,dst)
题目2:为什么要使用许多小卷积核 (如 3x 3) 而不是几个大卷积核?
这在 VGGNet 的原始论文中得到了很好的解释。原因有二:首先,您可以使用几个较小的核而不是几个较大的核来获得相同的感受野并捕获更多的空间上下文,但是使用较小的内核时,您使用的参数和计算量较少。其次,因为使用更小的核,您将使用更多的滤波器,您将能够使用更多的激活函数,从而使您的 CNN 学习到更具区分性的映射函数。
题目3:梯度消失与梯度爆炸的产生原因是什么?
梯度消失:
(1)隐藏层的层数过多;
(2)采用了不合适的激活函数 (更容易产生梯度消失,但是也有可能产生梯度爆炸)
梯度爆炸:
(1)隐藏层的层数过多;
(2)权重的初始化值过大
题目4:如何确定是否出现梯度爆炸?
-
模型无法从训练数据中获得更新(如低损失)。
-
模型不稳定,导致更新过程中的损失出现显著变化。
-
训练过程中,模型损失变成 NaN。
题目5:如何解决梯度爆炸与梯度消失?
1、预训练加微调
2、梯度剪切、权重正则化(针对梯度爆炸)
3、用 ReLU、Leaky-ReLU、P-ReLU、R-ReLU、Maxout 等替代 sigmoid 函数。
4、使用 batchnorm
5、使用残差结构
6、LSTM 的结构设计也可以改善 RNN 中的梯度消失问题。
梯度消失和梯度爆炸问题都是因为网络太深,网络权值更新不稳定造成的,本质上是因为梯度反向传播中的连乘效应。
以上是总结的CV面试题,用来共勉,以后还会每次总结。