分数阶最大值池化:就是输入和输出的维度比例可能不是整数,通常我们max pooling按kernel=(2, 2),stride=2或kernel=(3,3),stride=2,比例大小是2,作者提出比例为分数的做法,下面描述比例属于(1,2)时的办法,其他的类似。
设(Nin,Nin), (Nout, Nout)分别为输入和输出的feature map的大小,利用随机产生序列,根据序列将输入的feature map分成Nout*Nout块,每块分别做max pooling,分出的块为
Pij=[ai-1, ai-1]*[bj-1, bj-1] 或Pij=[ai-1, ai]*[bj-1, bj]
分别是不相交和有叫叠的做法。
产生序列的方法有两种,首先固定间隔只能为1或2。
作用就是因为随机pool size的话可认为是个随机的scale变换,这个能算aug了,外加一点dropout,正则性能好一些,防止过拟合。