Group Convolution分组卷积，以及Depthwise Convolution和Global Depthwise Convolution

Group Convolution分组卷积，以及Depthwise Convolution和Global Depthwise Convolution
博客：blog.shinelee.me | 博客园 | CSDN
目录
写在前面

Group Convolution分组卷积，最早见于AlexNet——2012年Imagenet的冠军方法，Group Convolution被用来切分网络，使其在2个GPU上并行运行，AlexNet网络结构如下：

Convolution VS Group Convolution

在介绍Group Convolution前，先回顾下常规卷积是怎么做的，具体可以参见博文《卷积神经网络之卷积计算、作用与思想》。如果输入feature map尺寸为(C*H*W)，卷积核有(N)个，输出feature map与卷积核的数量相同也是(N)，每个卷积核的尺寸为(C*K*K)，(N)个卷积核的总参数量为(N*C*K*K)，输入map与输出map的连接方式如下图左所示，图片来自链接：

Group Convolution顾名思义，则是对输入feature map进行分组，然后每组分别卷积。假设输入feature map的尺寸仍为(C*H*W)，输出feature map的数量为(N)个，如果设定要分成(G)个groups，则每组的输入feature map数量为(frac{C}{G})，每组的输出feature map数量为(frac{N}{G})，每个卷积核的尺寸为(frac{C}{G} * K * K)，卷积核的总数仍为(N)个，每组的卷积核数量为(frac{N}{G})，卷积核只与其同组的输入map进行卷积，卷积核的总参数量为(N * frac{C}{G} *K*K)，可见，总参数量减少为原来的 (frac{1}{G})，其连接方式如上图右所示，group1输出map数为2，有2个卷积核，每个卷积核的channel数为4，与group1的输入map的channel数相同，卷积核只与同组的输入map卷积，而不与其他组的输入map卷积。

Group Convolution的用途
1. 减少参数量，分成(G)组，则该层的参数量减少为原来的(frac{1}{G})
2. Group Convolution可以看成是structured sparse，每个卷积核的尺寸由(C*K*K)变为(frac{C}{G}*K*K)，可以将其余((C- frac{C}{G})*K*K)的参数视为0，有时甚至可以在减少参数量的同时获得更好的效果（相当于正则）。
3. 当分组数量等于输入map数量，输出map数量也等于输入map数量，即(G=N=C)、(N)个卷积核每个尺寸为(1*K*K)时，Group Convolution就成了Depthwise Convolution，参见MobileNet和Xception等，参数量进一步缩减，如下图所示
4. 更进一步，如果分组数(G=N=C)，同时卷积核的尺寸与输入map的尺寸相同，即(K=H=W)，则输出map为(C*1*1)即长度为(C)的向量，此时称之为Global Depthwise Convolution（GDC），见MobileFaceNet，可以看成是全局加权池化，与 Global Average Pooling（GAP） 的不同之处在于，GDC 给每个位置赋予了可学习的权重（对于已对齐的图像这很有效，比如人脸，中心位置和边界位置的权重自然应该不同），而GAP每个位置的权重相同，全局取个平均，如下图所示：
以上。

参考
- A Tutorial on Filter Groups (Grouped Convolution)
- Interleaved Group Convolutions for Deep Neural Networks
相关阅读:
git常用指令 github版本回退 reset
三门问题概率论
 如何高效的学习高等数学
 数据库6 关系代数(relational algebra) 函数依赖(functional dependency)
数据库5 索引动态哈希（Dynamic Hashing）
数据库4 3层结构(Three Level Architecture) DBA DML DDL DCL DQL
梦想开始的地方
 java String字符串转对象实体类
 java 生成图片验证码
 java 对象之间相同属性进行赋值
原文地址：https://www.cnblogs.com/shine-lee/p/10243114.html

Group Convolution分组卷积，以及Depthwise Convolution和Global Depthwise Convolution

写在前面

Convolution VS Group Convolution

Group Convolution的用途

参考