Xception: Deep Learning with Depthwise Separable Convolutions

核心贡献：从Inception的思想：剥离时序卷积和空域卷积得到启发，提出了Xception（Extreme Inception），希望能彻底解耦二者。

其他贡献：

故事

Inception结构的演进：In-Network[11] => 2014年GooLeNet（V1）[20] => Inception V2[7] => Inception V3[21] => Inception-ResNet[19]。

首先我们应该知道：一般的卷积实际上是在同时完成通道互相关和空域互相关。

这是基础。如果这一点不清楚，后面就没法看啦。

Inception的核心思想，就是解耦这两个操作：先做多个

Inception

看图应该就明白了。最好能提前熟悉

补充：V3有一些变种的思想是类似的，但不一样：它是希望解耦height-wise和width-wise的卷积，方法是级联

上图可以等价为下图3所示的两步：

既然如此，我们为什么不更进一步呢？我们让空域卷积只在单个通道上操作，即完全不含任何通道互相关信息。如图4：

得一提的是，TensorFlow和Keras里已经内置了类似的结构，称为深度可分离卷积。有两点不同：

作者将展示：第一点无关紧要，然而第二点非常重要。

Xception

36层卷积。Entry flow进行一次（8层卷积），Middle flow重复8次（24层卷积），最后是Exit flow（4层卷积）。由于是分类任务，最后跟了FC层和逻辑回归。
一共有14个module包裹这36个卷积层。每个module都有头尾短连接。

实验和V3比较，并且保证参数数量基本一致。优化方法都沿袭V3的方法。

实验结果：Xception更快、更好。

各模块的短连接有必要：

短连接

在 depthwise 和 pointwise 卷积之间的非线性激活是不好的。取消非线性激活，可以让收敛速度更快，效果更好：

不要非线性激活

这一点和Inception的报告是相反的。可能的原因是：Inception是将几百个通道分成3-4份，每一份都很多。因此非线性对于这种深度学习是有帮助的。但是，Xception的空域卷积只对单通道操作，深度不足，非线性反而会让信息丢失。

相关阅读:
vmware下玩ubuntu总结
.Net Json 字典序列化
Flex Air TitleWindow 拖动范围控制
TimesTen 问题荟萃
TimesTen 时间戳(timestamp)用法
批量数据插入 (.Net, ODBC)
腾讯 360浏览器调用js问题
[转]Android项目源码混淆问题解决方法
Intent调用大全
View实现涂鸦、撤销以及重做功能【转】

原文地址：https://www.cnblogs.com/ziwh666/p/12484601.html