• 跟我学算法-图像识别之图像分类(下)(GoogleNet网络, ResNet残差网络, ResNext网络, CNN设计准则)


    1.GoogleNet 网络: 

                Inception V1 - Inception V2 - Inception V3 - Inception V4 

                1. Inception v1

                    split - merge - 1*1卷积,3*3卷积, 5*5卷积, 3*3池化
                   

                    输入层:inception

                              1*1 卷积

                               1*1卷积 - 3*3卷积

                               1*1卷积 - 5*5卷积

                               3*3 maxpooling - 1*1 卷积

                    2个辅助分类器

                               深网络中,梯度回传到最初几层,存在严重消失问题

                                有效加速收敛

                                测试阶段不适用

                2. inception v2 

                          采用了Batch Normalization(批归一化),使得输出规划到(0, 1)

                          对每一个特征通道做归一化, 归一化是进行中心化和标准化
                            x1 = (x-u) / б

                            y(k) = y(k) * x1(k) + β(k)

                           training:

                                 每个batch中k组均值-标准差会被存储

                            testing:

                                 无batch, 将所有的Kzu均值-标准差分别求平均,使用这K组平均
                   3. Inception v3

                             核心组件

                                  非对称卷积: N*N 分解成1*N 和 N * 1 

                              

                    4. Inception v4

                            添加了一个残差神经网络的直连思想

    2.ResNet 残差网络

             可以拟合任意目标映射F(x), H(x) = F(x) + x

             F(x)是残差映射

             当H(x) 最优映射接近Identity, 容易捕捉到很小的扰动
             X - weight layer - relu - weight layer -relu  - 

             Y - weight layer - relu - weight layer - relu - , 直接从Y到达后面实现直连

             其他设计: 

                     全是3*3卷积核

                     卷积步长2取代池化

                     使用batch Normalization

                     取消:

                          Max池化

                          全连接

                           dropout

    3. ResNext网络

            提出了第三个维度

            策略:将卷积核按通道分组,形成32个并行分支

                       低维度卷积,进行特征变化

                       加法合并

    4. CNN设计准则

           避免信息瓶颈

                     卷积过程中

                            空间尺寸 H * W 变小

                             输出通道C变多

                      数据量H*W*C要缓慢变小
                      通道数量保持在可控范围内

                      感受野在前期要足够大

                            在后面几层使用多个尺寸的卷积核

                     CNN 设计准则

                              分组策略 采用通道分解(resnext)- 降低计算量

                              低秩分解 - 3*3*c*k - 1*3*c*k 和 3*1*c*k 

                                 

              

               

  • 相关阅读:
    约合¥1720 LG法国称G Watch将于6月开卖
    c语言中的位移位操作
    兼容的动态加载JS【原】
    Oracle 10g AND Oracle 11g手工建库案例--Oracle 10g
    面向对象思想----不看懊悔!
    学习设计模式--观察者模式(C++)
    使用POI 导入excel
    机器学习 F1-Score, recall, precision
    阿里无线11.11:手机淘宝移动端接入网关基础架构演进之路
    ICE 迁移64位安装问题
  • 原文地址:https://www.cnblogs.com/my-love-is-python/p/9794998.html
Copyright © 2020-2023  润新知