Datawhale 学CV--task3 字符识别代码理解

尝试修改网络结构的记录：

1、resnet18修改为vgg16，epoch=2时效果差点，修改：

model_conv = models.vgg16(pretrained=True)

#model_conv = models.restnet18(pretrained=True)

2、如果每个stage结构都一样，可以写如下，再传参数。

self.conv1 = nn.Sequential(
nn.Conv2d()
nn.BatchNormal()
nn.PReLU()
nn.MaxPooling()
nn.Dropout()
)

传参数：conv2d（n_in，n_out，kernel，stride，padding）

batchnormal（n_out）待处理数据的channel；batchnormal（n_out，0.1）包含了？

PRelu可以换成Relu，无参数；

Maxpooling（2）表示（2，2）的maxpooling

Dropout（0.2），网络小时取值也小，一般0.2--0.5

3. 代码记录如下；

def __init__(self):
super(SVHN_Model1, self).__init__()
# model_conv = models.vgg16(pretrained=True)

self.fc1 = nn.Linear(100, 11)
self.fc2 = nn.Linear(100, 11)
self.fc3 = nn.Linear(100, 11)
self.fc4 = nn.Linear(100, 11)
self.fc5 = nn.Linear(100, 11)

def conv_bn(inp, oup):
return nn.Sequential(
nn.Conv2d(inp, oup, 5, 1, 2),
nn.BatchNorm2d(oup),
nn.ReLU(inplace=True),
nn.MaxPool2d(2,2,1),
nn.Dropout(0.2),
)

self.cnn = nn.Sequential(
conv_bn( 3, 48),
conv_bn( 48, 64),
conv_bn( 64, 128),
conv_bn( 128,160),
conv_bn( 160, 192),
conv_bn( 192, 192),
conv_bn( 192, 192),
conv_bn( 192, 192), )

def dense_1(inp, oup):
return nn.Sequential(
nn.Linear(inp,oup),
nn.ReLU(inplace=True),
)
self.fc_2 = nn.Sequential(

dense_1( 768, 512),
dense_1( 512, 100),)

def forward(self, img):
feat = self.cnn(img)
#print(feat.shape)
#feat = feat.view(feat.shape[0], -1)
feat = feat.view(feat.shape[0], -1)
feat = self.fc_2(feat)

c1 = self.fc1(feat)
c2 = self.fc2(feat)
c3 = self.fc3(feat)
c4 = self.fc4(feat)
c5 = self.fc5(feat)
return c1, c2, c3, c4, c5

4、尝试修改conv的kernel从5（padding=2，stride=1）到3（padding=1，stride=1）

并且修改两个conv后再接maxpooling，共8个conv，4个pooling

但结果很差，loss几乎不变，原因还没有找到。

@ 先尝试了conv的kernel的修改，epoch=5，kernel=3或5 ，结果差别不大

@ 尝试少用4个pooling，（conv和maxpooling分开定义sequential）

https://www.jianshu.com/p/085f4c8256f1

相关阅读:
开源中最好的Web开发的资源
数据结构慕课PTA 05-树9 Huffman Codes
【读书笔记】C++ primer 5th 从入门到自闭（一）
【PTA】浙江大学数据结构慕课课后编程作业 03-树1 树的同构
nuvoton980 generate yaffs2 format rootfs (九)
nuvoton980 burn firmware to spi-nand (八)
nuvoton980 kernel support bridge and nat(七)
nuvoton980 kernel support tf card(六)
nuvoton980 kernel support leds-gpio (五)
nuvoton980 kernel support spi nand boot and rtc (四)

原文地址：https://www.cnblogs.com/haiyanli/p/12964599.html