LeNet:第一个卷积神经网络
「识别手写数字」是一个经典的机器学习任务,有著名的 MNIST 数据集。我们曾经利用多层感知机实现了 90+% 的准确率,本文将介绍卷积神经网络 LeNet,主要参考 这篇英文博客 的讲解。
LeNet 是几种神经网络的统称,它们是 Yann LeCun 等人在 1990 年代开发的。一般认为,它们是最早的卷积神经网络(Convolutional Neural Networks, CNNs)。模型接收灰度图像,并输出其中包含的手写数字。LeNet 包含了以下三个模型:
- LeNet-1:5 层模型,一个简单的 CNN。
- LeNet-4:6 层模型,是 LeNet-1 的改进版本。
- LeNet-5:7 层模型,最著名的版本。
CNN 的设计是为了模拟人眼的感知方式。传统的 CNN 一般包含以下三种层:
- 卷积层(convolution layers)
- 降采样层(subsampling layers),或称池化层(pooling layers)
- 全连接层(fully connected layers)
它们有各自的用途,通过排列这些层,我们能实现各种 CNN。接下来,我们分别介绍这三种部件。
https://blog.csdn.net/fengbingchun/article/details/125462001
https://blog.csdn.net/fengbingchun/article/details/126072998
https://github.com/fengbingchun/PyTorch_Test
https://github.com/bruceborgia/dive_into_DL
训练一个 GAN
本文记录了训练 GAN 来生成二次元头像的过程。我们先从网上获取二次元头像数据集,训练一个生成器、训练一个判别器,来获取生产二次元头像的网络。
数据集来源于李宏毅老师