GAN损失函数

GAN损失函数

https://zhuanlan.zhihu.com/p/33752313，讲的不错。

1.损失函数

第一项主要是针对真实样本的，第二项是针对生成样本的损失。

//判别器是尽可能地判别出是真实数据还是生成数据，我一直以为是尽可能判别不出呢。。。

2.训练过程

可以看到是先确定G，优化D，确定了优化D之后，再优化G，然后循环进行上面的过程。

3.GAN的缺点

https://zhuanlan.zhihu.com/p/58260684

当固定Generator时，最优的Discriminator是

在面对最优Discriminator时，Generator的优化目标就变成了

如果把Discriminator训练到极致，那么整个GAN的训练目标就成了最小化真实数据分布与合成数据分布之间的JS散度。

有关JS散度的目标函数会带来梯度消失的问题。也就是说，如果Discriminator训练得太好，Generator就无法得到足够的梯度继续优化，而如果Discriminator训练得太弱，指示作用不显著，同样不能让Generator进行有效的学习。这样一来，Discriminator的训练火候就非常难把控，这就是GAN训练难的根源。

//2021-4-5更新——————

4.基本训练过程

虽然图中画的是真实和生成图片同时进入判别器，但实际上是分阶段进入的。

使用交叉熵损失，针对判别器D和生成器G有不同的优化器，是分阶段优化的。

4.1 训练判别器D

基本分为4个步骤：

①向判别器D输入真实图片，获取输出，计算与真实label交叉熵损失；

②用生成器G生成虚假图片；

③将虚假图片输入判别器D，获取输出，计算与虚假label交叉熵损失；

④更新判别器D的参数

计算损失时分别计算的是真实的图片与真实的label，虚假的图片与虚假的label，目的是让判别器尽可能地分辨出真伪图片。

4.2 训练生成器G

基本分为3个步骤：

①生成虚假image；

②向判别器D输入虚假image，计算和真实label的交叉熵；

③更新G的参数

训练G的目的是尽可能生成和真实图片相似的image。
相关阅读:
题解 [CF891C] Envy
题解 [BZOJ4710] 分特产
 题解 [BZOJ2159] Crash的文明世界
 题解 [BZOJ4144] Petrol
#leetcode刷题之路1-两数之和
 week 7 文件操作与模板
 coursera 北京大学程序设计与算法专项课程 STL week8 list
coursera 北京大学程序设计与算法专项课程完美覆盖
 JSTL标签库不起作用的解决方案 .（转）
javax.servlet.jsp.PageContext.getELContext()Ljavax/el/ELContext解决办法（转）
原文地址：https://www.cnblogs.com/BlueBlueSea/p/13138423.html

1.损失函数

2.训练过程

3.GAN的缺点

4.基本训练过程

4.1 训练判别器D

4.2 训练生成器G