WGAN(Wasserstein GAN)看这一篇就够啦，WGAN论文解读

2023年6月23日上午4:22 • 人工智能 • 阅读 82

WGAN论文地址：[1701.07875] Wasserstein GAN (arxiv.org)

WGAN解决的问题

原始GAN训练过程中经常遇到的问题：

模式崩溃，生成器生成非常窄的分布，仅覆盖数据分布中的单一模式。模式崩溃的含义是生成器只能生成非常相似的样本（例如，MNIST中的单个数字），即生成的样本不是多样的。
没有指标可以告诉我们收敛情况。生成器和判别器的 loss并没有告诉我们任何收敛相关信息。当然，我们可以通过不时地查看生成器生成的数据来监控训练进度。但是，这是一个手动过程。因此，我们需要有一个可解释的指标可以告诉我们有关训练的进度。

一句话概括：判别器越好，生成器梯度消失越严重。

GAN网络训练的重点在于均衡生成器与判别器，若判别器太强，loss没有再下降，生成器学习不到东西，生成图像的质量便不会再有提升。

在最优判别器的下，我们可以把原始GAN定义的生成器loss 等价变换为最小化真实分布与生成分布之间的JS散度。我们越训练判别器，它就越接近最优，最小化生成器的loss也就会越近似于最小化真实分布与生成分布之间的JS散度。

关键点就在于如何评价生成图片和真实图片之间的距离

JS散度存在的问题

如果希望两个分布之间越接近它们的JS散度越小，我们通过优化JS散度就能将生成分布拉向真实分布，最终以假乱真。这个希望在两个分布有所重叠的时候是成立的，但是如果两个分布完全没有重叠的部分，或者它们重叠的部分可忽略，那它们的JS散度就一直是 log2。

在原始GAN的（近似）最优判别器下，生成器loss面临梯度消失问题。也面临优化目标荒谬、梯度不稳定、对多样性与准确性惩罚不平衡导致mode collapse问题。

原始GAN问题的根源可以归结为两点，

等价优化的距离衡量（JS散度）不合理
生成器随机初始化后的生成分布很难与真实分布有不可忽略的重叠

Wasserstein GAN（WGAN）就是希望解决上述两个问题

解决原始GAN问题的方法

解决问题的关键在于使用 Wasserstein距离衡量两个分布之间的距离 Wasserstein距离优越性在于：即使两个分布没有任何重叠，也可以反应他们之间的距离。

Wasserstein距离

P和Q为两个分布：P分布为一堆土，Q分布为要移到的目标，那么要移动P达到Q，哪种距离更小呢？

使用Wasserstein距离，无论两个分布多远，都有梯度，都是可以更新的

WGAN设计

原始的生成对抗网络，所要优化的目标函数为：

②固定判别器 D，优化生成器 G，舍去前面的常数，

这是一种数学的近似，同要求梯度变化的不要太猛。那么怎么梯度更新呢？因为D有了限制，无法直接利用SGD。这里引入一种方法：Weight clipping 就是强制令权重w 限制在c ~ -c之间。在参数更新后，如果 w>c，则令w=c，如果w

Original: https://blog.csdn.net/m0_62128864/article/details/124258797
Author: 码农男孩
Title: WGAN(Wasserstein GAN)看这一篇就够啦，WGAN论文解读

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/646626/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

☀️机器学习入门☀️(二) KNN分类算法 | 附加小练习

目录 1. 聚类与分类 * 1.1 聚类 1.2 分类 2. 关于KNN算法 * 2.1 Lp距离定义： 2.1 K值的选取 3. 练习 * 第一题：第二题：最后聚类与分类 …

人工智能 2023年5月31日
0086
对于神经网络参数初始化的一些理解

参数初始化 * – 动机 – 1. 预训练初始化 – 2. 随机初始化 – + 2.1 高斯（Gaussian）分布初始化 + 2….

人工智能 2023年7月14日
0085
MySQL数据库常用命令大全（完整）（表格形式）

易语言5.1 相对于易语言5.0更新说明：支持静态链接其它编程语言（如C/C++、汇编等）编译生成的静态库（.LIB或.OBJ），但仅限于COFF格式，支持cdecl和stdca…

人工智能 2023年7月30日
0064
通话质量好的蓝牙耳机有哪些？通话质量好的蓝牙耳机盘点

选择一副好的蓝牙耳机被认为是大多数耳机用户和喜欢听音乐的人都在考虑的问题。有些人可能已经找到了一些这样的方式，但许多人仍然不知道如何选择。以下是我推荐的几款蓝牙耳机。在我看来，它们…

人工智能 2023年5月25日
0096
原形网络（PrototypicalNetworks）基于PyTorch的实现

我在Jay2coomzz的基础上修改了数据处理方式和evaluation_model()方法，作为初学者若有不当之处恳请大家批评指正,原文链接如下：https://blog.csd…

人工智能 2023年7月23日
0088
哈工大计算机网络实验四利用 Wireshark 进行协议分析

计算机网络实验代码与文件可见github：计算机网络实验整理实验名称利用 Wireshark 进行协议分析实验目的：本次实验的主要目的。熟悉并掌握Wireshark的基本操作，了…

人工智能 2023年6月4日
0080
人工智能 | 基于支持向量机SVM模型的鸢尾花分类识别

一、实验目的通过鸢尾花萼片长度和宽度特征，采用感知器模型对鸢尾花数据集进行种类的分类识别。二、算法步骤 1.数据准备(1)从sklearn库里加载鸢尾花特性数据集；iris =…

人工智能 2023年6月30日
0098
2022世界杯感悟

世界杯转眼之间已经到了尾声，总共48场比赛，也只剩下了最后的两场。都说这一届是诸神黄昏，再过三天，也就到了真正封神的时候。回想第一次看世界杯，恰逢2002年中国队首次挤进世界杯…

人工智能 2023年7月30日
0060
保姆级教程，树莓派最新64位系统部署yolov5

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、树莓派安装64位系统二、树莓派前期准备三、配置部署环境四、安装yolov5环境运行程序 …

人工智能 2023年5月26日
0094
opencv与Image以及numpy转换和显示【附代码】

图像的显示在python中有很多方式，但针对自己的项目，需要有不同的读取或者显示方式，又或者想把图像转换成其他类型进行处理。比如你是用opencv读取的图像，然后检测完以后是用Im…

人工智能 2023年7月18日
00157
分类问题——判别分析（LDA、QDA）

一、前言 1.理解方差最大法在PCA（主成分）里，该方法经常被使用。在一个正交坐标系下使PCA1（即V1）的方差最大，而PCA2（V2）的方差最小，实现了降维（二维降成了一维） 2…

人工智能 2023年7月1日
00126
OpenCV角点检测—FLANN快速最近邻进行特征点匹配(9)

2.3 使用FLANN进行特征点匹配本节我们将讲如何使用FlannBasedMatcher接口和FLANN()函数来实现快速高效匹配(快速最邻近逼近搜索函数库，Fast Libr…

人工智能 2023年7月19日
0057
Android 环境下OpenCV使用– 环境搭建（一）

OpenCv 环境搭建 * – + 1、OpenCV SDK下载 + 2、Android Studio 创建 C++ 工程 + 3、openCV的so库加载项目中 +…

人工智能 2023年7月19日
0061
使用conda配置tensorflow环境

目录 * – 前置条件： – 操作步骤： – + 1.创建虚拟环境 + 2.激活虚拟环境 + 3.安装tensorflow + 4.配置pych…

人工智能 2023年5月25日
0090
【数智化案例展】深农集团——守护深圳“菜篮子”，腾讯安全携手深农集团保供稳价格…

腾讯安全案例本项目由腾讯安全投递并参与——《2022中国企业数智化转型升级创新服务企业》榜单/奖项”评选。数据智能产业创新服务媒体 ——聚焦数智 · 改变商业深圳…

人工智能 2023年7月15日
0062
两阶段(two stage)目标检测原理详解 — RCNN

目录一、目标检测的任务二、什么是”两阶段”呢？三、两阶段算法原理（二）候选区域算法（三）边框回归（ Bounding Box Regression…

人工智能 2023年5月26日
00124

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31