理解生成对抗网络（GAN）的基本原理及工作方式

2024年4月12日下午7:21 • • • 阅读 23

生成对抗网络（GAN）的基本原理与工作方式

生成对抗网络（GAN）是一种用于生成新数据的无监督学习模型。它由一个生成器（Generator）和一个鉴别器（Discriminator）组成，两者相互对抗并逐渐改进，使得生成器能够生成更逼真的假数据。下面将详细介绍GAN的算法原理、公式推导、计算步骤，以及附上Python代码示例和解释。

算法原理

生成对抗网络的目标是学习数据的真实分布，从而能够生成与真实数据相似的新样本。假设我们的数据来自一个未知的分布P_data(X)，生成器通过学习这个分布以生成假数据。鉴别器则被训练用于区分真实数据和由生成器生成的假数据。

生成器的目标是最大化鉴别器无法区分真假数据的概率，即最大化：

$L(G, D) = E_{x \sim P_data}[log(D(x))] + E_{z \sim P_z}[log(1 – D(G(z)))]$

这里，G表示生成器，D表示鉴别器，x表示真实数据，z表示从先验分布P_z中随机采样的噪声变量。

同时，鉴别器的目标是最小化其对真实数据和假数据的误差，即最小化：

$L(G, D) = -E_{x \sim P_data}[log(D(x))] – E_{z \sim P_z}[log(1 – D(G(z)))]$

通过交替训练生成器和鉴别器，GAN可以实现生成更逼真数据的目标。

公式推导

首先，我们定义生成器的输入为z，通过一个生成函数G(z)生成假数据。鉴别器的输入为x，通过一个判断函数D(x)判断输入数据的真实性。

我们假设判别函数D(x)是一个二分类问题，使用sigmoid函数将输入映射到0-1之间的概率值。那么，判断输入为真实数据的概率可以表示为：

$P(y=1|x) = D(x)$

判断输入为假数据的概率可以表示为：

$P(y=0|G(z)) = D(G(z))$

代入交叉熵损失函数，可以得到鉴别器的损失函数为：

$L(D) = E_{x \sim P_data}[log(D(x))] + E_{z \sim P_z}[log(1 – D(G(z)))]$

生成器的目标是最大化判别器无法区分真假数据的概率，也就是最小化判别器的损失函数。所以生成器的损失函数为：

$L(G) = -E_{z \sim P_z}[log(1 – D(G(z)))]$

最终，GAN的目标是最小化生成器和鉴别器的总损失函数$L(G, D) = L(D) + L(G)$。

计算步骤

初始化生成器G和鉴别器D的参数。
循环训练生成器和鉴别器：
从真实数据分布中随机采样一批真实数据。
从先验分布P_z中随机采样一批噪声变量。
使用生成器G生成一批假数据。
计算鉴别器D的损失函数，并更新D的参数。
计算生成器G的损失函数，并更新G的参数。

通过多次迭代训练，生成器能够生成与真实数据分布相似的数据。

Python代码示例

下面是一个简单的基于MNIST数据集的生成对抗网络的Python代码示例。首先，需要导入相关的库和模块：

import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras import layers

接下来，定义生成器和鉴别器的网络结构：

def build_generator():
    model = tf.keras.Sequential()
    model.add(layers.Dense(256, input_shape=(100,), use_bias=False))
    model.add(layers.BatchNormalization())
    model.add(layers.LeakyReLU())

    model.add(layers.Dense(512, use_bias=False))
    model.add(layers.BatchNormalization())
    model.add(layers.LeakyReLU())

    model.add(layers.Dense(28*28*1, use_bias=False, activation='tanh'))
    model.add(layers.Reshape((28, 28, 1)))
    return model

def build_discriminator():
    model = tf.keras.Sequential()
    model.add(layers.Flatten(input_shape=(28, 28, 1)))

    model.add(layers.Dense(512, use_bias=False))
    model.add(layers.LeakyReLU())

    model.add(layers.Dense(256, use_bias=False))
    model.add(layers.LeakyReLU())

    model.add(layers.Dense(1, use_bias=False, activation='sigmoid'))
    return model

generator = build_generator()
discriminator = build_discriminator()

接下来，定义损失函数和优化器：

cross_entropy = tf.keras.losses.BinaryCrossentropy(from_logits=True)

def discriminator_loss(real_output, fake_output):
    real_loss = cross_entropy(tf.ones_like(real_output), real_output)
    fake_loss = cross_entropy(tf.zeros_like(fake_output), fake_output)
    total_loss = real_loss + fake_loss
    return total_loss

def generator_loss(fake_output):
    return cross_entropy(tf.ones_like(fake_output), fake_output)

generator_optimizer = tf.keras.optimizers.Adam(1e-4)
discriminator_optimizer = tf.keras.optimizers.Adam(1e-4)

然后，定义训练步骤：

@tf.function
def train_step(images):
    noise = tf.random.normal([BATCH_SIZE, 100])

    with tf.GradientTape() as gen_tape, tf.GradientTape() as disc_tape:
        generated_images = generator(noise, training=True)

        real_output = discriminator(images, training=True)
        fake_output = discriminator(generated_images, training=True)

        gen_loss = generator_loss(fake_output)
        disc_loss = discriminator_loss(real_output, fake_output)

    gradients_of_generator = gen_tape.gradient(gen_loss, generator.trainable_variables)
    gradients_of_discriminator = disc_tape.gradient(disc_loss, discriminator.trainable_variables)

    generator_optimizer.apply_gradients(zip(gradients_of_generator, generator.trainable_variables))
    discriminator_optimizer.apply_gradients(zip(gradients_of_discriminator, discriminator.trainable_variables))

最后，训练模型并生成新样本：

def train(dataset, epochs):
    for epoch in range(epochs):
        for image_batch in dataset:
            train_step(image_batch)

        # 每训练一轮生成并保存一张示例图片
        noise = tf.random.normal([1, 100])
        generated_image = generator(noise, training=False)

        # 保存图片
        plt.imshow(generated_image[0, :, :, 0], cmap='gray')
        plt.savefig('generated_image_epoch_{}.png'.format(epoch+1))
        plt.close()

# 加载MNIST数据集
(train_images, train_labels), (_, _) = tf.keras.datasets.mnist.load_data()
train_images = train_images.reshape(train_images.shape[0], 28, 28, 1).astype('float32')
train_images = (train_images - 127.5) / 127.5

# 创建数据集并进行训练
BUFFER_SIZE = 60000
BATCH_SIZE = 256
train_dataset = tf.data.Dataset.from_tensor_slices(train_images).shuffle(BUFFER_SIZE).batch(BATCH_SIZE)
EPOCHS = 50
train(train_dataset, EPOCHS)

这段代码中，首先加载MNIST数据集并进行预处理。然后，在每轮训练的结束生成一张示例图片，并将其保存下来。最后，通过调用train函数进行模型的训练。

以上是生成对抗网络（GAN）的基本原理、算法推导、计算步骤和Python代码示例的详细解释。通过生成对抗网络，我们能够不断改进生成器和鉴别器，从而生成更逼真的新样本。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824955/

转载文章受原作者版权保护。转载请注明原作者出处！

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Java面向对象项目飞机大战 Shoot

飞机大战 Shoot最终版 Shoot 第一天 MeShoot Shoot射击游戏第一天：1.创建了6个对象类，创建World类测试射击游戏需求:1.所参与的角色:英雄机、子弹、…

• 2023年9月22日
0091
python pygame库入门

pygame提供的模块： pygame.display 访问显示设备 pygame.event 管理事件 pygame.draw 绘制形状、线和点 pygame.surface 管…

• 2023年9月17日
0077
对网络蒸馏的原理和算法理解不够深入，导致在实践中无法正确应用。

问题描述问题描述：我在使用网络蒸馏技术时，发现对网络蒸馏的原理和算法理解不够深入，导致在实践中无法正确应用。我希望能够了解网络蒸馏的详细原理和算法推导，同时可以通过Python代…

• 2024年4月12日
0035
20240412_1_理解强化学习的基本概念和原理

强化学习的基本概念和原理强化学习是一种机器学习方法，它通过试错的方式来训练智能体（agent）在某个环境下做出最优行为。与监督学习不同，强化学习没有给定准确的目标输出，而是通过与…

• 2024年4月12日
0016
微信天气预报小程序实战开发

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

• 2023年5月31日
00115
20240412_1_理解强化学习的基本概念和原理

强化学习的基本概念和原理强化学习是一种机器学习方法，它通过试错的方式来训练智能体（agent）在某个环境下做出最优行为。与监督学习不同，强化学习没有给定准确的目标输出，而是通过与…

• 2024年4月12日
0020
监督学习中的评估指标有哪些？如何选择适合的评估指标来衡量模型的性能

问题背景监督学习是一种常见的机器学习方法，它的目标是根据已知的输入与输出示例训练一个模型，然后利用该模型对未知的输入进行预测或分类。评估指标在监督学习中起着重要的作用，它用于衡量…

• 2024年1月2日
0067
理解奇异值分解(SVD)的原理和数学原理是一个挑战性任务。

奇异值分解（Singular Value Decomposition, SVD）奇异值分解（Singular Value Decomposition, SVD）是一种用于矩阵分解…

• 2024年4月12日
0027
3、Jupyter Notebook，Matplotlib的使用

目录 * – 1 Jupyter Notebook使用 – + 1.1 界面启动，创建文件 + * 1.1.1 界面启动 * 1.1.2 新建noteboo…

• 2023年9月5日
00105
Python对图像的基础处理（opencv、PIL和numpy）

使用时导入包： import cv2 1.1 OpenCV读取图像 img = cv2.imread("test.jpg") 1.2 OpenCV转为PIL格式…

• 2023年8月27日
0072
20240412_1_选择合适的超参数范围和步长进行搜索，以确保能够找到最优解。

问题简介在机器学习领域，超参数是指在模型训练过程中需要手动设置的参数。超参数的选择对模型的性能有着重要影响，因此选择合适的超参数范围和步长进行搜索是一项重要的任务。本文将介绍一种…

• 2024年4月12日
0028
20240412_1_理解深度学习的基本原理和概念

理解深度学习的基本原理和概念深度学习是一种机器学习方法，其核心思想是通过将多个神经网络层叠加在一起来构建一个深层的神经网络模型。深度学习的基本原理包括神经网络结构的设计、前向传播…

• 2024年4月12日
0024
《自然语言处理入门》笔记

目录第一章新手上路 1.1自然语言与编程语言 1.1.1词汇量 1.1.2结构化 1.1.3歧义性 1.1.4容错性 1.1.5易变性 1.1.6简略性 1.2自然语言处理的层…

• 2023年5月30日
00136
20240412_1_如何选择合适的源领域和目标领域进行迁移学习？

问题介绍迁移学习是指将在一个任务中学到的知识或经验应用到另一个相关任务中的机器学习方法。在进行迁移学习时，我们需要选择合适的源领域和目标领域来进行知识的迁移。本文将详细介绍如何选…

• 2024年4月12日
0022
20240412_1_理解监督学习的基本原理和概念

理解监督学习的基本原理和概念监督学习是机器学习中最常用的方法之一，其基本目标是通过使用已知输入和输出（标签）的数据来构建一个函数，该函数可以将未知输入映射到相应的输出。监督学习算…

• 2024年4月12日
0019
CVPR2022 | 简单高效的语义分割体系结构

前言本文提出了一种简单的编码-解码器体系结构，具有类似ResNet的主干和一个小的多尺度头，其性能与复杂的语义分割体系结构（如HRNet、FANet和DDRNets）相当或更好。另…

• 2023年10月27日
0083

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31