生成式对抗网络实战（一）——手写数字生成（CPU本地版）完整代码加详解

2023年5月24日下午7:23 • 人工智能 • 阅读 151

【注1】代码的原文来自以下网址，修改部分及增添注释（基本上都注释了）。修改版整体见最后，原版下方链接，均可以跑通，有问题欢迎交流。生成对抗网络GAN—生成mnist手写数字图像示例（
附代码）_陶将的博客-CSDN博客_gan生成手写数字

【注2】环境要求：≥python3.8，Windows10，pycharm2019，tensorflow2.70

如果是tensorflow版本问题可以考虑升级或使用原代码

一.调用库

import tensorflow as tf
tf.compat.v1.disable_eager_execution()

import numpy as np
import os
from tensorflow.examples.tutorials.mnist import input_data
from matplotlib import pyplot as plt

这里由于2.x版本的语法进行了修改，导致原文中部分代码无法运行，compat.v1使得可以让2.x直接运行1.x版本的代码。

【注3】正文的很多部分例如layers，dense等都需要在tf和包中间加入compat.v1

【注4】examples包我是自己下载的，csdn上已经有大佬上传了，记得找一个日期前一点的。

二.初始化准备

初始化准备
BATCH_SIZE = 64   # 每一轮训练的数量
UNITS_SIZE = 128  # 生成器隐藏层的参数
LEARNING_RATE = 0.001  # 学习速率
EPOCH = 300            # 训练迭代轮数
SMOOTH = 0.1           # 标签平滑
读入mnist数据，理论上1.9版本之后数据集不会自动下载，但是这个代码运行的时候是会下载出数据集的。
mnist = input_data.read_data_sets('/mnist_data/', one_hot=True)

【注5】参数可以随自己修改，本地cpu的要是显卡太垃圾（和我一样的话）建议找云服务器

三.生成器代码详解

生成器
def generatorModel(noise_img, units_size, out_size, alpha=0.01):
    # 参数解析
    # noise_img:生成器生成噪声图片
    # units_size: 隐藏层单元数
    # out_size:生成器输出图片大小
    # alpha：激活函数的系数
    with tf.compat.v1.variable_scope('generator'):
        # 创建一个空间generator，使得在这个空间当中，变量可以重复使用
        # 全连接，连接输入和隐藏层
        FC = tf.compat.v1.layers.dense(noise_img, units_size)
        # 隐藏层的激活函数，之后的dropout方法是为了防止发生过拟合的现象
        reLu = tf.nn.leaky_relu(FC, alpha)
        drop = tf.compat.v1.layers.dropout(reLu, rate=0.2)
        # 全连接，连接隐藏层和输出层，输出层的激活函数选择tanh
        logits = tf.compat.v1.layers.dense(drop, out_size)
        outputs = tf.tanh(logits)
        return logits, outputs

四.判别器代码详解

判别模型
def discriminatorModel(images, units_size, alpha=0.01, reuse=False):
    # 参数详解
    # images：真实图片
    # reuse：是否重复占用空间
    with tf.compat.v1.variable_scope('discriminator', reuse=reuse):
        # 全连接
        FC = tf.compat.v1.layers.dense(images, units_size)
        # 隐藏层激活函数
        reLu = tf.nn.leaky_relu(FC, alpha)
        # 全连接，这里输出层的激活函数改为sigmoid
        logits = tf.compat.v1.layers.dense(reLu, 1)
        outputs = tf.sigmoid(logits)
        return logits, outputs

【注6】这里可以看出，判别器和生成器的主要差别在于输出层的激活函数

五.损失函数代码详解

def loss_function(real_logits, fake_logits, smooth):
    # 生成器希望判别器判别出来的标签为1; tf.ones_like()创建一个将所有元素都设置为1的张量
    G_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=fake_logits,
                                                                    labels=tf.ones_like(fake_logits) * (1 - smooth)))
    # 判别器识别生成器产出的图片，希望识别出来的标签为0
    fake_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=fake_logits,
                                                                       labels=tf.zeros_like(fake_logits)))
    # 判别器判别真实图片，希望判别出来的标签为1
    real_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=real_logits,
                                                                       labels=tf.ones_like(real_logits) * (1 - smooth)))
    # 判别器总loss
    D_loss = tf.add(fake_loss, real_loss)
    return G_loss, fake_loss, real_loss, D_loss

【注7】

tf.nn.sigmoid_cross_entropy_with_logits

这个方法对传入的参数先使用sigmoid进行计算，然后在计算他们的交叉熵损失，使得结果不会溢出。

六.优化器代码详解

优化器
def optimizer(G_loss, D_loss, learning_rate):
    # 首先获取网络结构中的参数，也就是判别器和生成器的变量，在后面的最小化损失时修改
    train_var = tf.compat.v1.trainable_variables()
    G_var = [var for var in train_var if var.name.startswith('generator')]
    D_var = [var for var in train_var if var.name.startswith('discriminator')]

    # 因为GAN中一共训练了两个网络，所以分别对G和D进行优化
    # 这里使用AdamOptimizer方法来减少损失（娘希匹的2.x这玩意怎么直接用），动态调整每个参数的学习速率。
    G_optimizer = tf.compat.v1.train.AdadeltaOptimizer(learning_rate).minimize(G_loss, var_list=G_var)
    D_optimizer = tf.compat.v1.train.AdadeltaOptimizer(learning_rate).minimize(D_loss, var_list=D_var)
    return G_optimizer, D_optimizer

七.训练代码详解

【注8】以下两个部分均定义在一个def下！

def train(mnist):
    # 前期准备，该流程和上面的逻辑顺序相同
    # 真实图片的大小
    image_size = mnist.train.images[0].shape[0]
    # 定义接收输入的方法，占位符placeholder来获得输入的数据
    real_images = tf.compat.v1.placeholder(tf.float32, [None, image_size])
    fake_images = tf.compat.v1.placeholder(tf.float32, [None, image_size])

    # 生成器参数解释
    # 将噪声，生成器隐藏层节点数，真实图片大小传入生成器（这样搞可以生成大小一样的图片）
    G_logits, G_output = generatorModel(fake_images, UNITS_SIZE, image_size)
    # 判别器：先传入参数，给真实图片打分，再给生成图片打分。
    # D对真实图像的判别
    real_logits, real_output = discriminatorModel(real_images, UNITS_SIZE)
    # D对G生成图像的判别，为其打分
    fake_logits, fake_output = discriminatorModel(G_output, UNITS_SIZE, reuse=True)

    # 计算损失函数
    G_loss, real_loss, fake_loss, D_loss = loss_function(real_logits, fake_logits, SMOOTH)
    # 优化
    G_optimizer, D_optimizer = optimizer(G_loss, D_loss, LEARNING_RATE)
    # 保存生成器变量
    saver = tf.compat.v1.train.Saver()
    step = 0

   with tf.compat.v1.Session() as session:
        # 初始化模型的参数
        session.run(tf.compat.v1.global_variables_initializer())
        for epoch in range(EPOCH):
            for batch_i in range(mnist.train.num_examples // BATCH_SIZE):
                batch_image, _ = mnist.train.next_batch(BATCH_SIZE)
                # 对图像像素进行scale，tanh的输出结果为(-1,1)，real和fake图片共享参数
                batch_image = batch_image * 2 - 1
                # 生成模型的输入噪声（图片）
                noise_image = np.random.uniform(-1, 1, size=(BATCH_SIZE, image_size))
                # 先训练生成器，在训练判别器
                session.run(G_optimizer, feed_dict={fake_images: noise_image})
                session.run(D_optimizer, feed_dict={real_images: batch_image, fake_images: noise_image})
                step = step + 1

            # 判别器D的损失（每一轮训练之后）
            loss_D = session.run(D_loss, feed_dict={real_images: batch_image, fake_images: noise_image})
            # D对真实图片（训练时）
            loss_real = session.run(real_loss, feed_dict={real_images: batch_image, fake_images: noise_image})
            # D对生成图片（训练时）
            loss_fake = session.run(fake_loss, feed_dict={real_images: batch_image, fake_images: noise_image})
            # 生成器的损失
            loss_G = session.run(G_loss, feed_dict={fake_images: noise_image})
            print('epoch:', epoch, 'loss_D:', loss_D, ' loss_real', loss_real, ' loss_fake', loss_fake, ' loss_G',
                  loss_G)
            model_path = os.getcwd() + os.sep + "mnist.model"
            # 存储
            saver.save(session, model_path, global_step=step)

八.训练模型运行结果

下面是代码成功运行的图片，300轮的化大概24分钟左右（我是垃圾显卡2g）

正如您在这里看到的，它仍然相对模糊，您只能在对代码几乎没有更改的情况下增加迭代次数。

[En]

As you can see here, it is still relatively vague, and you can only increase the number of iterations with little change to the code.

九.完整代码直接运行版

import tensorflow as tf

tf.compat.v1.disable_eager_execution()

import numpy as np
import os
from tensorflow.examples.tutorials.mnist import input_data
from matplotlib import pyplot as plt

初始化准备
BATCH_SIZE = 64  # 每一轮训练的数量
UNITS_SIZE = 128  # 生成器隐藏层的参数
LEARNING_RATE = 0.001  # 学习速率
EPOCH = 300  # 训练迭代轮数
SMOOTH = 0.1  # 标签平滑
读入mnist数据，理论上1.9版本之后数据集不会自动下载，但是这个代码运行的时候是会下载出数据集的。
mnist = input_data.read_data_sets('/mnist_data/', one_hot=True)

生成器
def generatorModel(noise_img, units_size, out_size, alpha=0.01):
    # 参数解析
    # noise_img:生成器生成噪声图片
    # units_size: 隐藏层单元数
    # out_size:生成器输出图片大小
    # alpha：激活函数的系数
    with tf.compat.v1.variable_scope('generator'):
        # 创建一个空间generator，使得在这个空间当中，变量可以重复使用
        # 全连接，连接输入和隐藏层
        FC = tf.compat.v1.layers.dense(noise_img, units_size)
        # 隐藏层的激活函数，之后的dropout方法是为了防止发生过拟合的现象
        reLu = tf.nn.leaky_relu(FC, alpha)
        drop = tf.compat.v1.layers.dropout(reLu, rate=0.2)
        # 全连接，连接隐藏层和输出层，输出层的激活函数选择tanh
        logits = tf.compat.v1.layers.dense(drop, out_size)
        outputs = tf.tanh(logits)
        return logits, outputs

判别模型
def discriminatorModel(images, units_size, alpha=0.01, reuse=False):
    # 参数详解
    # images：真实图片
    # reuse：是否重复占用空间
    with tf.compat.v1.variable_scope('discriminator', reuse=reuse):
        # 全连接
        FC = tf.compat.v1.layers.dense(images, units_size)
        # 隐藏层激活函数
        reLu = tf.nn.leaky_relu(FC, alpha)
        # 全连接，这里输出层的激活函数改为sigmoid
        logits = tf.compat.v1.layers.dense(reLu, 1)
        outputs = tf.sigmoid(logits)
        return logits, outputs

损失函数
"""
判别器的目的是：
1. 对于真实图片，D要为其打上标签1
2. 对于生成图片，D要为其打上标签0
生成器的目的是：对于生成的图片，G希望D打上标签1
"""

def loss_function(real_logits, fake_logits, smooth):
    # 生成器希望判别器判别出来的标签为1; tf.ones_like()创建一个将所有元素都设置为1的张量
    G_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=fake_logits,
                                                                    labels=tf.ones_like(fake_logits) * (1 - smooth)))
    # 判别器识别生成器产出的图片，希望识别出来的标签为0
    fake_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=fake_logits,
                                                                       labels=tf.zeros_like(fake_logits)))
    # 判别器判别真实图片，希望判别出来的标签为1
    real_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=real_logits,
                                                                       labels=tf.ones_like(real_logits) * (1 - smooth)))
    # 判别器总loss
    D_loss = tf.add(fake_loss, real_loss)
    return G_loss, fake_loss, real_loss, D_loss

优化器
def optimizer(G_loss, D_loss, learning_rate):
    # 首先获取网络结构中的参数，也就是判别器和生成器的变量，在后面的最小化损失时修改
    train_var = tf.compat.v1.trainable_variables()
    G_var = [var for var in train_var if var.name.startswith('generator')]
    D_var = [var for var in train_var if var.name.startswith('discriminator')]

    # 因为GAN中一共训练了两个网络，所以分别对G和D进行优化
    # 这里使用AdamOptimizer方法来减少损失（娘希匹的2.x这玩意怎么直接用），动态调整每个参数的学习速率。
    G_optimizer = tf.compat.v1.train.AdadeltaOptimizer(learning_rate).minimize(G_loss, var_list=G_var)
    D_optimizer = tf.compat.v1.train.AdadeltaOptimizer(learning_rate).minimize(D_loss, var_list=D_var)
    return G_optimizer, D_optimizer

训练代码
def train(mnist):
    # 前期准备，该流程和上面的逻辑顺序相同
    # 真实图片的大小
    image_size = mnist.train.images[0].shape[0]
    # 定义接收输入的方法，占位符placeholder来获得输入的数据
    real_images = tf.compat.v1.placeholder(tf.float32, [None, image_size])
    fake_images = tf.compat.v1.placeholder(tf.float32, [None, image_size])

    # 生成器参数解释
    # 将噪声，生成器隐藏层节点数，真实图片大小传入生成器（这样搞可以生成大小一样的图片）
    G_logits, G_output = generatorModel(fake_images, UNITS_SIZE, image_size)
    # 判别器：先传入参数，给真实图片打分，再给生成图片打分。
    # D对真实图像的判别
    real_logits, real_output = discriminatorModel(real_images, UNITS_SIZE)
    # D对G生成图像的判别，为其打分
    fake_logits, fake_output = discriminatorModel(G_output, UNITS_SIZE, reuse=True)

    # 计算损失函数
    G_loss, real_loss, fake_loss, D_loss = loss_function(real_logits, fake_logits, SMOOTH)
    # 优化
    G_optimizer, D_optimizer = optimizer(G_loss, D_loss, LEARNING_RATE)
    # 保存生成器变量
    saver = tf.compat.v1.train.Saver()
    step = 0

    with tf.compat.v1.Session() as session:
        # 初始化模型的参数
        session.run(tf.compat.v1.global_variables_initializer())
        for epoch in range(EPOCH):
            for batch_i in range(mnist.train.num_examples // BATCH_SIZE):
                batch_image, _ = mnist.train.next_batch(BATCH_SIZE)
                # 对图像像素进行scale，tanh的输出结果为(-1,1)，real和fake图片共享参数
                batch_image = batch_image * 2 - 1
                # 生成模型的输入噪声（图片）
                noise_image = np.random.uniform(-1, 1, size=(BATCH_SIZE, image_size))
                # 先训练生成器，在训练判别器
                session.run(G_optimizer, feed_dict={fake_images: noise_image})
                session.run(D_optimizer, feed_dict={real_images: batch_image, fake_images: noise_image})
                step = step + 1

            # 判别器D的损失（每一轮训练之后）
            loss_D = session.run(D_loss, feed_dict={real_images: batch_image, fake_images: noise_image})
            # D对真实图片（训练时）
            loss_real = session.run(real_loss, feed_dict={real_images: batch_image, fake_images: noise_image})
            # D对生成图片（训练时）
            loss_fake = session.run(fake_loss, feed_dict={real_images: batch_image, fake_images: noise_image})
            # 生成器的损失
            loss_G = session.run(G_loss, feed_dict={fake_images: noise_image})
            print('epoch:', epoch, 'loss_D:', loss_D, ' loss_real', loss_real, ' loss_fake', loss_fake, ' loss_G',
                  loss_G)
            model_path = os.getcwd() + os.sep + "mnist.model"
            # 存储
            saver.save(session, model_path, global_step=step)

def main(argv=None):
    train(mnist)

if __name__ == '__main__':
    tf.compat.v1.app.run()

Original: https://blog.csdn.net/qq_40981869/article/details/122379993
Author: 物理系的计算机选手
Title: 生成式对抗网络实战（一）——手写数字生成（CPU本地版）完整代码加详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/509023/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

YOLOv5环境配置

yolov5环境配置因为项目要求，本文主要使用anaconda ，pycharm，安装包使用GPU版本暂时更新到安装包，所以其实一点yolov5的内容都还莫得安装anacond…

人工智能 2023年7月21日
0062
CANopen协议学习笔记

大纲前沿：以问题为导向学习是最高效的，本文主要讲述在学习Canopen协议中的一些疑惑点，分享一些学习心得，不讲协议本身的内容。 1.主机和从机的概念？ 2.PDO和SDO的区…

人工智能 2023年6月28日
00112
pytorch初学笔记（一）：如何加载数据和Dataset实战

目录一、Dataset初识以及项目前期准备工作二、MyData类 2.1 在python中定义类和方法 2.2 定义MyClass类 Dataset 2.3 获取图片 2.4 …

人工智能 2023年7月21日
0074
C#操作modbus

modbus使用范围广泛，广泛应用于各类仪表，PLC等。 modbus的好处是免费，属于应用层协议，底层硬件基于485/以太网。 modbus协议本质还是自定义协议。 modbus…

人工智能 2023年6月30日
0076
机器学习-决策树算法ID3实现，含例子(红酒分类）

决策树原理实现代码如下所示：（参考自机器学习实践 Peter Harrington)。 import math x=[[0,1,"no"],[0,1,&quot…

人工智能 2023年6月30日
0094
1、Python常见问题：pyinstaller打包的各种异常及其解决方案

随着自己工作的进行，接触到的技术栈也越来越多。给我一个很直观的感受就是，某一项技术/经验在刚开始接触的时候都记得很清楚。往往过了几个月都会忘记的差不多了，只有经常会用到的东西才有可…

人工智能 2023年7月6日
0058
AI绘画Stable Diffusion关键词分享

AI绘画平台地址 https://ai.feilianyun.cn/ 梵高星空关键字：Van Gogh’s paintings，Starry sky in a for…

人工智能 2023年7月30日
0057
中国汽车音响行业竞争分析及十四五发展潜力评估报告2022-2028年版

中国汽车音响行业竞争分析及十四五发展潜力评估报告2022-2028年版第1章：中国汽车音响行业发展综述1.1 汽车音响行业相关概述 1.1.1 汽车音响行业定义 1.1.2 汽车…

人工智能 2023年6月11日
0061
预测模型构建利器——基于logistic的列线图（R语言）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月1日
0079
毕设–基于深度学习的人脸识别（详细步骤）

最近闲来无事，想写一个本人毕设基于深度学习的人脸识别文章。我主要利用两个不同的神经网络进行实现，分别是一个简单三层的卷积神经网络和结构复杂的VGG16神经网络，并比对了两种网络训练…

人工智能 2023年5月23日
0079
sklearn_Lasso与多项式回归_菜菜视频学习笔记

lasso与多项式回归 1 Lasso与多重共线性 * 1.1 Lasso 强大的特征选择能力 1.2 选取最佳正则化参数 2. 非线性问题：多项式回归 * 2.1 使用分箱处理非…

人工智能 2023年6月18日
0057
【项目实战】基于Python实现xgboost回归模型(XGBRegressor)项目实战

说明：这是一个机器学习实战项目（附带数据+代码+文档+代码讲解），如需数据+代码+文档+代码讲解可以直接到文章最后获取。 1.项目背景随着大数据时代的到来，具备大数据思想至关…

人工智能 2023年6月16日
0055
sklearn逻辑回归:参数详解

一.入参说明 (一)入参分类与使用 (二)入参详细列表二.模型训练三.模型训练后的方法与属性 (一) 方法 (二) 属性本文讲述sklearn逻辑回归参数详解一.入参说明 …

人工智能 2023年6月15日
00130
python 爬取七普人口并展示人口区间的概率分布

爬虫常用的库：requests,beautifulsoup,urllib2,scrapy等，本次主要用requests库以及正则表达式提取关键信息。正态分布有一个非常重要的性质：…

人工智能 2023年7月16日
0055
IDEA配置Maven

文章目录一、Maven下载&环境配置 * 1.下载Maven 2.解压 3.配置环境变量 4.测试二、更改Maven中的设置 * 1.编辑settings.xml 2….

人工智能 2023年7月29日
0067
YOLOV7:OSError: [WinError 1455] 页面文件太小，无法完成操作的最终解决方案

目录 1.问题描述： 2.现有的解决方案（1）重启电脑（试过了，但是没用）（2）重启pycharm(成本很低，可以试一下，但是依然没用) （3）最火热的一种说法是设置num_w…

人工智能 2023年7月21日
0078

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

生成式对抗网络实战（一）——手写数字生成（CPU本地版）完整代码加详解

大家都在看