[Python人工智能] 三十八.Keras构建无监督学习Autoencoder模型及MNIST聚类可视化详解

2023年5月31日上午7:16 • 人工智能 • 阅读 77

从本专栏开始，作者正式研究Python深度学习、神经网络及人工智能相关知识。前一篇文章详细讲解了基于Transformer的商品评论情感分析案例。本篇文章将分享无监督学习Autoencoder的原理知识，然后介绍Keras构建自编码的案例，即通过MNIST手写数字案例进行对比实验及聚类分析，运行效果如下图所示。基础性文章，希望对您有所帮助！

[Python人工智能] 三十八.Keras构建无监督学习Autoencoder模型及MNIST聚类可视化详解

本专栏主要结合作者之前的博客、AI经验和莫烦老师的视频（强推”莫烦大神”视频）及论文介绍，后面随着深入会讲解更多的Python人工智能案例及应用。基础性文章，希望对您有所帮助，如果文章中存在错误或不足之处，还请海涵！作者作为人工智能的菜鸟，希望大家能与我在这一笔一划的博客中成长起来。写了这么多年博客，尝试第一个付（打）费（赏）专栏，为小宝赚点奶粉钱，其实github和公众号都已免费开源，且作者更多的博客尤其基础性文章，一直是免费分享。该专栏也会用心撰写，望对得起读者。如果有问题随时私聊我，只望您能从这个系列中学到知识，一起加油喔~

Keras下载地址：https://github.com/eastmountyxz/AI-for-Keras
TensorFlow下载地址：https://github.com/eastmountyxz/AI-for-TensorFlow

前文赏析：

; 一.什么是Autoencoder

自编码器（autoencoder, AE）是一类在半监督学习和非监督学习中使用的人工神经网络（Artificial Neural Networks, ANNs），其功能是通过将输入信息作为学习目标，对输入信息进行表征学习（representation learning）。自编码器包含编码器（encoder）和解码器（decoder）两部分。

(1) 首先，什么是自编码（Autoencoder）？
自编码是一种神经网络的形式，注意它是无监督学习算法。例如现在有一张图片，需要给它打码，然后又还原图片的过程，如下图所示：

一张图片经过压缩再解压的工序，当压缩时原有的图片质量被缩减，当解压时用信息量小却包含所有关键性文件恢复出原来的图片。为什么要这么做呢？有时神经网络需要输入大量的信息，比如分析高清图片时，输入量会上千万，神经网络从上千万中学习是非常难的一个工作，此时需要进行压缩，提取原图片中具有代表性的信息或特征，压缩输入的信息量，再把压缩的信息放入神经网络中学习。这样学习就变得轻松了，所以自编码就在这个时候发挥作用。

如下图所示，将原数据白色的X压缩解压成黑色的X，然后通过对比两个X，求出误差，再进行反向的传递，逐步提升自编码的准确性。

训练好的自编码，中间那部分就是原数据的精髓，从头到尾我们只用到了输入变量X，并没有用到输入变量对应的标签，所以自编码是一种无监督学习算法。

但是真正使用自编码时，通常只用到它的前半部分，叫做编码器，能得到原数据的精髓。然后只需要创建小的神经网络进行训练，不仅减小了神经网络的负担，而且同样能达到很好的效果。

(2) 自编码器的计算过程
在真实场景中，自编码器会不断计算原始数据和重构数据之间的误差，再反向传递提升自编码器的准确性，由于整个过程没有用到输入数据对应的标签，因此自编码器是一种无监督学习算法。自编码器的关键是编码器和解码器，假设给定输入空间和特征空间，自编码器求解两者的映射f和g，使得输入特征的重构误差最小，其计算过程如下：

下图是自编码整理出来的数据，它能总结出每类数据的特征，如果把这些数据放在一张二维图片上，每一种数据都能很好的用其精髓把原数据区分开来。自编码能类似于PCA（主成分分析）一样提取数据特征，也能用来降维，其降维效果甚至超越了PCA。

(3) 自编码器的应用场景
自编码器具有一般意义上表征学习算法的功能，常用场景包括：

降维（dimensionality reduction）
异常值检测（anomaly detection）
文本聚类
数据去燥
图像修复
信道压缩与重建
信息检索
…

自编码器在其研究早期是为解决表征学习中的”编码器问题（encoder problem）”，即基于神经网络的降维问题而提出的联结主义模型的学习算法。1985年，David H. Ackley、Geoffrey E. Hinton和Terrence J. Sejnowski在玻尔兹曼机上对自编码器算法进行了首次尝试，并通过模型权重对其表征学习能力进行了讨论。在1986年反向传播算法（Back-Propagation, BP）被正式提出后，自编码器算法作为BP的实现之一，即”自监督的反向传播（Self-supervised BP）”得到了研究，并在1987年被Jeffrey L. Elman和David Zipser用于语音数据的表征学习试验。

自编码器作为一类神经网络结构（包含编码器和解码器两部分）的正式提出，来自1987年Yann LeCun发表的研究。LeCun (1987)使用多层感知器（Multi-Layer Perceptron, MLP）构建了包含编码器和解码器的神经网络，并将其用于数据降噪。此外，在同一时期，Bourlard and Kamp (1988)使用MLP自编码器对数据降维进行的研究也得到了关注。1994年，Hinton和Richard S. Zemel通过提出”最小描述长度原理（Minimum Description Length principle, MDL）”构建了第一个基于自编码器的生成模型。
——百度百科 https://baike.baidu.com/item/自编码器/23686966

二.Autoencoder分析MNIST数据

Autoencoder算法属于非监督学习，它是把数据特征压缩，再把压缩后的特征解压的过程，跟PCA降维压缩类似。本篇文章的代码包括两部分内容：

第一部分：使用MNIST数据集，通过feature的压缩和解压，对比解压后的图片和压缩之前的图片，看看是否一致，实验想要的效果是和图片压缩之前的差不多。
第二部分：输出encoder的结果，压缩至两个元素并可视化显示。在显示图片中，相同颜色表示同一类型图片，比如类型为1（数字1），类型为2（数字2）等等，最终实现无监督的聚类。

有监督学习和无监督学习的区别：
(1) 有监督学习方法必须要有训练集与测试样本。在训练集中找规律，而对测试样本使用这种规律。而 非监督学习没有训练集，只有一组数据，在该组数据集内寻找规律。
(2) 有监督学习的方法就是识别事物，识别的结果表现在给待识别数据加上了标签。因此训练样本集必须由带标签的样本组成。而 非监督学习方法只有要分析的数据集的本身，预先没有什么标签。 如果发现数据集呈现某种聚集性，则可按自然的聚集性分类，但不予以某种预先分类标签对上号为目的。

让我们开始编写代码吧！采用Keras构建。

第一步，打开Anaconda，然后选择已经搭建好的”tensorflow”环境，运行Spyder。

第二步，导入扩展包。

import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Model
from keras.layers import Dense, Input
import matplotlib.pyplot as plt

第三步，下载数据集。
由于MNIST数据集是TensorFlow的示例数据，所以我们只需要下面一行代码，即可实现数据集的读取工作。如果数据集不存在它会在线下载，如果数据集已经被下载，它会被直接调用。

注意，仅使用x数据集


(x_train, _), (x_test, y_test) = mnist.load_data()
print(x_train.shape, x_test.shape, _.shape, y_test.shape)

输出结果如下，MNIST图片是28*28的像素，包括6万张训练集和1万张测试集。

(60000, 28, 28) (10000, 28, 28) (60000,) (10000,)

第四步，数据预处理。
通过minmax_normalized处理至(-0.5,0.5)区间，再修改其形状。


x_train = x_train.astype('float32') / 255. - 0.5
x_test = x_test.astype('float32') / 255. - 0.5
x_train = x_train.reshape((x_train.shape[0], -1))
x_test = x_test.reshape((x_test.shape[0], -1))
print(x_train.shape, x_test.shape)

输出如下：

(60000, 784) (10000, 784)

第五步，编写核心代码，即定义encoder和decoder函数来实现压缩和解压操作。
整个自编码器的输入特征为784，feature不断压缩，先压缩成128个，再经过一层隐藏层压缩到64个，再压缩至10，最终压缩成两维特征（方便可视化聚类）。然后把2个特征依次放大，最终解压成784个。最后对解压的784个和原始的784个特征进行cost对比，并根据cost提升Autoencoder的准确率。


encoding_dim = 2

input_img = Input(shape=(784,))

encoded = Dense(128, activation='relu')(input_img)
encoded = Dense(64, activation='relu')(encoded)
encoded = Dense(10, activation='relu')(encoded)
encoder_output = Dense(encoding_dim,)(encoded)

decoded = Dense(10, activation='relu')(encoder_output)
decoded = Dense(64, activation='relu')(decoded)
decoded = Dense(128, activation='relu')(decoded)
decoded = Dense(784, activation='tanh')(decoded)

关键代码解析如下，encoder和decoder均包括四层，具体含义为：

encoded = Dense(128, activation=’relu’)(input_img)
利用Dense构造Encoder层，其输出值为128，输入值为input_img
encoded = Dense(64, activation=’relu’)(encoded)
第二层的输出是64，输入是上一个构建的encoded
encoded = Dense(10, activation=’relu’)(encoded)
第三层压缩至10
encoder_output = Dense(encoding_dim,)(encoded)
最后构建需要的自编码压缩器，压缩成2个值，它能代表整个784个特征，并且可用于聚类

通常Encoder怎么构建，Decoder也对应反向构建，实现解压处理，重构至784个特征，关键代码如下：

decoded = Dense(10, activation=’relu’)(encoder_output)
decoded = Dense(64, activation=’relu’)(decoded)
decoded = Dense(128, activation=’relu’)(decoded)
decoded = Dense(784, activation=’tanh’)(decoded)
由于输入值是(-0.5,0.5)，而使用tanh激活函数的范围是(-1,1)，因此实现对应效果

第六步，构造自编码器模型，同时构建encoder模型进行可视化分析。


autoencoder = Model(inputs=input_img, outputs=decoded)

encoder = Model(inputs=input_img, outputs=encoder_output)

autoencoder.compile(optimizer='adam', loss='mse')

第七步，训练、测试和可视化代码，该部分为神经网络运行的核心代码。
输入和输出均是x_train，对比二者形成误差。可视化包括：

调用matplotlib库画图，可视化对比原始图像和预测图像
压缩结果聚类分析


autoencoder.fit(x_train,
                x_train,
                epochs=20,
                batch_size=256,
                shuffle=True)

encoded_imgs = encoder.predict(x_test)
decoded_imgs = autoencoder.predict(x_test)

f, a = plt.subplots(2, 10, figsize=(10, 2))
for i in range(10):
    a[0][i].imshow(np.reshape(x_test[i], (28, 28)))
    a[1][i].imshow(np.reshape(decoded_imgs[i], (28, 28)))
plt.show()

plt.scatter(encoded_imgs[:,0], encoded_imgs[:,1], c=y_test)
plt.colorbar()
plt.show()

运行结果如下所示：

(60000, 28, 28) (10000, 28, 28) (60000,) (10000,)
(60000, 784) (10000, 784)
Epoch 1/20
235/235 [==============================] - 2s 5ms/step - loss: 0.0697
Epoch 2/20
235/235 [==============================] - 1s 6ms/step - loss: 0.0564
Epoch 3/20
235/235 [==============================] - 1s 5ms/step - loss: 0.0516
Epoch 4/20
235/235 [==============================] - 1s 6ms/step - loss: 0.0493
Epoch 5/20
235/235 [==============================] - 1s 6ms/step - loss: 0.0475
Epoch 6/20
235/235 [==============================] - 1s 5ms/step - loss: 0.0462
Epoch 7/20
235/235 [==============================] - 1s 6ms/step - loss: 0.0453
Epoch 8/20
235/235 [==============================] - 1s 5ms/step - loss: 0.0446
Epoch 9/20
235/235 [==============================] - 1s 5ms/step - loss: 0.0439
Epoch 10/20
235/235 [==============================] - 2s 6ms/step - loss: 0.0432
Epoch 11/20
235/235 [==============================] - 2s 7ms/step - loss: 0.0427
Epoch 12/20
235/235 [==============================] - 2s 7ms/step - loss: 0.0421
Epoch 13/20
235/235 [==============================] - 2s 7ms/step - loss: 0.0418
Epoch 14/20
235/235 [==============================] - 2s 7ms/step - loss: 0.0414
Epoch 15/20
235/235 [==============================] - 2s 8ms/step - loss: 0.0411
Epoch 16/20
235/235 [==============================] - 2s 8ms/step - loss: 0.0409
Epoch 17/20
235/235 [==============================] - 2s 6ms/step - loss: 0.0406
Epoch 18/20
235/235 [==============================] - 2s 7ms/step - loss: 0.0404
Epoch 19/20
235/235 [==============================] - 2s 7ms/step - loss: 0.0401
Epoch 20/20
235/235 [==============================] - 2s 7ms/step - loss: 0.0400

通过20批训练，显示结果如下图所示，上面是真实的原始图像，下面是压缩之后再解压的图像数据。

聚类显示结果如下图所示，它将不同颜色的分在一堆，对应不同的数字。

三.完整代码

最后给出完整代码，也希望读者能将自编码器应用到更多场景中。同时，整个聚类结果还有待改善，因为这只是Autoencoder的一个简单例子。希望这篇文章能够帮助博友们理解和认识无监督学习和Autoencoder算法，后续作者会更深入的分享好案例。


import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Model
from keras.layers import Dense, Input
import matplotlib.pyplot as plt

(x_train, _), (x_test, y_test) = mnist.load_data()
print(x_train.shape, x_test.shape, _.shape, y_test.shape)

x_train = x_train.astype('float32') / 255. - 0.5
x_test = x_test.astype('float32') / 255. - 0.5
x_train = x_train.reshape((x_train.shape[0], -1))
x_test = x_test.reshape((x_test.shape[0], -1))
print(x_train.shape, x_test.shape)

encoding_dim = 2

input_img = Input(shape=(784,))

encoded = Dense(128, activation='relu')(input_img)

encoded = Dense(64, activation='relu')(encoded)

encoded = Dense(10, activation='relu')(encoded)

encoder_output = Dense(encoding_dim,)(encoded)

decoded = Dense(10, activation='relu')(encoder_output)
decoded = Dense(64, activation='relu')(decoded)
decoded = Dense(128, activation='relu')(decoded)

decoded = Dense(784, activation='tanh')(decoded)

autoencoder = Model(inputs=input_img, outputs=decoded)

encoder = Model(inputs=input_img, outputs=encoder_output)

autoencoder.compile(optimizer='adam', loss='mse')

autoencoder.fit(x_train,
                x_train,
                epochs=20,
                batch_size=256,
                shuffle=True)

encoded_imgs = encoder.predict(x_test)
decoded_imgs = autoencoder.predict(x_test)

f, a = plt.subplots(2, 10, figsize=(10, 2))
for i in range(10):
    a[0][i].imshow(np.reshape(x_test[i], (28, 28)))
    a[1][i].imshow(np.reshape(decoded_imgs[i], (28, 28)))
plt.show()

plt.scatter(encoded_imgs[:,0], encoded_imgs[:,1], c=y_test)
plt.colorbar()
plt.show()

四.总结

写到这里，本文介绍就完了，更多深度学习文章会继续分享，接下来我们会分享迁移学习、GAN、机器翻译、NER、文本识别、图像识别、语音识别等内容。如果读者有什么想学习的，也可以私聊我，我去学习并应用到您的领域。

最后，希望这篇基础性文章对您有所帮助，如果文章中存在错误或不足之处，还请海涵~作为人工智能的菜鸟，我希望自己能不断进步并深入，后续将它应用于图像识别、网络安全、对抗样本等领域，指导大家撰写简单的学术论文，一起加油！

下载地址：

(By:Eastmount 2022-08-23 夜于武汉 http://blog.csdn.net/eastmount/ )

参考文献：
[1] 杨秀璋, 颜娜. Python网络数据爬取及分析从入门到精通（分析篇）[M]. 北京：北京航天航空大学出版社, 2018.

[2] “莫烦大神” 网易云视频地址
[3] https://study.163.com/course/courseLearn.htm?courseId=1003209007
[4] https://github.com/siucaan/CNN_MNIST
[5] https://github.com/eastmountyxz/AI-for-TensorFlow
[6]《机器学习》周志华
[7] 深度学习（07）RNN-循环神经网络-02-Tensorflow中的实现 – 莫失莫忘Lawlite
[8] https://github.com/lawlite19/DeepLearning_Python

Original: https://blog.csdn.net/Eastmount/article/details/126476787
Author: Eastmount
Title: [Python人工智能] 三十八.Keras构建无监督学习Autoencoder模型及MNIST聚类可视化详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/549682/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

第五课：回归分析

目录一线性回归 1.理论 2.代码二非线性回归 1.理论三 Nonparametric methods 3.1理论 3.2Decision Trees 3.3代码四 …

人工智能 2023年6月17日
0074
【论文阅读】Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction

《Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction》论文来源：EMNLP2020 论…

人工智能 2023年6月1日
0061
linux操作系统安装显卡驱动教程与CUDA及cudnn安装教程

我尝试多个网络博客教程，或多或少都会出错，特别安装显卡驱动，最终找到一篇较好博客，我已将链接附在文末，也将安装方法进行记录，供读者参考。我的反思：显卡驱动不好安装，可查看是否安装…

人工智能 2023年6月4日
0049
Pytorch导出onnx模型，C++转化为TensorRT并实现推理过程

1 Pytorch模型推理测试导出onnx 这部分我们使用 torchvision 实例化一个简单的 ResNet50 分类模型，并将其导出为 onnx 模型。在这个过程中，我们还…

人工智能 2023年6月16日
0076
CloneNotSupportedException的解决方案 + Object的clone方法分析

主要是介绍各种格式流行的软件设计模式，对于程序员的进一步提升起推进作用，有时间可以随便翻翻~~ 23种设计模式汇集如果你还不了解设计模式是什么的话？那就先看设计模式引言 ! 学…

人工智能 2023年6月26日
0095
基于Halcon的图像增强算子以及分类例程汇总

摘要图像增强就是指通过某种图像处理方法对退化的某些图像特征，如边缘、轮廓、对比度等进行处理，以改善图像的视觉效果，提高图像的清晰度，或是突出图像中的某些”有用&#82…

人工智能 2023年6月30日
0060
CSDN竞赛14期·12月11日考试

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月30日
0035
python pandas 分割DataFrame中的字符串及元组

python pandas 分割DataFrame中的字符串类型数据的方法文章目录 1.使用str.split()方法 2.使用join()与split()方法结合 3. 使用a…

人工智能 2023年7月8日
00129
软件项目管理–进度计划

软件项目管理–进度计划项目初始–项目计划–项目执行控制–项目结束项目计划：范围计划成本计划进度计划质量计划配置管理计划人员与沟通计划风险计划合同计划集成计划 …

人工智能 2023年6月29日
0054
基于泰尔森回归的股票预测研究

基于泰尔森回归的股票预测研究绪论 * 背景目的流程主要内容 * 数据获取与数据存储数据调取以及案例数据分析模型比较分析 – 2.3.1 模型初始化 2.3….

人工智能 2023年6月18日
0074
Maven安装与配置，Idea配置Maven

回答1： Mac 的步骤如下： 1. 首先，需要在Mac上安装。可以通过Homebrew或手动下载安装包的方式进行安装。如果使用Homebrew，可以在终端中输入以下命令： br…

人工智能 2023年7月31日
0047
【数值预测案例】(3) LSTM 时间序列电量预测，附Tensorflow完整代码

大家好，今天和各位分享一下如何使用循环神经网络LSTM完成时间序列预测，本文是针对单个特征的预测，下一篇是对多个特征的预测。文末有完整代码 1. 导入工具包这里使用GPU加速计…

人工智能 2023年6月16日
0051
【ROS进阶篇】第八讲（上） URDF文件的语法详解

【ROS进阶篇】第八讲（上） URDF文件的语法详解文章目录【ROS进阶篇】第八讲（上） URDF文件的语法详解前言 * 一、URDF的基本概念二、link标签 &#821…

人工智能 2023年6月24日
0055
莫烦Tensorflow学习笔记（10-12）——构建简单的神经网络及其可视化

本笔记基于莫烦python的Tensorflow教程个人认为莫烦大神的视频教程不适合零基础的小白，如果是小白可以先观看李宏毅或者吴恩达的视频或者直接看书。莫烦大神的教程适合对深度…

人工智能 2023年5月25日
0068
【论文精读】TransE 及其实现

TransE 及其实现 1. What is TransE? TransE (Translating Embedding), an energy-based model for l…

人工智能 2023年7月27日
0052
故障预测方法分类

故障预测算法分类故障预测算法分为三类：基于模型(model-driven)的故障预测技术；基于数据驱动(data—driven)的故障预测技术；基于统计可靠性的故障预测技术…

人工智能 2023年7月28日
0045

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

[Python人工智能] 三十八.Keras构建无监督学习Autoencoder模型及MNIST聚类可视化详解

大家都在看