深度学习笔记：卷积神经网络的可视化–特征图

2023年6月16日下午3:18 • 人工智能 • 阅读 96

3.3 例化一个模型用于返回各层激活输出（即feature map）

3.5 各层各通道汇总可视化

4. 小结

参考文献

前言

人们常说，深度学习模型是”黑盒”，即模型学到的东西对于人类来说很难理解。对于很多深度学习模型来说的确是这样的，但是对于卷积神经网络（CNN）却并不尽然。CNN学习到的东西非常适合于可视化，因为它就是学习关于视觉概念的表示！自CNN诞生以来，人们已经开发了很多种技术来对卷积神经网络学习到的东西进行可视化和解释。其中最容易理解也最有用是以下三种：

特征图的可视化。特征图即中间激活层的输出。这个有助于理解CNN的各层如何对输入进行变换，也有助于初步了解CNN中每个过滤器的含义
过滤器的可视化。有助于精确理解CNN中每个过滤器对应的视觉模式或视觉概念
热力图的可视化。将图像中类激活的热力图可视化有助于理解图像的哪个部分被识别为属于哪个类别，从而可以定位图像中的物体

本篇我们先看看特征图的可视化。

特征图的可视化，是指对于给定输入图像，展示模型处理后的各中间层（包括卷积层和池化层等）输出的特征图（各中间层的激活函数的输出代表该层特征图）。这让我们可以看到输入数据在网络中是如何被分解，不同滤波器分别聚焦于原始图像的什么方面的信息。我们希望在三个维度对特征图进行可视化：宽度、高度和深度（通道，channel）。每个通道都对应相对独立的特征。所以将这些特征图可视化的正确方法是将每个通道的内容分别会支持成二维图像。

模型的训练

采用之前训练过的一个模型，参见””。事实上，如果在之前的训练中把这个模型存储下来了的话，可以直接加载已存储的模型而不必重复训练。这个把数据处理到模型训练的代码重新贴一遍只是为了保持本文自身的完备性。详细解说可以参考：利用数据增强在小数据集上从头训练卷积神经网络

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras import utils
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
print(tf.__version__)

数据集准备

def make_subset(subset_name, start_index, end_index):
    for category in ("cat", "dog"):
        dir = new_base_dir / subset_name / category
        src_dir = original_dir / category
        print(dir)
        os.makedirs(dir)
        fnames = [f"{i}.jpg" for i in range(start_index, end_index)]
        for fname in fnames:
            shutil.copyfile(src=src_dir / fname, dst=dir / fname)
import os, shutil, pathlib

original_dir = pathlib.Path("F:\DL\cats-vs-dogs")
new_base_dir = pathlib.Path("F:\DL\cats_vs_dogs_small")

#print(original_dir, new_base_dir)

start_index = np.random.randint(0,8000)
end_index   = start_index + 1000

start_index3 = end_index
end_index3   = start_index3 + 500

if os.path.exists(new_base_dir):
    shutil.rmtree(new_base_dir)

make_subset("train", start_index=start_index, end_index=end_index)
make_subset("test", start_index=start_index3, end_index=end_index3)

模型搭建

inputs = keras.Input(shape=(180, 180, 3))
x = layers.Conv2D(filters=32, kernel_size=3, activation="relu")(inputs)
x = layers.MaxPooling2D(pool_size=2)(x)
x = layers.Conv2D(filters=64, kernel_size=3, activation="relu")(x)
x = layers.MaxPooling2D(pool_size=2)(x)
x = layers.Conv2D(filters=128, kernel_size=3, activation="relu")(x)
x = layers.MaxPooling2D(pool_size=2)(x)
x = layers.Conv2D(filters=256, kernel_size=3, activation="relu")(x)
x = layers.MaxPooling2D(pool_size=2)(x)
x = layers.Conv2D(filters=256, kernel_size=3, activation="relu")(x)
x = layers.Flatten()(x)
x = layers.Dropout(0.5)(x)
outputs = layers.Dense(1, activation="sigmoid")(x)
model = keras.Model(inputs=inputs, outputs=outputs)
model.summary()
Configuring the model for training
model.compile(loss="binary_crossentropy",optimizer="rmsprop",metrics=["accuracy"])

数据预处理及数据增强

import os
from tensorflow.keras.preprocessing.image import ImageDataGenerator

batch_size = 32
train_dir = os.path.join('F:\DL\cats_vs_dogs_small', 'train')
test_dir = os.path.join('F:\DL\cats_vs_dogs_small', 'test')
train_datagen = ImageDataGenerator(rescale=1./255,validation_split=0.3,
      rotation_range=40,
      width_shift_range=0.2,
      height_shift_range=0.2,
      shear_range=0.2,
      zoom_range=0.2,
      horizontal_flip=True,
      fill_mode='nearest'
                                  )

test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
    directory=train_dir,
    target_size=(180, 180),
    color_mode="rgb",
    batch_size=batch_size,
    class_mode="binary",
    subset='training',
    shuffle=True,
    seed=42
)
valid_generator = train_datagen.flow_from_directory(
    directory=train_dir,
    target_size=(180, 180),
    color_mode="rgb",
    batch_size=batch_size,
    class_mode="binary",
    subset='validation',
    shuffle=True,
    seed=42
)
test_generator = test_datagen.flow_from_directory(
    directory=test_dir,
    target_size=(180, 180),
    color_mode="rgb",
    batch_size=batch_size,
    class_mode='binary',
    shuffle=False,
    seed=42
)

模型训练和保存

callbacks = [
    keras.callbacks.ModelCheckpoint(
        filepath="convnet_from_scratch_with_augmentation.keras",
        save_best_only=True,
        monitor="val_loss")
]
history = model.fit(
    x = train_generator,
    validation_data=valid_generator,
    steps_per_epoch = train_generator.n//train_generator.batch_size,
    validation_steps = valid_generator.n//valid_generator.batch_size,
    epochs=100,
    callbacks=callbacks)

训练完以后，大致可以得到在验证集上接近80%的分类准确度。并且训练完的模型被存为文件”convnet_from_scratch_with_augmentation.keras”，以供后续直接加载使用。

特征图可视化

3.1 加载保存的模型 ¶

model = keras.models.load_model("convnet_from_scratch_with_augmentation.keras")
model.summary()

3.2 图像预处理：将图像转换为张量

img_path = "F:/DL/cats-vs-dogs/Dog/24.jpg"
def get_img_array(img_path, target_size):
    img = keras.preprocessing.image.load_img(
        img_path, target_size=target_size)
    array = keras.preprocessing.image.img_to_array(img)
    array = np.expand_dims(array, axis=0)
    return array

img_tensor = get_img_array(img_path, target_size=(180, 180))
print(img_tensor.shape)

Displaying the test picture
import matplotlib.pyplot as plt
plt.axis("off")
plt.imshow(img_tensor[0].astype("uint8"))
plt.show()

3.3 例化一个模型用于返回各层激活输出（即feature map）

为了提取想要查看的特征图，我们需要创建一个Keras模型，以图像批量作为输入，并输出所有卷积层和池化层的激活。为此，我们需要使用Keras的Model类，模型的实例化需要两个参数，一个是输入张量（或输入张量列表），一个是输出张量（或输出张量列表）。得到的对象就是一个Keras模型，和之前的Sequential模型一样，将特定输入映射为特定输出。Model类运行多个输出，这个和Sequential类不同。

以下模型接收一张图像输入，将返回原始模型所有各卷积层和池化层的输出。可以理解为这个模型就是原有模型的一个wrapper（套了一层皮），这样我们就可以方便地将所有想观测的中间信息全部引出来。其中，由语句”isinstance(layer, (layers.Conv2D, layers.MaxPooling2D))”进行过滤提取卷积层和池化层。实际上，池化层的输出应该与其前面的卷积层输出大同小异，所以在以下代码将池化层也滤除掉了。

from tensorflow.keras import layers

layer_outputs = []
layer_names = []
for layer in model.layers:
    #if isinstance(layer, (layers.Conv2D, layers.MaxPooling2D)):
    if isinstance(layer, layers.Conv2D):
        layer_outputs.append(layer.output)
        layer_names.append(layer.name)
activation_model = keras.Model(inputs=model.input, outputs=layer_outputs)
print('There are totally {} layers in this model'.format(len(layer_names)))

原始模型总共有13层，其中有5层卷积层和4层池化层。

使用这个模型计算并输出中间层输出，看看第一个卷积层输出的几个通道的数据的显示效果。

import matplotlib.pyplot as plt

activations = activation_model.predict(img_tensor)
确认输出结果的shape与前面model.summary()给出的信息是一致的
first_layer_activation = activations[0]
print(first_layer_activation.shape)

fig, ax = plt.subplots(1,4,figsize=(12,16))
ax[0].matshow(first_layer_activation[0, :, :, 0], cmap="viridis")
ax[1].matshow(first_layer_activation[0, :, :, 5], cmap="viridis")
ax[2].matshow(first_layer_activation[0, :, :, 11], cmap="viridis")
ax[3].matshow(first_layer_activation[0, :, :, 24], cmap="viridis")

3.5 各层各通道汇总可视化

以下代码将所有各层的各个通道的输出均以二维图像的方式汇总画出。

images_per_row = 16 # 每行16个小图
for layer_name, layer_activation in zip(layer_names, activations):
    print(layer_name)
    n_features = layer_activation.shape[-1] # Number of features, i.e, channels of the current layer output.

    size = layer_activation.shape[1]
    n_cols = n_features // images_per_row   # n_cols should be 'number of plots per column', i.e, number of rows.

    display_grid = np.zeros(((size + 1) * n_cols - 1,images_per_row * (size + 1) - 1))
    for col in range(n_cols):
        for row in range(images_per_row):
            channel_index = col * images_per_row + row
            channel_image = layer_activation[0, :, :, channel_index].copy()
            if channel_image.sum() != 0: #数据处理，使其适合于作为图像展示
                channel_image -= channel_image.mean()
                channel_image /= channel_image.std()
                channel_image *= 64
                channel_image += 128
            channel_image = np.clip(channel_image, 0, 255).astype("uint8")
            display_grid[
                col * (size + 1): (col + 1) * size + col,
                row * (size + 1) : (row + 1) * size + row] = channel_image
    scale = 1. / size
    plt.figure(figsize=(scale * display_grid.shape[1],
                        scale * display_grid.shape[0]))
    plt.title(layer_name)
    plt.grid(False)
    plt.axis("off")
    plt.imshow(display_grid, aspect="auto", cmap="viridis")

从以上结果中可以看出：

第一层是各种边缘检测器的集合，在这一阶段，激活输出几乎保留了原始图像的所有信息
随着层数的加深，激活输出变得越来越抽象。conv2d_3的输出已经超出了人类直观理解的范围。可以这样理解，随着层数的加深，关于图像视觉内容信息越来越少，而关于类别的信息就越来越多
激活的稀疏度(sparsity)随着层数的加深而增大。在第一层中，所有滤波器都被输入图像所激活（体现为对应通道有有效的图像信息），而随着层数加深，越来越多的通道对应的图示为空，表明没有被激活，即输入图像中没有找到这些过滤器所习得（编码）的模式。
小结

以上实验揭示了深度神经网络学到的表示的一个重要的普遍特征：随着层数的加深，层所提取的特征变得越来越抽象，关于特定输入的信息越来越少，而关于目标的信息则越来越多（本例中即图像的类别：猫和狗）。深度神经网络可以有效地作为信息整流管道(information distillation pipeline)，输入原始数据（本例中是RGB信息），反复对其进行变换，将无关信息过滤掉（比如他，图像的具体外观），并放大和细化有用的信息（比如与图像类别有关的信息）。这与人类和动物感知世界的方式类似：人类观察一个场景几秒钟后，可以记住其中有哪些抽象物体（比如说自行车、数或者是哪个人），但是却不一定能记住物体的具体外观。事实上，尽管你可能见过成百上千辆自行车，但是要你试着画一辆自行车出来，估计会是歪歪扭扭的，只具备勉强能让人识别出是自行车的框架性特征。人类的大脑已经学会将视觉输入完全抽象化，将其转换为更高层次的视觉概念，同时过滤掉不想管的视觉细节，这使得大脑很难记住周围事物的具体外观特征。事实上，这也可能是一个明智的自然进化选择。

参考文献

[1] Francois Chollet, Deep Learning with Python, Chapter5.4

Original: https://blog.csdn.net/chenxy_bwave/article/details/122717766
Author: 笨牛慢耕
Title: 深度学习笔记：卷积神经网络的可视化–特征图

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624990/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

yuv422，yuv420，yuv444的区别

声明：下面的图部分是摘自博主的，感谢博主 https://www.cnblogs.com/tid-think/p/10616789.html，如果涉及侵权，感谢告知，学习了博主的…

人工智能 2023年6月20日
0096
pandas—pandas.read_parquet

文章目录 * – + 引言 + 1.pd.read_parquet 引言小伙伴可能要问了，这是个什么玩意？pd.read_csv不行嘛？结果都是返回DataFrame…

人工智能 2023年7月7日
0047
目标分割概述

目录目标分割介绍 * 图像分割的定义任务类型 – 任务描述任务类型常用的开源数据集 – VOC数据集城市风光Cityscapes数据集评价指标 …

人工智能 2023年6月20日
0066
航空公司客户价值分析的实验报告

航空公司客户价值分析的实验报告提示参考书：张良均《Python数据分析与挖掘实战》等。数据文件：课本自带数据。使用软件：Pycharm。类别：实验。温馨提示：该实验是跟…

人工智能 2023年7月17日
0062
科沃斯扫地机器人无语音提示_科沃斯机器人DN33常见问题及解决办法汇总

科沃斯机器人作为国产扫地机器人的龙头老大，扫地机器人产品也是遍布全国，那么多人购买科沃斯扫地机器人产品，难免会遇到这样那样的问题。经常有朋友留言问些DN33的问题，这里扫地科沃斯…

人工智能 2023年5月27日
00129
[附源码]java毕业设计大学生足球预约信息

项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX（Webstorm也行）+ Eclispe（IntelliJ IDEA,Eclis…

人工智能 2023年6月28日
00100
激活函数和最常用的10个激活函数

1. 什么是激活函数 activation function 激活函数是一种添加到ANN中的函数，它决定了最终要发射给下一个神经元的内容。在人工神经网络中，一个节点的激活函数 …

人工智能 2023年6月23日
0097
动物识别论文整理——一种基于生物特征的鱼类分类模型

论文简介论文中文翻译:《一种基于生物特征的鱼类分类模型》论文名称:《A biometric-based model for fish species classification…

人工智能 2023年7月3日
0056
语音识别中的评价指标通常包括词错误率（Wor

问题背景在语音识别中，评价指标是用来衡量语音识别系统性能的重要指标。其中，一种常用的评价指标是词错误率（Word Error Rate，简称WER），它可以用来衡量识别结果和参考…

人工智能 2024年1月3日
0046
Transformer之编码器

Bert是从transformer中衍生出来的预训练的模型，transformer模型已经得到广泛应用，应用的方式是先进行预训练语言模型，然后把预训练的模型适配给下游任务，以完成各…

人工智能 2023年5月28日
00132
MySQL update正在执行中突然断电，数据是否更改成功？

今天有个朋友突然问到我这个问题，当我们的update语句执行过程中，服务器突然断电了会发生什么？其实这个问题主要在于对mysql update生命周期的理解，以及了解mysql 的…

人工智能 2023年6月27日
0091
五、朴素贝叶斯面试题总结

1. 朴素贝叶斯朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的数据集，首先基于特征条件独立假设学习输入输出的联合概率分布。然后基于此模型，对给定的输入x，…

人工智能 2023年7月1日
0083
YOLOV5目标检测记录

文章目录 1、运行官网YOLOV5代码 * 1、下载源代码 2、文件夹解析 3、开始测试 – 1、图片测试 2、视频测试 3、摄像头实时测试 2、训练自己的神经网络模型…

人工智能 2023年7月12日
0087
创造性自然语言生成(NLG)最新研究论文整理分享

什么是自然语言生成（NLG）？自然语言处理（NLP）分为自然语言理解（NLU）和自然语言生成（NLG），NLU负责理解文本内容而NLG负责根据信息生成文本内容，该信息可以是语音、…

人工智能 2023年5月28日
00108
【踩雷日记】Anaconda+cuda11.1+pytorch1.8.1+mmcv-full安装

文章目录一、安装Anaconda 二、安装Pytorch * 1.cuda和nvidia驱动匹配问题 2.安装cuda和cudnn 3.创建虚拟环境 4.安装pytorch 三….

人工智能 2023年7月23日
0061
2021年人工智能独角兽企业发展评析：理性与坚持

2021开年，伴随着我国经济的复苏与高增长，人工智能行业也是保持了欣欣向荣的景象。但看似繁荣的AI，2021年，或许会成为一个重要的”分水岭”。一、20…

人工智能 2023年6月1日
0082

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习笔记：卷积神经网络的可视化–特征图

3.1 加载保存的模型 ¶

3.2 图像预处理：将图像转换为张量

3.3 例化一个模型用于返回各层激活输出（即feature map）

3.5 各层各通道汇总可视化

大家都在看