Grad-Cam梯度类激活&卷积输出特征可视化&卷积核可视化【附实现代码】

2023年5月28日下午5:55 • 人工智能 • 阅读 60

文章目录

前言
一、Grad-CAM梯度类激活映射
*
1.1 效果图
1.2 程序
二、卷积输出特征可视化
*
2.1 效果图
2.1 程序
三、卷积核可视化
*
3.1 效果图
3.2 程序

前言

我在研究生阶段主要做的是深度学习情感识别的可解释性研究，期间做了一点决策机制的可视化工作，主要从三方面：类激活、卷积输出特征、卷积核，找出面部中对情感识别贡献最大的区域，以下是我工作中所用到的一些技术，自己在研究中磕磕绊绊地摸索，希望可以对后来的师弟师妹们一些启发，欢迎交流，

深度学习的可解释性目前仍处于起步阶段，可以将其定义为试图以一种人类可以理解的方式来解释模型的决策过程。大多数的深度学习模型可以通过突出显示输入图像中与预测结果相关的区域来解释，这些基于热力图的解释提供了关于这些显著区域如何促进模型做出相关决策的信息。这种方法的目标是确定每个输入特征对目标输出的贡献。在图像分类任务中，最终分类层之前的特征映射的每个通道都对应于一个特定的类。因此将内部特征甚至输入图像与输出标签的神经元相关联是合理的。这种可视化通过突出输入图像中的”重要”位置或者强烈影响输出的内部特征提供一种归于预测的直观解释。常用的基于可视化的解释性方法有类激活映射(Class Activation Mapping, CAM)[96]方法、特征映射可视化方法[97]和梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)[63]方法。

一、Grad-CAM梯度类激活映射

类激活映射方法通过生成类激活图来可视化卷积神经网络的关注区域，它通过定位分类器所关注的部分来确定一个样本是否属于一类，这个过程的输出称为类激活映射。类激活映射的思想是利用一种特定的卷积神经网络架构来产生可视化的热力图，类激活映射方法定位了模型认为对分类很重要的类特定的图像区域。

1.1 效果图

因为涉及到隐私，故马赛克处理

; 1.2 程序

1.用到的package

from keras.models import load_model
import cv2
import numpy as np
from sklearn import metrics
from keras.layers import Layer
from keras.layers import Activation
from keras.layers import GlobalMaxPooling2D
from keras.layers import GlobalAveragePooling2D
import keras.backend as K
import matplotlib.pyplot as plt
from matplotlib.image import imread

2.CAM函数
说明：model是我自己搭建的模型，keras搭建，函数式编程


def CAM(img_path, model, save_path):

    img = cv2.imread(img_path)
    img = img.astype('float32')
    img /= 255
    img = np.array(img).reshape(1, 224, 224, 3)

    preds = model.predict(img)
    pred_label = np.argmax(preds[0])

    output = model.output[:, pred_label]
    last_conv_layer = model.get_layer('conv2d_19')
    grads = K.gradients(output, last_conv_layer.output)[0]
    pooled_grads = K.mean(grads, axis=(0, 1, 2))
    iterate = K.function([model.input], [pooled_grads, last_conv_layer.output[0]])
    pooled_grads_value, conv_layer_output_value = iterate([img])

    for i in range(512):
        conv_layer_output_value[:, :, i] *= pooled_grads_value[i]

    heatmap = np.mean(conv_layer_output_value, axis=-1)

    heatmap = np.maximum(heatmap, 0)
    heatmap /= np.max(heatmap)

    img2 = cv2.imread(img_path)
    heatmap = cv2.resize(heatmap, (img2.shape[1], img2.shape[0]))
    heatmap = np.uint8(255 * heatmap)
    heatmap = cv2.applyColorMap(heatmap, cv2.COLORMAP_JET)
    superimposed_img = heatmap * 0.5 + img2

    cv2.imwrite(save_path, superimposed_img)

二、卷积输出特征可视化

卷积神经网络的结构往往是一种包含多层卷积层的前向神经网络。在卷积神经网络的低层卷积中，提取到的特征往往是低级的语义特征，如图像的边缘、轮廓、角点等简单的结构；而在高层的卷积中，提取到的特征往往是图像类别等高级语义特征。图像在卷积神经网络的反向传播过程中，每一层都会产生由不同卷积核运算得到的二维数据堆叠得到的三维特征块，我们称之为特征图。

2.1 效果图

浅层卷积层

中层特征图

深层特征图

; 2.1 程序


import os

import tensorflow

os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"] = "0"

config = tensorflow.compat.v1.ConfigProto()
config.gpu_options.allow_growth = True
sess = tensorflow.compat.v1.Session(config=config)

tensorflow.compat.v1.disable_eager_execution()
from keras import Model
from keras.models import load_model
from keras.utils import plot_model
import cv2
import numpy as np
from sklearn import metrics
from keras.layers import Layer
from keras.layers import Activation
from keras.layers import GlobalMaxPooling2D
from keras.layers import GlobalAveragePooling2D
import keras.backend as K
import os
import matplotlib.pyplot as plt
from matplotlib.image import imread
from keras import models

class GlobalMixPooling2D(Layer):
    def __init__(self, **kwargs):
        super(GlobalMixPooling2D, self).__init__(**kwargs)

    def build(self, input_shape):
        self.kernel = self.add_weight(name='initial_weight', shape=(1,), initializer='zeros', trainable=True)
        super(GlobalMixPooling2D, self).build(input_shape)

    def call(self, x):
        max_output = GlobalMaxPooling2D()(x)
        avg_output = GlobalAveragePooling2D()(x)
        kernel = Activation('sigmoid')(self.kernel)
        return kernel * max_output + (1.0 - kernel) * avg_output

    def compute_output_shape(self, input_shape):
        return (input_shape[0], input_shape[3])

def sensitivity(y_true, y_pred):

    TP = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))
    P = K.sum(K.round(K.clip(y_true, 0, 1)))
    FN = P - TP
    recall = TP / (TP + FN + K.epsilon())
    return recall

img_path = r"03084_1.jpg"
save_path = r"../03084/03084_multiply_2.jpg"
layer_name = r"multiply_2"

model = load_model("model.h5", custom_objects={'sensitivity': sensitivity, 'GlobalMixPooling2D': GlobalMixPooling2D})
model.summary()

img = cv2.imread(img_path)
img = cv2.resize(img, (224, 224))
img = img.astype('float32')
img /= 255
img = np.array(img).reshape(1, 224, 224, 3)
print(img.shape)

layer_outputs = model.get_layer(layer_name).output

activation_model = Model(inputs=model.input, outputs=layer_outputs)
activations = activation_model.predict(img)
print(activations.shape)

images_per_row = 16

n_features = activations.shape[-1] // 2

size = activations.shape[1]

n_cols = n_features // images_per_row
display_grid = np.zeros((size * n_cols, images_per_row * size))

for col in range(n_cols):
    for row in range(images_per_row):
        channel_image = activations[0, :, :, col * images_per_row + row]

        channel_image *= 64
        channel_image += 128
        channel_image = np.clip(channel_image, 0, 255).astype('uint8')
        display_grid[col * size : (col + 1) * size,
                     row * size : (row + 1) * size] = channel_image
        scale = 1. / size
        plt.figure(figsize=(scale * display_grid.shape[1],
                            scale * display_grid.shape[0]))

        plt.grid(False)
        plt.imshow(display_grid, aspect='auto', cmap='viridis')
        plt.savefig(save_path)

三、卷积核可视化

3.1 效果图

; 3.2 程序


import os

import tensorflow

os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"] = "0"

config = tensorflow.compat.v1.ConfigProto()
config.gpu_options.allow_growth = True
sess = tensorflow.compat.v1.Session(config=config)

tensorflow.compat.v1.disable_eager_execution()
from keras import Model
from keras.models import load_model
import cv2
import numpy as np
from sklearn import metrics
from keras.layers import Layer
from keras.layers import Activation
from keras.layers import GlobalMaxPooling2D
from keras.layers import GlobalAveragePooling2D
import keras.backend as K
import os
import matplotlib.pyplot as plt
from matplotlib.image import imread
from keras import models

class GlobalMixPooling2D(Layer):
    def __init__(self, **kwargs):
        super(GlobalMixPooling2D, self).__init__(**kwargs)

    def build(self, input_shape):
        self.kernel = self.add_weight(name='initial_weight', shape=(1,), initializer='zeros', trainable=True)
        super(GlobalMixPooling2D, self).build(input_shape)

    def call(self, x):
        max_output = GlobalMaxPooling2D()(x)
        avg_output = GlobalAveragePooling2D()(x)
        kernel = Activation('sigmoid')(self.kernel)
        return kernel * max_output + (1.0 - kernel) * avg_output

    def compute_output_shape(self, input_shape):
        return (input_shape[0], input_shape[3])

def sensitivity(y_true, y_pred):

    TP = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))
    P = K.sum(K.round(K.clip(y_true, 0, 1)))
    FN = P - TP
    recall = TP / (TP + FN + K.epsilon())
    return recall

model = load_model("model.h5", custom_objects={'sensitivity': sensitivity, 'GlobalMixPooling2D': GlobalMixPooling2D})
model.summary()

layer_names = []
for layer in model.layers[83:84]:
    layer_names.append(layer.name)

def deprocess_image(x):
    x -= x.mean();
    x /= (x.std() + 1e-5)
    x *= 0.1

    x += 0.5
    x = np.clip(x, 0, 1)
    x *= 255
    x = np.clip(x, 0, 255).astype('uint8')

    return x

def generate_pattern(layer_name, filter_index, size=150):
    layer_output = model.get_layer(layer_name).output
    loss = K.mean(layer_output[:, :, :, filter_index])

    grads = K.gradients(loss, model.input)[0]
    grads /= (K.sqrt(K.mean(K.square(grads))) + 1e-5)

    iterate = K.function([model.input], [loss, grads])

    input_img_data = np.random.random((1, size, size, 3)) * 20 + 128
    step = 1
    for i in range(40):
        loss_value, grads_value = iterate([input_img_data])
        input_img_data += grads_value * step

    img = input_img_data[0]

    return deprocess_image(img)

for layer_name in layer_names:
    size = 64
    margin = 5

    results = np.zeros((8 * size + 7 * margin, 8 * size + 7 * margin, 3), dtype='uint8')

    for i in range(8):
        for j in range(8):
            filter_img = generate_pattern(layer_name, i + (j * 8), size=size)

            horizontal_start = i * size + i * margin
            horizontal_end = horizontal_start + size
            vertical_start = j * size + j * margin
            vertical_end = vertical_start + size
            results[horizontal_start: horizontal_end, vertical_start:vertical_end, :] = filter_img

    plt.figure(figsize=(20, 20))
    plt.imshow(results)
    plt.savefig(layer_name)

plt.show()

Original: https://blog.csdn.net/yangchuangyc/article/details/123552936
Author: SuperChuangChuang
Title: Grad-Cam梯度类激活&卷积输出特征可视化&卷积核可视化【附实现代码】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/532841/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

关于attention的学习（原理+代码）

日志贴，有错拜托评论区指正~ 附上李宏毅老师对transformer的讲解：李宏毅2020机器学习深度学习(完整版)国语_哔哩哔哩_bilibili 关键的原理性问题 1、att…

人工智能 2023年7月22日
0062
【建议背诵】软考高项考试案例简答题汇总~

为大家在考前整理了软考高项案例分析题答案汇总！考前可以速记一下。有电子版本的，可以打印下载来看看！ 1. 管理者的权力来源种类及其特点？ (1)职位权力,来源于管理者在组织中的职…

人工智能 2023年6月28日
0071
pytorch+cuda11.1安装问题及解决（pycharm）

本文安装环境：win10 + 1050，安装的pytorch是gpu版文章目录 * – 一、cuda及cudnn安装 – 二、pytorch安装（踩坑及解…

人工智能 2023年6月13日
0081
DynamicHead：基于注意力的统一目标检测头CVPR2021

目录研究动机方法 Dynamic Head是首个突破COCO数据集上单模型表现超越60AP的方法，来自论文： Dynamic Head: Unifying Object Det…

人工智能 2023年7月10日
0055
数据预处理：缺失值处理

数据缺失是指在数据采集、传输和处理的过程中，由于某些原因导致数据不完整的情况。缺失值的存在会给数据的统计带来问题，某些数据分析模型也不能直接处理存在缺失值的数据集，因此，如果要对…

人工智能 2023年6月20日
0090
Pandas中常见的数据处理功能(reindexing, drop, selection, sorting, mapping/apply..等)

Pandas有Seriers和DataFrame两大数据结构， Seriers 处理一唯数据，每个数据有一个对应指针index。DataFrame 处理二维数据，每个数据有一个对…

人工智能 2023年7月9日
0047
数据分析 | Pandas 200道练习题，每日10道题，学完必成大神（1）

❤️ 作者简介：大家好我是小鱼干儿♛是一个热爱编程、热爱算法的大三学生，蓝桥杯国赛二等奖获得者 🐟 个人主页：https://blog.csdn.net/qq_52007481 …

人工智能 2023年7月4日
00172
【CV】用于图像恢复的深度学习方法综述论文（2022年）

论文名称：A survey of deep learning approaches to image restoration论文下载：https://www.sciencedire…

人工智能 2023年6月16日
0087
特征工程阅读笔记(第三章)

特征工程–思维导图 KNN算法 K-means算法 KNN算法算法过程计算待分类观察值与其他观察值之间的距离 x k 是点 X 的坐标 ( x 1 , x 2 , . ….

人工智能 2023年6月2日
0096
Ai绘画工具有哪些？推荐这7款效果惊艳的AI绘画神器

2022虽然不是ai绘图这项技术诞生的时间，但却是到目前为止最爆火出圈的绘图元年。 AI绘图（AI painting）就是以文生图（text2image），属于跨模态生成（Cros…

人工智能 2023年7月26日
00110
【物联网】30.物联网数据分析的基础 – 机器学习

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月3日
0068
[附源码]计算机毕业设计JAVAjsp智慧农产品朔源系统

[附源码]计算机毕业设计JAVAjsp智慧农产品朔源系统项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX （Webstorm也行…

人工智能 2023年6月28日
0076
YOLOv7中的数据集处理【代码分析】

本文章主要是针对yolov7中数据集处理部分代码进行解析(和yolov5是一样的)，也是可以更好的理解训练中送入的数据集到底是什么样子的。数据集的处理离不开两个类，一个是Data…

人工智能 2023年7月21日
0041
SPSS：主成分分析确定不同指标权重

主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量，同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息，也是数学上处理降维的一种统计学…

人工智能 2023年6月24日
0086
【数据分析】业务分析之ABtest

A/B测试AB测试是为Web或App界面或流程制作两个（A/B）或多个（A/B/n）版本，在同一时间维度，分别让组成成分相同（相似）的访客群组（目标人群）随机的访问这些版本，收集各…

人工智能 2023年7月17日
0051
找靓机 App 埋点 Case 自动化回归

找靓机埋点 Case 自动化回归一、背景和目的线上存在埋点数量总数大于 1000 个，主流程 case 大于 300 个，在对功能迭代过程中经常会有对已有的埋点进行回归的述…

人工智能 2023年6月17日
00104

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30