CNN可视化技术 — CAM & Grad-CAM详解及pytorch简洁实现

2023年7月22日下午5:35 • 人工智能 • 阅读 95

文章目录

前言
1. CAM（Class Activation Map）
2. Grad-CAM
3. PyTorch中的hook机制
4. Grad-CAM的PyTorch简洁实现
参考资料

前言

CNN中的特征可视化大体可分为两类：

细节信息：ZFNet中使用的deconvolution，改进的guide backpropagation
信息的重要性区分：类激活图（CAM），改进的Grad-CAM

第一类方法只显示了在深层特征中保留了哪些信息，而没有突出显示这些信息的相对重要性。第二类方法则具有一定的解释性，例如在分类任务中，通过CAM能够解释模型究竟是通过重点学习输入图像中的哪些信息来判断类别的。

CAM（Class Activation Map）

Network in Network中提出了用全局平均池化（GAP）替代全连接层以 加强特征映射与类别之间的联系，更具可解释性。受该思想启发，CAM可视化技术应运而出。生成CAM的流程如下图所示（论文原图）：

CNN可视化技术 -- CAM & Grad-CAM详解及pytorch简洁实现

可以看出，生成CAM的步骤非常简单，但是对网络结构有要求（网络末端为GAP+FC这样的结构，并且FC只有一层，用于输出类别概率）。假设分类任务采用的是VGG网络，此时生成CAM的步骤为：

将VGG中的前两个FC替换为GAP，重新训练；
获取最后一个卷积层输出的特征图[ f 1 , f 2 , . . . , f n ] [f_1, f_2, …, f_n][f 1 ,f 2 ,…,f n ]，以及全连接层的权重[ w 1 , w 2 , . . . , w n ] [w_1, w_2, …, w_n][w 1 ,w 2 ,…,w n ]；
计算C A M = ∑ i = 1 n w i f i CAM=\sum_{i=1}^{n}w_if_i C A M =∑i =1 n w i f i

不难发现，若网络结构不符合要求，按照上述方法计算CAM需要修改网络结构和重新训练。针对该问题，后续研究中提出了Gard-CAM。

; 2. Grad-CAM

由上述CAM的计算方法可知，生成CAM的关键是获取特征图的权重。基于对原始CAM的改进，Grad-CAM通过求 网络输出的类别置信度对特征图的偏导来获取权重，适用于任意网络，并且能够可视化任意层的类激活图（ 通常选择最后一个卷积层，因为其包含了丰富的高级语义和空间信息）。

生成Grad-CAM的步骤如下：
图片送入网络，前向传播，获取最后一个卷积层的特征图A k A^k A k（可选，任意层均可，k k k为通道index）；
反向传播，获取网络输出的类别c c c 的概率y c y^c y c关于A k A^k A k的梯度∂ y c ∂ A k \frac{\partial y^c}{\partial A^k}∂A k ∂y c ；
计算权重α k c = 1 Z ∑ i ∑ j ∂ y c ∂ A i , j k \alpha^{c}{k}=\frac{1}{Z}\sum\limits{i}\sum\limits_{j}\frac{\partial y^c}{\partial A^k_{i,j}}αk c =Z 1 i ∑j ∑∂A i ,j k ∂y c
计算Grad-CAM：L G r a d − C A M c = R e L U ( ∑ k α k c A k ) L_{Grad-CAM}^{c}=ReLU(\sum\limits_{k}\alpha^{c}_{k}A^k)L G r a d −C A M c =R e L U (k ∑αk c A k )
求偏导的意义：参考知乎中的文章，偏导表示输出关于输入的变化率，也就是特征图上变化一个单位，得到的输出变化多少单位。可以反映出输出y c y^c y c关于A i , j k A^k_{i,j}A i ,j k 的敏感程度，如果梯度大，则非常敏感，表示该位置更有可能属于类别c c c。
PyTorch中的hook机制
PyTorch中设计hook的目的：在不改变网络代码、不在forward中返回某一层的输出的情况下，获取网络中某一层在前向传播或反向传播过程的输入和输出，并对其进行相关操作（例如：特征图可视化，梯度裁剪）。
Grad-CAM的PyTorch简洁实现

import numpy as np
import torch
import cv2
import matplotlib.pyplot as plt
import torchvision.models as models
from torchvision.transforms import Compose, Normalize, ToTensor

class GradCAM():
    '''
    Grad-cam: Visual explanations from deep networks via gradient-based localization
    Selvaraju R R, Cogswell M, Das A, et al.

    https://openaccess.thecvf.com/content_iccv_2017/html/Selvaraju_Grad-CAM_Visual_Explanations_ICCV_2017_paper.html
    '''
    def __init__(self, model, target_layers, use_cuda=True):
        super(GradCAM).__init__()
        self.use_cuda = use_cuda
        self.model = model
        self.target_layers = target_layers

        self.target_layers.register_forward_hook(self.forward_hook)
        self.target_layers.register_full_backward_hook(self.backward_hook)

        self.activations = []
        self.grads = []

    def forward_hook(self, module, input, output):
        self.activations.append(output[0])

    def backward_hook(self, module, grad_input, grad_output):
        self.grads.append(grad_output[0].detach())

    def calculate_cam(self, model_input):
        if self.use_cuda:
            device = torch.device('cuda')
            self.model.to(device)
            model_input = model_input.to(device)
        self.model.eval()

        y_hat = self.model(model_input)
        max_class = np.argmax(y_hat.cpu().data.numpy(), axis=1)

        model.zero_grad()
        y_c = y_hat[0, max_class]
        y_c.backward()

        activations = self.activations[0].cpu().data.numpy().squeeze()
        grads = self.grads[0].cpu().data.numpy().squeeze()

        weights = np.mean(grads.reshape(grads.shape[0], -1), axis=1)
        weights = weights.reshape(-1, 1, 1)
        cam = (weights * activations).sum(axis=0)
        cam = np.maximum(cam, 0)
        cam = cam / cam.max()
        return cam

    @staticmethod
    def show_cam_on_image(image, cam):

        h, w = image.shape[:2]

        cam = cv2.resize(cam, (h,w))
        cam = cam / cam.max()
        heatmap = cv2.applyColorMap((255*cam).astype(np.uint8), cv2.COLORMAP_JET)
        heatmap = cv2.cvtColor(heatmap, cv2.COLOR_BGR2RGB)

        image = image / image.max()
        heatmap = heatmap / heatmap.max()

        result = 0.4*heatmap + 0.6*image
        result = result / result.max()

        plt.figure()
        plt.imshow((result*255).astype(np.uint8))
        plt.colorbar(shrink=0.8)
        plt.tight_layout()
        plt.show()

    @staticmethod
    def preprocess_image(img, mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5]):
        preprocessing = Compose([
            ToTensor(),
            Normalize(mean=mean, std=std)
            ])
        return preprocessing(img.copy()).unsqueeze(0)

if __name__ == '__main__':
    image = cv2.imread('both.png')
    input_tensor = GradCAM.preprocess_image(image)
    model = models.resnet18(pretrained=True)
    grad_cam = GradCAM(model, model.layer4[-1], 224)
    cam = grad_cam.calculate_cam(input_tensor)
    GradCAM.show_cam_on_image(image, cam)

测试结果

(https://github.com/jacobgil/pytorch-grad-cam/blob/master/examples/both.png)

参考资料

Original: https://blog.csdn.net/zxdd2018/article/details/125505352
Author: 有时候。
Title: CNN可视化技术 — CAM & Grad-CAM详解及pytorch简洁实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/709348/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【opencv】图像浅拷贝与深拷贝

目录：1.浅拷贝2.深拷贝创建图像或处理图象时，我们可能会用到拷贝图像的操作，而拷贝图像在opencv中实际上分两种：浅拷贝与深拷贝。 1.浅拷贝浅拷贝一般有两种形式：1.用&#…

人工智能 2023年7月20日
0075
YOLOv5（v6.1）解析（四）超参数进化

YOLOv5（v6.1）解析（四）超参数进化本文对YOLOv5项目的超参数算法进行详细阐述，笔者以后会定期讲解关于模型的其他的模块与相关技术，笔者也建立了一个关于目标检测的交流群…

人工智能 2023年5月26日
00140
解析NLP竞赛中的提分点-对抗训练

欢迎大家访问个人博客：https://jmxgodlz.xyz 前言在NLP比赛中，对抗训练是常见的提分手段。本文将详细介绍对抗训练的场景、作用、类型、具体实现以及未来的展望。 …

人工智能 2023年5月30日
00121
知识蒸馏算法和代码（Pytorch）笔记分享，一个必须要了解的算法

一、知识蒸馏算法理论讲解知识蒸馏说真的还是挺重要的，当时看论文的时候，总是会出现老师网络和学生网络，把我说的一脸蒙，所以自己就进行了解了一下，做了一些笔记和大家一起分享！不过大家…

人工智能 2023年7月20日
0086
机器学习随笔（1）——pandas.DataFrame和数据清洗

1. pandas.DataFrame 2. 数据清洗当我想对机器学习的基础进一步了解的时候，才发现这些基础都还没打牢，而且许多用法记不太清，特此笔记来回顾一下。以下是官方参考…

人工智能 2023年7月8日
0082
densenet的网络结构和实现代码总结(torch)

简介 densenet网络是CVPR 2017 (Best Paper Award)，这篇论文是在Stochastic Depth的启发下提出的。densenet和Stochast…

人工智能 2023年6月17日
00159
Multi-Modal Knowledge Graph Construction and Application: A Survey

Absract: 存在问题：1.现实世界知识爆炸；2现存KG是with pure symbol,不好让机器去理解。 ->解决问题方案：Multi-Modal KG，这可以更好…

人工智能 2023年6月1日
00135
202209-4 吉祥物投票（CSP C语言）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月28日
00124
Python之DataFrame基础用法

引入库 import pandas as pd import numpy as np pandas官方文档：https://pandas.pydata.org/pandas-doc…

人工智能 2023年7月7日
0058
使用 deb 包的方式安装 TensorRT

使用 deb 包的方式安装 TensorRT 完成日期：2022 年 4 月 17 日最后修改：—-此文使用 markdown 完成要在 ubuntu 下使用 Ten…

人工智能 2023年6月4日
0097
【学习笔记】OpenCv图像处理基础（下）

4 图像特征与目标检测 ; 4.1 图像特征图像特征是图像中独特的，易于跟踪和比较的特定模板或特定结构。图像特征主要有图像的颜色特征、纹理特征、形状特征和空间关系特征。 …

人工智能 2023年6月22日
00122
论文翻译 | FCOSv2：《FCOS: A Simple and Strong Anchor-free Object Detector》

FCOS: A Simple and Strong Anchor-free Object Detector 摘要：目标检测是计算机视觉中最重要的任务之一，它为一些实例级的识别任务和…

人工智能 2023年7月12日
0070
如何用Python将普通视频变成动漫视频

文章目录容我废话一下一、思路流程二、图像转动漫三、视频帧读取与视频帧写入容我废话一下最近几个月，毒教材被曝光引发争议，那些编写度教材的人着实可恶。咱程序员也没有手绘插画…

人工智能 2023年5月26日
00131
【软件工程】作业3

文章目录 “图书”数据字典形式化方法 * 形式化方法的概念软件工程领域的形式化方法形式化方法的分类应用场景优缺点分析 – 优点缺点 …

人工智能 2023年6月28日
0094
OpenCV.js 快速入门指南

OpenCV.js 常用的 API 如下：图像读取和显示 cv.imread(dom) -> dst cv.imshow(dst, dom) dom(Dom/string)…

人工智能 2023年5月26日
00181
YOLOv5-v6.0学习笔记

YOLOv5-v6.0学习笔记 1. 网络结构 * 1.1 Backbone – 1.1.1 Conv模块 1.1.2 Focus模块 1.1.3 CSPDarkNet…

人工智能 2023年6月23日
0072

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

CNN可视化技术 — CAM & Grad-CAM详解及pytorch简洁实现

文章目录

大家都在看