类别激活热力图grad-cam(pytorch)实战跑图

2023年7月20日下午5:37 • 人工智能 • 阅读 68

写在前面

类激活热力图：用于检查图像哪一部分对模型的最终输出有更大的贡献。具体某个类别对应到图片的那个区域响应最大，也就是对该类别的识别贡献最大

pytorch-grad-cam库代码GitHub代码
如果只想跑个图的话不用下！

作用：一是清晰直观的看看到底影响检测结果的特征；而是cv论文里出图真的很好看
本篇只是跑了代码给的猫狗图，下一篇要写如何可视化其他类别实战

先上跑完结果

使用的是resnet50，可以看出其关注度不仅仅只有狗，还有后面的背景，这会对以后的检测结果造成影响

; 实战

1.安装 `pytorch-grad-cam`

在pycharm终端中输入

pip install grad-cam

我之前安装过了，页面如下

2.复制全部代码

'''
1)导入相关的包并加载模型
'''

from pytorch_grad_cam import GradCAM, ScoreCAM, GradCAMPlusPlus, AblationCAM, XGradCAM, EigenCAM
from pytorch_grad_cam.utils.image import show_cam_on_image, \
                                         deprocess_image, \
                                         preprocess_image
from torchvision.models import resnet50
import cv2
import numpy as np
import os

os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"

model = resnet50(pretrained=True)

target_layer = [model.layer4]
'''
Resnet18 and 50: model.layer4[-1]
VGG and densenet161: model.features[-1]
mnasnet1_0: model.layers[-1]
ViT: model.blocks[-1].norm1
'''

'''
2)构建输入图像的Tensor形式，使其能传送到model里面去计算
'''

image_path = '../../examples/both.png'
rgb_img = cv2.imread(image_path, 1)[:, :, ::-1]

rgb_img = cv2.imread(image_path, 1)
rgb_img = np.float32(rgb_img) / 255

input_tensor = preprocess_image(rgb_img, mean=[0.485, 0.456, 0.406],
                                             std=[0.229, 0.224, 0.225])

'''
3)初始化CAM对象，包括模型，目标层以及是否使用cuda等
'''

cam = GradCAM(model=model, target_layers=target_layer, use_cuda=False)
'''
4)选定目标类别，如果不设置，则默认为分数最高的那一类
'''

target_category = None

'''
5)计算cam
'''

grayscale_cam = cam(input_tensor=input_tensor, target_category=target_category)

'''
6)展示热力图并保存
'''

grayscale_cam = grayscale_cam[0]
visualization = show_cam_on_image(rgb_img, grayscale_cam)
cv2.imwrite(f'first_try.jpg', visualization)

> 步骤：先把博客中代码复制，然后按照本博客写的修改即可，也可以直接拉到下面复制我的代码，然后按照说明修改路径

3.自己使用代码需要修改的部分

1、图片路径

第34行，将单引号地址改为你要用的图片地址

image_path = '../../examples/both.png'

不会的请详细参看错误1内容，写的很清楚
注意：路径中不要有中文

2、结果图名称

第79行

cv2.imwrite(f'first_try.jpg', visualization)

将”改为你希望的名字即可

4.查看结果图

其实就在代码当前路径的文件夹下
当然也可以复制图片名称first_try.jpg，在保存代码的文件夹里直接查找

点击结果图

; 运行代码所遇到的问题

错误1：TypeError: ‘NoneType’ object is not subscriptable

1、报错内容：

Traceback (most recent call last):
File “E:/CAM/pytorch-grad-cam/pytorch_grad_cam/utils/using_grad_cam.py”, line 32, in
rgb_img = cv2.imread(image_path, 1)[:, :, ::-1] # 1是读取rgb
TypeError: ‘NoneType’ object is not subscriptable

; 2、错误代码：

第2）构建输入图像的Tensor形式，使其能传送到model里面去计算，这一步

image_path = './examples/both.png'
rgb_img = cv2.imread(image_path, 1)[:, :, ::-1]
rgb_img = np.float32(rgb_img) / 255

使用OpenCV读取图片时发生错误，一直显示图片类型是”nonetype”

3、修正：

发现是路径错误

image_path = './examples/both.png'

修改后

image_path = '../../examples/both.png'

附上运行代码与读取的图片位置

关于路径如何正确表示可以看这篇文件路径./和…/

错误2：AttributeError: ‘GradCAM’ object has no attribute ‘activations_and_grads’

报错内容：

Traceback (most recent call last):
File “D:\anaconda\envs\pytorch\lib\site-packages\pytorch_grad_cam\base_cam.py”, line 192, in del
self.activations_and_grads.release()
AttributeError: ‘GradCAM’ object has no attribute ‘activations_and_grads’

; 错误3：TypeError: init () got an unexpected keyword argument ‘target_layer’

报错内容：

Traceback (most recent call last):
File “E:/CAM/pytorch-grad-cam/pytorch_grad_cam/utils/using_grad_cam.py”, line 60, in
cam = GradCAM(model=model, target_layer=target_layer, use_cuda=False)
TypeError: init() got an unexpected keyword argument ‘target_layer’

; 针对错误2与错误3的修改：

第一处：

target_layer = model.layer4[-1]

修改为 target_layer = [model.layer4]
第二处：

cam = GradCAM(model=model, target_layer=target_layer, use_cuda=False)

修改为

cam = GradCAM(model=model, target_layers=target_layer, use_cuda=False)

只想跑图出结果的不需要看，想大概熟悉代码与原理的可以看一看

使用pytorch实现grad-cam需了解hook机制，详细看 pytorch的autograd
pytorch的hook应用
个人理解：hook就是储存pytorch所释放的中间变量的”钩子”，哪里需要就钩在哪里举例更好理解。
hook机制一定要理解，grad-cam中hook是重要代码

基础差的看不懂基础代码，可以哪里不懂点哪里
1、 *args， **kargs 知识点讲解链接
2、Python自带模块argparse详细使用说明书 Python argparse命令行参数解析包的详细使用说明书
例：采用LeNet-5演示backward_hook在grad-cam中应用，下面是代码过程（具体代码上面链接中有） 1、创建网络net
2、注册forward_hook函数用于提取最后一层特征图；
3、注册backward_hook函数用于提取类向量（one-hot）关于特征图的梯度； 4、对特征图的梯度进行求均值，并对特征图进行加权；
5、可视化heatmap model._modules.items() 遍历输出每一层
register_hook的作用：即对x求导时，对x的导数进行操作，并且register_hook的参数只能以函数的形式传过去。（保护求导中中间值作用，不然pytorch将直接保存最后结果，中间结果不保存）详细解释

本篇主要参考CAM(类激活映射)，卷积可视化，神经网络可视化，一个库搞定，真的简单的不能再简单

Original: https://blog.csdn.net/rensweet/article/details/123263812
Author: 半甜田田
Title: 类别激活热力图grad-cam(pytorch)实战跑图

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/705413/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

国庆假期看了一系列图像分割Unet、DeepLabv3+改进期刊论文，总结了一些改进创新的技巧

关于图像分割方面的论文改进目前深度学习图像处理主流方向的模型基本都做到了很高的精度，你能想到的方法，基本上前人都做过了，并且还做得很好，因此越往后论文越来越难发，创新点越来越…

人工智能 2023年7月30日
0049
机器学习（九）——聚类（分类+原理＋计算示例）

1、聚类的定义 \qquad聚类：是机器学习中的无监督学习，目标是通过对无标记训练样本的学习来解释数据的内在性质以及规律，为进一步的数据分析提供基础。\qquad聚类试图将数据集中…

人工智能 2023年5月31日
0054
【PYLTP】pyltp（SentenceSplitter、Segmentor、Postagger、NamedEntityRecognizer、Parserr）个人理解（含可执行代码）

此博客均为对下面这个文档的复现，非原创！！！！附录 — LTP4 4.1.4 文档 1.安装pyltp 首先激活你的虚拟环境，然后输入下面语句即可，如果出现问题的话可以更换为清华…

人工智能 2023年5月28日
0070
pytorch使用detectron2模型库模型训练自己的数据

一应用场景在x86 （Ubuntu18.04）cpu，在pytorch1.10框架下，使用detectron2模型库模型训练自己的数据集，并进行目标检测推理。二环境配置我…

人工智能 2023年6月17日
0064
【深度学习】(10) 自定义学习率衰减策略（指数、分段、余弦），附TensorFlow完整代码

大家好，今天和大家分享一下如何使用 TensorFlow自定义指数学习率下降、阶梯学习率下降、余弦学习率下降方法，并使用 Mnist数据集验证自定义的学习率下降策略。创建…

人工智能 2023年7月14日
0058
主成分分析（PCA）原理及其python实现

主成分分析一、概述 * 1.1 问题提出 1.2 降维的作用二、主成分分析(PCA)主要思想三、相关数学知识四、PCA实现步骤 * 4.1 特征值分解矩阵 4.2 SVD分…

人工智能 2023年6月24日
0093
如何对张量进行归一化和标准化处理

人工智能 2024年1月1日
0035
YOLO系列论文精读

YOLO系列论文精读 YOLOV1 * 1 ）实现 2）详细解读总结 YOLOV2/9000 * 1）Better： 2）Faster： 3）Stronger：总结 YOL…

人工智能 2023年5月28日
0056
python pandas中groupby()的使用，sum和count

groupby[根据哪一列][对于哪一列]进行计算 groupby 中sum的使用（求和的作用）表格样式： import pandas as pd df = pd.DataFra…

人工智能 2023年7月14日
0086
Opencv_04 图像的数据类型Mat详解

文章目录 * – + 一. Mat数据类型介绍 + 二. Mat的常用操作 + * ① 创建Mat对象,常用的Mat构造函数 * ② Mat的行与列相关的操作 * ③ …

人工智能 2023年7月18日
0067
linux录制声卡声音_录制有声书需要买专业设备吗？

是的，如果你真的想把你的精力花在做好这件事上，而不仅仅是为了好玩。 [En] Yes, if you really want to put your energy into doi…

人工智能 2023年5月27日
0057
人工智能基本概念

人工智能是想让机器跟人一样进行学习、理解、分析、决策等智能思想行为，会涉及到听、说、读、写、行动等方面的能力。 1、弱人工智能某一方面的人工智能，比如图像识别中的人脸识别，只能识…

人工智能 2023年5月31日
0071
opencv-python 实时获取摄像头数据并实时显示。

import cv2 camera = cv2.VideoCapture(source) while True: (grabbed, frame) = camera.read() …

人工智能 2023年7月19日
0072
互联网服务客户流失分析（个人练习+源代码）

import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as s…

人工智能 2023年6月11日
0078
构建自己的gym训练环境巨详细

环境中主要有六个模块，下面将主要以官方的MountainCarEnv为例对每个模块进行说明。 1. init 主要作用是初始化一些参数如在MountainCarEnv中，对car…

人工智能 2023年6月23日
0072
slam原理介绍和经典算法

1.传统slam局限性 slam算法假设的环境中的物体都是处于静态或者低运动状态的，然而，现实世界是复杂多变的，因此这种假设对于应用环境有着严格的限制，同时影响视觉slam系统在…

人工智能 2023年5月26日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

类别激活热力图grad-cam(pytorch)实战跑图

1.安装 pytorch-grad-cam

2.复制全部代码

3.自己使用代码需要修改的部分

1、图片路径

2、结果图名称

4.查看结果图

错误1：TypeError: ‘NoneType’ object is not subscriptable

1、报错内容：

; 2、错误代码：

3、修正：

错误2：AttributeError: ‘GradCAM’ object has no attribute ‘activations_and_grads’

报错内容：

; 错误3：TypeError: init () got an unexpected keyword argument ‘target_layer’

报错内容：

; 针对错误2与错误3的修改：

只想跑图出结果的不需要看，想大概熟悉代码与原理的可以看一看

大家都在看

1.安装 `pytorch-grad-cam`