Pytorch目标检测实现

2023年7月24日上午4:36 • 人工智能 • 阅读 55

torchvision库中已存在目标检测的相应模型，只需要调用相应的函数即可。

单文件：


import numpy as np
import torchvision
import torch
import torchvision.transforms as transforms
from PIL import Image, ImageDraw, ImageFont
import matplotlib.pyplot as plt

model = torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)
model.eval()

image = Image.open("/mnt/COCO2017/val2017/000000000285.jpg")
transform_d = transforms.Compose([transforms.ToTensor()])
image_t = transform_d(image)
pred = model([image_t])
print(pred)

"""
    fire hydrant 消防栓，stop sign 停车标志， parking meter 停车收费器， bench 长椅。
    zebra 斑马， giraffe 长颈鹿， handbag 手提包， suitcase 手提箱， frisbee （游戏用）飞盘（flying disc）。
    skis 滑雪板（ski的复数），snowboard 滑雪板（ski是单板滑雪，snowboarding 是双板滑雪。）
    kite 风筝， baseball bat 棒球棍， baseball glove 棒球手套， skateboard 滑板， surfboard 冲浪板， tennis racket 网球拍。
    broccoli 西蓝花，donut甜甜圈，炸面圈(doughnut，空心的油炸面包), cake 蛋糕、饼, couch 长沙发（靠chi)。
    potted plant 盆栽植物。 dining table 餐桌。 laptop 笔记本电脑，remote 遥控器(=remote control),
    cell phone 移动电话(=mobile phone)(cellular 细胞的、蜂窝状的)， oven 烤炉、烤箱。 toaster 烤面包器（toast 烤面包片）
    sink 洗碗池, refrigerator 冰箱。（=fridge）， scissor剪刀(see, zer), teddy bear 泰迪熊。 hair drier 吹风机。
    toothbrush 牙刷。
"""
COCO_INSTANCE_CATEGORY_NAMES = [
    '__BACKGROUND__', 'person', 'bicycle', 'car', 'motorcycle',
    'airplane', 'bus', 'train', 'trunk', 'boat', 'traffic light',
    'fire hydrant', 'N/A', 'stop sign', 'parking meter', 'bench',
    'bird', 'cat', 'dog', 'horse', 'sheep', 'cow', 'elephant',
    'bear', 'zebra', 'giraffe', 'N/A', 'backpack', 'umbrella', 'N/A',
    'N/A', 'handbag', 'tie', 'suitcase', 'frisbee', 'skis', 'snowboard',
    'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard',
    'surfboard', 'tennis racket', 'bottle', 'N/A', 'wine glass',
    'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
    'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza',
    'donut', 'cake', 'chair', 'couch', 'potted plant', 'bed', 'N/A',
    'dining table', 'N/A', 'N/A', 'toilet', 'N/A', 'tv', 'laptop',
    'mouse', 'remote', 'keyboard', 'cell phone', 'microwave', 'oven',
    'toaster', 'toaster', 'sink', 'refrigerator', 'N/A', 'book', 'clock',
    'vase', 'scissors', 'teddy bear', 'hair drier', 'toothbrush'
]

pred_class = [COCO_INSTANCE_CATEGORY_NAMES[ii] for ii in list(pred[0]['labels'].numpy())]
pred_score = list(pred[0]['scores'].detach().numpy())

pred_boxes = [[ii[0], ii[1], ii[2], ii[3]] for ii in list(pred[0]['boxes'].detach().numpy())]

pred_index = [pred_score.index(x) for x in pred_score if x > 0.5]

fontsize = np.int16(image.size[1] / 20)
font1 = ImageFont.truetype("/usr/share/fonts/gnu-free/FreeMono.ttf", fontsize)

draw = ImageDraw.Draw(image)
for index in pred_index:
    box = pred_boxes[index]
    draw.rectangle(box, outline="blue")
    texts = pred_class[index]+":"+str(np.round(pred_score[index], 2))
    draw.text((box[0], box[1]), texts, fill="blue", font=font1)

plt.imshow(image)
plt.show()

对该文件夹下随机10个文件进行目标检测。

"""
    对给定文件夹下随机数量的文件进行目标检测。
"""
import numpy as np
import torchvision
import torch
import torchvision.transforms as transforms
from PIL import Image, ImageDraw, ImageFont
import matplotlib.pyplot as plt
import os

"""
    fire hydrant 消防栓，stop sign 停车标志， parking meter 停车收费器， bench 长椅。
    zebra 斑马， giraffe 长颈鹿， handbag 手提包， suitcase 手提箱， frisbee （游戏用）飞盘（flying disc）。
    skis 滑雪板（ski的复数），snowboard 滑雪板（ski是单板滑雪，snowboarding 是双板滑雪。）
    kite 风筝， baseball bat 棒球棍， baseball glove 棒球手套， skateboard 滑板， surfboard 冲浪板， tennis racket 网球拍。
    broccoli 西蓝花，donut甜甜圈，炸面圈(doughnut，空心的油炸面包), cake 蛋糕、饼, couch 长沙发（靠chi)。
    potted plant 盆栽植物。 dining table 餐桌。 laptop 笔记本电脑，remote 遥控器(=remote control),
    cell phone 移动电话(=mobile phone)(cellular 细胞的、蜂窝状的)， oven 烤炉、烤箱。 toaster 烤面包器（toast 烤面包片）
    sink 洗碗池, refrigerator 冰箱。（=fridge）， scissor剪刀(see, zer), teddy bear 泰迪熊。 hair drier 吹风机。
    toothbrush 牙刷。
"""
COCO_INSTANCE_CATEGORY_NAMES = [
    '__BACKGROUND__', 'person', 'bicycle', 'car', 'motorcycle',
    'airplane', 'bus', 'train', 'trunk', 'boat', 'traffic light',
    'fire hydrant', 'N/A', 'stop sign', 'parking meter', 'bench',
    'bird', 'cat', 'dog', 'horse', 'sheep', 'cow', 'elephant',
    'bear', 'zebra', 'giraffe', 'N/A', 'backpack', 'umbrella', 'N/A',
    'N/A', 'handbag', 'tie', 'suitcase', 'frisbee', 'skis', 'snowboard',
    'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard',
    'surfboard', 'tennis racket', 'bottle', 'N/A', 'wine glass',
    'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
    'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza',
    'donut', 'cake', 'chair', 'couch', 'potted plant', 'bed', 'N/A',
    'dining table', 'N/A', 'N/A', 'toilet', 'N/A', 'tv', 'laptop',
    'mouse', 'remote', 'keyboard', 'cell phone', 'microwave', 'oven',
    'toaster', 'toaster', 'sink', 'refrigerator', 'N/A', 'book', 'clock',
    'vase', 'scissors', 'teddy bear', 'hair drier', 'toothbrush'
]

model = torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)
model.eval()

image_folder_path = "/mnt/COCO2017/val2017/"
number = 10
transform_d = transforms.Compose([transforms.ToTensor()])

dirs = os.listdir(image_folder_path)
idx = np.random.randint(0, len(dirs), number)

for i in idx:
    image_path = os.path.join(image_folder_path, dirs[i])
    image = Image.open(image_path)

    image_t = transform_d(image)
    pred = model([image_t])
    print(pred)

    pred_class = [COCO_INSTANCE_CATEGORY_NAMES[ii] for ii in list(pred[0]['labels'].numpy())]
    pred_score = list(pred[0]['scores'].detach().numpy())

    pred_boxes = [[ii[0], ii[1], ii[2], ii[3]] for ii in list(pred[0]['boxes'].detach().numpy())]

    pred_index = [pred_score.index(x) for x in pred_score if x > 0.5]

    fontsize = np.int16(image.size[1] / 20)
    font1 = ImageFont.truetype("/usr/share/fonts/gnu-free/FreeMono.ttf", fontsize)

    draw = ImageDraw.Draw(image)
    for index in pred_index:
        box = pred_boxes[index]
        draw.rectangle(box, outline="blue")
        texts = pred_class[index]+":"+str(np.round(pred_score[index], 2))
        draw.text((box[0], box[1]), texts, fill="blue", font=font1)

    plt.imshow(image)
    plt.show()

我们在COCO2017数据集上进行了一些测试，结果如下：

上图识别出了”人”，概率为100%，识别出了”棒球手套”，概率没瞅见哈哈。

上图识别出了”摩托”，概率100%，”长椅”，概率为74%。

这玩意认为有66%的概率存在”马桶”，87%的概率存在”杯子”，这个识别就有点问题啊。

上面识别出了”披萨（pizza）”，”勺子（spoon）”，”叉子（fork）”。

妈耶，我的Trypophobia都出来了。不过其识别出了 bowl，cup，dinning table，person、spoon，可以调优下哈哈。

下面的图我就不描述了。

识别出了西蓝花(broccoli)，三明治、叉子。

消防栓，fire hydrant

; 4. 参考书籍：

《PyTorch深度学习入门与实践》孙玉林、余本国著。

Original: https://blog.csdn.net/csdnliwenqi/article/details/121686129
Author: 爱学习的大白菜
Title: Pytorch目标检测实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/711976/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

神经网络的发展过程

神经网络的发展大致经过五个阶段。第一阶段：模型提出在1943年，心理学家Warren McCulloch和数学家Walter Pitts和最早描述了一种理想化的人工神经网络，并构建…

人工智能 2023年5月27日
00113
深度学习——CNN实现MNIST手写数字的识别

活动地址：CSDN21天学习挑战赛目录知识点介绍 MNIST 介绍下载数据的简单处理 CNN神经网络 CNN的作用 CNN的主要特征 CNN的神经网络结构 CNN的相关参…

人工智能 2023年7月3日
0073
Python机器学习算法之K-Means算法

### 回答1： k-means聚类算法_的 _Python_包有很多，比如： 1. scikit-learn：这是一个非常流行的 _Python 机器学习_库，其中包含了k-m…

人工智能 2023年6月2日
0080
Redisson–最好用的Redis客户端–介绍

原文网址：Redisson–最好用的Redis客户端–介绍_IT利刃出鞘的博客-CSDN博客简介说明本文介绍Redisson这款最好用的Redis客户…

人工智能 2023年5月30日
00125
对比学习的应用（SimCSE，CLEAR，DeCLUTR，DiffCSE）

前已经有博文整理过了对比学习的概念，比较重要且流行的文章，和一些已经有的应用，主要是在image或者video上的应用： Contrastive Learning（对比学习，MoC…

人工智能 2023年5月27日
0077
贪心算法笔记

贪婪者总是一贫如洗 ——克劳德兰纳斯目录什么是贪心怎样实现例一 AC代码例二 AC代码总结步骤写在最后什么是贪心 360百科里是这样说的：贪婪算法是一种对某些求最…

人工智能 2023年6月27日
0075
AI作画：十分钟快速搭建自己的text-to-image diffusion models

### 回答1： Q: 什么是”调色板：图像到图像扩散模型“？ A: 调色板：图像到图像扩散模型_是一种图像处理技术，它利用调色板（一组预定义的颜色）将…

人工智能 2023年6月24日
0079
机器学习实验四：朴素贝叶斯分类

文章目录 * – 一、算法介绍 – 二、朴素贝叶斯分类的优缺点 – 三、代码简单实现一、算法介绍贝叶斯分类算法是一大类分类算法的总称，贝叶斯…

人工智能 2023年7月2日
0068
对于torch.nn.AdaptiveAvgPool2d()自适应平均池化函数的一些理解

AdaptiveAvgPool2d()介绍 torch.nn.AdaptiveAvgPool2d()接受两个参数，分别为输出特征图的长和宽，其通道数前后不发生变化。vgg在卷积层和…

人工智能 2023年7月21日
0097
PyTorch 网络搭建训练代码模板

神经网络看起来很复杂，节点很多，层很多，参数更多，但核心部分或组件不多，把这些组件确定后，这个神经网络就确定了。这些核心组件包括多个层连接在一起构成一个模型或网络，输入数据通过这…

人工智能 2023年7月13日
0061
数据增强神器 SimpleCopyPaste 支持全流程

引言 SimpleCopyPaste 数据增强是谷歌在 2021 年 1 月提出的一种实例分割的数据增强方法，它通过在训练过程中直接将一张图片中的实例简单地复制粘贴到另外一张图片中…

人工智能 2023年7月28日
0071
树莓派视觉小车 — 人脸追踪（人脸识别、PID控制舵机运动）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月18日
0076
详解SVM支持向量机算法(五:概率输出、合页损失、多分类、回归模型)

作者：RayChiu_Labloy版权声明：著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处目录 SVM的概率化输出合页损失函数(hinge loss fun…

人工智能 2023年7月1日
0086
opencv图像仿射变换，cv2.warpAffine

目录仿射变换原理介绍 cv2.warpAffine函数介绍代码实例仿射变换原理介绍仿射变换，又称仿射映射，是指在几何中，一个向量空间进行一次线性变换并接上一个平移，变换为…

人工智能 2023年6月13日
0093
Fibonacci数列那些事！

对于 Fibonacci数，相信我们都不陌生，在初学编程时，算 Fibonacci数往往是一个不错的编程习题，那么接下来一起深入了解一下 Fibonacci数吧先假设一个初始条件…

人工智能 2023年6月28日
0085
[机器学习]模型评估方法

[机器学习]模型评估方法评估方法 * 留出法交叉验证法留一法自助法评估方法当进行模型选择时，理想方案是对候选模型的泛化误差进行评估，选择泛化误差最小的模型。但我们却无法…

人工智能 2023年7月2日
0087

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch目标检测实现

大家都在看