Python图像处理库的默认导入格式、坐标轴方位易错点辨析

2023年6月22日上午11:49 • 人工智能 • 阅读 108

Python进行图像处理、计算机视觉时有若干常用库，他们导入后的张量形状、坐标轴位置、相互转换方法各有不同。本文的总结包括PIL、skimage、numpy、opencv、pytorch等几个库。

PIL库

PIL库导入的图片为专用PIL对象，无法直接显示某一点像素值，与其他格式之间均需要转换。

PIL中Image.open()方法读入图像通道顺序为RGB。

PIL对象的属性PIL_img.size输出为一个元组，顺序是 (width,height)，这与大多数顺序为H*W的图像处理库不同。

PIL对象与numpy数组间的转换

注意：类型转换前后，数据维度信息由（c,w,h）自动变为(c,h,w)，但通道顺序不会变。

PIL&#x5BF9;&#x8C61;&#x8F6C;numpy&#x5BF9;&#x8C61;
img_ndarray = np.array(image_PIL)
numpy&#x5BF9;&#x8C61;&#x8F6C;PIL&#x5BF9;&#x8C61;
image_PIL = Image.fromarray(img_ndarray)

PIL对象与pytorch张量间的转换

一般使用torchvision.transform.ToTensor()函数将PIL转换为torch张量。

注意！！该函数自动执行张量形状调整和归一化，即输出张量形状为CHW，数据类型float32，数据范围0~1。

import torch, torchvision
PIL&#x5BF9;&#x8C61;&#x8F6C;pytorch&#x5F20;&#x91CF;
img_tensor = torchvision.transform.ToTensor()(img_PIL)

Numpy库和OpenCV库

OpenCV库导入的图片本身就是numpy格式！

OpenCV只是封装了许多图像领域对三维张量的操作，而且值得注意的是，OpenCV只能处理通道数

OpenCV中使用imread方法读入的图像通道顺序为BGR，形状为HWC。

OpenCV中图像坐标轴位置如图所示：

Pytorch库

Pytorch库中的张量与其他库类型均不同，需要转换。一般使用torchvision下transform包中相关函数进行转换。

numpy转tensor

我们一般使用torchvision.transform.ToTensor()函数将numpy图像转换为torch张量。

注意！！当输入numpy对象形状为HWC，数据类型为uint8，该函数会自动认为输入数据为图片数据范围为0~255，函数自动执行形状调整和归一化，变为CHW，数据类型float32，数据范围0~1。

当输入numpy对象为其他数据类型时，ToTensor()函数则不会有数据类型和维度的自动变换。会基于ndarray和tensor的数据类型对应关系进行转换，维度不变。

另一种方式为torch.from_numpy()，使用该函数时pytorch 不会对数据类型和维度做出任何改变 。也就意味着我们需要手动调整维度（.permute(2, 1, 0)），手动归一化

tensor转numpy

一般使用如下方式实现Tensor转numpy：

tensor.numpy()  # tensor&#x5728;&#x5185;&#x5B58;&#x4E2D;&#x65F6;
tensor.cpu().numpy()  # tensor&#x88AB;&#x52A0;&#x8F7D;&#x5230;&#x663E;&#x5B58;&#x4E2D;&#xFF0C;&#x9700;&#x8981;&#x79FB;&#x56DE;&#x5185;&#x5B58;&#x4E2D;

这里有一大坑点：就在上面我们讲述了当numpy对象数据类型和维度满足一定要求时转tensor后的自动归一化操作。但是！！当我们使用tensor.numpy时，系统并不会反向执行该操作，只会将torch张量直接变成形状、类型对应的numpy数组（那就会变成0~1float -1~1float -0.5~0.5float等，一定要自己想清楚）。

Original: https://blog.csdn.net/u013598963/article/details/120606043
Author: 孟大师
Title: Python图像处理库的默认导入格式、坐标轴方位易错点辨析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/645459/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

OpenCV-Python快速入门（十二）：轮廓拟合

OpenCV-Python快速入门（十二）：轮廓拟合 * – 前言 – 前提条件 – 实验环境 – 轮廓拟合 – + 矩…

人工智能 2023年6月29日
00109
基于SVM(支持向量机)对鸢尾花进行分类

支持向量机方法也是一种强大的机器学习分类方法。在感知器算法中，我们的目标是最小化分类误差，而在SVM中，我们的优化目标是最大化分类间隔。较大的分类间隔意味着模型有较小的泛化误差，较…

人工智能 2023年6月16日
0072
【数据库迁移系列】从MySQL到openGauss的数据库对象迁移实践

在之前这一篇中我们分享过使用chameleon工具完成MySQL到openGauss的全量数据复制、实时在线复制。9.30新发布的openGauss 3.1.0版本，工具的全量迁…

人工智能 2023年7月29日
0090
Bart模型应用实例及解析（二）————基于泰坦尼克号数据集的分类模型

Bart模型应用实例及解析（二）————基于泰坦尼克号数据集的分类模型前言 * 一、数据集 – 1、数据集的获取 2、数据集变量名及意义 3、数据集处理二、完整代码…

人工智能 2023年7月3日
00118
【C++天梯计划】1.5 深搜(DFS deep search)

文章目录 * – 什么是深搜？ – 模拟深搜 – 例题1：卒的遍历 – + * 题目描述 * 输入 * 输出 * 输入输出样例 * …

人工智能 2023年6月29日
0070
k-means聚类，密度聚类，层次聚类优缺点

k-means：优点：1，简单，易于理解和实现；2，时间复杂度低缺点：1，需要对均值给出定义,2，需要指定要聚类的数目；3，一些过大的异常值会带来很大影响；4，算法对初始选值敏感…

人工智能 2023年6月2日
00131
解决 JanusGraph – but mismatched timestamps； no lock column contained our timestamp (2020-10-12T02:09:

1. 问题描述启动Apache Atlas时，报错信息如下 Caused by: org.janusgraph.diskstorage.PermanentBackendExcep…

人工智能 2023年6月10日
00110
(学习笔记一)基于YOLOv5的车辆检测项目

1.YOLOv5模型简介 YOLO能实现图像或视频中物体的快速识别，在相同的识别类别范围和识别准确率条件下，YOLO识别速度最快。YOLO有多种模型，其中最新的为V5，V5的特点是…

人工智能 2023年6月16日
00133
新闻数据分析：jieba关键词提取、LDA主题生成、贝叶斯新闻分类

news_analysis.ipynb import pandas as pd import jieba import numpy df_news = pd.read_table(…

人工智能 2023年7月3日
00105
低光图像目标检测的研究成果总结

1、A Novel Method to Compensate Variety of Illumination In Face Detection 本文介绍了一些基于空间域的传统方法…

人工智能 2023年7月9日
0058
windows下完全离线安装Anaconda+Tensorflow

由于工作平台原因，需要在内网下安装深度学习框架，不联网的话，需要提前下载好第三方库的安装包，再离线安装。这里以Anaconda和Tensorflow为例，看过几个博客，坑不少，所以…

人工智能 2023年5月23日
0076
人工神经网络算法实战教程

神经网络（Artificial Neural Network，也称为人工神经网络，简称ANN）具有通过示例学习能力。ANN是受生物神经元系统启发的的信息处理模型，它由大量高度互联的…

人工智能 2023年7月13日
0065
知识图谱内容调研

目录知识图谱内容调研 * 是什么解决什么问题研究现状及发展趋势 – 知识图谱构建应用实践知识图谱构建技术 + 命名实体识别技术关系抽提技术现有方案 &#82…

人工智能 2023年6月1日
0063
流聚类之DenStream

前文在流聚类之CluStream中介绍了CluStream算法的相关内容，本文简单总结了有关流聚类算法DenStream的相关知识，从算法提出的目的以及两阶段过程进行阐述。对Cl…

人工智能 2023年6月2日
0080
前端——表单相关的属性（下）

表单相关的属性新增的与表单相关的元素如下。 min、max和step属性 min、max和step属性用于为包含数字或日期的input类型规定限定（约束）。max属性规定输入域所…

人工智能 2023年7月29日
0051
LabelImg标注的YOLO格式txt标签中心坐标和物体边界框长宽的转换

回答1：将的voc 文件，需要进行以下步骤： 1. 读取文件中的信息，包括目标类别、位置等。 2. 根据的要求，将目标位置为相对于图像宽度和高度的比例。 3. 将目标…

人工智能 2023年7月31日
0068

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31