PyTorch数据归一化处理：transforms.Normalize及计算图像数据集的均值和方差

2023年7月6日上午9:38 • 人工智能 • 阅读 55

PyTorch数据归一化处理：transforms.Normalize及计算图像数据集的均值和方差

1.数据归一化处理：transforms.Normalize
*
1.1 理解torchvision
1.2 数据标准化Normalize
2.计算图像数据集的均值和方差
*
2.1 使用PyTorch计算图像数据集的均值和方差(推荐)
2.2 使用opencv和numpy计算图像数据集的均值和方差
2.3 计算某个目录下所有图片的均值和方差
参考资料


print('==> Preparing data..')
transform_train = transforms.Compose([
    transforms.RandomCrop(32, padding=4),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
])

transform_test = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
])

trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform_train)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=128, shuffle=True, num_workers=0)

testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform_test)
testloader = torch.utils.data.DataLoader(testset, batch_size=100, shuffle=False, num_workers=0)

1.数据归一化处理：transforms.Normalize

1.1 理解torchvision

torchvision.transforms：常用的图像预处理方法
torchvision.datasets：常用的数据集Dataset实现
torchvision.models：常用的CV（预训练）模型实现

torchvision.transforms:常用的数据预处理方法，提升泛化能力，包括：数据中心化、数据标准化、缩放、裁剪、旋转、翻转、填充、噪声添加、灰度变换、线性变换、仿射变换、亮度、饱和度及对比度变换等

数据增强又称为数据增广，数据扩增，它是对训练集进行变换，使训练集更丰富，从而让模型更具泛化能力。

1.2 数据标准化Normalize

功能：逐channel的对图像进行标准化（均值变为0，标准差变为1），可以加快模型的收敛
output = (input – mean) / std
mean：各通道的均值
std：各通道的标准差
inplace：是否原地操作

思考：

（1）据我所知，归一化就是要把图片3个通道中的数据整理到[-1, 1]区间。
x = (x – mean(x))/std(x)
只要输入数据集x确定了，mean(x)和std(x)也就是确定的数值了，为什么Normalize()函数还需要输入mean和std的数值呢？？？？

（2）RGB单个通道的值是[0, 255]，所以一个通道的均值应该在127附近才对。
如果Normalize()函数去计算 x = (x – mean)/std ，因为RGB是[0, 255]，算出来的x就不可能落在[-1, 1]区间了。

（3）在我看的了论文代码里面是这样的：
torchvision.transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
为什么就确定了这一组数值，这一组数值是怎么来的？为什么这三个通道的均值都是小于1的值呢？

理解：

（1）针对第一个问题，mean 和 std 肯定要在normalize（）之前自己先算好再传进去的，不然每次normalize（）就得把所有的图片都读取一遍算出mean和std

（2）针对第二个问题，有两种情况
（a )如果是imagenet数据集，那么ImageNet的数据在加载的时候就已经转换成了[0, 1].

（b) 应用了torchvision.transforms.ToTensor，其作用是将数据归一化到[0,1]（是将数据除以255），transforms.ToTensor（）会把HWC会变成C H W（拓展：格式为(h,w,c)，像素顺序为RGB）

（3）针对第三个问题：[0.485, 0.456, 0.406]这一组平均值是从imagenet训练集中抽样算出来的。

继续有疑问：

ToTensor 已经[0,1]为什么还要[0.485, 0.456, 0.406]？那么归一化后，为什么还要接一个Normalize()呢?Normalize()是对数据按通道进行标准化，即减去均值，再除以方差

解答：

别人的解答：数据如果分布在(0,1)之间，可能实际的bias，就是神经网络的输入b会比较大，而模型初始化时b=0的，这样会导致神经网络收敛比较慢，经过Normalize后，可以加快模型的收敛速度。因为对RGB图片而言，数据范围是[0-255]的，需要先经过ToTensor除以255归一化到[0,1]之后，再通过Normalize计算过后，将数据归一化到[-1,1]。

是否可以这样理解：[0，1]只是范围改变了，并没有改变分布，mean和std处理后可以让数据正态分布😂

2.计算图像数据集的均值和方差

2.1 使用PyTorch计算图像数据集的均值和方差(推荐)

Pytorch图像预处理时，通常使用 transforms.Normalize(mean, std)对图像按通道进行标准化，即减去均值，再除以方差。这样做可以加快模型的收敛速度。其中参数mean和std分别表示图像每个通道的均值和方差序列。

Imagenet数据集的均值和方差为： mean=(0.485, 0.456, 0.406)， std=(0.229, 0.224, 0.225)，因为这是在百万张图像上计算而得的，所以我们通常见到在训练过程中使用它们做标准化。而对于特定的数据集，选择这个值的结果可能并不理想。接下来给出计算特定数据集的均值和方差的方法。

import torch
from torchvision.datasets import ImageFolder

def getStat(train_data):
    '''
    Compute mean and variance for training data
    :param train_data: 自定义类Dataset(或ImageFolder即可)
    :return: (mean, std)
    '''
    print('Compute mean and variance for training data.')
    print(len(train_data))
    train_loader = torch.utils.data.DataLoader(
        train_data, batch_size=1, shuffle=False, num_workers=0,
        pin_memory=True)
    mean = torch.zeros(3)
    std = torch.zeros(3)
    for X, _ in train_loader:
        for d in range(3):
            mean[d] += X[:, d, :, :].mean()
            std[d] += X[:, d, :, :].std()
    mean.div_(len(train_data))
    std.div_(len(train_data))
    return list(mean.numpy()), list(std.numpy())

if __name__ == '__main__':
    train_dataset = ImageFolder(root=r'./data/food/', transform=None)
    print(getStat(train_dataset))

./data/ready_chinese_food/的目录结构如下：

PyTorch数据归一化处理：transforms.Normalize及计算图像数据集的均值和方差

getState()方法接收一个Dataset类（ImageFolder），然后累加所有图像三个通道的均值和方差，最后除以图像总数并返回。

这里用食品数据集尚做的测试，测试集返回的结果如下所示：

Compute mean and variance for training data.

10000
([0.4940607, 0.4850613, 0.45037037], [0.20085774, 0.19870903, 0.20153421])

2.2 使用opencv和numpy计算图像数据集的均值和方差

import os
import random

import cv2
import numpy as np

train_txt_path = './data/Label/TR.txt'
base_path = './data/food'

CNum = 66071

img_h, img_w = 256, 256
imgs = np.zeros([img_w, img_h, 3, 1])
means, stdevs = [], []

with open(train_txt_path, 'r') as f:
    lines = f.readlines()
    random.shuffle(lines)

    for i in range(CNum):

        img_path = base_path + lines[i].rstrip().split()[0]

        img = cv2.imread(img_path)
        img = cv2.resize(img, (img_h, img_w))
        img = img[:, :, :, np.newaxis]

        imgs = np.concatenate((imgs, img), axis=3)

imgs = imgs.astype(np.float32) / 255.

for i in range(3):
    pixels = imgs[:, :, i, :].ravel()
    means.append(np.mean(pixels))
    stdevs.append(np.std(pixels))

means.reverse()
stdevs.reverse()

print("normMean = {}".format(means))
print("normStd = {}".format(stdevs))
print('transforms.Normalize(normMean = {}, normStd = {})'.format(means, stdevs))

2.3 计算某个目录下所有图片的均值和方差

import numpy as np
import cv2
import os

img_h, img_w = 32, 48
means, stdevs = [], []
img_list = []

imgs_path = 'D:/database/VOCdevkit/VOC2012/JPEGImages/'
imgs_path_list = os.listdir(imgs_path)

len_ = len(imgs_path_list)
i = 0
for item in imgs_path_list:
    img = cv2.imread(os.path.join(imgs_path,item))
    img = cv2.resize(img,(img_w,img_h))
    img = img[:, :, :, np.newaxis]
    img_list.append(img)
    i += 1
    print(i,'/',len_)

imgs = np.concatenate(img_list, axis=3)
imgs = imgs.astype(np.float32) / 255.

for i in range(3):
    pixels = imgs[:, :, i, :].ravel()
    means.append(np.mean(pixels))
    stdevs.append(np.std(pixels))

means.reverse()
stdevs.reverse()

print("normMean = {}".format(means))
print("normStd = {}".format(stdevs))

参考资料

https://blog.csdn.net/PanYHHH/article/details/107896526
https://blog.csdn.net/weixin_38533896/article/details/85951903
https://blog.csdn.net/dcrmg/article/details/102467434

Original: https://blog.csdn.net/qq_40507857/article/details/116600119
Author: 紫芝
Title: PyTorch数据归一化处理：transforms.Normalize及计算图像数据集的均值和方差

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/673685/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据分析，主成分分析例题

已知协方差矩阵求X的各主成分以及主成分的贡献率 ; 主成分分析原理：找出几个综合变量来代替原来众多的变量，使这些综合变量能尽可能地代表原来变量的信息量，且彼此之间互不相关统计方…

人工智能 2023年7月15日
0052
Few-shot Object Detection via Feature Reweighting跑自己的数据集

Few-shot Object Detection via Feature Reweighting跑自己的数据集说明 * 配置环境说明上篇文章记录了我配置环境的过程，现在看来…

人工智能 2023年6月17日
0077
【论文笔记】Modeling User Exposure in Recommendation

Modeling User Exposure in Recommendation 【论文作者】Dawen Liang, David M. Blei, etc. WWW’…

人工智能 2023年6月6日
0056
Channel-wise Knowledge Distillation for Dense Prediction阅读笔记

Channel-wise KD阅读笔记 * – (一) Title – (二) Summary – (三) Research Object &#…

人工智能 2023年7月10日
0072
vs2022在win11下配置opencv3.4.5（保姆式教学）

vs2022在win11下配置opencv3.4.5 1、下载官网下载地址：opencv找到你要的版本我这里选择的是3.4.5的版本然后点击 windows下载 ; 2、安装会…

人工智能 2023年7月19日
0066
OpenCV的图像直角坐标系转极坐标系的函数warpPolar()详解,并附自己写的实现直角坐标系转极坐标系的MATLAB代码

【草稿】详解OpenCV实现图像直角坐标系转极坐标系的函数warpPolar(),并附自己写的实现直角坐标系转极坐标系的MATLAB代码有些时候我们需要把图像或矩阵从直角坐标系(…

人工智能 2023年5月26日
0092
数仓面试题

数仓面试题问题一：什么叫数据仓库？数据仓库是一个面向主题的、集成的、相对稳定的、反应历史变化的数据集合，它用于支持企业或者组织的决策分析处理数据仓库是为了便于多维分析和多角度展现而…

人工智能 2023年6月1日
0063
自监督学习

两种基本的学习范式（1）有监督的学习：利用大量的标注数据来训练模型，计算模型预测结果和真实标签之间的损失，反向传播，通过不断地学习，最终可以获得识别新样本的能力。（2）无监督的学…

人工智能 2023年6月16日
0042
Xavier NX 使用OpenCV+GStreamer实现硬解码

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、NVCODEC是什么？二、编译OpenCV * 1.准备环境 2.编译 3.测试代码总结 …

人工智能 2023年6月19日
0097
异常检测之基于聚类的局部异常因子检测算法（CBLOF）详细解释且配上代码运行实例

基于聚类的局部异常因子检测算法（CBLOF）文章目录基于聚类的局部异常因子检测算法（CBLOF）前言一、CBLOF是什么？二、CBLOF详解三、CBLOF代码实例前言…

人工智能 2023年6月19日
00103
OpenCV之 BGR、GRAY、HSV色彩空间&色彩通道专题【Open_CV系列（三）】

文章目录 1.色彩空间 * 1.1 BGR色彩空间 1.2 GRAY色彩空间 1.3 HSV色彩空间 1.4 空间转换 – 1.4.1 BGR 转 GRAY 1.4.2…

人工智能 2023年7月25日
0049
yolov5 训练结果解析

yolov5 训练结果解析本文仅用于记录之前在CSDN中所学有关YOLOv5结果解析所转载知识的记录和总结笔记用。在每次训练之后，都会在runs-train 文件夹下出现一下文…

人工智能 2023年7月25日
0055
本周总结—-ResNet 模型

一、Resnet论文解读以resnet34为例介绍* 图一：res34层整体结构图二： resnet的尺寸通道数表 1、残差结构主通道上输入x进入一个卷积层后做BN，做re…

人工智能 2023年7月1日
0070
基于yolov3的目标检测与LPRnet字符识别的车牌识别（CCPD2020新能源车牌数据集）

文章目录前言一、程序思路二、使用步骤 * 1.配置环境 2.文件结构 3.准备数据集 4.训练有问题欢迎指正前言项目放这：车牌识别验证集70%多的识别率吧，效果不算特…

人工智能 2023年6月16日
0092
Pandas数据分析——常用操作

引言 Pandas是一种常见且便捷的数据处理库，为便于使用和复习，个人针对一些常用操作进行了总结。目录引言一、pandas是什么？二、pandas常用操作有哪些？ * 1….

人工智能 2023年7月7日
0045
基于回归模型的协同过滤（随机梯度下降+交替最小二乘优化）

将评分看作是一个连续的值而不是离散的值，就可以借助线性回归思想来预测目标用户对某物品的评分。其中一种实现策略被称为Baseline（基准预测）。 1. Baseline：基准预测 …

人工智能 2023年7月17日
0045

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

PyTorch数据归一化处理：transforms.Normalize及计算图像数据集的均值和方差

PyTorch数据归一化处理：transforms.Normalize及计算图像数据集的均值和方差

1.1 理解torchvision

1.2 数据标准化Normalize

2.1 使用PyTorch计算图像数据集的均值和方差(推荐)

2.2 使用opencv和numpy计算图像数据集的均值和方差

2.3 计算某个目录下所有图片的均值和方差

大家都在看