F.interpolate——数组采样操作

2023年5月26日上午3:43 • 人工智能 • 阅读 73

torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', align_corners=None, recompute_scale_factor=None)

功能：利用插值方法，对输入的张量数组进行上\下采样操作，换句话说就是科学合理地改变数组的尺寸大小，尽量保持数据完整。

输入：

input(Tensor)：需要进行采样处理的数组。
size(int或序列)：输出空间的大小
scale_factor(float或序列)：空间大小的乘数
mode(str)：用于采样的算法。 'nearest'| 'linear'| 'bilinear'| 'bicubic'| 'trilinear'| 'area'。默认： 'nearest'
align_corners(bool)：在几何上，我们将输入和输出的像素视为正方形而不是点。如果设置为 True，则输入和输出张量按其 角像素的 中心点对齐，保留角像素处的值。如果设置为 False，则输入和输出张量通过其 角像素的角点对齐，并且插值使用边缘值填充用于边界外值，使此操作在保持不变时独立于输入大小 scale_factor。
recompute_scale_facto(bool)：重新计算用于插值计算的 scale_factor。当scale_factor作为参数传递时，它用于计算output_size。如果recompute_scale_factor的 False或没有指定，传入的scale_factor将在插值计算中使用。否则，将根据用于插值计算的输出和输入大小计算新的scale_factor（即，如果计算的output_size显式传入，则计算将相同）。注意当scale_factor 是浮点数，由于舍入和精度问题，重新计算的 scale_factor 可能与传入的不同。

注意：

输入的张量数组里面的数据类型必须是 float。
输入的数组维数只能是3、4或5，分别对应于时间、空间、体积采样。
不对输入数组的前两个维度(批次和通道)采样，从第三个维度往后开始采样处理。
输入的维度形式为：批量(batch_size)× 通道(channel)×[可选深度]×[可选高度]×宽度(前两个维度具有特殊的含义，不进行采样处理)
size与 scale_factor两个参数 只能定义一个，即两种采样模式只能用一个。要么让数组放大成特定大小、要么给定特定系数，来等比放大数组。
如果 size或者 scale_factor输入序列，则 必须匹配输入的大小。如果输入四维，则它们的序列长度必须是2，如果输入是五维，则它们的序列长度必须是3。
如果 size输入整数x，则相当于把3、4维度放大成(x,x)大小(输入以四维为例，下面同理)。
如果 scale_factor输入整数x，则相当于把3、4维度都等比放大x倍。
mode是’linear’时输入必须是3维的；是’bicubic’时输入必须是4维的；是’trilinear’时输入必须是5维的
如果 align_corners被赋值，则 mode必须是 'linear'， 'bilinear'， 'bicubic'或 'trilinear'中的一个。
插值方法不同，结果就不一样，需要结合具体任务，选择 合适的插值方法。

补充：

一图看懂align_corners=True与False的区别，从4×4上采样成8×8。一个是按四角的像素点中心对齐，另一个是按四角的像素角点对齐。

图片转自：https://discuss.pytorch.org/t/what-we-should-use-align-corners-false/22663/9

代码案例

一般用法

import torch.nn.functional as F
import torch

a=torch.arange(12,dtype=torch.float32).reshape(1,2,2,3)
b=F.interpolate(a,size=(4,4),mode='bilinear')

print(a)
print(b)
print('原数组尺寸:',a.shape)
print('size采样尺寸:',b.shape)

输出结果，一二维度大小不会发生变化


tensor([[[[ 0.,  1.,  2.],
          [ 3.,  4.,  5.]],

         [[ 6.,  7.,  8.],
          [ 9., 10., 11.]]]])

tensor([[[[ 0.0000,  0.6250,  1.3750,  2.0000],
          [ 0.7500,  1.3750,  2.1250,  2.7500],
          [ 2.2500,  2.8750,  3.6250,  4.2500],
          [ 3.0000,  3.6250,  4.3750,  5.0000]],

         [[ 6.0000,  6.6250,  7.3750,  8.0000],
          [ 6.7500,  7.3750,  8.1250,  8.7500],
          [ 8.2500,  8.8750,  9.6250, 10.2500],
          [ 9.0000,  9.6250, 10.3750, 11.0000]]]])
原数组尺寸: torch.Size([1, 2, 2, 3])
size采样尺寸: torch.Size([1, 2, 4, 4])

`size` 与 `scale_factor` 的区别：输入序列时

import torch.nn.functional as F
import torch

a=torch.arange(4*512*14*14,dtype=torch.float32).reshape(4,512,14,14)
b=F.interpolate(a,size=(28,56),mode='bilinear')
c=F.interpolate(a,scale_factor=(4,8),mode='bilinear')
print('原数组尺寸:',a.shape)
print('size采样尺寸:',b.shape)
print('scale_factor采样尺寸:',c.shape)

输出结果

原数组尺寸: torch.Size([4, 512, 14, 14])
size采样尺寸: torch.Size([4, 512, 28, 56])

scale_factor采样尺寸: torch.Size([4, 512, 56, 112])

`size` 与 `scale_factor` 的区别：输入整数时

import torch.nn.functional as F
import torch

a=torch.arange(4*512*14*14,dtype=torch.float32).reshape(4,512,14,14)
b=F.interpolate(a,size=28,mode='bilinear')
c=F.interpolate(a,scale_factor=4,mode='bilinear')
print('原数组尺寸:',a.shape)
print('size采样尺寸:',b.shape)
print('scale_factor采样尺寸:',c.shape)

输出结果

原数组尺寸: torch.Size([4, 512, 14, 14])
size采样尺寸: torch.Size([4, 512, 28, 28])

scale_factor采样尺寸: torch.Size([4, 512, 56, 56])

`align_corners` =True与False的区别

import torch.nn.functional as F
import torch

a=torch.arange(18,dtype=torch.float32).reshape(1,2,3,3)
b=F.interpolate(a,size=(4,4),mode='bicubic',align_corners=True)
c=F.interpolate(a,size=(4,4),mode='bicubic',align_corners=False)

print(a)
print(b)
print(c)

输出结果， 具体效果会因mode插值方法而异

tensor([[[[ 0.,  1.,  2.],
          [ 3.,  4.,  5.],
          [ 6.,  7.,  8.]],

         [[ 9., 10., 11.],
          [12., 13., 14.],
          [15., 16., 17.]]]])

tensor([[[[ 0.0000,  0.5741,  1.4259,  2.0000],
          [ 1.7222,  2.2963,  3.1481,  3.7222],
          [ 4.2778,  4.8519,  5.7037,  6.2778],
          [ 6.0000,  6.5741,  7.4259,  8.0000]],

         [[ 9.0000,  9.5741, 10.4259, 11.0000],
          [10.7222, 11.2963, 12.1481, 12.7222],
          [13.2778, 13.8519, 14.7037, 15.2778],
          [15.0000, 15.5741, 16.4259, 17.0000]]]])

tensor([[[[-0.2871,  0.3145,  1.2549,  1.8564],
          [ 1.5176,  2.1191,  3.0596,  3.6611],
          [ 4.3389,  4.9404,  5.8809,  6.4824],
          [ 6.1436,  6.7451,  7.6855,  8.2871]],

         [[ 8.7129,  9.3145, 10.2549, 10.8564],
          [10.5176, 11.1191, 12.0596, 12.6611],
          [13.3389, 13.9404, 14.8809, 15.4824],
          [15.1436, 15.7451, 16.6855, 17.2871]]]])

扩展：

在计算机视觉中， interpolate函数常用于图像的放大(即上采样操作)。比如在细粒度识别领域中，注意力图有时候会对特征图进行裁剪操作，将有用的部分裁剪出来，裁剪后的图像往往尺寸小于原始特征图，这时候如果强制转换成原始图像大小，往往是无效的，会丢掉部分有用的信息。所以这时候就需要用到 interpolate函数对其进行 上采样操作，在 保证图像信息不丢失的情况下，放大图像，从而 放大图像的细节，有利于进一步的特征提取工作。

官方文档

torch.nn.functional.interpolate：https://pytorch.org/docs/stable/generated/torch.nn.functional.interpolate.html?highlight=interpolate#torch.nn.functional.interpolate

点个赞支持一下吧

Original: https://blog.csdn.net/qq_50001789/article/details/120297401
Author: 视觉萌新、
Title: F.interpolate——数组采样操作

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/517948/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Vue】Vue-Router 路由的理解和使用（2）

‍还有一个问题要给大家解答: 我们可以看到上面路由的配置里面，‍‍当访问根路径的时候直接就展示Home组件，而下面为什么会有一个import这样的语法，【第19行】实际上‍‍ …

人工智能 2023年6月30日
0083
Vue考试题单选、多选、判断页面渲染和提交

前言: 这几天在写简易版的学生考试,当我们获取到后端返给我们的试题如何再提交给后端呢?这里我的题目只有单选、多选、判断题目首先我们看一下获取试题的数据结构,(这里的字段命名就不要吐…

人工智能 2023年6月27日
0067
【pytorch】关于OpenCV和PIL.Image读取图片的区别

首先从pytorch出发，torchvision.transforms()要求传入的图像是PIL.Image格式（通道要求是RGB格式的），另外模型处理输入要转换为[1,chann…

人工智能 2023年7月19日
0034
pandas算加权平均值_使用Pandas数据框计算加权平均值

I have te following pandas dataframe: data_df = pd.DataFrame({‘ind’:[‘la…

人工智能 2023年7月8日
0064
Python实现导弹自动追踪

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0056
《CTDNet：Complementary Trilateral Decoder for Fast and Accurate Salient Object Detection》论文笔记

参考代码：CTDNet 概述导读：这是一篇关于显著性目标检测的文章，文章对影响显著性目标检测的网络各个部分进行探究，也就是将需要在一张图像中获取的信息划分为3个部分：语义上下文…

人工智能 2023年7月12日
0045
《R语言与数据挖掘》⑤高级绘图工具【lattice包】【ggplot2】【交互式】

书籍：《R语言与数据挖掘》作者：张良均出版社：机械工业出版社 ISBN：9787111540526 本书由北京华章图文信息有限公司授权杭州云悦读网络有限公司电子版制作与发行版…

人工智能 2023年7月17日
0055
Kaggle（入门）

如果你想在上运行自己的代码，可以按照以下步骤进行操作： 1. 登录账号并创建一个新的 Notebooks。 2. 在 Notebooks 中选择”+ Add Dat…

人工智能 2023年7月18日
0029
知识图谱 & 图 & 强化学习 & 推荐系统

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月5日
0056
基于springboot二手交易平台

开发工具：IDEA 服务器：Tomcat9.0， jdk1.8 项目构建：maven 数据库：mysql5.7 系统分前后台，非前后端分离前端技术：vue.js+elementU…

人工智能 2023年6月27日
0080
OpenCV-Python实战（番外篇）——利用 K-Means 聚类进行色彩量化

OpenCV-Python实战（番外篇）——利用 K-Means 聚类进行色彩量化 * – 前言 – 利用 K-Means 聚类进行色彩量化 –…

人工智能 2023年5月26日
0065
深度学习中正样本、负样本、简单样本、困难样本的区别（简单易懂）

在读论文或者看一些博客的时候，经常会出现这种名词：正样本、负样本、简单样本以及困难样本，最近自己为了加深这方面的理解，参考网上的一些资料，整理了下这几者之间的区别，方便自己查看也方…

人工智能 2023年6月16日
0060
想去看演唱却总是抢不到票？教你用Python制作一个自动抢票脚本

前言嗨喽！大家好，这里是魔王！！大麦网，是中国综合类现场娱乐票务营销平台，业务覆盖演唱会、话剧、音乐剧、体育赛事等领域。但是因为票数有限，还有黄牛们不能丢了饭碗，所以导致了…

人工智能 2023年7月3日
0075
文本的检测、识别实战：使用 Tesseract 进行 OpenCV OCR 和文本识别

在本篇文章中，我们将使用 OpenCV、Python 和 Tesseract 执行 (1) 文本检测和 (2) 文本识别。上篇文章，我向您展示了如何使用 OpenCV 的 EAS…

人工智能 2023年5月31日
0085
python处理几十g的数据_Python数据处理（持续更新）

打开txt文件打开txt文件 with open(‘day02.txt’) as f:for line inf.readlines(): aline=li…

人工智能 2023年7月8日
0061
yolov4-tiny从安装到训练再到python调用接口

（一）安装在GitHub网址https://github.com/AlexeyAB/darknet下载最新版的darknetAB源码解压后会生成名为darknet-master的…

人工智能 2023年7月11日
0049

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

F.interpolate——数组采样操作

一般用法

size 与 scale_factor 的区别：输入序列时

size 与 scale_factor 的区别：输入整数时

align_corners =True与False的区别

大家都在看

`size` 与 `scale_factor` 的区别：输入序列时

`size` 与 `scale_factor` 的区别：输入整数时

`align_corners` =True与False的区别