计算机视觉中的编码-解码器结构总结（持续更新）

2023年6月24日上午6:21 • 人工智能 • 阅读 203

文章目录

NLP领域的编码解码器结构
机器学习中的编码器
*
自动编码器
视觉领域中的编码解码器结构

编码器-解码器结构：编码器原始输入信号转化为中间格式，然后解码器将中间格式转化为目的信号。在NLP领域的机器翻译、摘要提取等部分，在视觉领域的目标检测、场景感知，在传统的机器学习中MLP等等都是Encoder-Decoder的结构。

NLP领域的编码解码器结构

直接用一个函数完成数据转化，可能会存在困难。例如对机器翻译来说输入和输出的长度是不固定的，二者还可能不相等，因此通过一个中间格式来完成输出与输入的转化。

对于NLP任务，Embedding是从语义空间到向量空间的映射，语义相近的两个词汇在向量空间的位置也比较接近，编码器-解码器网络是一个成功的翻译模型，接受一个序列作为输入，并将序列中的信息编码作为中间表示，解码器将中间表示解码为目标语言。

如上图所示，RNN中的Seq-to-Seq结构，处理机器翻译问题，将原始语言向量输入通过RNN编码为中间形式，后面通过Decoder解码为另一种语言向量序列。

; 机器学习中的编码器

自动编码器

最简单的，PCA在机器学习领域作为一种降维的工具，可以将样本投影在新的坐标系下，相当于一种新的中间表示形式，我们后面用线性回归或者SVM进行分类等任务，这时候机器学习模型扮演解码器的结构，这是一种 非自动编码器，需要先人工干预编码，然后训练解码器。

如上图所示，自动编码器（Auto-Encoder，简称AE）是一种特殊的神经网络，用于特征提取和数据降维络。最简单的自动编码器由一个输入层，一个隐含层，一个输出层组成。隐含层的映射充当编码器，输出层的映射充当解码器。训练时编码器对输入向量进行映射，得到编码后的向量；解码器对编码向量进行映射，得到重构后的向量，它是对输入向量的近似。

编码器和解码器同时训练，训练的目标是最小化重构误差，即让重构向量与原始输入向量之间的误差最小化，这与PCA非常类似。因此样本x的标签值就是样本自身。训练完成之后，在预测时只使用编码器而不再需要解码器，编码器的输出结果被进一步使用，用于分类，回归等任务。

; 视觉领域中的编码解码器结构

Transfuser：多模态领域

如上图所示，模型将图像和雷达信息编码成512长度的一维向量，表示场景语义信息，后面用MLP组合RNN进行解码，预测车辆的行动轨迹。
这种结构，其实就是将CNN产生的局部注意力图用作transformer计算全局注意力，从而达到 快速收敛和稳定的效果
SRN-DeblurNet：高质量图像生成

对原图像（带有噪声、低分辨率）编码并解码生成高分辨率去噪图片。
DETR：目标检测

利用CNN和Encoder作为编码器生成中间形式的查询向量，然后通过Decoder解码用来FFN预测目标信息。
利用CNN做预处理的优点是，虽然牺牲了浅层部分的全局注意力，但是CNN特征图可以带来有效的局部信息和较少的噪声（这里的噪声是指无关的像素），我认为是起到一种过滤器的效果。

Original: https://blog.csdn.net/weixin_43253464/article/details/123525214
Author: naca yu
Title: 计算机视觉中的编码-解码器结构总结（持续更新）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/648596/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Java多线程记录(包含案例)

线程是程序的执行单元，执行路径。是程序使用CPU的最基本单位多线程 — 程序有多条执行路径，提高应用进程的使用率进程中线程越多，抢到CPU执行权概率越高。线程的执行…

人工智能 2023年6月4日
0063
【opencv-python】大津法（Otsu）阈值分割原理深入分析

大津法（Otsu）是图像处理领域里面较为重要的阈值分割方法，适用于处理双峰图像。但大多数开发人员并不熟悉其原理，因此有必要对其进行详细说明与分析。 opnecv的实例代码链接为：o…

人工智能 2023年7月18日
0074
TensorFlow+Pytorch识别阿猫阿狗

文章目录猫狗大战 * 前言 1. TensorFlow版 – 1.1 获取数据集 1.2 载入划分训练集，并且构造数据生成器 1.3 模型构建与训练 2. Pytor…

人工智能 2023年5月24日
0095
Uninformed Students: Student-Teacher Anomaly Detection with Discriminative Latent Embeddings论文复现及解析

paper地址Uninformed Students: Student-Teacher Anomaly Detection with Discriminative Latent E…

人工智能 2023年6月20日
0091
deepspeech 笔记

为了回馈广大粉丝和订阅者，我在之前的笔记中看到了一些可能对你有用的信息。我希望它能对你有所帮助。 [En] In order to give back to the majorit…

人工智能 2023年5月27日
0049
【python游戏制作】拼图永不过时，这就是我这个年龄该玩的游戏~

前言嗨喽~大家好呀，这里是魔王呐 ! 拼图游戏是广受欢迎的一种智力游戏，它的变化多端，难度不一它分为单面拼图、双面拼图、立体拼图、球形拼图、虚拟拼图今天我就给带来虚拟的单面拼…

人工智能 2023年6月30日
0075
Python列表推导式（更有风格的Python代码写法）

所谓推导式也就是Python中一种更有风格的Python代码的写法。什么样是有风格的呢？假如有个需求，它可能需要三行五行甚至是更多行代码完成，但是如果是同样的需求用推导式来书写的话…

人工智能 2023年7月4日
0069
Hopfield神经网络（HNN）详解

Hopfield神经网络是一种比较特殊的网络，它不像一般的神经网络那样有输入层和输出层，并且通过训练来改变神经网络中的参数，最终实现预测、识别等功能。Hopfield网络只有一群神…

人工智能 2023年7月30日
0075
JPEG图片编码格式分析

图片展示需要BGR模式的三维向量，图片的编码是把BGR图片编码成文件能存储的格式，解码则反之。目前常见的编码为jpg、png、gif等。新兴的如webp、heic。 BMP 从简单…

人工智能 2023年6月18日
0090
OpenCV数字图像处理基于C++：灰度变换

OpenCV数字图像处理基于C++：灰度变换 1.1 灰度变换概念在图像预处理中，图像的灰度变换是图像增强的重要手段，灰度变换可以使图像对比度扩展，图像清晰，特征明显，灰度变换主…

人工智能 2023年6月18日
0082
Java&线程&协程

目录线程的实现（OS&&JVM） 1.内核线程实现 2.用户线程实现 3.混合实现 4.Java线程的实现 ——如何实现不受Java虚拟机规范的约束 Java线程…

人工智能 2023年6月27日
0080
【自然语言处理】【聚类】基于对比学习的聚类算法SCCL

基于对比学习的聚类算法SCCL 相关博客：【自然语言处理】【聚类】基于神经网络的聚类算法DEC【自然语言处理】【聚类】基于对比学习的聚类算法SCCL【自然语言处理】【聚类】DCSC…

人工智能 2023年5月27日
0087
RAFT:使用深度学习的光流估计

在这篇文章中，我们将讨论两种基于深度学习的使用光流进行运动估计的方法。FlowNet是第一种用于计算光流的CNN方法，RAFT是目前最先进的估算光流的方法。我们还将看到如何使用作者…

人工智能 2023年7月22日
0094
强化学习之stable_baseline3详细说明和各项功能的使用

本文基于官方文档的基础上，把其中的重要部分整合和翻译，并整理成容易理解的顺序。其中蕴含有大量使用案例，方便大家理解和查看。官方文档：https://stable-baseline…

人工智能 2023年6月16日
0098
【matlab图像处理】映射和仿射变换

中国史之【恭王即位】：周恭王姬繄（yi）扈，周穆王之子。周恭王继位后，裁减军队，明法息民，令百姓安于生产；采取和平稳定的外交政策；允许土地自由买卖，这是西周王朝首次把士地私有合法化…

人工智能 2023年6月20日
00107
Keras CIFAR-10分类自定义simple CNN篇

; Keras CIFAR-10分类自定义simple CNN 文章目录 Keras CIFAR-10分类自定义simple CNN * keras介绍 – ker…

人工智能 2023年7月1日
0063

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

计算机视觉中的编码-解码器结构总结（持续更新）

文章目录

自动编码器

大家都在看