论文笔记 ICML 2017|Deep Value Networks Learn to Evaluate and Iteratively Refine Structured Outputs

2023年5月31日上午3:07 • 人工智能 • 阅读 72

文章目录

*
– 1 简介
–
+ 1.2 创新
– 2 背景知识
– 3 方法
– 4 实验

1 简介

论文题目：Deep Value Networks Learn to Evaluate and Iteratively Refine Structured Outputs
论文来源：ICML 2017
论文链接：https://arxiv.org/pdf/1703.04363.pdf
代码链接：https://github.com/gyglim/dvn

1.2 创新

提出一个deep value network(DVN)模型，将x和y作为输入，输出一个标量，衡量x和y的一致性。(学习批判不同的输出比学习直接提出最佳预测更容易)
在文本分类和图像分割任务上达到sota。

2 背景知识

Structured output prediction学习一个input到多元离散output的映射，loss函数如下(对于多分类任务使用负F1值；图像分割任务使用负IOU)：

论文笔记 ICML 2017|Deep Value Networks Learn to Evaluate and Iteratively Refine Structured Outputs

优化得分函数，使预测得分接近负损失值：

在预测时：

; 3 方法

提出一个deep value network为v ( x , y ; θ ) v(x,y;\theta)v (x ,y ;θ)，预测一个标量，评估x和y的一致性，在训练期间假设oracle value function为：

用于图像分割和多标签分类的oracle value function包括 IOU 和 F1 指标：

使用简单的梯度下降优化器进行推理,将y ∈ { 0 , 1 } M y \in {0,1}^M y ∈{0 ,1 }M替换为y ∈ [ 0 , 1 ] M y \in [0,1]^M y ∈[0 ,1 ]M,经过多次梯度上升：

为了训练DVN，需要扩展v ∗ ( y , y ∗ ) v(y,y)v ∗(y ,y ∗)的范围(以适应连续的输出y),对于IOU和F1分数，通过max和min扩展交集和并集的概念。

loss函数如下：

训练DVN的算法过程如下：

每一个训练样本包括input，output和oracle value,如( x , y , v ∗ ) (x,y,v^*)(x ,y ,v ∗),生成训练样本有下面三种方式：

在训练期间进行基于梯度的推理
生成对抗样本(v ( x , y ; θ ) v(x,y;\theta)v (x ,y ;θ)和( x , y , v ∗ ) (x,y,v^*)(x ,y ,v ∗)有很大的差异,通过最大化loss生成)
随机取样(可能与y ∗ y^y ∗有偏差，p ( y ) ∝ e x p { v ∗ ( y , y ∗ ) / τ } p(y)\propto exp{v^(y,y^*)/\tau }p (y )∝e x p {v ∗(y ,y ∗)/τ})

4 实验

多标签分类选择的数据集为Bibtex和Bookmarks(使用SPENs作为模型结构)，实验结果如下图：

图像分割选择的数据集为Weizmann horses，使用的模型结构和实验效果如下图：

可视化结果：

在Labeled Faces in theWild数据集上进行图像分割的实验效果如下图：

可视化结果：

消融实验结果：

在Weizmann数据集上可视化模型学到的内容：

Original: https://blog.csdn.net/o11oo11o/article/details/122565475
Author: hlee-top
Title: 论文笔记 ICML 2017|Deep Value Networks Learn to Evaluate and Iteratively Refine Structured Outputs

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/548171/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python文字转换为数字信号的过程_使用python脚本进行文本转换的方法

使用python脚本进行文本转换的方法发布时间：2020-11-13 10:05:40 来源：亿速云阅读：96 作者：小新小编给大家分享一下使用python脚本进行文本转换的…

人工智能 2023年5月27日
0092
印章识别–笛卡尔坐标系转换成极坐标系

#代码，使用了opencv自带的函数linearPolar import cv2 import numpy as np source = cv2.imread(‘images/im…

人工智能 2023年7月19日
0048
NLP标注工具Brat详细使用教程

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月27日
0081
轻松搞懂Word2vec / FastText+BiLSTM、TextCNN、CNN+BiLSTM、BiLSTM+Attention实现中英文情感分类

代码（包括数据集）链接放在文末。本人在大三期间做了一个关于”疫苗接种”主题的舆情分析，主要涉及的技术有：爬虫（微博和知乎评论）、数据清洗、文本特征提取、建…

人工智能 2023年5月31日
0098
Flink1.15源码解析–安全模块及安全上下文

文章目录 * – 1.6、通过 SPI 加载安全配置模块 – + 1.6.1、SecurityConfiguration 初始化 + 1.6.2、Secur…

人工智能 2023年6月29日
0092
AI 音辨世界：艺术小白的我，靠这个AI模型，速识音乐流派选择音乐

💡 作者：韩信子@ShowMeAI📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40📘 机器学习实战系列：https://www.s…

人工智能 2023年6月11日
0078
Complementary Trilateral Decoder for Fast and Accurate Salient Object Detection（速读啊）内含与u-shape的对比

今天早早起来了吃完饭就开始干活了十点开始读论文所以速读适合没有很长事假你的情况下，你只需要读懂大意就可以了 QAQ，bhys，以后一定精读，好好找找里面的专业名词整理下来呜呜…

人工智能 2023年7月10日
0072
西瓜书第六章课后题

本文章有的是自己做的，有的是参考其他人的答案，毕竟能力有限，完全使用的放上原博主的博客，仅做自己个人学习使用。如有冒犯和侵权，本人会立刻进行删除，感谢这些能做出来的大神。 6.1 …

人工智能 2023年6月17日
0063
BERT如何进化-预训练语言模型研究进展【1】

模型结构演进本文以演进方向和目的为线索梳理了一些我常见到但不是很熟悉的预训练语言模型，首先来看看”完全版的BERT”： RoBERTa: A Robust…

人工智能 2023年6月4日
0068
最新版腾讯防水墙（二代）识别

2022最新版腾讯防水墙（二代）识别戳这里→康康你手机号在过多少网站注册过！！！友情推荐：新一代安全短信 * 验证&#x780…

人工智能 2023年7月18日
0057
Pytorch搭建常见分类网络模型——VGG、Googlenet、 MobileNetV3、ResNet50（1）

常见的分类网络都可以分为两部分，一部分是特征提取部分，另一部分是分类部分。 1、特征提取部分的功能是对输入进来的图片进行特征提取，优秀的特征可以帮助更容易区分目标，所以特征提取…

人工智能 2023年7月1日
0077
设计模式-建造者模式

在我们生活中的对象比如汽车，它是由车轮、车架、发动机等组合起来的对象，但是往往使用的人只想要一辆汽车并不想知道创建汽车的过程此时就可以使用建造者模式。在软件开发中，也存在大量类似…

人工智能 2023年6月27日
0077
机器学习——PCA与LDA

机器学习——PCA与LDA PCA 推导一个PCA LDA LDA的中心思想是什么 LDA的优缺点 LDA的步骤推导LDA PCA和LDA有什么区别偏差与方差 SVD 伯努利分…

人工智能 2023年6月16日
0065
前向传播代码解析——你真的明白了吗？

我们知道预训练模型通常包括两部分：def _ init _ (self,last_conv_stride=2): 和def forward(self,x):两部分，前者主要用来继承…

人工智能 2023年5月25日
0056
相机校准—外参矩阵

在本文中，我们将探讨摄影机的外参，并通过Python中的一个实践示例来加强我们的理解。相机外参摄像头可以位于世界任何地方，并且可以指向任何方向。我们想从摄像机的角度来观察世界上…

人工智能 2023年7月28日
0068
基于强化学习的图像配准 – Image Registration: Reinforcement Learning Approaches

配准定义给定参考图像 I_f 和浮动图像 I_m ，所谓的配准就是寻找一个图像变换T，将浮动图像I_m变换到和 I_f 相同的坐标空间下，使得两个图像中对应的点处于同一坐标下，从…

人工智能 2023年5月28日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31