Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation

2023年5月30日上午11:23 • 人工智能 • 阅读 79

Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation（探索和提炼后验和先验知识的放射学报告生成）

*
– 先验与后验
– 目前的放射学报告生成的局限性
– Paper的贡献
– 模型详解
–
+ 模型输入
+ 模型主要部分

先验与后验

在阅读这篇Paper之前，我们首先需要明确什么是先验和后验。先验是指根据以往经验和分析，而后验是指基于新的数据，对原来的先验修正。
通俗而言，
先验知识：这些柿子红了，肯定已经熟了
后验知识：我刚刚吃了柿子，已经熟透了

目前的放射学报告生成的局限性

目前的大多数的放射学报告都采用encoder-decoder结构，比如CNN-HRNN等，CNN从整个图像中提取图像特征，然后由HRNN生成报告。
这样的是直接将image-caption方法引入到了放射学报告生成这一领域，未免太粗暴了一些，会产生以下两个问题：

Visual data deviation:数据集中正常图像是多数，而异常是少数，其次，正常图像的外观大大优于异常图像，会分散模型的注意力，使其无法准确捕捉罕见且多样的异常区域特征
Textual data deviation: 一份放射学报告，医生倾向于在衣服图像中描述所有的项目，使得对正常区域的描述占了主导，这样就会导致文本分布的极不平衡，使用这样的数据集进行训练就会导致模型无法定位关键异常，例如HRNN就只能生成一些重复的正常句，并不能描述异常。在放射学报告中，产生异常的正确性应比其他正常情况更受重视，而在自然图像段落中，每句话都具有同等的重要性。

这里解释HRNN的原理， HRNN——分层循环神经网络，可以用来生成长且语义连贯的段落来描述输入图像，HRNN用两级RNN，一个段落RNN，一个句子RNN，段落RNN生成主题向量，句子RNN对每一个主题向量生成句子描述图像

Paper的贡献

为了缓解数据偏差问题，本文提出了后验和先验知识探索和提取方法，包括后验和先验知识探索器(PoKE和PrKE)和多领域知识提取器(MKD)。
PoKE使用疾病的词袋探索后验知识，捕捉罕见、多样和重要的异常区域;PrKE从以前的工作经验和以前的医学知识中探索以前的知识;MKD将提取的知识提取出来生成报告。
通过对IU-Xray和MIMIC-CXR公开数据集的实验和分析，验证了该方法的有效性，在这两个数据集上，该方法的性能优于目前最先进的模型。

模型详解

Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation

; 模型输入

PPKED需要的输入：Image Embedding、Word Embedding（包含大部分常见的abnormalities和findings）、先验工作经验、先验医学知识，一共四部分
Image Embedding：利用ResNet152 提取2048个 7*7的特征图，然后把它们映射到512维上
Word Embedding: 实验中，选择了20个最常见的异常主题，例如心脏肿大、脊柱侧凸、骨折等等。
先验的工作经验：从ResNet-152的最后一个平均池化层提取image embedding，这个image embedding是针对所有图像的; 然后对于给定一张图片。在语料库中找与输入图像余弦相似度最高的100张图片，将这样检索到的100张图片的报告用BERT和一个最大池化连接层进行编码，以此得到工作经验
先验医学知识：构建一张医学图。词袋中的主题被设置为节点，根据它们相关的器官和身体部分进行分组；对于分在一起的主题用边连接起来，用图卷积神经网络提取先验医学知识（一组节点）When radiology report generation meets knowledge graph.

模型主要部分

PoKE: 从输入的图像中提取后验知识，对图像进行编码，然后根据余弦相似度过滤掉不想关的主题，因为词袋中包含的是异常的主题，所以这样就可以找到异常区域，还可以将参与的异常区域和相关主题进行对齐，模拟放射科医生在检查异常区域时将疾病主题分配给异常区域的工作模式，对齐后直接相加经过LayerNorm就得到了图像的后验知识，这些后验知识被称为放射科医生检查异常区域的第一印象
PrKE: 由先前工作经验和先前医学知识组成，分别用Wpr和Gpr来表示，通过这两个部分来处理PoKE中的后验知识，就可以获得输入图像异常区域的先验知识
MKD: 获得先验与后验知识后，MKD作为解码器来生成最终的放射学报告；MKD将词嵌入和位置嵌入和作为输入

Original: https://blog.csdn.net/qq_45645521/article/details/123493075
Author: Jason Avicii
Title: Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/542523/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pytorch中的 torch.Tensor() 和 torch.tensor() 的区别

直接在搜索引擎里进行搜索，可以看到官方文档中两者对应的页面：分别点击进去，第一个链接解释了什么是 torch.Tensor： torch.Tensor 是一个包含单一数据类型元素…

人工智能 2023年7月22日
0060
【机器学习】聚类算法——DBSCAN算法（理论+图解）

🌠 『精品学习专栏导航帖』 🐳最适合入门的100个深度学习实战项目 🐳 🐙【PyTorch深度学习项目实战100例目录】项目详解 + 数据集 + 完整源码 🐙 🐶【机器学习入门项目…

人工智能 2023年6月2日
00145
【YOLO系列】YOLO V1 论文精读与学习总结

目录 0. 前言 1.YOLO V1 大体思路 2. YOLO V1的训练过程 * 2.1 YOLO V1网络结构 2.2 具体训练过程 – 2.2.1 把主干结构在I…

人工智能 2023年7月9日
0073
关于汽车领域的知识图谱实战入门

根据https://www.bilibili.com/video/BV1iv411k7qG整理 01实体识别基于nlp的g3语言去抽取实体对象和基于关系抽取的情境下，用到命名实体…

人工智能 2023年6月1日
0063
中文实体命名识别工具使用汇总：Stanza、LAC、Ltp、Hanlp、foolnltk、NLTK、BosonNLP

实体命名识别 * – 相关知识 – Stanford CoreNLP 命名实体识别 – + 一、简介： + 二、java版本使用 + 三、pyt…

人工智能 2023年6月1日
0087
Anaconda安装Jupyter Notebook及使用

文章目录 * – + 一、什么是Jupyter Notebook + * 1. 网页应用 * 2. 文档 + 二、安装 Jupyter Notebook + * 1. …

人工智能 2023年7月29日
0099
时间序列工具库学习（11） Darts模块-N-BEATS模型

1.导库 N-BEATS是一个最先进的模型，它展示了时间序列预测背景下纯深度学习架构的潜力。它在M3和M4比赛中优于成熟的统计方法。有关模型的更多详细信息，请参见：论文 from …

人工智能 2023年7月7日
0060
数据分析师的职场晋升

数据分析师怎么晋升？数据分析师的优势在哪？数据分析师的护城河在哪？以上三个问题我相信很多数据相关的同学都有疑问。对于我(螺丝钉)来说，工作8年，现任数据负责人。分别做过SR…

人工智能 2023年6月19日
0065
arduino与语音模块LDV7（LD3320）的串口通信实现简单语音控制

文章目录简述器件代码部分测试结果总结简述这里利用语音识别模块与arduino UNO 测试一个简单的语音控制小灯亮灭的程序。希望能给我一样的在两个东西的串口通信有困惑…

人工智能 2023年5月27日
0088
python 梦幻西游_tensorflow实践：梦幻西游人物弹窗识别（二）

由上一篇的思路我们可以定义以下的具体实现步骤本篇将围绕窗口捕获、屏幕截图、截图切分讲述screen.py代码环境描述C:\Users\SF>ver Microsoft W…

人工智能 2023年5月26日
0071
【神经网络】(18) EfficientNetV2 代码复现，网络解析，附Tensorflow完整代码

各位同学好，今天和大家分享一下如何使用 Tensorflow 搭建 EfficientNetV2 卷积神经网络模型。 EfficientNetV2 在 EfficientNetV1…

人工智能 2023年5月25日
00124
csv文件python读取报错编码错误问题终极完美解决

用jupyter notebook连接服务器&a…

人工智能 2023年7月7日
0068
【信息检索导论】第一章布尔检索

总览第一章主要介绍了信息检索，布尔检索的概念以及一些检索的基本定义，如倒排索引等。 1.1 信息检索的一个例子信息检索（information retrieval）：从大规模非…

人工智能 2023年5月30日
0099
浅析拉格朗日乘数法及其对偶问题

在数学最优问题中，拉格朗日乘数法（以数学家约瑟夫·路易斯·拉格朗日命名）是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法。这种方法将一个有n个变量与k个约束条件的最优化问…

人工智能 2023年6月4日
0052
【数字图像处理】OpenCV相机标定计算内参外参

相机标定理论四个坐标轴的变换关系：（1）从 world 到 camera （2）从camera到image（3）从 image 到 pixel（4）从world 到 pixel…

人工智能 2023年5月26日
0091
卡尔曼滤波实例——预测橘子的轨迹

目录流程一、采用轮廓的方式检测橘子位置（一）滚动条获取阈值（二）获取到图像中的包围橘子对应的白色图形的最小矩形框的信息二、获取橘子检测框的质心三、将质心送入卡尔曼滤波器…

人工智能 2023年7月20日
0072

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30