关系抽取信息抽取知识图谱

2023年6月1日下午5:16 • 人工智能 • 阅读 81

20210629

http://cmekg.pcl.ac.cn/
cmekg 知识图谱，关系抽取

20210628

https://www.cnblogs.com/robert-dlut/p/14343408.html
中文电子病历命名实体识别（CNER）研究进展

http://www.cips-chip.org.cn/2020/eval2
chip 关系种类

http://schema.omaha.org.cn/class/Severities
hita知识图谱 schama

yidu-n7k_医疗实体名词标准化
应该没啥用直接共指关系就可以解决

20210627

https://blog.csdn.net/hacker_long/article/details/100148374/
【每周NLP论文推荐】掌握实体关系抽取必读的文章

https://github.com.cnpmjs.org/thunlp/NREPapers
快速必须看的关系抽取论文

Consider the location-contains relation, imagining
that in Freebase we had two instances of
this relation: hVirginia, Richmondi and
hFrance, Nantesi.

实例和关系

20210624

https://zhuanlan.zhihu.com/p/379130398
https://aistudio.baidu.com/aistudio/competition/detail/65
https://gitee.com/baymax_syt/kg-2019
http://lic2019.ccf.org.cn/kg

百度关系抽取比赛

https://zhuanlan.zhihu.com/p/47949341
知识图谱的本体模型设计和ER模型设计的区别

节点融合:本质上是同一个实体的不同提及合并成一个实体

本体:以大类作为节点来构图?

从以往经验看来，一个合理的本体模型大概要满足以下几点要求：

有效地支撑业务的分析和决策。
正确一致地展示数据信息。
拥有广泛的适用性，易于添加新的节点类型和关系。

20210616

https://zhuanlan.zhihu.com/p/69362160
医疗健康文本的关系抽取和属性抽取

https://blog.csdn.net/demm868/article/details/110944404
实体-关系信息抽取上线使用F1值87.1% (附数据集)

https://blog.csdn.net/qq_27590277/article/details/108701469
医疗NLP相关数据集整理

关系提取

零氪科技医学文本实体关系抽取

https://github.com/lyn2018lyn/awesome_chinese_medical_nlp
医疗NLP 资源汇总重点

https://blog.csdn.net/qq_35914625/article/details/109307361
https://github.com/beader/ruijin_round2
里面有竞赛连接和数据集
天池下的瑞金医院MMC人工智能辅助构建知识图谱

大部分都属于跨句子但是局限于一个段落内
而不是跨段落文档级

https://blog.csdn.net/weixin_40485502/article/details/104294410
跨句多元关系抽取

SOTA集结，2020登顶关系抽取的3篇佳作
https://blog.csdn.net/qq_27590277/article/details/113101227

20210615

需要明确的问题

mult-tun qa
和
joint model 二者可以解决嵌套实体的问题?

1.基于transformer
2.远程监督
3.现实体训练数据量
4.关系种类个数
5.限定域还是开放域
6.是否开放关系抽取
7.少样本量学习
8.文档级关系抽取
9.对抗网络快速实现
10.基于预训练和transformer的模型
或者EPGNN
11.考察openNER

20210610

1.问宏当的问题
那种信息抽取效果最好
精度,泛化性
2.需要明确的问题
2.1 标注数据的多少
2.2 实体和关系的多少
2.3计划先半个月出 demo

wang shi yang:
数据量少
wang shi yang:
标注工作量大
wang shi yang:
1.三元组提取出来
wang shi yang:
2. 实体消歧义
wang shi yang:
实体统一
wang shi yang:
3.构建知识图谱
wang shi yang:
95%
wang shi yang:
事件抽取
wang shi yang:
训练数据
wang shi yang:
由于
wang shi yang:
实体定义关系定义
wang shi yang:
半个月一个月效果
wang shi yang:
实体关系太多可能效果不好

https://blog.csdn.net/sdu_hao/article/details/105314218

关系抽取方法综述

信息抽取(Information Extraction, IE)是从自然语言文本中抽取结构化信息的领域。该领域用于各种NLP任务，如创建知识图谱、问答系统、文本摘要等。关系抽取本身就是IE的一个子域。

OpenIE 5.0和Stanford OpenIE是这样做的两个开源系统。它们比TextRunner更现代(这里只是用它来演示范例)。我们可以期望从这样的系统输出许多不同的关系类型(因为我们没有指定我们感兴趣的关系类型)。

https://zhuanlan.zhihu.com/p/349716490
综述：关系抽取，挑战与机遇并存！
未看完
在大多数情况下，一个关系只有很少的数据，这使得简单的关系抽取模型无能为力，为了解决监督学习中的数据需求问题，一种办法是上述提及的远程监督的方法，自动生成带有标签的训练数据，减轻人工标注数据的成本；另一种办法是研究如何充分利用少量标注数据进行训练，使得模型具有更好的泛化能力，即少样本学习（ Few-shot Learning），少样本关系抽取任务的目的是通过少量的标注样本数据训练（或者微调）模型，使模型可以快速学习到一个或几个关系类别的特征信息，从而对这些类别准确分类。

少样本学习主要有两类主要方法：

1、度量学习：谷歌提出的 MTB 模型[8]在FewRel上面取得了 SOTA 的效果，采用对比学习的思想，利用 BERT 预训练模型，引入 matching the blanks 目标：如果两个句子中包含相同的实体对，那么它们关系表示的相似度尽可能高，反之相似度应尽可能低。

一种无监督的图像/文本的表示学习。
Motivation：人类往往是通过对比来学习区分事物的。模型无需学习到过于具体的细节（图像：像素级别；文本：词语级别），只需要学习到足以区分对象的高层次的特征。

对比学习

对比学习广泛应用于图像领域的无监督表示学习，以MoCo(ICML2020)和SimCLR(2020)为代表，在ImageNet数据集上取得了显著的提升。「对比学习的核心在于如何构建正负样本集合」，图像领域一般通过旋转、裁剪等图片操作，而文本领域往往通过回译、字符插入删除等方法，这些方法依赖于领域经验，缺乏多样性和灵活性；因此，近期有一些论文（「Robust Pre-Training by Adversarial Contrastive Learning」）通过对抗攻击来做数据增强，获取正负样本，值得关注。

全局特征为锚点（anchor）

https://zhuanlan.zhihu.com/p/131275999
关系抽取综述与前瞻

https://zhuanlan.zhihu.com/p/74914680
基于深度学习的关系抽取综述

https://zhuanlan.zhihu.com/p/91762831
知识图谱从哪里来：实体关系抽取的现状与未来清华大学

https://blog.csdn.net/CSDN_wujian/article/details/100136621
关系抽取概述及研究进展Relation Extraction Progress
数据集

http://nlpprogress.com/english/relationship_extraction.html
关系抽取各种数据集对应的进展

Original: https://blog.csdn.net/kyle1314608/article/details/117791452
Author: weixin_ry5219775
Title: 关系抽取信息抽取知识图谱

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/557809/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【20210920】HMM入门

隐马尔可夫模型 Hidden Markov Model 1. 马尔可夫过程简介 2. {A、B、π \pi π} 3. 引入α , β \alpha,\beta α,β便于Eval…

人工智能 2023年5月25日
0074
数据结构-(2)链表

链表整体代码及相关操作： #include <stdio.h> #include <stdlib.h> #include <time.h> //…

人工智能 2023年6月4日
0075
open3d学习教程2–点云1

目录： 1.open3d介绍 2.点云 * 2.1 读取，可视化点云 2.2点云体素下采样 2.3点法线估计 2.4点云着色 1.open3d介绍接着上一节点云pointclou…

人工智能 2023年5月28日
0078
FPN(特征金字塔)-pytorch实践

1.FPN FPN来源于论文《Feature Pyramid Networks for Object Detection》 1.1要解决的问题传统的物体检测模型通常只在深度卷积网…

人工智能 2023年7月10日
0091
输电线路图像数据集

本人根据项目需求、研究兴趣收集了一些输电线路数据集、电网数据集、电气工程相关数据集，可结合人工智能中图像识别、目标检测、图像处理等技术实现智能化的设备状态诊断！包含以下数据集：（…

人工智能 2023年6月25日
0042
pandas 读写 excel 数据

pip install pandas pip install openpyxl 详情请参考 https://pandas.pydata.org/pandas-docs/stable…

人工智能 2023年7月7日
0084
tensorflow-gpu安装教程【1.x版本与2.x版本都适用的安装教程】cuda与cudnn简单安装（避坑），无需去官网下载

tensorflow-gpu安装教程【1.x版本与2.x版本都适用】cuda与cudnn简单安装，无需去官网下载 * – 1.安装Anaconda – 2….

人工智能 2023年5月26日
0042
计算机视觉与机器学习之6σ问题

前言本文章基于MATLAB的数字图像处理，结合概率论中的正态分布，可应用于工程实践中工件的筛选，拓展功能有基础的机器学习知识。因为没有工程现场及零件，所以本例的零件用冰糖来替代…

人工智能 2023年6月20日
0066
回归预测 | MATLAB实现RBF径向基神经网络多输入单输出

回归预测 | MATLAB实现RBF径向基神经网络多输入单输出目录 * – 回归预测 | MATLAB实现RBF径向基神经网络多输入单输出 – + 预测效…

人工智能 2023年6月18日
0062
分析方法论_用户生命周期的建立

前言工作中针对用户生命周期学习实践总结笔记，不足之处，希望改正很多。 [En] Work for the user life cycle learning practice su…

人工智能 2023年5月27日
0088
torch.hub.load()解析，如何加载本地权重

用yolov5训练了一个权重，项目只能部署在本地 torch.hub.load(repo_or_dir, model, *args, source=’github’, force_…

人工智能 2023年7月6日
0067
分类——正则化Python实现

第Ⅰ部分初步了解 Python 第1章编程基础和字符串 3 1.1 编程与使用计算机的区别 3 1.1.1 编程的一致性 3 1.1.2 编程的可控性 4 1.1.3 程序要应…

人工智能 2023年7月3日
0085
tensorflow利用for循环进行训练遇到的内存爆炸问题(OOM)

最近在用tensorflow学习模型的知识蒸馏，自己基于cifar10数据集训练得到的teacher模型，在对3种不同参数量的student模型使用相同的alpha和tempera…

人工智能 2023年5月23日
0093
Opengl入门基础-基础知识

通过之前的教程，我们已经拥有了开发环境，但是在真正开发程序之前，我们首先了解下Opengl的基本概念。 Opengl是什么？通常网上会说Opengl是一种规范，一种接口，但是这种…

人工智能 2023年5月26日
0084
学习weka（7）：weka数据预处理方法

1、前言 weka 数据预处理阶段全部在 filter 上：下面把一些常见的机器学习数据与处理方法处理说一下（下面所有实例都是在 Explorer 模块上进行的）。 ; 2、数据…

人工智能 2023年6月19日
0097
CVPR2022 ReID方向接收论文

跨模态 1、Learning Memory-Augmented Unidirectional Metrics for Cross-modality Person Re-identi…

人工智能 2023年6月25日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

关系抽取信息抽取知识图谱

大家都在看