基于Transformer的NLP智能对话机器人实战课程（第十九章、第二十章、第二十一章）

2023年5月31日上午4:09 • 人工智能 • 阅读 83

基于Transformer的NLP智能对话机器人实战课程（第十九章、第二十章、第二十一章）

“如果说 Transformer 是人工智能时代的芯片，那么StarSpace 就是AI 时代的操作系统。”

第 19 章： NLP 阅读理解 MRC(Machine Reading Comprehension) 数学原理、技术本质及常见算 法

1，以一篇119个Words的GRE(Graduate Record Examinations)文章及2个相应的阅读理解题目为例来剖析阅读理解的过程及其背后的机制

2，MRC在智能客服、机器问答、搜索引擎等等广泛应用背后的原因：规模化价值复制

3，信息的本质及信息理解的本质数学机制剖析

4，MRC三元素：Question-Context-Answer数学模型及技术本质剖析

5，MRC的核心：Attention Computations

6，MRC对信息理解三大层次解析及背后对应的数学模型

7，MRC实现方法之传统特征工程解析

8，MRC实现方法之深层语意图匹配解析

9，MRC实现方式之神经网络及Attention机制解析

10，MRC数据之Single-Document和Multiple-Document解析

11，MRC的四大核心任务之Cloze Tests数据集、数学原理和技术本质剖析

12，MRC的四大核心任务之Multiple Choice数据集、数学原理和技术本质剖析

13，MRC的四大核心任务之Span Extraction数据集、数学原理和技术本质剖析

14，MRC的四大核心任务之Free Anwering数据集、数学原理和技术本质剖析

15，Cloze Tests数据集分析：CNN&Daily Mail、CBT等

16，Multiple Choice数据集分析：MC Test、RACE等

17，Span Extraction数据集分析：SQuAD、NewsQA等

18，Free Answering数据集分析：MS MARCO、DuReader等

19，MRC的测试集解析：In-domain、Over-sensitivity、Over-stability、Generalization等

20，MRC的可回答问题及无答案问题数学原理剖析及BERT实现

21，MRC的Feature extraction数学原理及算法分析

22，传统Machine Learning Algorithms对MRC 算法解析

23，BiDAF (Bi-Directional Attention Flow)下的MRC算法解析

24，QANet下的MRC算法解析

25，Transformer架构下的BERT及ALBERT下的MRC 解析

26，Transformer架构下的XLNET下的MRC 解析

第 20 章： MRC 通用架构双线模型内核机制、数学原理、及组件内 幕

1，双线模型架构解析：Multiple Encoders、Interaction

2，双线模型中为何Interaction环节是实现信息理解的关键？

3，双线模型底层数学原理剖析

4，Embeddings下的One-hot Representation及多层One-hot机制解析

5，Embeddings下的Word2vec的CBOW模型解析及源码实现

6，Embeddings下的Word2vec的Skipgram模型解析及源码实现

7，MRC下GloVe: Global Vectors for Word Representation架构解析及源码实现

8，MRC 下解决一次多义Elmo架构解析及源码实现

9，使用BERT进行Embeddings架构及最佳实践解析

10，Feature Extraction下的CNN模型解析及源码实现

11，Feature Extraction下的RNN模型解析及源码实现

12，Feature Extraction下的Transformer Encoder或者Decoder的架构解析及源码实现

13，MRC灵魂：Context-Question Interaction及Question-Context Interaction

14，Answer Prediction之Word Predictor数学原理及源码实现剖析

15，Answer Prediction之Option Predictor数学原理及源码实现剖析

16，Answer Prediction之Span Extractor数学原理及源码实现剖析

17，Answer Prediction之Answer Generator数学原理及源码实现剖析

18，MRC中的Negative Sampling数学机制及具体实现

19，BERT对MRC中无答案问题处理剖析及实现

20，MRC on Knowledge Graph解析

21，对MRC进行Evaluation Metrics之Accuracy、Precision、Recall、F1解析

22，对MRC进行Evaluation Metrices之Rouge-L解析

23，对MRC进行Evaluation Metrics之BLEU解析

24，提升MRC能力的7大方法详解

第 21 章：基于 Bayesian Theory 的 MRC 文本理解基础经典模型算法详 解

1，Bayesian prior在模型训练时候对Weight控制、训练速度影响等功能详解

2，Bayesian prior能够提供模型训练速度和质量的数学原理剖析

3，从Word2vec走向GloVe：从Local 信息走向Global+Local信息表示模式

4，GloVe 中的Vector相关性算法

5，GloVe的Co-occurrence matrix解析

6，GloVe的Loss计算

7，神经网络表达信息的三大局限剖析

7，使用Convolutions取代神经网络传统的matrix multiplication操作

8，文本序列的Vector表示及Convolutions的天然契合点分析

9，Parameter sharing背后的数学原理和工程的广泛应用

10，Vector中的参数真的能够很好的表达信息吗？数学原理及工程实践

11，TextCNN架构设计解析

12，CNN-rand数学原理及工程实现

13，CNN-static数学原理及工程实现

14，CNN-non-static数学原理及工程实现

15，CNN-multiple channel数学原理及工程实现

16，处理长短不一的Sentence

17，Kernel设置的数学原理及最佳实践

18，传统模型Attention实现本质：权重分配

19，通过Soft-Search的方式来构建Attention机制及数学原理剖析

20，KQV：Attention-based model based on weight allocation

21，Local-Attention、Global-Attention、Self-Attention对比及最佳实践

22，基于一维匹配的Attentive Reader架构及数学原理剖析

23，基于二维匹配的Impatient Reader架构及数学原理剖析

24，Multi-Hop机制多次提取更充足信息的Attention实现剖析

25，Multi-Hop机制多次提取更充足信息的TimeStep状态推进剖析

26，Pointer network和Attention机制的对比

27，R-NET：借助pointer network和使用gateway机制的attention实现

28，R-NET的Encoding Layer解析

29，R-NET的Question-Passage Matching解析

30，R-NET的Passage Self-Matching解析

31，R-NET的Answer Prediction解析

32，Fully-Aware Fusion Network提出的MRC的Fusion层次划分解析

33，Fully-Aware Fusion Network中的History-of-word机制来更好的理解语意

34，Fully-Aware Fusion Network的Attention机制解析

35，Fully-Aware Fusion Network的Encoding Layer：GloVe、CoVe、POS、NER等

36，Fully-Aware Fusion Network的Multi-level Fusion解析

37，Fully-Aware Fusion Network的Fully-Aware Self-Boosted Fusion解析

38，Fully-Aware Fusion Network的Output layer解析

39，QA-Net的架构之Embedding Encoder Layer解析

40，QA-Net的架构之Context-Query Attention Layer解析

41，QA-Net的架构之Model Encoder Layer解析

42，QA-Net的架构之Output Layer解析

Transformer,注意力机制,Attention机制,Transfomer课程,Transformer架构,Transformer模型,对话机器人,NLP课程,NLP,自然语言处理,知识图谱,命名实体识别

Original: https://blog.csdn.net/oatmeal2022/article/details/121305717
Author: 森大蔬
Title: 基于Transformer的NLP智能对话机器人实战课程（第十九章、第二十章、第二十一章）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/548550/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

语义网简介，常见的知识图谱应用场景

知识图谱简介及应用场景知识图谱最早是谷歌提出来的，又可以叫语义网，用来描述真实世界中存在的各种实体或概念及其关系，构成一张巨大的语义网络图，结点表示实体或概念，边由属性或关系构…

人工智能 2023年6月10日
0077
谈谈机器学习AI模型测试与评估方法分析

随着数字化转型与人工智能发展，AI应用软件层出不穷，人们虽然理解人工智能趋势，但是，企业往往很难接受这样AI应用软件，其中质疑点主要有：预测或识别的准确性模型相关性鲁棒性安…

人工智能 2023年6月16日
0086
关联规则挖掘（Apriori算法和FP-Growth算法）

一、关联规则概述1.关联规则分析用于在一个数据集中找出各种数据项之间的关联关系，广泛用于购物篮数据、个性化推荐、预警、时尚穿搭、生物信息学、医疗诊断、网页挖掘和科学数据分析中2.关…

人工智能 2023年6月16日
0083
Tableau制作漏斗图的两种方法

很多业务都是由多个流程、多个环节组成，每一个环节的数据很多时候呈现逐级递减的趋势，如电商中用户的下单数据。漏斗图主要用于展现每个环节的留存、转化情况，本文讲一下如何使用Table…

人工智能 2023年7月16日
0069
Jetson Nano 安装配置conda、pytorch1.7.0

jetson nano是自带CUDA的，按照官方的教程文档可以逐步配置好ubuntu镜像、python和tensorflow的。这两天突然想配置上conda和pytorch，于是浪…

人工智能 2023年5月25日
0091
深度学习—三好学生各成绩所占权重问题（3）

🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🥰 博客首页：knighthood2001😗 欢迎点赞👍评论🗨️❤️ 热爱python，期待与大家一同进步成长！！❤️ 之前，我们从三好学生成绩问题开始，设…

人工智能 2023年5月26日
0095
新增笔记打标签太麻烦，想找却又找不到，怎么办？

Photo by Patrick Perkins on Unsplash 在知识星球上，总能看见读者提出的经过深思熟虑的好问题，我也很愿意通过自己的思考，加以交流切磋。给你分享最…

人工智能 2023年6月1日
00202
实践 | 基于全连接神经网络实现房价预测

使用PaddlePaddle建立房价预测模型线性回归中：假设函数：用数学的方法描述自变量和因变量之间的关系，它们之间可以是一个线性函数或非线性函数。在本次线性回顾模型中，我们…

人工智能 2023年7月14日
0076
Pytorch中 nn.Transformer的使用详解与Transformer的黑盒讲解

文章目录本文内容将Transformer看成黑盒 Transformer的推理过程 Transformer的训练过程 Pytorch中的nn.Transformer * nn….

人工智能 2023年7月27日
0090
数据分析5-银行客户风险评估实战

本项目来源于数据酷客 1 项目背景信用风险是商业银行长期以来面临的主要风险。个人消费信贷业务成为我国商业银行新的利润增长点，而个人信用风险管理手段的落后成为制约个人消费信贷产业发…

人工智能 2023年6月20日
00106
集束搜索（Beam Search）

来源：Coursera吴恩达深度学习课程我们来看看集束搜索（beam search）算法，上篇文章选择最可能的句子讲了对于机器翻译来说，给定输入（法语句子），我们并不想要一个随…

人工智能 2023年5月25日
0077
知识图谱数据库和mysql_知识图谱之图数据库Neo4j

知识图谱中的知识是通过RDF结构来进行表示的，其基本单元是事实。每个事实是一个三元组(S, P, O)，在实际系统中，按照存储方式的不同，知识图谱的存储可以分为基于表结构的存储和基…

人工智能 2023年6月1日
0074
python+OpenCv笔记（十三）：边缘检测——Sobel检测算子

Sobel检测算子概述： Sobel边缘检测算法比较简单，实际应用中效率比canny边缘检测效率要高，但是边缘不如Canny检测的准确，但是很多实际应用的场合，sobel边缘却是…

人工智能 2023年5月28日
0084
使用paddle ernie预训练模型进行中文文本分类代码

需要解决的问题：在电商中有一些黑产使用机器脚本自动注册大量的垃圾店铺，而这些垃圾店铺的店铺名有一些是无意义的乱文，例如”唇评照桌”，”脑冻砸路忻…

人工智能 2023年7月2日
0067
3-Python数据划分代码-小记

Python划分数据集由于模型需要使用训练集、验证集和测试集，而我只有一个总的数据集，因此用Python实现了数据集的划分，特此小记一下。同时也是为了记录这个过程中用到的Pyt…

人工智能 2023年6月19日
0099
error: Ignore above cudart dlerror if you do not have a GPU set up on your machine.

具体错误描述： W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dyn…

人工智能 2023年5月26日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于Transformer的NLP智能对话机器人实战课程（第十九章、第二十章、第二十一章）

大家都在看