详解BiLSTM

2023年7月12日下午11:23 • 人工智能 • 阅读 72

一、介绍

1.1 文章组织

本文简要介绍了BiLSTM的基本原理，并以句子级情感分类任务为例介绍为什么需要使用LSTM或BiLSTM进行建模。

1.2 情感分类任务

自然语言处理中的情感分类任务是对给定文本进行情感倾向分类的任务，粗略来看可以认为其是分类任务中的一种。对于情感分类任务，目前通常的做法是先对词或者短语进行表示，再通过某种组合方式把句子中词的表示组合句子的表示。最后，利用句子的表示对句子进行情感分类。
举一个对句子进行褒贬二分类的例子：

句子：我爱你
情感标签：褒义

1.3 什么是LSTM和BiLSTM

LSTM的全称是Long Short-Term Memory，它是RNN的一种。LSTM由于其设计的特点，非常合适用于对时序数据的建模，如文本数据。BiLSTM（directional Long Short-Term Memory）是由前向LSTM与后向LSTM组合而成。两者在自然语言处理任务中都常杯用来建模上下文信息。

1.４为什么使用LSTM和BiLSTM

将词的表示组合成句子的表示，可以采用相加的方法，即将所有词的表示进行加和，或者取平均等方法，但是这些方法没有考虑到词语在句子中前后顺序。如句子”我不觉得他好”。”不”字是对后面”好”的否定，即该句子的情感极性是贬义。使用LSTM模型可以更好的捕捉到较长距离的依赖关系。因为LSTM通过训练过程可以学到记忆哪些信息和遗忘哪些信息。

但是利用LSTM对句子进行建模还存在一个问题：无法编码从后到前的信息。在更细粒度的分类时，如对于强程度的褒义、弱程度的褒义、中性、弱程度的贬义、强程度的贬义的五分类任务需要注意情感词、程度词、否定词之间的交互。举一个例子，”这个餐厅脏得不行，没有隔壁好”，这里的”不行”是对”脏”的程度的一种修饰，通过BiLSTM可以更好的捕捉双向的语义依赖。

二、BiLSTM原理简介

2.1 LSTM介绍

2.1.1总体框架

总体框架如图所示：

; 2.1.2 详细介绍计算过程

计算遗忘门，选择遗忘的信息。

输入：前一刻的隐层状态h t − 1 h_{t-1}h t −1 ，当前时刻输入词X t X_t X t
输出：遗忘门的值f t f_t f t

计算记忆们，选择要记忆的信息。

输入：前一刻的隐层状态h t h_t h t ，当前时刻的输入词X t X_t X t
输出：记忆门的值i t i_t i t ，临时细胞状态C ^ t \widehat{C}_t C t

计算当前时刻细胞状态。

输入：记忆们的值i t i_t i t ，遗忘门的值f t f_t f t ，临时细胞状态C ^ t − 1 \widehat{C}_{t-1}C t −1
输出：当前时刻细胞状态C t C_t C t

计算输出门和当前时刻隐层状态

输入：前一时刻的隐层状态h t − 1 h_{t-1}h t −1 ，当前时刻的输入词X t X_t X t ，当前时刻细胞状态C t C_t C t
输出：输出门的值O t O_t O t ，隐层状态h t h_t h t

最终，我们可以得到与句子长度相同的隐层状态序列{h 0 , h 1 , h 2 , . . . , h n − 1 h_0,h_1,h_2,…,h_{n-1}h 0 ,h 1 ,h 2 ,…,h n −1 }

2.2 BiLSTM介绍

前向的LSTM与后向的LSTM结合成BiLSTM。比如，我们对”我爱中国”这句话进行编码，模型如图所示。

对于情感分类任务来说，采用的句子的表示往往是[ {h L 2 , h R 2 h_{L2},h_{R2}h L 2 ,h R 2 } ]。
因为其包含了前向与后向的所有信息，如图所示。
详解BiLSTM

; 三、总结

本文中，我们结合情感分类任务介绍了LSTM以及BiLSTM的基本原理，除了情感分类任务，LSTM与BiLSTM在自然语言处理领域的其它任务上也得到了广泛应用，如机器翻译任务中使用其进行源语言的编码和目标语言的解码，机器阅读理解任务中使用其对文章和问题的编码等。

代码实例请见：https://zhuanlan.zhihu.com/p/47802053

Original: https://blog.csdn.net/suotanyu1595/article/details/120262707
Author: 莫杨94
Title: 详解BiLSTM

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/688610/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Deep Learning × ECG (5) ：利用循环神经网络RNN对心律失常ECG数据进行分类

文章目录 1. RNN 介绍 2. 搭建RNN模型进行训练 RNN 介绍循环神经网络RNN的提出主要针对于时间序列数据。类似于股票、心律失常 ECG 和电力数据等数据都是属…

人工智能 2023年7月1日
0089
Neo4j图算法库（Graph Algorithms）的安装与使用

Neo4j提供了强大的算法库，可供我们直接调用，而不需要自己再手动编写。要使用其自带的算法库，首先需要添加相应插件，下面详细介绍。 ; 一、支持算法 1、中心度算法（Centra…

人工智能 2023年6月10日
0082
按索引和值对Pandas DataFrame进行排序

DataFrame。sort_values（by，axis = 0，ascending = True，inplace = False，kind =’ quicksort ‘，na_…

人工智能 2023年6月2日
0077
首个中文Stable Diffusion模型开源；TPU演进十年；18个PyTorch性能优化技巧 | AI系统前沿动态…

希腊神话中，特洛伊战争的起因是两方争夺世界上最美的女人——海伦，后世诗人将海伦的美貌”令成千战舰为之起航”。TPU就像海伦，它的出现引起了”成千…

人工智能 2023年7月28日
0052
PermissionError: [WinError 32] 另一个程序正在使用此文件，进程无法访问。: ‘C:tmptmpp2jgciexlog_feedback_to_the_rknn

onnx转rknn出现这样的问题，请教一下怎么解决这问题： D:\anaconda3\envs\rknnpy36\python.exe C:/Users/86157/Downloa…

人工智能 2023年5月25日
0067
智能家居 (3) ——语音识别控制端线程

语音识别 > 树莓派串口 > 控制设备 1.工厂模式创建语音控制对象： #include "command.h" #include void voi…

人工智能 2023年5月27日
0072
Python数据分析上机

一,Numpy数值计算上机 1．创建数组并进行运算。（1）创建一个数值范围为0~1，间隔为0.01的数组，并查看该数组的维度。（2）创建100个服从正态分布的随机数，并查看数组的类…

人工智能 2023年7月16日
0061
基于FPGA的车牌识别系统

程序基于Xilinx公司的Pynq-Z2开发板,使用opencv库完成车牌识别. 项目背景和设计目的 • 车牌识别系统是计算机视频图像识别技术在车辆牌照识别中的一种应用，在高速公路…

人工智能 2023年7月20日
0043
spark计算两个DataFrame的差集、交集、合集

spark 计算两个 dataframe 的差集、交集、合集，只选择某一列来对比比较好。新建两个 dataframe ： import org.apache.spark.{Spar…

人工智能 2023年6月2日
0064
计算机视觉项目-银行卡卡号自动识别

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将继续讲解关于OpenCV的相关知识，利用项目讲解继续巩固自己得基础知识。🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人…

人工智能 2023年6月18日
0071
Matplotlib可视化数据分析图表下（常用图表的绘制、折线图、柱形图、直方图、饼形图、散点图、面积图、热力图、箱形图、3D图表、绘制多个图表、双y轴可视化图表、颜色渐变图）

本文来自《Python数据分析从入门到精通》_明日科技编著 5.6 常用图表的绘制本节介绍常用图表的绘制，主要包括绘制折线图、绘制柱形图、绘制直方图、绘制饼形图、绘制散点图、绘制…

人工智能 2023年6月11日
0069
Hover-net: Simultaneous segmentation and classification of nuclei

4.Evaluation metrics(评价指标): 常用的整体评价指标是dice2和AJI，但是他们有局限性，在图中可以看到预测结果A和B仅仅有几个像素不同但是B的得分就要比…

人工智能 2023年6月18日
0069
（4）回归决策树_预测波士顿房价

文章目录前言摘要 1、构建模型并检验模型的准确率 2、构建决策树 3、将每个特征的重要性可视化 4、附件： * 4.1 完整代码： 4.2 DecisionTreeRegres…

人工智能 2023年6月17日
0075
乐吾乐le5le-Topology为智慧水务可视化赋能（二）

►前言智慧水务可视化是运用物联网、5G、大数据等数字化手段，通过建模和组态，能实现远程对现场能控制和查看实时的数据和状态的可视化功能，在抗洪救灾、城市供水、养殖产业、航运旅游、农…

人工智能 2023年6月26日
0067
pandas中loc与iloc的用法

初衷由于个人不经常使用这个常见的pandas函数，所以总是用到的时候不熟练需要百度一下，所以本文对函数用法做一个详细的笔记以比便于自己记忆。从名称来区别loc与iloc 从字母…

人工智能 2023年7月8日
0074
python+tensorflow2.0实现简单人脸识别—–第一天：训练集的采集

今年寒假，笔者想自己做一个简单的人脸识别系统。 [En] The author wants to make a simple face recognition system on …

人工智能 2023年5月24日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31