【学习笔记】Pytorch-两层BiLSTM情感计算Demo代码解读

2023年5月27日下午11:49 • 人工智能 • 阅读 69

BiLSTM for Sentiment Computing Demo

模型： 两层、双向LSTM
数据集：IMDB
环境：
Python3.7
torch==1.10.0
torchtext==0.11.0
spacy==2.2.4
相关代码参考自：https://www.bilibili.com/video/BV1Rv411y7oE?p=75

import torch
import torch.nn as nn
import torch.optim as optim
from torchtext.legacy import data, datasets

在神经网络中，参数默认是进行随机初始化的。如果不设置的话每次训练时的初始化都是随机的，导致结果不确定。如果设置初始化，则 每次初始化都是固定的。

print('GPU:', torch.cuda.is_available())

torch.cuda.manual_seed(123)

输出：GPU: True

1.加载数据


TEXT = data.Field(tokenize='spacy')

LABEL = data.LabelField(dtype=torch.float)

train_data,test_data = datasets.IMDB.splits(TEXT, LABEL)

查看数据集样本个数和某个文本数据的内容

print('len of train data:', len(train_data))
print('len of test data:', len(test_data))
print(train_data.examples[15].text)
print(train_data.examples[15].label)

output：
len of train data: 25000
len of test data: 25000
[‘A’, ‘bus’, ‘full’, ‘of’, ‘passengers’, ‘is’, ‘stuck’, ‘during’, ‘a’, ‘snow’, ‘storm’, ‘.’, ‘The’, ‘police’, ‘have’, ‘closed’, ‘the’, ‘bridge’, ‘–’, ‘saying’, ‘it’, “‘s”, ‘unsafe’, ‘and’, ‘they’, ‘are’, ‘stuck’, ‘in’, ‘a’, ‘little’, ‘café’, ‘until’, ‘the’, ‘road’, ‘has’, ‘been’, ‘cleared’, ‘.’, ‘However’, ‘,’, ‘after’, ‘a’, ‘while’, ‘,’, ‘their’, ‘boredom’, ‘is’, ‘turned’, ‘to’, ‘concern’, ‘,’, ‘as’, ‘it’, ‘seems’, ‘that’, ‘one’, ‘of’, ‘the’, ‘passengers’, ‘was’, ‘NOT’, ‘originally’, ‘on’, ‘the’, ‘bus’, ‘and’, ‘may’, ‘just’, ‘be’, ‘an’, ‘alien’, ‘!’, ‘!’, ‘This’, ‘leads’, ‘to’, ‘a’, ‘conclusion’, ‘that’, ‘is’, ‘ironic’, ‘but’, ‘also’, ‘rather’, ‘funny’, ‘in’, ‘a’, ‘low’, ‘-‘, ‘brow’, ‘way.

pos

利用训练集构建词表，vocabulary把每个单词一一映射到一个数字。使用10k个单词来构建单词表（用max_size这个参数可以设定），所有其他的单词都用来表示。映射到数字后使用vectors创建词向量。

TEXT.build_vocab(train_data, max_size=10000, vectors='glove.6B.100d')

LABEL.build_vocab(train_data)

print(TEXT.vocab.stoi)
print(LABEL.vocab.stoi)

batchsz = 32

device = torch.device('cuda')

创建迭代器，相当于torch的DataLoader。每个iterator中各有两部分：词（.text）和标签(.label)，其中text全部转换成数字了。

BucketIterator会把长度差不多的句子放到同一个batch中，确保每个batch中不出现太多的padding。这里因为pad比较少，所以把也当做了模型的输入进行训练。如果有GPU，还可以指定每个iteration返回的tensor都在GPU上。

train_iterator, test_iterator = data.BucketIterator.splits(
    (train_data, test_data),
    batch_size = batchsz,
    device=device
)

2.定义模型

举个例子，我们定义一个num_layers=3的双向LSTM。
h_n第一个维度的大小就等于 6 （23），
h_n[0]表示 第一层前向传播最后一个time step的输出，h_n[1]表示 第一层后向传播*最后一个time step的输出；
h_n[2]表示第二层前向传播最后一个time step的输出，h_n[3]表示第二层后向传播最后一个time step的输出；
h_n[4]和h_n[5]分别表示第三层前向和后向传播时最后一个time step的输出。

class RNN(nn.Module):

    def __init__(self, vocab_size, embedding_dim, hidden_dim):

        super(RNN, self).__init__()

        self.embedding = nn.Embedding(vocab_size, embedding_dim)

        self.rnn = nn.LSTM(embedding_dim, hidden_dim, num_layers=2,
                           bidirectional=True, dropout=0.5)

        self.fc = nn.Linear(hidden_dim*2, 1)
        self.dropout = nn.Dropout(0.5)

    def forward(self, x):
"""
        x: [seq_len, b] vs [b, 3, 28, 28]
"""

        embedding = self.dropout(self.embedding(x))

        output, (hidden, cell) = self.rnn(embedding)

        hidden = torch.cat([hidden[-2], hidden[-1]], dim=1)

        hidden = self.dropout(hidden)
        out = self.fc(hidden)

        return out

3.初始化模型


rnn = RNN(len(TEXT.vocab), 100, 256)

pretrained_embedding = TEXT.vocab.vectors
print('pretrained_embedding:', pretrained_embedding.shape)
rnn.embedding.weight.data.copy_(pretrained_embedding)
print('embedding layer inited.')

optimizer = optim.Adam(rnn.parameters(), lr=1e-3)

criterion = nn.BCEWithLogitsLoss().to(device)
rnn.to(device)

输出

pretrained_embedding: torch.Size([10002, 100])
embedding layer inited.

RNN(
  (embedding): Embedding(10002, 100)
  (rnn): LSTM(100, 256, num_layers=2, dropout=0.5, bidirectional=True)
  (fc): Linear(in_features=512, out_features=1, bias=True)
  (dropout): Dropout(p=0.5, inplace=False)
)

4.定义评估指标函数

import numpy as np

def binary_acc(preds, y):
"""
    get accuracy
"""

    preds = torch.round(torch.sigmoid(preds))
    correct = torch.eq(preds, y).float()
    acc = correct.sum() / len(correct)
    return acc

5.定义训练和测试函数


def train(rnn, iterator, optimizer, criterion):

    avg_acc = []
    rnn.train()

    for i, batch in enumerate(iterator):

        pred = rnn(batch.text).squeeze(1)

        loss = criterion(pred, batch.label)
        acc = binary_acc(pred, batch.label).item()
        avg_acc.append(acc)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if i%10 == 0:
            print(i, acc)

    avg_acc = np.array(avg_acc).mean()
    print('avg acc:', avg_acc)

def eval(rnn, iterator, criterion):

    avg_acc = []

    rnn.eval()

    with torch.no_grad():
        for batch in iterator:

            pred = rnn(batch.text).squeeze(1)

            loss = criterion(pred, batch.label)

            acc = binary_acc(pred, batch.label).item()
            avg_acc.append(acc)

    avg_acc = np.array(avg_acc).mean()

    print('>>test:', avg_acc)

6.训练

for epoch in range(10):
    train(rnn, train_iterator, optimizer, criterion)
    eval(rnn, test_iterator, criterion)

Original: https://blog.csdn.net/m0_47779101/article/details/123854237
Author: JoonleonWong
Title: 【学习笔记】Pytorch-两层BiLSTM情感计算Demo代码解读

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/528220/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

tensorflow的cuba错误

2021-12-15 16:36:54.995706: E tensorflow/stream_executor/cuda/cuda_driver.cc:271] failed c…

人工智能 2023年5月25日
0055
【语音分析】基于matlab语音短时频域分析【含Matlab源码 558期】

⛄一、获取代码方式获取代码方式1：完整代码已上传我的资源：【语音分析】基于matlab语音短时频域分析【含Matlab源码 558期】点击上面的蓝色字体，付费直接下载，就可以了。…

人工智能 2023年5月27日
0082
使用RGBD相机实现YOLOv3目标识别并测距，获取物体三维坐标

设备环境：Ubuntu18.04 + ros melodic 相机：乐视相机（乐视遗产，和奥比中光的Astra Pro 同方案，便宜）首先要安装一部分依赖 sudo apt in…

人工智能 2023年7月9日
0056
什么是填充（Padding）？为什么在CNN中使用填充

什么是填充（Padding）？填充（Padding）是指在输入的图像或序列的周围添加额外的值，使其尺寸与期望的尺寸相匹配。在深度学习中，特别是在卷积神经网络（Convolutio…

人工智能 2024年1月1日
0028
线性规划之单纯形法

1.单纯形法建立在标准型线性规划上 2.标准型线性规划其最优解必定在可行域顶点上 3.单纯形法是在顶点上搜索最优解 4.掌握修正单纯形法的迭代步骤上一篇我们把搜索算法的逻辑做了详…

人工智能 2023年6月16日
0074
目标检测论文解读复现之二：基于改进YOLOv5的轻量化航空目标检测方法

目标检测论文解读复现文章目录目标检测论文解读复现前言一、摘要二、网络模型及核心创新点三、应用数据集四、实验效果（部分展示）五、实验结论六、投稿期刊介绍前言此前…

人工智能 2023年6月26日
0074
数睿数据深度 | 商业智能红海，下一代BI还能激起多大的浪花

商业智能这一概念，自1996年提出至今，已经过了26年。市场对BI的态度，从好奇、探索直到习以为常，80-90年代的IT人还记忆犹新。但如果有一家初创公司，要迈入这个成熟的市场，…

人工智能 2023年6月11日
00126
基于Verilog搭建一个卷积运算单元的简单实现

目录前言 1. 图片的缓存与读取 2. 滑窗的构建 3. 权值的读取 * 3.1 行列计数器的构建 3.2 权重数据的取存 4. 卷积运算 * 4.1 乘法运算 4.2 加法运算…

人工智能 2023年7月27日
0068
华为手机记事本导出_今天才发现！华为手机备忘录这么厉害，可惜自己知道太晚了…

众所周知!华为手机有很多有用的技能，包括手指关节截屏、关屏等功能家喻户晓。但你知道华为手机上的备忘录吗？其实它很厉害，不仅可以录东西，还有很多很酷的技术人员，但我知道已经太晚了！ …

人工智能 2023年5月27日
00266
多项式概率分布（Multinomial probability distribution）和分类分布（categorical distribution）

文章目录 * – + 多项式概率分布 + 分类分布多项式概率分布其由二项分布推广而来，从而更加普遍。所以我们先回顾一下二项分布。二项分布的典型例子是扔硬币，设硬币…

人工智能 2023年7月2日
0080
Ubuntu 20.04配置ORB-SLAM2和ORB-SLAM3运行环境+ROS实时运行ORB-SLAM2+Gazebo仿真运行ORB-SLAM2+各种相关库的安装

文章目录一、换源 * 1.1 通过软件更新 1.2 通过修改源文件二、安装三方库 * 2.1 安装必要的依赖项 2.2 安装Pangolin 2.3 安装OpenCV3 2.4…

人工智能 2023年5月26日
0099
调用讯飞开放平台的语音转写api

讯飞开放平台提供的api import base64 import hashlib import hmac import json import os import time im…

人工智能 2023年5月27日
0068
【华为云ModelArts】识别你的专属云宝

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月27日
0082
Python小游戏——小鸟管道游戏【含完整源码】

前言又是一篇摸鱼小文章~相信这个游戏应该大多数人都玩过吧话不多说，现在就来开整，赶紧做完，赶紧摸鱼不得不说这个小游戏挑战性还蛮大的 ; 开发工具 Python版本：3.6.4…

人工智能 2023年7月5日
0073
PyTorch：train模式与eval模式的那些坑

文章目录 * – 前言 – 1. train模式与eval模式 – 2. BatchNorm – 3. 数学原理 – 4…

人工智能 2023年5月28日
0079
Disambiguation-Free Partial Label Learning无歧义部分标记学习

相关工作：PL训练示例传递的监督信息是隐式的，因为地面真实值标签隐藏在候选标签集中。因此，部分标记学习可以看做是一个具有隐含标记信息的弱监督学习框架。它介于监督谱的两端，即显性监督…

人工智能 2023年7月2日
0057

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31