初识循环神经网络(RNN)

2023年5月28日下午1:03 • 大数据 • 阅读 94

1 概念

循环神经网络 (Recurrent Neural Network, RNN) 是一类具有短期记忆能力的神经网络. 它与深层神经网络、卷积神经网络不同的是, 它不仅接收其他神经元的信息, 同时也可以接收自身的信息, 形成了一种具有闭环的网络结构, 这也是它”循环”的来由.

具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中, 即隐藏层之间的节点不再无连接而是有连接的, 并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出.

RNN目前应用领域：

语音识别: 输入的语音数据, 生成相应的语音文本信息. 比如微信的语音转文字功能.
机器翻译: 不同语言之间的相互转换. 像有道翻译、腾讯翻译官等.
音乐生成: 使用RNN网络生成音乐, 一般会用到RNN中的LSTM算法 (该算法可以解决RNN网络中相距较远的节点梯度消失的问题).
文本生成：利用RNN亦可以生成某种风格的文字.
情感分类: 输入文本或者语音的评论数据, 输出相应的打分数据.
DNA序列分析: 输入的DNA序列, 输出蛋白质表达的子序列.
视频行为识别: 识别输入的视频帧序列中的人物行为.
实体名字识别: 从文本中识别实体的名字.

2 隐层

给定一个输入序列 X = { x 1 , x 2 , … , x t } \mathbf{X} ={x_1, x_2, \dots, x_t}X ={x 1 ,x 2 ,…,x t }, 循环神经网络通过下面公式更新带反馈边的隐藏层的 活性值 h t h_t h t ：
h t = f ( h t − 1 , x t ) h_t = f(h_{t-1},x_t)h t =f (h t −1 ,x t )
其中 h 0 = 0 h_0=0 h 0 =0, 函数 f f f 为一个非线性函数, 可以是一个前馈网络.

也可以写成
h t = g ( w h x x t + b h x + w h h h t − 1 + b h h ) h_t=g(w_{hx}x_t+b_{hx}+w_{hh}h_{t-1}+b_{hh})h t =g (w h x x t +b h x +w h h h t −1 +b h h )
激活函数 g g g 通常为 tanh ⁡ \tanh tanh.

那么输出序列 Y = { y 1 , y 2 , … , y t } \mathbf{Y} = {y_1, y_2, \dots, y_t}Y ={y 1 ,y 2 ,…,y t } 中 y t y_t y t 为
y t = w y h h 0 + b y h y_t = w_{yh}h_0 + b_{yh}y t =w y h h 0 +b y h
注意, 此处不再有激活函数

; 3 例子

Train a model to learn (with pytorch):

“hello” —> “ohlol”

import torch
import torch.nn.functional as F

inputSize = 4
hiddenSize = 4
batchSize = 1

word = ['e', 'h', 'l', 'o']
xData = [1, 0, 2, 2, 3]
yData = [3, 1, 2, 3, 2]

xOnehot = F.one_hot(torch.tensor(xData), len(word))
xOnehot = xOnehot.float()
inputs = xOnehot.view(-1, batchSize, inputSize)

labels = torch.LongTensor(yData)

class Net(torch.nn.Module):
    def __init__(self, inputSize, hiddenSize, batchSize, numLayers=1):
        super(Net, self).__init__()
        self.numLayers = numLayers
        self.inputSize = inputSize
        self.hiddenSize = hiddenSize
        self.batchSize = batchSize
        self.rnn = torch.nn.RNN(self.inputSize, self.hiddenSize, self.numLayers)

    def forward(self, input):
        hidden = torch.zeros(self.numLayers, self.batchSize, self.hiddenSize)
        out, _ = self.rnn(input, hidden)
        out = out.view(-1, self.hiddenSize)
        return out

model = Net(inputSize, hiddenSize, batchSize, numLayers=1)

lossFunction = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.05)

for epoch in range(15):
    optimizer.zero_grad()
    predict = model(inputs)
    loss = lossFunction(predict, labels)
    loss.backward()
    optimizer.step()
    _, index = predict.max(dim=1)
    index = index.data.numpy()
    print("Predicted:", "".join(word[i] for i in index), end='')
    print(", Epoch[%d/15] lossAll= %.4f" % (epoch + 1, loss.item()))

输出部分

Predicted: ohhhh, Epoch[1/15] lossAll= 1.3558
Predicted: oholo, Epoch[2/15] lossAll= 1.2035
Predicted: oholl, Epoch[3/15] lossAll= 1.1030
Predicted: oooll, Epoch[4/15] lossAll= 1.0328
Predicted: ooool, Epoch[5/15] lossAll= 0.9791
Predicted: ooool, Epoch[6/15] lossAll= 0.9326
Predicted: ohool, Epoch[7/15] lossAll= 0.8878
Predicted: ohool, Epoch[8/15] lossAll= 0.8444
Predicted: ohool, Epoch[9/15] lossAll= 0.8042
Predicted: ohlol, Epoch[10/15] lossAll= 0.7684
Predicted: ohlol, Epoch[11/15] lossAll= 0.7366
Predicted: ohlol, Epoch[12/15] lossAll= 0.7081
Predicted: ohlol, Epoch[13/15] lossAll= 0.6821
Predicted: ohlol, Epoch[14/15] lossAll= 0.6580
Predicted: ohlol, Epoch[15/15] lossAll= 0.6354

Process finished with exit code 0

https://blog.csdn.net/qq_32241189/article/details/80461635
https://www.jianshu.com/p/aca535702242
https://www.bilibili.com/video/BV1Y7411d7Ys?p=12

Original: https://blog.csdn.net/weixin_48320163/article/details/121517980
Author: uodgnez
Title: 初识循环神经网络(RNN)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/531694/

转载文章受原作者版权保护。转载请注明原作者出处！

大数据

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

HIVE如何获取当前日期的前两个工作日

大数据 2023年11月14日
0040
我眼中的大数据（三）——MapReduce

这次来聊聊Hadoop中使用广泛的分布式计算方案——MapReduce。 MapReduce是一种编程模型，还是一个分布式计算框架。 MapReduce作为一种编程模型功能强大，使…

大数据 2023年6月2日
0065
如何使用 etcd 实现分布式 /etc 目录

etcd 是一款兼具一致性和高可用性的键值数据库，简单、安全、快速、可信，目前是 Kubernetes 的首要数据存储。我们先来看一段 etcd 官方对于名字的解释。 The na…

大数据 2023年6月3日
00119
论文笔记之Distributed Representations of Words and Phrases and their Compositionality

这篇文章是用于解决skip-gram和CBOW两种模型在计算 softmax时因为语料库V太大导致计算复杂度偏高的问题。为了降低复杂度，提高运算效率，论文作者提出了层次softma…

大数据 2023年5月28日
0096
Flink TableAPI更新模式

更新模式在流处理过程中，表的处理并不像传统定义的那样简单。对于流式查询（Streaming Queries），需要声明如何在（动态）表和外部连接器之间执行转换。与外部系统交换的…

大数据 2023年5月25日
0080
Ubuntu18.04格式化boot分区后恢复

不小心把Ubuntu18.04的boot分区格式化了,进不去系统了,一开机就是BIOS界面,最后使用boot-repair恢复了boot分区. 使用Ubuntu18.04的安装U盘…

大数据 2023年5月27日
0097
超级详细的 Redis 安装教程

大数据 2023年11月14日
0039
python sqlite3

–– coding: utf-8 ––“””乐乐感知学堂公众号@author: https://…

大数据 2023年11月10日
0046
0基础替换数据：智慧城市可视化大屏模板合集

听说你还在找智慧城市大屏的模板？这不就来了嘛~！本文精选了山海鲸可视化的6 份智慧城市大屏模板，颜值天花板+ 高级感拉满！最重要的是只需要将自己的数据替换到模板中去，再将组…

大数据 2023年6月2日
0077
Spark快速上手(1)window下环境配置

笔者使用的开发环境是IntelliJ IDEA Community Edition 2021.3.3 scala版本是2.11.8，与Spark2.0严格对应。在maven环境中…

大数据 2023年6月3日
0085
有了Openvswitch和Docker，终于可以做《TCP/IP详解》的实验了！

所有做过网络编程的程序员，想必都会看《TCP/IP详解》卷一：协议后来出了第二版，但是由于第一版才是Rechard Stevens的原版，本人还是多次看了第一版。对这一版印象最…

大数据 2023年5月29日
0082
Note（10）：运用数据库实现对墨墨背单词中单词的导出

Step1：获取墨墨背单词的安卓安装包apk文件。以上apk文件下载链接：墨墨背单词apk安装包在线下载 Step2：将安装包apk后缀改为rar或者zip压缩包格式。 Step…

大数据 2023年11月11日
0046
BERT参数量计算

目前，预训练模型在NLP领域占据核心地位。预训练模型的参数量是庞大的，例如BERT(base)的参数量是110M，BERT(large)的参数量是330M。为了深入认识，我决定思考…

大数据 2023年5月28日
00100
Java学习笔记：SQLite数据库

第一个我们学什么 1、数据库管理系统有很多品牌：SQLite、MySQL、MS SQLServer、PostgreSQL、Oracle等。大体用法（包括SQL语句）差不多，细节有差…

大数据 2023年11月10日
0046
【SQLite】创建数据库 | 创建数据表

.databases 一、假设 1、假设SQLite环境已经搭建OK 2、说的是Windows环境二、步骤-创建数据库 1）我的跟安装包放一起了，目录名： databases2）…

大数据 2023年11月12日
0057
【Linux c】 Sqlite3 操作与功能实现

一、Sqlite3 数据类型二、Sqlite3 常用指令操作三、Sqlite3 API 1. sqlite3_open ( ) 2. sqlite3_errmsg ( ) 3….

大数据 2023年11月10日
0052

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

初识循环神经网络(RNN)

1 概念

2 隐层

; 3 例子

大家都在看