简单seq2seq代码使用tensorflow的LSTMCell构造循环decoder

2023年5月24日下午6:30 • 人工智能 • 阅读 103

好多预测模型的论文都是用seq2seq实现的，具体是LSTM_encoder将输入序列编码为一个tensor（又叫output、H或Y），同时保留序列状态state（又叫w或c）；
LSTM_decoder继承encoder的状态，将上层的output作为输入，得到的每个输出到embeding中找对应的词向量，然后再次调用LSTM_decoder刚才的输出作为这次的输入。一直循环，直到输出EOS为止。

tensorflow中并没有循环网络（可能有，我不知道）。因此决定用LSTMCell循环实现。
代码如下：

class MyModel(tf.keras.Model):
    def __init__(self):
        super().__init__()
        self.encodeLSTM = layers.LSTM(1, return_state=True)
        self.decodeLSTM = layers.LSTMCell(1)

    def call(self, inputs):
        x, memory_state, carry_state = self.encodeLSTM(inputs)
        pred = tf.constant([], shape=(16, 0), dtype=tf.float32)
        for i in range(8):
            x,[memory_state, carry_state] = self.decodeLSTM(x,[memory_state, carry_state])
            pred = tf.concat((pred, x),axis=1 )
        return pred

model = MyModel()
model.build((None, 10, 1))
model.summary()

简单seq2seq代码使用tensorflow的LSTMCell构造循环decoder

LSTMCell一般与RNN组合使用，例

cell=[layer.LSTMCell(10) , layers.LSTMCell(5)]
layers.RNN(cell)

单独使用时请注意几点：

[En]

Note a few points when using it alone:

①LSTMCell帮助文档中没有关于状态的参数，需要从**kwargs传入。
②LSTMCell的状态不能保留，因此它每一次运算都会返回当前状态，以便下一次继续使用。
③LSTMCell由于不处理时间序列time_seq，它的输入格式为(batch_size,units)和输出格式相同。对比LSTM输入(batch_size,time_seq,units)输出(batch_size,units)

感谢官方文档和github教我的用法
https://tensorflow.google.cn/api_docs/python/tf/keras/layers/LSTMCell
https://github.com/search?q=tensorflow+layers.LSTMCell&type=Code

Original: https://blog.csdn.net/Loutre_star/article/details/124015331
Author: Loutre_star
Title: 简单seq2seq代码使用tensorflow的LSTMCell构造循环decoder

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/508807/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【计算机视觉】新冠肺炎COVID-19 CT影片阳性检测，感染区域分割，肺部分割，智慧医疗实践，医疗影像处理示例

引言新型冠状病毒肺炎（Corona Virus Disease 2019，COVID-19），简称”新冠肺炎”，世界卫生组织命名为”2019冠…

人工智能 2023年7月29日
0063
python深度学习-tensorflow实现一个线性回归的案例（对excel数据进行分析）

一、实验大体步骤：准备数据；构建回归模型；构建损失函数（损失用均方误差表示）；优化损失（用梯度下降方法定义优化器）；输出测试集准确率和预测值。二、具体实现：线性回归：…

人工智能 2023年5月24日
0060
【Tensorflow+Keras】tf.keras.layers.LSTM的解析与使用

1 作用原理实现LSTM网络原理介绍：长短期记忆模型（Long-Short Term Memory，LSTM） 2 参数 tf.keras.layers.LSTM(units,a…

人工智能 2023年5月25日
0082
无监督算法

无监督算法简介就是依靠数据之间的相似度，形成数据的类别。（下图有些是网上扒的，如有侵权望告知，立删）层次聚类比如有7个数据点，A，B，C，D，E，F，G。我们采用数据的欧式距…

人工智能 2023年5月31日
0059
知识表示和知识建模（王昊奋知识图谱笔记）

知识表示和知识建模大纲早期知识表示简介基于语义网的知识表示框架 RDF和RDFS OWL和OWL2Fragments SPARQL查询语言 *Json-LD、RDFa、HTM…

人工智能 2023年6月1日
0082
【OpenCV】车辆识别目标检测级联分类器 C++ 案例实现

目录前言一、目标检测技术二、样本采集工作原理三、创建自己的级联分类器 Step1：准备好样本图像 Step2：环境配置（OpenCV win10） Step3：设置路径 S…

人工智能 2023年6月17日
0082
Python–随机森林模型

机器学习概念 Bagging算法 Boosting算法随机森林模型的基本原理随机森林模型的代码实现大数据分析与机器学习概念集成学习模型：将多个模型组合在一起，从而产生更…

人工智能 2023年6月19日
0083
干货！常识和事实联合驱动的知识图谱推理框架

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入！当前知识表示学习方法都采用对三元组打分的方式来判断其正确性，在负采样和推理过程都容易受到知识图谱嵌入表示不确定性的影…

人工智能 2023年6月1日
0076
【三维目标检测】VoxelNet（三）：模型详解

本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为”https://blog.csdn.net/suiying…

人工智能 2023年7月12日
0083
jupyter中缺少包时，如何正确安装

背景：学习深度学习，用的anaconda，创建了虚拟环境，在学习中遇见了缺少的包当时是想要使用 keras.utils.plot_model(model, "./len…

人工智能 2023年5月23日
0080
基于蝙蝠算法优化BP神经网络的数据分类算法及其MATLAB实现-附代码

基于蝙蝠算法优化BP神经网络的数据分类算法及其MATLAB实现-附代码文章目录基于蝙蝠算法优化BP神经网络的数据分类算法及其MATLAB实现-附代码 1 蝙蝠算法与BP神经网络…

人工智能 2023年7月3日
0085
【图神经网络】图分类学习研究综述[2]：基于图神经网络的图分类

基于GNN的图分类学习研究综述[2]：基于图神经网络的图分类论文阅读：基于GNN的图分类学习研究综述 3. 基于图神经网络的图分类 * 3.1 卷积 3.2 池化论文阅读：基于…

人工智能 2023年7月1日
0085
机器学习-生成对抗网络WGAN-GP实战（四-2）

这里就涉及到WGAN-GP的训练代码，这一部分相对比较繁琐，和传统的GAN相比，关键就是损失函数的计算和梯度的计算。还是建议大家先读机器学习-生成对抗网络变种（三），有个基础概念。…

人工智能 2023年5月23日
0075
【YOLOV5-6.x中文注释版】整体项目代码全中文注释导航页面-By2022

现在YOLOV5已经更新到6.X版本，现在网上很多还停留在5.X的源码注释上，因此特开一贴传承开源精神！ 5.X版本的可以看其他大佬的帖子本文章主要从6.X版本出发，主要解决6….

人工智能 2023年6月17日
0094
核函数高斯核函数，线性核函数，多项式核函数

核函数是我们处理数据时使用的一种方式。对于给的一些特征数据我们通过核函数的方式来对其进行处理。我们经常在SVM中提到核函数，就是因为通过核函数来将原本的数据进行各种方式的组合计算，…

人工智能 2023年6月12日
0077
R语言ggplot2可视化：可视化人口金字塔图、直方图（堆叠直方图、连续变量堆叠直方图、离散变量堆叠直方图）、密度图、箱图（添加抖动数据点、tufte箱图、多分类变量分组箱图）、小提琴图

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月1日
0054

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

简单seq2seq代码 使用tensorflow的LSTMCell构造循环decoder

大家都在看

简单seq2seq代码使用tensorflow的LSTMCell构造循环decoder