深入浅出TensorFlow2函数——tf.keras.layers.Embedding

2023年5月24日下午8:09 • 人工智能 • 阅读 51

tf.keras.layers.Embedding(
    input_dim, output_dim, embeddings_initializer='uniform',
    embeddings_regularizer=None, activity_regularizer=None,
    embeddings_constraint=None, mask_zero=False, input_length=None, **kwargs
)

该函数是神经网络的Embedding层，其仅可用于神经网络的第一层。

import numpy as np
model = tf.keras.Sequential()
model.add(tf.keras.layers.Embedding(1000, 64, input_length=10))
input_array = np.random.randint(1000, size=(32, 10))
model.compile('rmsprop', 'mse')
output_array = model.predict(input_array)
print(output_array.shape)

参数意义input_dim[

]词汇表的大小，即最大整数索引+1。output_dim[

]稠密嵌入的维数。embeddings_initializer嵌入矩阵的初始值设定项（参见

）。embeddings_regularizer应用于嵌入矩阵的正则化器函数（参见

）。embeddings_constraint应用于嵌入矩阵的约束函数（参见

）。mask_zero[

mask_zero

True，则索引0不能在词汇表中使用（input_dim应等于词汇表的大小+1）。input_length输入序列的长度，当其为常数时。如果要将"展平Dense层"连接到上游，则需要此参数，如果没有此参数，则无法计算密集输出的形状。 <code>(batch_size, input_length)</code>的二维张量。 <code>(batch_size, input_length, output_dim)</code>的三维张量。 默认情况下，如果GPU可用，则嵌入矩阵将放置在GPU上。这可以实现最佳性能，但可能会导致以下问题：您可能正在使用不支持稀疏GPU内核的优化器。在这种情况下，您将在训练模型时看到一个错误。您的嵌入矩阵可能太大，无法全部读入GPU。在这种情况下，您将看到内存不足（OOM）错误。此时，应该将嵌入矩阵放在CPU内存上。您可以使用设备作用域执行此操作，例如： <pre><code class="language-python">with tf.device('cpu:0'): embedding_layer = Embedding(...) embedding_layer.build() </code></pre> <pre><code class="language-python"> from tensorflow.python.keras import backend from tensorflow.python.keras import constraints from tensorflow.python.keras import initializers from tensorflow.python.keras import regularizers from tensorflow.python.keras.engine import base_layer_utils from tensorflow.python.keras.engine.base_layer import Layer from tensorflow.python.keras.utils import tf_utils from tensorflow.python.ops import embedding_ops from tensorflow.python.ops import math_ops from tensorflow.python.util.tf_export import keras_export @keras_export('keras.layers.Embedding') class Embedding(Layer): def __init__(self, input_dim, output_dim, embeddings_initializer='uniform', embeddings_regularizer=None, activity_regularizer=None, embeddings_constraint=None, mask_zero=False, input_length=None, **kwargs): if 'input_shape' not in kwargs: if input_length: kwargs['input_shape'] = (input_length,) else: kwargs['input_shape'] = (None,) if input_dim 0 or output_dim 0: raise ValueError('Bothinput_dim and output_dim` should be positive, ‘
‘found input_dim {} and output_dim {}’.format(
input_dim, output_dim))
if (not base_layer_utils.v2_dtype_behavior_enabled() and
‘dtype’ not in kwargs):

kwargs[‘dtype’] = backend.floatx()

kwargs[‘autocast’] = False
super(Embedding, self).__init__(**kwargs)

self.input_dim = input_dim
self.output_dim = output_dim
self.embeddings_initializer = initializers.get(embeddings_initializer)
self.embeddings_regularizer = regularizers.get(embeddings_regularizer)
self.activity_regularizer = regularizers.get(activity_regularizer)
self.embeddings_constraint = constraints.get(embeddings_constraint)
self.mask_zero = mask_zero
self.supports_masking = mask_zero
self.input_length = input_length

@tf_utils.shape_type_conversion
def build(self, input_shape=None):
self.embeddings = self.add_weight(
shape=(self.input_dim, self.output_dim),
initializer=self.embeddings_initializer,
name=’embeddings’,
regularizer=self.embeddings_regularizer,
constraint=self.embeddings_constraint,
experimental_autocast=False)
self.built = True

def compute_mask(self, inputs, mask=None):
if not self.mask_zero:
return None
return math_ops.not_equal(inputs, 0)

@tf_utils.shape_type_conversion
def compute_output_shape(self, input_shape):
if self.input_length is None:
return input_shape + (self.output_dim,)
else:

if isinstance(self.input_length, (list, tuple)):
in_lens = list(self.input_length)
else:
in_lens = [self.input_length]
if len(in_lens) != len(input_shape) – 1:
raise ValueError(‘"input_length" is %s, ‘
‘but received input has shape %s’ % (str(
self.input_length), str(input_shape)))
else:
for i, (s1, s2) in enumerate(zip(in_lens, input_shape[1:])):
if s1 is not None and s2 is not None and s1 != s2:
raise ValueError(‘"input_length" is %s, ‘
‘but received input has shape %s’ % (str(
self.input_length), str(input_shape)))
elif s1 is None:
in_lens[i] = s2
return (input_shape[0],) + tuple(in_lens) + (self.output_dim,)

def call(self, inputs):
dtype = backend.dtype(inputs)
if dtype != ‘int32’ and dtype != ‘int64’:
inputs = math_ops.cast(inputs, ‘int32’)
out = embedding_ops.embedding_lookup_v2(self.embeddings, inputs)
if self._dtype_policy.compute_dtype != self._dtype_policy.variable_dtype:

out = math_ops.cast(out, self._dtype_policy.compute_dtype)
return out

def get_config(self):
config = {
‘input_dim’: self.input_dim,
‘output_dim’: self.output_dim,
’embeddings_initializer’:
initializers.serialize(self.embeddings_initializer),
’embeddings_regularizer’:
regularizers.serialize(self.embeddings_regularizer),
‘activity_regularizer’:
regularizers.serialize(self.activity_regularizer),
’embeddings_constraint’:
constraints.serialize(self.embeddings_constraint),
‘mask_zero’: self.mask_zero,
‘input_length’: self.input_length
}
base_config = super(Embedding, self).get_config()
return dict(list(base_config.items()) + list(config.items()))

Original: https://blog.csdn.net/hy592070616/article/details/122024879
Author: von Neumann
Title: 深入浅出TensorFlow2函数——tf.keras.layers.Embedding

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/509236/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

2022-2028年中国脱汞行业市场规模及发展前景分析报告

【报告类型】产业研究【出版时间】即时更新（交付时间约3个工作日）【发布机构】智研瞻产业研究院【报告格式】PDF版本报告介绍了脱汞行业相关概述、中国脱汞行业运行环境、分析了中…

人工智能 2023年6月11日
0063
EEG | EEGNet 神经网络分类脑电信号实战（附完整源码）

EEGNet + MNE 分类 Sample数据集一、环境配置 Package name Version Python3.7Tensorflow2.7.0mne0.24.1mat…

人工智能 2023年6月30日
0098
《黑客帝国：矩阵重启》科幻经典回归，你会选择红色药丸还是蓝色药丸

期待已久的《黑客帝国：矩阵重启》于一月中旬上线，整个矩阵重启，大段的叙事和镜头都在向前三部致敬：Neo的再次被唤醒，所需要作的选择依然是”红与蓝”——红色药…

人工智能 2023年6月17日
0070
神经网络阈值是什么意思,神经网络的权值和阈值

BP神经网络中初始权值和阈值的设定 1、首先需要了解BP神经网络是一种多层前馈网络。2、以看一下在matlab中BP神经网络的训练函数，有梯度下降法traingd,弹性梯度下降法t…

人工智能 2023年7月13日
0069
基于YOLO目标检测及OpenCV实现的游戏代玩人工智能体(Auto Gaming Agent) [4]

大型生存类游戏自动代玩人工智能[4] — 自动控制一、键鼠自动操作 * – 1. 操作游戏角色 2. 瞄准目标二、自动采集 * – 1. O…

人工智能 2023年7月9日
00103
sklearn库中逻辑回归如何实现多分类

对于逻辑回归算法主要是用回归的算法解决分类的问题，它只能解决二分类的问题，经过改造便可以进行多分类问题，主要的改造方式有两大类：(1)OVR/A(One VS Rest/ALL)(…

人工智能 2023年7月1日
0070
计量经济学笔记5-Eviews操作-异方差的检验与消除（White检验与加权最小二乘）

完成期末作业的同时来更一下博客问题背景：对中国储蓄存款总额（Y，亿元）与GDP（亿元）两个变量进行一元线性回归，检验并消除异方差。 White检验是通过一个辅助回归式进行异方差检验…

人工智能 2023年6月17日
00147
吴恩达机器学习Python实现课后习题（4）：Backpropagation 反向传播（文末有完整代码）

1 Prepare datasets 其中有5000个训练样本，每个样本是20*20像素的数字的灰度图像。每个像素代表一个浮点数，表示该位置的灰度强度。20×20的像素网格被展开成…

人工智能 2023年7月14日
0047
OpenGL之环境映射

1.1 环境映射（Environment Mapping）具有光滑表面的物体会反射形成周围环境的影响，是一种环境光效果。光线跟踪等(全局光照)可以实现这种效果，但是效率太低，可以…

人工智能 2023年6月30日
0070
Python Pandas PK esProc SPL，谁才是数据预处理王者？

做数据分析和人工智能运算前常常需要大量的数据准备工作，也就是把各种数据源以及各种规格的数据整理成统一的格式。因为情况非常复杂多样，很难有某种可视化工具来完成此项工作，常常需要编程才…

人工智能 2023年7月4日
0075
Andrej Karpathy | 详解神经网络和反向传播（基于 micrograd）

只要你懂 Python，大概记得高中学过的求导知识，看完这个视频你还不理解反向传播和神经网络核心要点的话，那我就吃鞋:D Andrej Karpathy，前特斯拉 AI 高级总监、…

人工智能 2023年6月4日
0089
“OSError: [WinError 1455]页面文件太小，无法完成操作。”解决方案

“OSError: [WinError 1455]页面文件太小，无法完成操作”解决方案引言 1 问题原因 2 解决方案引言某次在Windows系统上跑…

人工智能 2023年7月29日
0095
opencv模板匹配

cv2.TM_CCOEFF_NORMED ——化相关系数匹配法(最好匹配1) 本文举例两种方式： 1.opencv方法：通过opencv的matchTemp…

人工智能 2023年7月20日
0042
以最易懂的人话讲分类和聚类算法（建议分享和收藏）

以最易懂的人话讲分类和聚类算法（建议分享）今天在使用聚类方法进行客户价值分析时遇到了个问题，将我卡住了半个小时，实际上现在想来是一个很简单的问题，但是大家都知道，一个人脑子短路时…

人工智能 2023年5月31日
0072
python重新编号功能_在dataframe列中重新编码列表值

我试图在一个以列表格式组织的dataframe列中重新编码值。我知道如何替换dataframe列中的字符串值，但在列表中却很难做到这一点。在以下是我的数据片段：{0: &#821…

人工智能 2023年7月7日
0044
sqlite加载csv文件，并做数据分析

csv文件太多，很难做数据分析，可以下载sqllite到本地，将数据导入到sqllite中并做数据分析。 1、下载并安装sqlite3，注意windows需要下载sqllite3的…

人工智能 2023年6月11日
0070

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

深入浅出TensorFlow2函数——tf.keras.layers.Embedding

大家都在看