【TensorFlow2.0】高级API中关于tf.keras.layers.Conv2D()函数的参数详细说明(建议保存)

关于

函数的官方文档,然后逐一对每个参数的含义和用法进行解释:

tf.keras.layers.Conv2D(filters,
                       kernel_size,
                       strides=(1, 1),
                       padding='valid',
                       data_format=None,
                       dilation_rate=(1, 1),
                       groups=1,
                       activation=None,
                       use_bias=True,
                       kernel_initializer='glorot_uniform',
                       bias_initializer='zeros',
                       kernel_regularizer=None,
                       bias_regularizer=None,
                       activity_regularizer=None,
                       kernel_constraint=None,
                       bias_constraint=None,
                       **kwargs)

参数说明:

这个函数的定义能看出来,filters ,kernel_size过滤器个数和卷积核尺寸,这是两个位置参数,没有默认值,必须给。后面的那个多参数,都是关键字参数(有等于号的),都是有默认值的,可以不写,下面来逐一分析每个参数的含义:

这是第一个参数,位置是固定的,含义是过滤器个数,或者叫 卷积核个数,这个与卷积后的输出通道数一样,比如下面filters为64的时候,卷积输出的通道数(最后一位)就是64。

model.add(tf.keras.layers.Conv2D(64, 3,
                                kernel_initializer='he_normal',
                                strides=1,
                                activation='relu',
                                padding='same',
                                input_shape=(32, 32, 3),
                                name="conv1"))

filters卷积核个数为64的时候,输出的通道数就是64。

卷积核尺寸,一般为3×3,或者5×5,此处用2个整数的元组或列表表示,比如(3,3),[5,5],如果height, width长宽一样,直接用一个整数表示就行,比如3或者5。

默认横向和纵向滑动均为1,这个与上面的 卷积核size配合使用,用来计算输出的形状。滑动步长就是卷积核在原图像矩阵上的每次移动的长度。

此处只有两个取值,另一个取值为 “same”,表示边缘用0填充,如果padding =”same”,则输出的形状为 height =width = P/strides ,向上取整。

model.add(tf.keras.layers.Conv2D(64, 3,
                                strides=1,
                                activation='relu',
                                padding='same',
                                kernel_initializer='he_normal',
                                input_shape=(32, 32, 3),
                                name="conv1"))

此处只有两个取值 ,”channels_first” 和 “channels_last”,即输入的数据格式中,通道数是第一个还是最后一个,默认为 “channels_last”,即默认输入数据的格式中,通道数为最后一个。

将卷积核进行形状膨胀,新的位置用0填充,新卷积核的尺寸和膨胀系数的计算公式如下:
原卷积核的尺寸为S ,膨胀系数为k,则膨胀后的卷积核尺寸为:
size = k×(S-1)+1

相当于经过卷积输出后,在经过一次激活函数,常见的激活函数有relu,softmax,selu,等

此处取值为布尔值,0或者1,0表示没有增加bias,1表示有。

kernel_initializer :卷积核初始化,
bias_initializer :偏差值初始化,
kernel_regularizer :卷积核正则化
bias_regularizer :偏差正则化
activity_regularizer 这个地方也是一个正则化
kernel_constraint :卷积核约束
bias_constraint :偏差约束。

这个是指输入的形状,一般是4D的,(batch size, height, width, channels),也可以不定义,那就是默认输入的形状。

Original: https://blog.csdn.net/weixin_43529465/article/details/124721583
Author: 量化Mike
Title: 【TensorFlow2.0】高级API中关于tf.keras.layers.Conv2D()函数的参数详细说明(建议保存)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/520887/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球