CNN卷积函数Conv2D()各参数的含义及用法解读
作者:园游会的魔法糖 发布时间:2022-03-12 05:35:21
首先我们放出tf2.0关于tf.keras.layers.Conv2D()函数的官方文档,然后逐一对每个参数的含义和用法进行解释:
tf.keras.layers.Conv2D(
filters, kernel_size, strides=(1, 1), padding='valid', data_format=None,
dilation_rate=(1, 1), activation=None, use_bias=True,
kernel_initializer='glorot_uniform', bias_initializer='zeros',
kernel_regularizer=None, bias_regularizer=None, activity_regularizer=None,
kernel_constraint=None, bias_constraint=None, **kwargs
)
从这个函数的定义能看出来,filters ,kernel_size过滤器个数和卷积核尺寸,这是两个位置参数,没有默认值,必须给。
后面的那个多参数,都是关键字参数(有等于号的),都是有默认值的,可以不写,下面来逐一分析每个参数的含义:
1.函数的位置参数filters
这是第一个参数,位置是固定的,含义是过滤器个数,或者叫卷积核个数,这个与卷积后的输出通道数一样,比如下面filters为5的时候,卷积输出的通道数(最后一位)就是5
filters卷积核个数为8的时候,输出的通道数就是8
2.函数的第二个位置参数 kernel_size
卷积核尺寸,一般为3×3,或者5×5,此处用2个整数的元组或列表表示,比如(3,3),[5,5],如果height, width长宽一样,直接用一个整数表示就行,比如3或者5,卷积后的,卷积后的height,width的计算公式如下:滑动步长为strides,卷积核的尺寸为S,输入的尺寸为P,padding = ‘valid“
height =width = (P-S)/strides +1,
此处 输入形状为20×20,卷积核为3×3,滑动步长为1,所以输出为(20-3)/1 +1 =18
此处,输入为20×20,卷积核为5×5,滑动步长为2×2,所以输出的形状为,(20-5)/2 +1向下取整,等于8,
3.关键字参数strides=(1, 1),滑动步长
默认横向和纵向滑动均为1,这个与上面的 卷积核size配合使用,用来计算输出的形状,
height =width = (P-S)/strides +1,
4.关键字参数padding = “valid”
默认是边缘不填充
此处只有两个取值,另一个取值为 “same”,表示边缘用0填充,如果padding =“same”,则输出的形状为 height =width = P/strides ,向上取整,如下图,
5.关键字参数 data_format = ’ channels_first’
输入的数据格式
此处只有两个取值 ,“channels_first”,和“channels_last”,即输入的数据格式中,通道数是第一个还是最后一个,默认为“channels_last”,即默认输入数据的格式中,通道数为最后一个。
当data_format = "channels_first"的时候,输入和输出的shape格式为
(batch_size, channels, height, width)即(图片数量,通道数,长,宽)正如下图所示:
6.关键字参数dalition_rate = (1,1)
这个含义是卷积核的膨胀系数,
此处的作用是将卷积核进行形状膨胀,新的位置用0填充,新卷积核的尺寸和膨胀系数的计算公式如下:
原卷积核的尺寸为S ,膨胀系数为k,则膨胀后的卷积核尺寸为
size = k×(S-1)+1
7.关键字参数activation = “relu”
此处的含义是激活函数,
相当于经过卷积输出后,在经过一次激活函数,常见的激活函数有relu,softmax,selu,等
8.关键字参数use_bias =0 、1
偏置项
此处取值为布尔值,0或者1,0表示没有增加bias,1表示有。
9.后面的关键字参数一般不常用
kernel_initializer
:卷积核初始化,bias_initializer
:偏差值初始化,kernel_regularizer
:卷积核正则化bias_regularizer
:偏差正则化activity_regularizer
:这个地方也是一个正则化kernel_constraint
:卷积核约束bias_constraint
:偏差约束。
这几个参数不常用,
10.最后还有几个可选 的关键字参数
input_shape
这个是指输入的形状,一般是4D的,(batch size, height, width, channels),也可以不定义,那就是默认输入的形状。
来源:https://blog.csdn.net/Zh_1999a/article/details/107526001
猜你喜欢
- 本文分析了让ThinkPHP的模板引擎达到最佳效率的方法。分享给大家供大家参考,具体如下:默认情况下ThinkPHP框架系统默认使用的模板引
- 关于Ajax在使用中要使浏览器产生前进后退的方法,网上比较多的方法有两种:一是采用hash值的方式,这是我们在地图preview版中使用的方
- 方法一:在php中,抓取https的网站,提示如下的错误内容:Warning: file_get_contents() [function.
- 过程名:catch(str) 使用方法: 代码如下:on error resume next '你的代码,如数据库连接 call c
- 首先数据库里需要有一个自动编号字段(ID)。然后第一次访问的时候,取出所有记录,定制好每页的记录数PageSize,计算出页数,然后根据页数
- 废话不多说了,直接给大家贴js代码了,具体代码如下所示:<!DOCTYPE html><html><head&
- 递归是以相似的方式重复项目的过程。同样适用于编程语言中,如果一个程序可以让你调用同一个函数被调用的函数,递归调用函数内使用如下。func r
- 今天再为大家提供一种方法:不需要安装Excel也可以导入到我们的SQL Server数据库。首先用SQL Server自身的数据转换功能把E
- 私有变量表示方法在变量前加上两个下划线的是私有变量。class Teacher(): def __init__(self,nam
- 何为共线性:共线性问题指的是输入的自变量之间存在较高的线性相关度。共线性问题会导致回归模型的稳定性和准确性大大降低,另外,过多无关的维度计算
- 本文实例为大家分享了python多进程实现文件下载传输功能的具体代码,供大家参考,具体内容如下需求:实现文件夹拷贝功能(包括文件内的文件),
- 计算机一般来说是需要定期的清理,系统的内存不能无限延伸,同时有一些不需要的文件也可以得以清除掉。有些人会使用os.remove来进行文件的清
- 前言k-means算法是无监督的聚类算法,实现起来较为简单,k-means++可以理解为k-means的增强版,在初始化中心点的方式上比k-
- 第一章:霍夫变换检测圆① 实例演示1这个是设定半径范围 0-50 后的效果。② 实例演示2这个是设定半径范围 50-70 后的效果,因为原图
- 可以采用exec方法注意:使exec不能返回一些变量的值,而且当前的变量值在exec的语句里无效。declare @tempStr
- 代码如下:--建立数据表createtable TestData ( ID int identity(1,1) primary key, D
- 方法1: 将shell执行的结果保存到字符串def run_cmd(cmd): result_str='' process
- 去空格函数有如下两种:·LTRIM()LTRIM() 函数把字符串头部(左)的空格去掉,其语法如下:LTRIM (<character
- 主要用到requests和bf4两个库将获得的信息保存在d://hotsearch.txt下import requests;import b
- 使用timer来统计asp页面程序的运行时间。实例代码和说明见下:<%Dim varInitial_TimevarIniti