CNN卷积函数Conv2D()各参数的含义及用法解读
作者:园游会的魔法糖 发布时间:2022-03-12 05:35:21
首先我们放出tf2.0关于tf.keras.layers.Conv2D()函数的官方文档,然后逐一对每个参数的含义和用法进行解释:
tf.keras.layers.Conv2D(
filters, kernel_size, strides=(1, 1), padding='valid', data_format=None,
dilation_rate=(1, 1), activation=None, use_bias=True,
kernel_initializer='glorot_uniform', bias_initializer='zeros',
kernel_regularizer=None, bias_regularizer=None, activity_regularizer=None,
kernel_constraint=None, bias_constraint=None, **kwargs
)
从这个函数的定义能看出来,filters ,kernel_size过滤器个数和卷积核尺寸,这是两个位置参数,没有默认值,必须给。
后面的那个多参数,都是关键字参数(有等于号的),都是有默认值的,可以不写,下面来逐一分析每个参数的含义:
1.函数的位置参数filters
这是第一个参数,位置是固定的,含义是过滤器个数,或者叫卷积核个数,这个与卷积后的输出通道数一样,比如下面filters为5的时候,卷积输出的通道数(最后一位)就是5
filters卷积核个数为8的时候,输出的通道数就是8
2.函数的第二个位置参数 kernel_size
卷积核尺寸,一般为3×3,或者5×5,此处用2个整数的元组或列表表示,比如(3,3),[5,5],如果height, width长宽一样,直接用一个整数表示就行,比如3或者5,卷积后的,卷积后的height,width的计算公式如下:滑动步长为strides,卷积核的尺寸为S,输入的尺寸为P,padding = ‘valid“
height =width = (P-S)/strides +1,
此处 输入形状为20×20,卷积核为3×3,滑动步长为1,所以输出为(20-3)/1 +1 =18
此处,输入为20×20,卷积核为5×5,滑动步长为2×2,所以输出的形状为,(20-5)/2 +1向下取整,等于8,
3.关键字参数strides=(1, 1),滑动步长
默认横向和纵向滑动均为1,这个与上面的 卷积核size配合使用,用来计算输出的形状,
height =width = (P-S)/strides +1,
4.关键字参数padding = “valid”
默认是边缘不填充
此处只有两个取值,另一个取值为 “same”,表示边缘用0填充,如果padding =“same”,则输出的形状为 height =width = P/strides ,向上取整,如下图,
5.关键字参数 data_format = ’ channels_first’
输入的数据格式
此处只有两个取值 ,“channels_first”,和“channels_last”,即输入的数据格式中,通道数是第一个还是最后一个,默认为“channels_last”,即默认输入数据的格式中,通道数为最后一个。
当data_format = "channels_first"的时候,输入和输出的shape格式为
(batch_size, channels, height, width)即(图片数量,通道数,长,宽)正如下图所示:
6.关键字参数dalition_rate = (1,1)
这个含义是卷积核的膨胀系数,
此处的作用是将卷积核进行形状膨胀,新的位置用0填充,新卷积核的尺寸和膨胀系数的计算公式如下:
原卷积核的尺寸为S ,膨胀系数为k,则膨胀后的卷积核尺寸为
size = k×(S-1)+1
7.关键字参数activation = “relu”
此处的含义是激活函数,
相当于经过卷积输出后,在经过一次激活函数,常见的激活函数有relu,softmax,selu,等
8.关键字参数use_bias =0 、1
偏置项
此处取值为布尔值,0或者1,0表示没有增加bias,1表示有。
9.后面的关键字参数一般不常用
kernel_initializer
:卷积核初始化,bias_initializer
:偏差值初始化,kernel_regularizer
:卷积核正则化bias_regularizer
:偏差正则化activity_regularizer
:这个地方也是一个正则化kernel_constraint
:卷积核约束bias_constraint
:偏差约束。
这几个参数不常用,
10.最后还有几个可选 的关键字参数
input_shape
这个是指输入的形状,一般是4D的,(batch size, height, width, channels),也可以不定义,那就是默认输入的形状。
来源:https://blog.csdn.net/Zh_1999a/article/details/107526001


猜你喜欢
- 前言图像分割是许多计算机视觉应用中的关键处理步骤,通常用于将图像划分为不同的区域,这些区域常常对应于真实世界的对象。因此,图像分割是图像识别
- 背景公司一个golang的项目,使用到了公司的私有仓库,去执行go mod tidy(下载依赖)的时候,到download公司私有库的时候就
- 本文实例讲述了vue.js使用v-if实现显示与隐藏功能。分享给大家供大家参考,具体如下:<!doctype html><
- 实际开发中,有时候系统提供的异常类型不能满足开发的需求。这时候你可以通过创建一个新的异常类来拥有自己的异常。异常类继承自 Exception
- Selenium的介绍、配置和调用Selenium(浏览器自动化测试框架) 是一个用于Web应用程序测试的工具。Selenium测
- 前言本文主要给大家介绍了关于python图片添加半透明水印的相关资料,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧示例代码
- 时间序列预测时间序列是按照时间顺序排列的数据集合,在很多应用中都非常常见。时间序列分析是对这些数据进行分析和预测的过程。时间序列预测是该分析
- PHP 备份 mysql 数据库的源代码,在完善的 PHP+Mysql 项目中,在后台都会有备份 Mysql 数据库的功能,有了这个功能,对
- 数据库索引是一个数据结构,提高操作的速度,在一个表中可以使用一个或多个列,提供两个快速随机查找和高效的顺序访问记录的基础创建索引。在创建索引
- Dreamweaver MX 2004 试用试用心得:安装:选择工作界面(我选了默认的设计模式)初次启动,选择30天试用如果你也看到这个警告
- 下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数
- 导语电脑桌面文件太多查找起来比较花费时间,并且凌乱的电脑桌面也会影响工作心情,于是利用python根据时间自动建立当日文件夹,这样就可以把桌
- 如下所示:def softmax(logits, axis=None, name=None, dim=None): ""
- 本文实例讲述了python批量提交沙箱问题,分享给大家供大家参考。具体方法如下:出现的问题如下:1. Popen的使用,在linux下参数用
- 前言使用Python写过面向对象的代码的同学,可能对 __init__ 方法已经非常熟悉了,__init__方法在类的一个对象被建立时,马上
- 前言数据集下载地址:链接: https://pan.baidu.com/s/17aglKyKFvMvcug0xrOqJdQ?pwd=6i7m
- 链表由一系列不必在内存中相连的结构构成,这些对象按线性顺序排序。每个结构含有表元素和指向后继元素的指针。最后一个单元的指针指向NULL。为了
- BCP语句的作用:BCP是SQL提供的进行数据传输的实用程序,这种语句提供了非常快的数据导入的方法。(当然7。0也有BCP的替代方法就是DT
- 输入汉字提示拼音,试试下面这个函数,不知是不是你要的那个:查询汉字便宜到词典网<%function getpychar(ch
- 在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread