总结近几年Pytorch基于Imgagenet数据集图像分类模型
作者:刘润森! 发布时间:2023-01-06 01:15:31
AlexNet (2012 )
2012 年,AlexNet 由 Alex Krizhevsky 为 ImageNet 大规模视觉识别挑战赛 ( ILSVRV ) 提出的,ILSVRV 评估用于对象检测和图像分类的算法。
AlexNet 总共由八层组成
其中前5层是卷积层,后3层是全连接层。
前两个卷积层连接到重叠的最大池化层以提取最大数量的特征。
第三、四、五卷积层直接与全连接层相连。
卷积层和全连接层的所有输出都连接到 ReLu 非线性激活函数。
最后的输出层连接到一个 softmax 激活层,它产生 1000 个类标签的分布。
VGG (2014)
VGG 是一种流行的神经网络架构
由2014年,牛津大学的 Karen Simonyan 和 Andrew Zisserman 提出。
与 AlexNet 相比,VGG 的主要改进包括使用大内核大小的过滤器
(第一和第二卷积层中的大小分别为 11 和 5)和多个(3×3)内核大小的过滤器。
GoogleNet (2014)
2014年,GoogleNet 诞生,该架构有 22 层深
包括 27 个池化层。总共有 9 个初始模块线性堆叠。Inception 模块的末端连接到全局平均池化层。
下面是完整 GoogleNet 架构的缩小图像。
ResNet (2015)
由于深度神经网络训练既费时又容易过拟合,微软引入了一个残差学习框架来改进比以前使用的更深的网络的训练。
ResNet在PyTorch的官方代码中共有5种不同深度的结构
深度分别为18、34、50、101、152(各种网络的深度指的是“需要通过训练更新参数”的层数,如卷积层,全连接层等)。
Inception v3 (2015)
与 VGGNet 相比,
Inception Networks 已被证明在计算效率更高
Inception v3 网络的架构是逐步构建的,结构图可点击查看大图
SqueezeNet (2016)
SqueezeNet 是一个较小的网络
它的参数比 AlexNet 少近 50 倍,但执行速度快 3 倍。
如上图中最左边所示,SqueezeNet 以一个标准的卷积层开始,然后是 8 个 Fire 模块,最后再以一个卷积层结束。
步长为 2 的池化分别跟在第一个卷积层、 第 4 个 Fire 模块、第 8 个 Fire 模块和最后一个卷积层后面。
中间的网络结构在特征图通道数相同的 Fire 模块之间引入了残差网络中的跳跃连接,
而最右边的网络结构在中间结构的基础上,针对特征图通道数不一样的情况,通过一个 1×1 的卷积来调整通道数一致后再相加。
DenseNet (2016)
DenseNet 拥有与传统深度 CNN 相比的一大优势:
通过多层的信息在到达网络末端时不会被冲刷或消失。这是通过简单的连接模式实现的。
要理解这一点,必须知道普通 CNN 中的层是如何连接的。
这是一个简单的 CNN,其中各层按顺序连接。然而,在DenseNet 中,每一层从所有前面的层获得额外的输入,并将其自己的特征映射传递给所有后续层。
下面是描绘DenseNet 的图像。
Xception (2016)
Xception是Google公司继Inception后提出的
对 Inception-v3 的另一种改进
Xception 的结构基于 ResNet,但是将其中的卷积层换成了Separable Convolution(极致的 Inception模块)。
如下图所示。整个网络被分为了三个部分:Entry,Middle和Exit。
ShuffleNet v2 (2018)
2018年,开始了轻度网络的研究,MnasNet ,MobileNet,ShuffleNet,,Xception采用了分组卷积,
深度可分离卷积等操作,这些操作
在一定程度上大大减少了FLOP
整体 ShuffleNet v2 架构列表如下:
MnasNet (2018)
Google 团队最新提出 MnasNet
使用强化学习的思路,提出一种资源约束的终端 CNN 模型的自动神经结构搜索方法。
ResNeXt(2019)
ResNeXt是ResNet 的变体
ResNet有许多版本,对应的ResNeXt也有许多不同版本。
对比下,ResNet50和ResNeXt-50的网络结构图如下:
MobileNetv3 (2019)
在ImageNet分类任务上,相对于MobileNetV2,
MobileNetV3-small精度提高了大约3.2%,时间减少了15%
MobileNetV3-large精度提高了大约34.6%,时间减少了5%。
MobileNetV3的large和small结构如下图所示。
EfficientNet 2019 and EfficientNet v2 2021
谷歌研究人员在一篇 ICML 2019 论文《EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks》中,
提出了
一种新型模型缩放方法
该方法使用一种简单但高效的复合系数(compound coefficient)以更加结构化的方式扩展 CNN,这成为后ResNet时代的顶流EfficientNet,
很多模型网络及其复杂,学会怎么用轮子就好了。
以上就是总结近几年Pytorch基于Imgagenet数据集图像分类模型的详细内容,更多关于Pytorch基于Imgagenet数据集图像分类模型的资料请关注脚本之家其它相关文章!
来源:https://blog.csdn.net/weixin_44510615/article/details/119980341


猜你喜欢
- <SCRIPT language="javascript"> function&nbs
- 1.今天复习一下Vue自定义指令的代码,结果出现一个很无语的结果,先贴代码。2.<div id="example"
- 一、什么是MQTTMQTT(Message Queuing Telemetry Transport,消息队列遥测传输协议),是一种基于发布/
- 一、语法while 条件:执行代码while就是当的意思,它指当其后面的条件成立,就执行while下面的代码。例:写一个从0打印到10的程序
- 本文实例讲述了Python3读取文件常用方法。分享给大家供大家参考。具体如下:''''' Creat
- 详解 sys.argv关于 sys.argv 可得好好说道说道了。当初我可是被折磨的不要不要的,上一章节我们提到 argv 是获取程序外部的
- DateDiff 函数描述 返回两个日期之间的时间间隔。 语法 DateDiff(interval, date1, date2 [,firs
- 前言最近国内疫情状况好转,快递业也逐渐恢复,大家的快递是不是跑起来了?本文就来讲解如何让 python自动为你查询快递信息 ,并在
- 首先确保已安装jupyter notebook,而且添加到了环境变量再找到保存ipynb文件的文件夹,在路径处直接输入cmd,然后回车进入命
- 使用MySQL,目前你可以在三种基本数据库表格式间选择。当你创建一张表时,你可以告诉MySQL它应该对于表使用哪个表类型。MySQL将总是创
- JSON 格式字段是 Mysql 5.7 新加的属性,不够它本质上以字符串性质保存在库中的,刚接触时我只了解 $.xx 查询字段的方法,因为
- 本文实例讲述了Python基于动态规划算法解决01背包问题。分享给大家供大家参考,具体如下:在01背包问题中,在选择是否要把一个物品加到背包
- 前言在跑模型的时候,遇到如下报错UserWarning: To copy construct from a tensor, it is re
- 过滤器模板层对变量的操作实际还有很多,过滤器就是其中一种。学过Linux系统的一定知道管道操作符,其可以将上一步输出直接作为下一步输入进行处
- 编程一直是在课余时间,放假时间自学,到现在为止也有半年了。这是我自己用python实现的连连看,也是第一个完成的游戏,虽然极其简陋。思路呢,
- 正则表达式:((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?
- 1、炫酷星空登录实现代码<!DOCTYPE HTML><html><head><meta http
- 1.安装PHP脚本运行环境yum install -y php php-mysql2.加载官方percona模板[root@cat /]#
- 前言WebStorm是一款强大的前端开发软件,vue是当前前端热门技术栈。对于WebStorm默认的配置,它会把vue当成文本文件处理,从而
- reflect 反射包针对反射,Go 提供了 reflect 包,使用这个包里的函数可以在程序运行时获取和更新未知变量的值,操作未知变量的方