位置：首页>> 网络编程>> Python编程>> Python编程pytorch深度卷积神经网络AlexNet详解

Python编程pytorch深度卷积神经网络AlexNet详解

作者：Supre_yuan　　发布时间：2022-02-18 10:28:40　

标签：Python,pytorch,AlexNet,神经网络

2012年，AlexNet横空出世。它首次证明了学习到的特征可以超越手工设计的特征。它一举打破了计算机视觉研究的现状。AlexNet使用了8层卷积神经网络，并以很大的优势赢得了2012年的ImageNet图像识别挑战赛。

下图展示了从LeNet（左）到AlexNet（right）的架构。

AlexNet和LeNet的设计理念非常相似，但也有如下区别：

AlexNet比相对较小的LeNet5要深得多。
AlexNet使用ReLU而不是sigmoid作为其激活函数。

容量控制和预处理

AlexNet通过dropout控制全连接层的模型复杂度，而LeNet只使用了权重衰减。为了进一步扩充数据，AlexNet在训练时增加了大量的图像增强数据，如翻转、裁剪和变色。这使得模型更加健壮，更大的样本量有效地减少了过拟合。

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
# 这里，我们使用一个11*11的更大窗口来捕捉对象
# 同时，步幅为4，以减少输出的高度和宽度
# 另外，输出通道的数目远大于LeNet
nn.Conv2d(1, 96, kernel_size=11, stride=4, padding=1), nn.ReLU(),
nn.MaxPool2d(kernel_size=3, stride=2)
# 减少卷积窗口，使用填充为2来使得输入与输出的高和宽一致，且增大输出通道数
nn.Conv2d(96, 256, kernel_size=5, padding=2), nn.ReLU(),
nn.MaxPool2d(kernel_size=3, stride=2)
# 使用三个连续的卷积层和较小的卷积窗口
# 除了最后的卷积层，输出通道的数量进一步增加
# 在前两个卷积层之后，汇聚层不用于减少输入的高度和宽度
nn.Conv2d(256, 384, kernel_size=3, padding=1), nn.ReLU(),
nn.Conv2d(384, 384, kernel_size=3, padding=1), nn.ReLU(),
nn.Conv2d(384, 384, kernel_size=3, padding=1), nn.ReLU(),
nn.MaxPool2d(kernel_size=3, stride=2),
nn.Flatten(),
# 这里，全连接层的输出数量是LeNet中的好几倍。使用dropout层来减轻过度拟合
nn.Linear(6400, 4096), nn.ReLU(),
nn.Dropout(p=0.5),
nn.Linear(4096, 4096), nn.ReLU(),
nn.Dropout(p=0.5),
# 最后是输出层。由于这里使用Fashion-MNIST，所以用类别数位10
nn.Linear(4096, 10)
)

我们构造一个高度和宽度都为224的单通道数据，来观察每一层输出的形状。它与上面离得最近的图中的AlexNet架构相匹配。

X = torch.randn(1, 1, 224, 224)
for layer in net:
X = layer(X)
print(layer.__class__.__name__,'Output shape:\t', X.shape)

Conv2d Output shape: torch.Size([1, 96, 54, 54])
ReLU Output shape: torch.Size([1, 96, 54, 54])
MaxPool2d Output shape: torch.Size([1, 96, 26, 26])
Conv2d Output shape: torch.Size([1, 256, 26, 26])
ReLU Output shape: torch.Size([1, 256, 26, 26])
MaxPool2d Output shape: torch.Size([1, 256, 12, 12])
Conv2d Output shape: torch.Size([1, 384, 12, 12])
ReLU Output shape: torch.Size([1, 384, 12, 12])
Conv2d Output shape: torch.Size([1, 384, 12, 12])
ReLU Output shape: torch.Size([1, 384, 12, 12])
Conv2d Output shape: torch.Size([1, 256, 12, 12])
ReLU Output shape: torch.Size([1, 256, 12, 12])
MaxPool2d Output shape: torch.Size([1, 256, 5, 5])
Flatten Output shape: torch.Size([1, 6400])
Linear Output shape: torch.Size([1, 4096])
ReLU Output shape: torch.Size([1, 4096])
Dropout Output shape: torch.Size([1, 4096])
Linear Output shape: torch.Size([1, 4096])
ReLU Output shape: torch.Size([1, 4096])
Dropout Output shape: torch.Size([1, 4096])
Linear Output shape: torch.Size([1, 10])

读取数据集

在这里将AlexNet直接应用于Fashion-MNIST的识别，但这里有一个问题，那就是Fashion-MNIST图像的分辨率（ 28 × 28 28\times28 28×28像素）低于ImageNet图像。为了解决这个问题，我们将它们增加到 224 × 224 224\times224 224×224（通常来讲这不是一个明智的做法，但我们在这里这样做是为了有效使用AlexNet结构）。我们使用d2l.load_data_fashion_mnist函数中的resize参数执行此调整。

batch_size = 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)

现在，我们可以开始训练AlexNet了，与LeNet相比，这里的主要变化是使用更小的学习速率训练，这是因为网络更深更广、图像分辨率更高，训练卷积伸进网络就更昂贵。

lr, num_epochs = 0.01, 10
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

loss 0.330, train acc 0.879, test acc 0.877
4163.0 examples/sec on cuda:0

来源：https://blog.csdn.net/weixin_43880225/article/details/120625556

0

投稿

猜你喜欢

Bootstrap每天必学之表单
本文主要讲解的是表单，这个其实对于做过网站的人来说，并不陌生，而且可以说是最为常用的提交数据的Form表单。本文主要来讲解一下内容：1.基本
四种Python机器学习超参数搜索方法总结
在建模时模型的超参数对精度有一定的影响，而设置和调整超参数的取值，往往称为调参。在实践中调参往往依赖人工来进行设置调整范围，然后使用机器在超
Matplotlib绘制子图的常见几种方法
前言Matplotlib的可以把很多张图画到一个显示界面，在作对比分析的时候非常有用。对应的有plt的subplot和figure的add_
Django中实现一个高性能计数器(Counter)实例
计数器(Counter)是一个非常常用的功能组件，这篇blog以未读消息数为例，介绍了在 Django中实现一个高性能计数器的基本要点。故事
js正则的几个基本概念
经常看到说正则的文章，但说的只是方法，却很少有说以下几个基本概念：1.贪婪：+,*,?,{m,n}等默认是贪婪匹配，即尽可能多匹配，也叫最大
Python命令行参数解析包argparse的使用详解
一、argparse简介argparse 是 python 自带的命令行参数解析包，可以用来方便的服务命令行参数，使用之前需要先导入包 im
Python使用背景差分器实现运动物体检测
前言目前，许多运动检测技术都是基于简单的背景差分概念的，即假设摄像头（视频）的曝光和场景中的光照条件是稳定的，当摄像头捕捉到新的帧时，我们可
Python图像处理之直线和曲线的拟合与绘制【curve_fit()应用】
本文实例讲述了Python图像处理之直线和曲线的拟合与绘制。分享给大家供大家参考，具体如下：在数据处理和绘图中，我们通常会遇到直线或曲线的拟
asp如何获知并显示文件的大小？
当然可以，我们使用强大的fso对象来获取文件夹的大小请敲入如下代码即可：<％Set MyFileSize =&nb
Linux服务器网卡流量查看方法 shell和Python各一枚
有时我们需要较为实时的查看服务器上的网卡流量，这里我写了两个小脚本，一个用shell（先写的，一次只能查看一个网卡），另一个用Python（
python web基础之加载静态文件实例
在web运行中很重要的一个功能就是加载静态文件，在django中可能已经给我们设置好了，我们只要直接把模板文件放在templates就好了，
一篇文章带你了解Python中的类
1、类的定义创建一个rectangle.py文件，并在该文件中定义一个Rectangle类。在该类中，__init__表示构造方法。其中，s
Django中ORM的基本使用教程
前言Django框架功能齐全自带数据库操作功能，本文主要介绍Django的ORM框架到目前为止，当我们的程序涉及到数据库相关操作时，我们一般
php中ob_flush函数和flush函数用法分析
本文实例分析了php中ob_flush函数和flush函数用法。分享给大家供大家参考。具体如下：ob_flush()函数: 取出PHP bu
Python爬虫框架Scrapy基本用法入门教程
本文实例讲述了Python爬虫框架Scrapy基本用法。分享给大家供大家参考，具体如下：Xpath<html><head&
python模拟鼠标点击和键盘输入的操作
所有代码都是网上百度出来的，通过个人实践找到适合自己的。采用的python 库是 pymouse、pykeyboard安装时直接p
Django框架ORM操作数据库不生效问题示例解决方法
本文详细描述使用Django 的ORM框架操作PostgreSQL数据库删除不生效问题的定位过程及解决方案，并总结使用ORM框架操作数据库不
Python用selenium实现自动登录和下单的项目实战
前言学python对selenium应该不陌生吧Selenium 是最广泛使用的开源 Web UI（用户界面）自动化测试套件之一。Selen
在SQL Server 2005数据库中更改数据架构
在数据库testDB中存在架构A及用户A，现将testDB数据库所属的用户由A改为B，同时删除用户A；架构也由A改为B，删除架构A，操作如下
一文带你了解ChatGPT API的使用
1.概述随着人工智能技术的不断发展，越来越多的AI产品被应用到各个领域，其中最具代表性的莫过于人工智能语言模型。语言模型是一种可以通过学习大

Python使用百度API上传文件到百度网盘代码分享

Django 内置权限扩展案例详解

如何利用 Python 绘制动态可视化图表

详解python中@的用法

1分钟快速生成用于网页内容提取的xslt

Python全局变量与局部变量区别及用法分析

用Python的线程来解决生产者消费问题的示例

Python中使用双下划线防止类属性被覆盖问题

django的聚合函数和aggregate、annotate方法使用详解

Python如何利用IMAP实现邮箱客户端功能

Excel2013设置数据有效性

创造与魔法椰奶食谱配方怎么制作

解决mysql ERROR 1017:Can't find file: '/xxx.frm' 错误

Java中Thread类详解及常用的方法

Bandicam音频捕获失败怎么办？Bandicam音频捕获失败解决方法

优酷视频怎么上传视频文件上传视频的操作方法

Win11dll文件缺失怎么修复？Win11系统dll文件丢失的解决方法

云顶之弈斗枪开局装备如何选择？斗枪开局装备选择推荐

剑网3指尖江湖火折子怎么得? 火折子获取途径介绍

wps文字怎样修改水印图片大小

手机版 网络编程 asp之家 www.aspxhome.com