位置：首页>> 网络编程>> Python编程>> Tensorflow加载Vgg预训练模型操作

Tensorflow加载Vgg预训练模型操作

作者：GodWriter　　发布时间：2023-10-13 10:56:23　

标签：Tensorflow,加载,Vgg,模型

很多深度神经网络模型需要加载预训练过的Vgg参数，比如说：风格迁移、目标检测、图像标注等计算机视觉中常见的任务。那么到底如何加载Vgg模型呢？Vgg文件的参数到底有何意义呢？加载后的模型该如何使用呢？

本文将以Vgg19为例子，详细说明Tensorflow如何加载Vgg预训练模型。

实验环境

GTX1050-ti, cuda9.0

Window10, Tensorflow 1.12

展示Vgg19构造

import tensorflow as tf

import numpy as np
import scipy.io

data_path = 'model/vgg19.mat' # data_path指下载下来的Vgg19预训练模型的文件地址

# 读取Vgg19文件
data = scipy.io.loadmat(data_path)
# 打印Vgg19的数据类型及其组成
print("type: ", type(data))
print("data.keys: ", data.keys())

# 得到对应卷积核的矩阵
weights = data['layers'][0]
# 定义Vgg19的组成
layers = (
'conv1_1', 'relu1_1', 'conv1_2', 'relu1_2', 'pool1',

'conv2_1', 'relu2_1', 'conv2_2', 'relu2_2', 'pool2',

'conv3_1', 'relu3_1', 'conv3_2', 'relu3_2', 'conv3_3',
'relu3_3', 'conv3_4', 'relu3_4', 'pool3',

'conv4_1', 'relu4_1', 'conv4_2', 'relu4_2', 'conv4_3',
'relu4_3', 'conv4_4', 'relu4_4', 'pool4',

'conv5_1', 'relu5_1', 'conv5_2', 'relu5_2', 'conv5_3',
'relu5_3', 'conv5_4', 'relu5_4'
)

# 打印Vgg19不同卷积层所对应的维度
for i, name in enumerate(layers):
kind = name[:4]
if kind == 'conv':
print("％s: ％s" ％ (name, weights[i][0][0][2][0][0].shape))
elif kind == 'relu':
print(name)
elif kind == 'pool':
print(name)

代码输出结果如下：
type: <class 'dict'>
data.keys: dict_keys(['__header__', '__version__', '__globals__', 'layers', 'meta'])

conv1_1: (3, 3, 3, 64)
relu1_1
conv1_2: (3, 3, 64, 64)
relu1_2
pool1
conv2_1: (3, 3, 64, 128)
relu2_1
conv2_2: (3, 3, 128, 128)
relu2_2
pool2
conv3_1: (3, 3, 128, 256)
relu3_1
conv3_2: (3, 3, 256, 256)
relu3_2
conv3_3: (3, 3, 256, 256)
relu3_3
conv3_4: (3, 3, 256, 256)
relu3_4
pool3
conv4_1: (3, 3, 256, 512)
relu4_1
conv4_2: (3, 3, 512, 512)
relu4_2
conv4_3: (3, 3, 512, 512)
relu4_3
conv4_4: (3, 3, 512, 512)
relu4_4
pool4
conv5_1: (3, 3, 512, 512)
relu5_1
conv5_2: (3, 3, 512, 512)
relu5_2
conv5_3: (3, 3, 512, 512)
relu5_3
conv5_4: (3, 3, 512, 512)
relu5_4

那么Vgg19真实的网络结构是怎么样子的呢，如下图所示：

在本文，主要讨论卷积模块，大家通过对比可以发现，我们打印出来的Vgg19结构及其卷积核的构造的确如论文中给出的Vgg19结构一致。

构建Vgg19模型

def _conv_layer(input, weights, bias):
conv = tf.nn.conv2d(input, tf.constant(weights), strides=(1, 1, 1, 1),
padding='SAME')
return tf.nn.bias_add(conv, bias)

def _pool_layer(input):
return tf.nn.max_pool(input, ksize=(1, 2, 2, 1), strides=(1, 2, 2, 1),
padding='SAME')

class VGG19:
layers = (
'conv1_1', 'relu1_1', 'conv1_2', 'relu1_2', 'pool1',

'conv2_1', 'relu2_1', 'conv2_2', 'relu2_2', 'pool2',

'conv3_1', 'relu3_1', 'conv3_2', 'relu3_2', 'conv3_3',
'relu3_3', 'conv3_4', 'relu3_4', 'pool3',

'conv4_1', 'relu4_1', 'conv4_2', 'relu4_2', 'conv4_3',
'relu4_3', 'conv4_4', 'relu4_4', 'pool4',

'conv5_1', 'relu5_1', 'conv5_2', 'relu5_2', 'conv5_3',
'relu5_3', 'conv5_4', 'relu5_4'
)

def __init__(self, data_path):
data = scipy.io.loadmat(data_path)

self.weights = data['layers'][0]

def feed_forward(self, input_image, scope=None):
# 定义net用来保存模型每一步输出的特征图
net = {}
current = input_image

with tf.variable_scope(scope):
for i, name in enumerate(self.layers):
kind = name[:4]
if kind == 'conv':
kernels = self.weights[i][0][0][2][0][0]
bias = self.weights[i][0][0][2][0][1]

kernels = np.transpose(kernels, (1, 0, 2, 3))
bias = bias.reshape(-1)

current = _conv_layer(current, kernels, bias)
elif kind == 'relu':
current = tf.nn.relu(current)
elif kind == 'pool':
current = _pool_layer(current)
# 在每一步都保存当前输出的特征图
net[name] = current

return net

在上面的代码中，我们定义了一个Vgg19的类别专门用来加载Vgg19模型，并且将每一层卷积得到的特征图保存到net中，最后返回这个net，用于代码后续的处理。

测试Vgg19模型

在给出Vgg19的构造模型后，我们下一步就是如何用它，我们的思路如下：

加载本地图片

定义Vgg19模型，传入本地图片

得到返回每一层的特征图

image_path = "data/test.jpg" # 本地的测试图片

image_raw = tf.gfile.GFile(image_path, 'rb').read()
# 一定要tf.float()，否则会报错
image_decoded = tf.to_float(tf.image.decode_jpeg(image_raw))

# 扩展图片的维度，从三维变成四维，符合Vgg19的输入接口
image_expand_dim = tf.expand_dims(image_decoded, 0)

# 定义Vgg19模型
vgg19 = VGG19(data_path)
net = vgg19.feed_forward(image_expand_dim, 'vgg19')
print(net)

代码结果如下所示：
{'conv1_1': <tf.Tensor 'vgg19_1/BiasAdd:0' shape=(1, ?, ?, 64) dtype=float32>,
'relu1_1': <tf.Tensor 'vgg19_1/Relu:0' shape=(1, ?, ?, 64) dtype=float32>,
'conv1_2': <tf.Tensor 'vgg19_1/BiasAdd_1:0' shape=(1, ?, ?, 64) dtype=float32>,
'relu1_2': <tf.Tensor 'vgg19_1/Relu_1:0' shape=(1, ?, ?, 64) dtype=float32>,
'pool1': <tf.Tensor 'vgg19_1/MaxPool:0' shape=(1, ?, ?, 64) dtype=float32>,
'conv2_1': <tf.Tensor 'vgg19_1/BiasAdd_2:0' shape=(1, ?, ?, 128) dtype=float32>,
'relu2_1': <tf.Tensor 'vgg19_1/Relu_2:0' shape=(1, ?, ?, 128) dtype=float32>,
'conv2_2': <tf.Tensor 'vgg19_1/BiasAdd_3:0' shape=(1, ?, ?, 128) dtype=float32>,
'relu2_2': <tf.Tensor 'vgg19_1/Relu_3:0' shape=(1, ?, ?, 128) dtype=float32>,
'pool2': <tf.Tensor 'vgg19_1/MaxPool_1:0' shape=(1, ?, ?, 128) dtype=float32>,
'conv3_1': <tf.Tensor 'vgg19_1/BiasAdd_4:0' shape=(1, ?, ?, 256) dtype=float32>,
'relu3_1': <tf.Tensor 'vgg19_1/Relu_4:0' shape=(1, ?, ?, 256) dtype=float32>,
'conv3_2': <tf.Tensor 'vgg19_1/BiasAdd_5:0' shape=(1, ?, ?, 256) dtype=float32>,
'relu3_2': <tf.Tensor 'vgg19_1/Relu_5:0' shape=(1, ?, ?, 256) dtype=float32>,
'conv3_3': <tf.Tensor 'vgg19_1/BiasAdd_6:0' shape=(1, ?, ?, 256) dtype=float32>,
'relu3_3': <tf.Tensor 'vgg19_1/Relu_6:0' shape=(1, ?, ?, 256) dtype=float32>,
'conv3_4': <tf.Tensor 'vgg19_1/BiasAdd_7:0' shape=(1, ?, ?, 256) dtype=float32>,
'relu3_4': <tf.Tensor 'vgg19_1/Relu_7:0' shape=(1, ?, ?, 256) dtype=float32>,
'pool3': <tf.Tensor 'vgg19_1/MaxPool_2:0' shape=(1, ?, ?, 256) dtype=float32>,
'conv4_1': <tf.Tensor 'vgg19_1/BiasAdd_8:0' shape=(1, ?, ?, 512) dtype=float32>,
'relu4_1': <tf.Tensor 'vgg19_1/Relu_8:0' shape=(1, ?, ?, 512) dtype=float32>,
'conv4_2': <tf.Tensor 'vgg19_1/BiasAdd_9:0' shape=(1, ?, ?, 512) dtype=float32>,
'relu4_2': <tf.Tensor 'vgg19_1/Relu_9:0' shape=(1, ?, ?, 512) dtype=float32>,
'conv4_3': <tf.Tensor 'vgg19_1/BiasAdd_10:0' shape=(1, ?, ?, 512) dtype=float32>,
'relu4_3': <tf.Tensor 'vgg19_1/Relu_10:0' shape=(1, ?, ?, 512) dtype=float32>,
'conv4_4': <tf.Tensor 'vgg19_1/BiasAdd_11:0' shape=(1, ?, ?, 512) dtype=float32>,
'relu4_4': <tf.Tensor 'vgg19_1/Relu_11:0' shape=(1, ?, ?, 512) dtype=float32>,
'pool4': <tf.Tensor 'vgg19_1/MaxPool_3:0' shape=(1, ?, ?, 512) dtype=float32>,
'conv5_1': <tf.Tensor 'vgg19_1/BiasAdd_12:0' shape=(1, ?, ?, 512) dtype=float32>,
'relu5_1': <tf.Tensor 'vgg19_1/Relu_12:0' shape=(1, ?, ?, 512) dtype=float32>,
'conv5_2': <tf.Tensor 'vgg19_1/BiasAdd_13:0' shape=(1, ?, ?, 512) dtype=float32>,
'relu5_2': <tf.Tensor 'vgg19_1/Relu_13:0' shape=(1, ?, ?, 512) dtype=float32>,
'conv5_3': <tf.Tensor 'vgg19_1/BiasAdd_14:0' shape=(1, ?, ?, 512) dtype=float32>,
'relu5_3': <tf.Tensor 'vgg19_1/Relu_14:0' shape=(1, ?, ?, 512) dtype=float32>,
'conv5_4': <tf.Tensor 'vgg19_1/BiasAdd_15:0' shape=(1, ?, ?, 512) dtype=float32>,
'relu5_4': <tf.Tensor 'vgg19_1/Relu_15:0' shape=(1, ?, ?, 512) dtype=float32>}

本文提供的测试代码是完成正确的，已经避免了很多使用Vgg19预训练模型的坑操作，比如：给图片添加维度，转换读取图片的的格式等，为什么这么做的详细原因可参考我的另一篇博客：Tensorflow加载Vgg预训练模型的几个注意事项。

到这里，如何使用tensorflow读取Vgg19模型结束了，若是大家有其他疑惑，可在评论区留言，会定时回答。

来源：https://blog.csdn.net/GodWriter/article/details/88082471

0

投稿

猜你喜欢

python 打印出所有的对象/模块的属性(实例代码)
实例如下：import sysdef print_all(module_): modulelist = dir(module_)
javascript-表格排序(降序/反序)实现介绍(附图)
知识点： Array方法： sort:降序 reverse:反序效果：代码： <style> *{ margin
asp简单可逆运算字符串加密解密函数
前段时间在开发雨哲树网程序的时候，遇到需要转换地址中的参数，需要用到简单可逆运算的加密功能。在网上找了很多都不理想。因为我需要的这个可逆运算
图文详解laravel多对多关联模型
关联模型（多对多）多对多关系（抽象）例：一篇文章可能有多个关键词，一个关键词可能被多个文章使用。关键词表：字段id主键字段keyword关
python调用cmd复制文件代码分享
import osdef load() : filename = os.getcwd() + r'
如何用Python一次性下载抖音上音乐
Python 链接抖音python下载抖音内容的帖子网上有一些，但都比较麻烦，需要通过adb连接安卓手机后，模拟操作。我这么懒，这种事儿玩不
Redis IP地址的绑定的实现
很多时候我们的redis的IP地址一般都是默认的127.0.0.1代表只能接受本机的访问，因此我们其他机器上想要访问这个redis的时候，就
Python2.7编程中SQLite3基本操作方法示例
本文实例讲述了Python2.7中SQLite3基本操作方法。分享给大家供大家参考，具体如下：1、基本操作# -*- coding: utf
快速掌握ASP+Access数据库的18条安全法则
ASP+Access数据库的18条安全法则：1.首先，我们需要过滤所有客户端提交的内容,其中包括?id=N一类,另外还有提交的html代码中
菜鸟课堂：详述如何提高MySQL中数据装载效率
很多时候关心的是优化SELECT 查询，因为它们是最常用的查询，而且确定怎样优化它们并不总是直截了当。相对来说，将数据装入数据库是直截了当的
python 定时器,实现每天凌晨3点执行的方法
如下所示：'''Created on 2018-4-20例子:每天凌晨3点执行func方法''
Tensorflow深度学习使用CNN分类英文文本
前言Github源码地址本文同时也是学习唐宇迪老师深度学习课程的一些理解与记录。文中代码是实现在TensorFlow下使用卷积神经网络（CN
python中单下划线(_)和双下划线（__）的特殊用法
函数使用单下划线_开头使用单下划线(_)开头的函数_func不能被模块外部以: from module import *形式导入。但可以用：
Dreamweaver 网页编辑常用表现的实现方法
在我们制作网页的时候会经常碰到一些需求，如果不知道方法，说不定会困扰我们半天。其实实现它们都很简单，下面我们就一起来看看这些常用的网页编辑方
如何在网页设计中使用个性化字体
一个常常令设计师和前端开发人员都头疼的事情就是字体的使用，设计师常常在设计稿中使用某些很漂亮的字体，以实现比较酷炫的界面。但这样常常给编码人
Windows下MySQL安全权限设置方法
*注意：本文的内容涉及到修改NTFS磁盘权限和设置安全策略，请务必在确认您了解操作可能的后果之后再动手进行任何的修改。文中提及的权限都是在原
Python input()函数案例教程
Python input()函数Python input()函数教程在 Python 中，input() 函数用于获取用于的输入，并给出提示
python如何对链表操作
链表链表(linked list)是由一组被称为结点的数据元素组成的数据结构，每个结点都包含结点本身的信息和指向下一个结点的地址。由于每个结
python命令行参数解析OptionParser类用法实例
本文实例讲述了python命令行参数解析OptionParser类的用法，分享给大家供大家参考。具体代码如下：from optparse i
在Asp程序中取得表单所有内容的方法
在Asp中如何得到所有表单的名称跟对应的值。其实，这个问题很简单，但是可能还是有很多人不知道该怎么做，所以特地写下来，仅供参考。在Asp程序

Python中datetime常用时间处理方法

windows安装python超详细图文教程

python 爬取百度文库并下载(免费文章限定)

如何基于pythonnet调用halcon脚本

Python 装饰器代码解析

python 读取文件并替换字段的实例

Python爬虫小技巧之伪造随机的User-Agent

源码解析python中randint函数的效率缺陷

用python打开摄像头并把图像传回qq邮箱(Pyinstaller打包)

Python如何利用％操作符格式化字符串详解

Win11的defender打不开怎么办？Win11的defender打不开的解决办法

iOS 15 新功能：在“健康”App 中共享和查看健康数据

win7桌面显示比例不正常要怎么设置？

Oracle临时表空间删除和重建实现过程

EXCEL一个图表中如何设置两个纵坐标

excel中如何将文本格式数字转为数字格式

Win7使用Disk Genius检测和修复硬盘坏道教程

如何解决Win7时间同步出错的问题

WPS 文本转表格实现教程

win8应用商店显示未连接到Internet(具体排查方法)

手机版 网络编程 asp之家 www.aspxhome.com