pytorch 中transforms的使用详解
作者:头发没了还会再长 发布时间:2021-11-12 04:51:18
transforms
按住Ctrl查看transforms的源码可以知道,transforms就是一个python文件,里面定义了很多类,每一个类都是一个工具
在结构那里,可以看到有很多的类
ToTensor
Convert a
PIL Image
ornumpy.ndarray
to tensor. This transform does not support torchscript
通过ToTensor来学习transforms如何使用以及为什么使用tensor数据类型
transforms使用
transforms里面每一个类都可以看成是一个模具,我们可以用里面的模具做出一个具体的工具,如何用这个具体的工具来实现具体的功能
比如ToTensor的使用:
from torchvision import transforms
from PIL import Image
img_path = "data/train/ants_image/0013035.jpg"
img = Image.open(img_path)
tensor_trans = transforms.ToTensor()#模具(也就是这个类的对象)
tensor_img = tensor_trans(img)#实现ToTensor的功能,将一个input(PIL Image)转化成tensor
print(tensor_img)
为什么需要tensor数据类型呢?
在使用tensorboard里面常用的add_image时,里面的第二个参数是图片的数据类型,这个数据类型,可以是torch.Tensor, numpy.array, or string/blobname,上一篇博客用的是numpy.array,这里,其实可以直接得到tensor类型后直接用
from torchvision import transforms
from torch.utils.tensorboard import SummaryWriter
from PIL import Image
img_path = "data/train/ants_image/0013035.jpg"
img = Image.open(img_path)
tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(img)
writer = SummaryWriter("logs")
writer.add_image("Tensor_image", tensor_img)
writer.close()
常见的transforms
内置方法__call__()
可以发现基本上transforms里面的每一个类都有一个内置方法__call__(),这个方法和普通的方法的区别其实就是,普通方法一般是类的对象通过.
的方式调用,但是call函数不需要,可以直接用对象加括号的形式调用
一个Person类,内置方法__call__和hello都有一个参数name,然后两个方法都输出name,一个通过person(“”)形式调用,一个通过person.hello(“”)调用
Normalize
Normalize a tensor image with mean and standard deviation.
这个方法进行归一化的时候,传入的参数是有两个列表一个是均值,一个是标准差,每个列表的n表示维度,是根据输入的channel数量决定的,比如我们的图片是rgb那n=3,它能将每个信道的输入进行归一化
根据公式可以知道计算的结果其实就是
代码示例:
from PIL import Image
from torchvision import transforms
img_path = "data/train/ants_image/0013035.jpg"
img = Image.open(img_path)
trans_totensor = transforms.ToTensor()
img_tensor = trans_totensor(img)
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer = SummaryWriter("logs")
writer.add_image("Normalize", img_norm)
writer.close()
输出:
tensor(0.3137)
tensor(-0.3725)
Resize
Resize the input image to the given size
参数:
可以给一个(H,W)这样的参数,改变图片的大小,也可以指定一个int,改变长和宽的比例
代码示例
print(img.size)
trans_resize = transforms.Resize((512, 512))
img_resize = trans_resize(img)# 参数和返回值都是 img PIL
print(img_resize)
输出结果:
变成了正方形
Compose
Composes several transforms together. This transform does not support torchscript.
可以将第一种类型转化为第二种,参数一的类型做输入,参数二的类型做输出,输入一定要对应,不然就会报错
代码示例
trans_totensor = transforms.ToTensor()
trans_resize_2 = transforms.Resize(512)
# PIL -> tensor
trans_compose = transforms.Compose([trans_resize_2, trans_totensor])
img_resize_2 = trans_compose(img)
writer.add_image("Resize", img_resize_2, 1)
来源:https://blog.csdn.net/m0_51474171/article/details/125135895


猜你喜欢
- 简介Blade 是 Laravel 所提供的一个简单且强大的模板引擎。相较于其它知名的 PHP 模板引擎,Blade 并不会限制你必须得在视
- 最近工作转型到数据开发领域,想在本地搭建一个数据开发环境。自己有三年python开发经验,马上想到使用numpy、scipy、sklearn
- 如图:其中Num是自增长列,Operation是分类标签,count是汇总数据 代码如下:select Num=row_numb
- 将Excel与Word集成,无缝生成自动报告毫无疑问,微软的Excel和Word是公司和非公司领域使用最广泛的两款软件。它们实际上是“工作”
- 前言随着人工智能的日益火热,计算机视觉领域发展迅速,尤其在人脸识别或物体检测方向更为广泛,今天就为大家带来最基础的人脸识别基础,从一个个函数
- 1、何为计算属性:大白话讲就是计算出来的结果保存在属性当中,可以想象为缓存。<!DOCTYPE html><html la
- 本文主要包括三大方面,大家仔细学习。1、导航栏中的表单导航栏中的表单不是使用 Bootstrap 表单 章节中所讲到的默认的 class,它
- 废话不多说了,直接给大家分享java操作sql数据库常见的连接问题。1.连接,查询,更新,关闭这几个数据基础操作,所以放到一起,写成一个工具
- 已经11月了,不知道还有没有人看华强买瓜。。。要把华强卖瓜做成字符视频,总共分为三步读取视频把每一帧转为字符画把字符画表现出来 读
- 带你走进数据类型一:整数、浮点数Python中整数和浮点数的定义以及运算和C++都是一样的,我在这里就不需多说了,我就说明一点:Python
- 背景:我司Redis服务器使用的亚马逊服务,本地需要通过跳板机,然后才有权限访问Redis服务。连接原理:使用SSHTunnelForwar
- 本文实例讲述了JavaScript实现隐藏省略文字效果的方法。分享给大家供大家参考,具体如下:<html> <
- 这篇文章主要介绍了Python序列化与反序列化pickle用法实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价
- 新闻系统、blog系统等都可能用到将动态页面生成静态页面的技巧来提高页面的访问速度,从而减轻服务器的压力,本文为大家搜集整理了ASP编程中常
- 连续看到几个和 Oracle 优化器隐含参数 _sort_elimination_cost_ratio 相关的优化案例(Refer Refe
- Vue开发环境跨域访问其他服务器或者本机其他端口,需要配置项目中config/index.js文件,修改如下module.exports =
- Pygal可用来生成可缩放的矢量图形文件,对于需要在尺寸不同的屏幕上显示的图表,这很有用,可以自动缩放,自适应观看者的屏幕1、Pygal模块
- 首先要介绍的是 Python Imaging Library,使用方法如下:from PIL import Imagefrom PIL.Ex
- 一、读取Excel中的数据安装xlrd 只能读取Excel内容pip install xlrd==1.2.0xlrd库的open_workb
- 经常用FLASH嵌入到网页里面,那咋能躲过W3C那个家伙呢?看下面!<object type="applicati