Python详细讲解图像处理的而两种库OpenCV和Pillow
作者:明之季 发布时间:2022-08-14 05:23:19
一、简介
实现计算机视觉任务的过程中,不可避免地需要对图像进行读写操作以及图像预处理操作,下面介绍两个常用的Python图像处理库:OpenCV和Pillow。
OpenCV全称是由英特尔公司资助的开源计算机视觉库。
它由一系列C函数和少量C++类所组成,实现图像处理和计算机视觉方面的很多通用算法,例如特征检测与跟踪、运动分析、目标分割与识别以及3D重建等。
OpenCV作为基于C/C++语言编写的跨平台开源软件,可以运行在Linux、Windows、Android和MacOS操作系统上,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。
1.1 图像处理-OpenCV
OpenCV是模块结构的,有以下主要模块。
【core】–核心功能模块,包含内容有:OpenCV基本数据结构、动态数据结构、绘图函数、数组操作相关函数、辅助功能与系统函数和宏、与OpenGL的互操作。
【imgproc】–图像处理模块,包含内容有:线性和非线性的图像滤波、图像的几何变换、图像转换、直方图相关、结构分析和形状描述、运动分析和对象跟踪、特征检测、目标检测等内容。
【features2D】–2D功能模块,包含以下内容:特征检测和描述、特征检测器、描述符提取器等内容。
【highGUI】–高层GUI图形用户界面,包含:媒体的I/O输入输出、视频捕捉、图像和视频的编码解码、图形交互界面的接口等内容。
1.2 图像处理- PIL和Pillow
作为Python2的第三方图像处理库是Pillow的前身。随着Python3的更新,PIL移植到Python3更名为Pillow。与OpenCV一样,Pillow也是模块结构,主要包括以下结构。
【Image】–图像功能模块,包含内容有:读写图像、图像混合、图像放缩、图像裁切、图像旋转。
【ImageFilter】–图像滤波功能模块,包含内容有:各类图像滤波核。
【ImageEnhance】–图像增强功能模块,包含内容有:色彩增强、亮度增强、对比度增强、清晰度增强。
【ImageDraw】–图像绘画功能模块,包含内容有:绘制几何形状、绘制文字。
二、常用图像类型
2.1 二值图像
二值图像只有黑白两种颜色,如图所示。图像中的每个像素只能是黑或白,没有中间的过渡。因此二值图像的像素值只能为0或1,0表示黑色,1表示白色。
2.2 灰度图像
灰度图像只表达图像的亮度信息没有颜色信息,如(a)图所示。
灰度图像的每个像素点上只包含一个量化的灰度级(即灰度值)。
像素点的亮度水平如(b)图所示,通常使用1字节(8位二进制数)来存储灰度值,因此用正整数表示灰度值的范围是0~255。
2.3 RGB图像
RGB(Red、Green、Blue)图像如(a)图,可以看成是由多个RGB像素点组成。
每个彩色像素点分别由R、G、B三种颜色空间组成如(b)图,本质是3维数组。
在RGB颜色空间中,任意色光都可以用R、G、B三色不同分量的相加混合而成。
2.4 常用颜色空间简介
实际应用中常用的颜色空间很多,通常使用3个独立的变量对颜色进行描述,例如RGB、HSV、YUV等。
一个图像的不同的颜色空间是可以转换的,cv2.cvtColor可以实现颜色的转换。
• cv2.COLOR_BGR2GRAY
• cv2.COLOR_BGR2RGB
• cv2.COLOR_BGR2HSV
• cv2.COLOR_BGR2YUV
• cv2.COLOR_BGR2HLS
三、OpenCV图像读写与显示
通过OpenCV库对数字图像进行处理时,涉及到的基础操作包括读取、显示、写出图像文件。
在OpenCV库中,图像数据是以NumPy数组的形式存在。
3.1 读入图像
在python的OpenCV中,通过cv2.imread()函数读入图像数据,其基本使用格式如下。cv2.imread(filename, flags)
在默认情况下通过cv2.imread()
函数读入图像数据为3通道的彩 * ,像素值为8位的非负整数,图像数据以NumPy中ndarray的方式存在。
如果定义了cv2.imread()读入模式为cv2.IMREAD_GRAYSCALE那么读入图像为单通道的灰度图。
需要注意的是,通过OpenCV读入彩 * 像数据的颜色通道顺序为BGR(蓝、绿、红)并非常用的RGB(红、绿、蓝)顺序。
在OpenCV中,读取到的图像数组维度可以表示为:
(高,宽,通道数)即(height, width, channel)。OpenCV图像坐标与常规的数学坐标有区别,左上角位置为坐标原点。
• 在Windows【画图】工具中,帽檐红点坐标为(248, 102),但在OpenCV中像素位置应为(102, 248)。
• X轴 == 列位置 == 图像宽
• Y轴 == 行位置 == 图像高
3.2 显示图像
在OpenCV中,通过cv2.imshow()函数显示图像数据,其基本使用格式如下。
cv2.imshow(winname, img)
在OpenCV中,通过cv2.waitKey()函数设置图片窗口显示时长,其基本使用格式如下。
cv2.waitKey([,delay])
waitKey作用是图像显示时等待用户按键触发,如果用户按键触发或时间超过了设置的时间则退出图片展示。
cv2.waitKey(0)的作用是令程序一直停留在显示图像的状态。如果没有增加cv2.waitKey(0),那么程序运行完毕后,图像显示窗口会自动关闭,即一闪而逝。
3.3 写出图像
在OpenCV中,通过cv2.write()函数保存图像数据,其基本使用格式如下。
cv2.imwrite(filename, img)
import cv2
import matplotlib.pyplot as plt
import numpy
# 读写图像
img = cv2.imread(filename='lena.jpg', flags=cv2.IMREAD_GRAYSCALE)
img.shape
# (377, 373)
img.dtype
# dtype('uint8')
# 图像展示
cv2.imshow(winname='lena', mat=img)
cv2.waitKey(0)
# 图像保存
cv2.imwrite(filename='test_img.jpg', img=img)
四、图像几何变换
4.1 图像平移
图像平移变换将一幅图像中的所有像素点都按照给定的偏移量在水平方向(沿x轴方向)或垂直方向(沿y轴方向)移动,是图像几何变换中较为简单的一种变换。
图像平移原理示意图如下图所示。
假设对点P_0 (x_0,y_0 )进行平移后得到点P(x,y),其中x方向的平移量为∆x,y方向的平移量为∆y ,则点P(x,y)的坐标如下式。
利用齐次坐标表示图像平移变换前后点P_0 (x_0,y_0 )到点P(x,y)的关系如下式所示。
实现步骤:
1. 定义平移变换矩阵: 例如:np.float32([[1,0,50], [0,1,100]])
• [1,0,50]表示在x轴方向移动50个单位
• [0,1,100]表示在y轴方向移动100个单位
2. 执行转换:cv2.warpAffine (src, M, dsize)
通过OpenCV实现图像平移操作,结果如下图所示,(a)为原图和(b)为平移后图像。
import cv2
import matplotlib.pyplot as plt
import numpy as np
img = cv2.imread('lena.jpg')
height, width, channel = img.shape
# 图像平移
# 1、定义平移变换矩阵
M = np.float32([[1,0,50], [0,1,100]])
# 2、执行平移变换
img_tran = cv2.warpAffine(src=img, M=M, dsize=(height, width))
cv2.imshow('image translation', img_tran)
cv2.waitKey(0)
4.2 图像旋转
图像旋转(Rotation)是指图像以某一点为中心旋转一定的角度形成一幅新的图像的过程。通常是以图像的中心为圆心旋转,将图像中的所有像素点都旋转一个相同的角度。
图像旋转原理如图所示,将点(x_0,y_0)绕原点o顺时针旋转至点(x_1,y_1 ),其中a为旋转角,r为点(x_0,y_0 )到原点的距离, b为原点o到点(x_0,y_0 )的线段与x轴之间的夹角。在旋转过程中, r保持不变。
设旋转前,x_0、y_0的坐标分别为x_0=r cosb、y_0=r sinb,当旋转a角度后,坐标x_1、y_1的值分别如下式所示。
上式的矩阵的形式如下式所示。
实现步骤:
1. 计算旋转变换矩阵: cv2.getRotationMatrix2D (center, angle, scale)
2. 执行转换:cv2.warpAffine (src, M, dsize)
通过OpenCV实现图像旋转,得到的效果如图所示。
# 图像旋转
# 1、定义旋转变换矩阵
M = cv2.getRotationMatrix2D(center=(height*0.5, width*0.5), # 旋转的中心位置坐标
angle=45, # 旋转的角度
scale=0.8 # 缩放比例
)
# 2、执行旋转变换
img_rotation = cv2.warpAffine(img, M, dsize=(height,width))
cv2.imshow('image_rotation', img_rotation)
cv2.waitKey(0)
4.3 图像缩放
图像比例缩放是指将给定的图像在x轴方向按比例缩放f_x倍,在y轴方向按比例缩放f_y倍,从而获得一幅新的图像。如果f_x=f_y,即x轴方向和y轴方向缩放的比率相同,此比例缩放为图像的全比例缩放。如果f_x≠f_y,那么图像的比例缩放会改变原始图像的像素间的相对位置,产生几何畸变。
在OpenCV中cv2.resize(src, dsize, fx, fy, interpolation)可以实现图像缩放。
具体实现图像缩放有多种插值方法,OpenCV的resize函数提供了如下5种常见方法。
• 最邻近插值:cv2.INTER_NEAREST
• 双线性插值:cv2.INTER_LINEAR
• 区域插值:cv2.INTER_AREA
• 三次样条插值:cv2.INTER_CUBIC
• Lanczos插值:cv2.INTER_LANCZOS4
# 图像缩放
# 1、直接指定缩放大小
img_res = cv2.resize(img, dsize=(244,244))
img_res.shape
# (244, 244, 3)
cv2.imshow('image_resize', img_res)
cv2.waitKey(0)
# 2、最近邻插值
img_near = cv2.resize(img, dsize=None, fx=1.5, fy=1,
interpolation=cv2.INTER_NEAREST)
cv2.imshow('img_near', img_near)
cv2.waitKey(0)
来源:https://blog.csdn.net/u011125673/article/details/125240315
猜你喜欢
- 本文实例为大家分享了python使用Matplotlib绘制分段函数的具体代码,供大家参考,具体内容如下环境Python3Mac OS代码#
- ASP中查询数据库记录写入XML文件示例,把下面代码保存为Asp_XML.asp运行即可: &
- 一个常常令设计师和前端开发人员都头疼的事情就是字体的使用,设计师常常在设计稿中使用某些很漂亮的字体,以实现比较酷炫的界面。但这样常常给编码人
- Python中的布尔类型Python中的布尔类型(bool)只有两个取值,分别是True和False。bool类型通常用于逻辑判断和条件控制
- 首先来看,ASP读取ACCESS数据库。代码如下:<% @language="VBScript"&nbs
- 已经11月了,不知道还有没有人看华强买瓜。。。要把华强卖瓜做成字符视频,总共分为三步读取视频把每一帧转为字符画把字符画表现出来 读
- Updates(2019.8.14 19:53)吃饭前用这个方法实战了一下,吃完回来一看好像不太行:跑完一组参数之后,到跑下一组参数时好像没
- 目的是想通过给定一个ID,取出所有的子ID,包括子ID的子ID。一开始写成FUNCTION,因为FUNCTION调用方便,但是报错:ERRO
- 本文使用css结合js技术给网页背景background 插入flash播放器播放音乐,想法很大胆,呵呵!刚刚乱试一翻搞出这个,有意思吗?请
- MySQL Group By用法我们现在回到函数上。记得我们用 SUM 这个指令来算出所有的 Sales (营业额)吧!如果我们的需求变成是
- 数据库连接字符串的常见问题和解决方法:基本知识1:SQL Server数据库的身份验证方式,分windows验证,SQL Server验证两
- 简单asp加载access数据库,并生成XML,然后再将XML数据加载进LIST组件范例学习。演示:http://www.taoshaw.c
- var date = new Date('2016-11-11 11:11:11');document.write(date
- 如果视图定义包括条件(譬如 WHERE 子句)并且其意图是确保任何引用该视图的 INSERT 或 UPDATE 语句都应用 WHERE 子句
- 我发现有的网站利用了SQL SERVER提供的通过EXCHANGE或OUTLOOK收发邮件的扩展存储过程来完成收发和自动处理邮件(这句话太长
- ExecuteReader(),ExecuteNonQuery(),ExecuteScalar(),ExecuteXmlReader()之间
- 让Python提速超过40倍的神器:Cython人工智能最火的语言,自然是被誉为迄今为止最容易使用的代码之一的Python。Python代码
- 往往我们在建立一个较为大型的网站的时候会有很多的副页面框架模式甚至一些小的细节元素都是相同的,但是令人困扰的是在更新它们时却要费些周折,要一
- 监控Linux服务器嘛,脚本逻辑基本上是用os.popen模块,然后把获取到的结果通过split切分成一个list,再拿目标list值和我阈
- 元素的CSS样式,除了包括内联的(即通过style属性加上的)样式定义外,还有页面嵌入的css和外部引入的css两种方式。但在JS中通过el