Python OpenCV 针对图像细节的不同操作技巧
作者:梦想橡皮擦 发布时间:2021-08-13 01:29:22
本系列专栏写作将采用首创的问答式写作形式,快速让你学习到 OpenCV 的初级、中级、高级知识。
6. 在 Python OpenCV 针对图像细节的不同操作
本篇博客的目标将为你解释一幅图像的拆解,包括图像像素的说明,图像属性信息的获取与修改,
图像目标区域 ROI 相关内容,以及图像通道的知识(包括拆分通道和合并通道)
这些内容在知识结构上与 numpy
库十分紧密,如果从学习的角度出发,建议你储备一下 numpy
相关知识。
读取修改图像的像素值
在之前的博客中,我们已经学到了如何读取一幅图像,使用 cv2.imread
函数即可,并且掌握了该函数的两个关键参数。
读取图片之后,我们可以直接使用操作数组的方式获取图像任意位置的颜色,一般这个颜色的默认顺序是 BGR。
测试代码如下:
import cv2
import matplotlib.pyplot as plt
src = cv2.imread("./6_test.jpg")
# 获取 100 x 100 位置的像素值
print(src[100, 100])
cv2.imshow("src", src)
cv2.waitKey()
这里首先获取 100 x 100 位置的像素值。src[100,100]
会获取到三个值,分别对应的 BGR 通道的值。我们在图片上标记一个像素点,rows = 250,cols=470 ,接下来修改上述代码,看获取到的 BGR 值。
import cv2
import matplotlib.pyplot as plt
src = cv2.imread("./6_test.jpg")
# 注意获取像素值的格式为 [cols,rows]
print(src[250, 470])
cv2.imshow("src", src)
cv2.waitKey()
上文特别注意的就是,获取像素值的格式为 [cols,rows]
,列在前,行在后。
以上获取到的是 BGR 值,也可以只获取单个通道的值,对应的代码是 [cols,rows,channel]
,对应到代码部分,如下所示:
# 获取蓝色通道值
print(src[250, 470, 0])
蓝色通道对应 0,绿色通道为 1,红色通道为 2,超出以上三个值,就会出现如下错误:
IndexError: index 3 is out of bounds for axis 2 with size 3
当前如果你直接读取了灰度图,例如下述代码,三个通道的值是相同的。
import cv2
import matplotlib.pyplot as plt
src = cv2.imread("./6_test.jpg", 0)
# 注意获取像素值的格式为 [cols,rows]
print(src[250, 470])
cv2.imshow("src", src)
cv2.waitKey()
这个地方还有一个编码上存在的潜在问题,如果读取的是四通道图片,即图片有透明度,那数组的索引值可以读取到 3,也就是下述代码是正确的。
import cv2
import matplotlib.pyplot as plt
src = cv2.imread("./test.jpg", -1)
# 注意获取像素值的格式为 [cols,rows]
print(src[250, 470, 3])
cv2.imshow("src", src)
cv2.waitKey()
src[250, 470, 3]
成功读取到了透明通道的值。
我们可以针对特定的像素点进行值的修改,例如下述代码
import cv2
import matplotlib.pyplot as plt
src = cv2.imread("./6_test.jpg")
# 注意获取像素值的格式为 [cols,rows]
src[250, 470] = [255, 255, 255]
cv2.imshow("src", src)
cv2.waitKey()
注意下图的红色箭头指向的位置,出现一个白色亮点,使用该办法,可以制造出一个【椒盐图片】。
这个地方需要注意的一个潜在 BUG,读取图片的通道数,决定了你复制时数组元素个数,例如下述代码将会报错。
import cv2
import matplotlib.pyplot as plt
src = cv2.imread("./6_test.jpg")
# 注意获取像素值的格式为 [cols,rows]
src[250, 470] = [255, 255, 255, 255]
cv2.imshow("src", src)
cv2.waitKey()
错误信息都是类似的,提示数组维度不同。
ValueError: cannot copy sequence with size 4 to array axis with dimension 3
最后一点使用以上方式操作图像的像素点,非常耗时,因为一张图片的像素点数据是非常大的,一般情况下能用 numpy 集成好的方法,就不要用这种最笨拙的方式。
使用 numpy 获取通道值,注意该方式获取的是标量,如果你想获得所有 BGR 的值,你需要使用 array.item()
依次获取。
import cv2
import numpy as np
src = cv2.imread("./6_test.jpg")
print(src[100, 100])
b = src.item(100, 100, 0)
g = src.item(100, 100, 1)
r = src.item(100, 100, 2)
print(b, g, r)
cv2.imshow("src", src)
cv2.waitKey()
如果希望设置该值,直接使用 itemset
函数即可。
src.itemset((100, 100, 0), 200)
print(src[100, 100])
可以任意寻找一张图片进行对应的测试,运行效果如下:
[ 31 68 118]
31 68 118
[200 68 118]
OpenCV 中图像属性常见问题解析
对于一幅图像,除了像素矩阵以外,还有一个非常重要的内容,是图像的属性,这些包括行、列、通道、数据类型,像素数量、图像形状等内容。
例如,我们经常使用 img.shape
去获取图像的形状,尤其注意的是,返回的内容是行数(rows),列数(cols),以及通道数(channels),并且返回值类型是一个元组。
如果你读取图像的时候,设置紧读取灰度图,那只会返回行数和列数,相应的通过这个值很容易能判断出你加载的图像类型。
例如下述代码,通过不同的方式读取同一张图片,输出图像的不同形状。
import cv2
import numpy as np
# 选择一个 jpg 图片,可以读取到不同的通道
src1 = cv2.imread("./test.jpg", -1)
src2 = cv2.imread("./test.jpg", 0)
src3 = cv2.imread("./test.jpg")
# 四通道,包含透明通道
print(src1.shape)
# 灰度图
print(src2.shape)
# 三通道
print(src3.shape)
输出结果可以快速的读取出图像是彩 * 像还是灰度图像。
(397, 595, 4)
(397, 595)
(397, 595, 3)
使用 img.size
可以快速返回图像中像素的合计数目,测试代码如下:
# 选择一个 jpg 图片,可以读取到不同的通道
src1 = cv2.imread("./test.jpg", -1)
src2 = cv2.imread("./test.jpg", 0)
src3 = cv2.imread("./test.jpg")
# 四通道,包含透明通道
print(src1.shape)
print(src1.size)
# 灰度图
print(src2.shape)
print(src2.size)
# 三通道
print(src3.shape)
print(src3.size)
我们依旧三种不同的读取方式,读取到的像素数分别如下:
(397, 595, 4)
944860
(397, 595)
236215
(397, 595, 3)
708645
注意,灰度图像和彩 * 像的像素数不同,它们之前存在如下关系。
灰度图像的像素数 = 行数 x 列数 = 397 x 595 = 236215
彩 * 像的像素数 = 行数 x 列数 x 通道数 = 944860 (四通道)/ 708645(三通道)
使用 img.dtype
属性可以获取到图像的类型,具体如下:
print(src1.dtype)
这里读取到的值,都是相同的 uint8
表示 8 位图像,这里可以记住只要是 uint8
格式,那对应的 BGR 值的范围就是在 [0,255]
之间。
在操作上述属性值的时候,会出现如下 BUG,该 BUG 的通用解决方案是排查图片是否正常读取,需要特别注意下:
AttributeError: 'NoneType' object has no attribute 'shape'
print(src1.dtype)
这里读取到的值,都是相同的 uint8
表示 8 位图像,这里可以记住只要是 uint8
格式,那对应的 BGR 值的范围就是在 [0,255]
之间。
在操作上述属性值的时候,会出现如下 BUG,该 BUG 的通用解决方案是排查图片是否正常读取,需要特别注意下:
AttributeError: 'NoneType' object has no attribute 'shape'
来源:https://blog.csdn.net/hihell/article/details/119719818
猜你喜欢
- 做项目的时候,用户认证几乎是必不可少的,如果我们的项目由于一些原因不得不使用 users 之外的用户表进行认证,那么就需要多做一点工作来完成
- 前言图片的本质就是大量像素在二维平面上的组合,每个像素点用数字化方式记录颜色。可以直观的想象,一张图片就是一个巨大的电子栅格,每个格子内有一
- 很多朋友说JavaScript的decodeURI函数也可以实现,但有bug所有呢,下面看下下面的函数,经过测试使用暂时没什么问题,我在之前
- 以下虚线框内为mk.asp文件的具体代码:<%filename="test.htm"if request
- 工作闲余,除抱有浓厚兴趣领域,我很不喜欢看些晦涩难懂的文字,于是想像茶余饭后的闲聊,随谈点话题。一次和一朋友吃饭聊天,随便聊到了他最近做的一
- 在上一篇博客中,我们学习了python遗传算法包geatpy。并用它展示了一个不带约束的单目标规划问题,对往期内容感兴趣的同学可以参考👇:链
- 比如说在1-3000之内生成随机永不重复数,点击运行代码的时候请注意,此代码比较占用资源,如果硬件配置比较菜请把count改小。俺的电脑配置
- 由于工作对人的眼球和精神都会带来一定的疲劳,所以在界面设计中,希望用户能够准确的关注重要的信息,而不因为用户的长期使用而流失信息。最近在看《
- 本文实例为大家分享了bootstrapTable+ajax加载数据,和refresh更新数据两部分,供大家参考,具体内容如下1.html&l
- Player.playState0 Undefined Windows Media Player is in an undefined st
- 我们工作中经常需要将数据转化成柱状图,饼图等,以方便直观的分析数据, 这里给大家介绍一个ASP中制作饼图、柱状图的组件:csDra
- 可以查看mysql文件目录my.ini文件,可以找到类似于 datadir="D:/beeagle/Program Files/M
- 1. composer 安装 PDF组件composer require setasign/fpdicomposer require set
- 如何验证日期输入是否正确?我们可以利用ASP 3.0里的On Error Resume Next来完成这项功能:<%Option&nb
- golang sort package: https://studygolang.com/articles/3360sort 操作的对象通常
- 404页面对于站长来说应该并不陌生,其作用无碍乎二点:提高用户体验和增强对搜索引擎的友好性。去年在跟几个朋友在聊天的时候,跟我说404页面不
- 如果出现 automation服务器不能创建对象 解决方法:1、如果是Scripting.FileSystemObje
- 开源监控系统 Prometheus 集成了跟踪多种类型的时间序列数据,但如果没有集成你想要的数据,那么很容易构建一个。一个经常使用的例子使用
- 对于个人用户来说,除了病毒和木马,网页中的隐形代码也开始严重地威胁着我们的安全,但大多数人却缺乏自我保护意识,对隐形代码的危害认识不够,甚至
- 安装pip install faker使用简单使用本库可生成姓名、地址、电话、邮箱、公司等等一系列数据。首先导入库,实例化:from fak