python计算机视觉opencv图像金字塔轮廓及模板匹配
作者:Swayzzu 发布时间:2021-10-10 09:15:33
1.图像金字塔
①高斯金字塔
向下采样,数据会越来越少,减少的方式是:将偶数行和列删除
向上采样,数据会越来越多,将图像在每个方向上扩大为原来的两倍,新增的行和列用0来填充。使用先前同样的内核与放大后的图像卷积,获得近似值。
上采样之后,图片会变大。
下采样后,图片会变小。
②拉普拉斯金字塔
对于原始图像,先执行下采样,再执行上采样,并用原始图像减去得到的采样结果。
以上的计算方式为1层,第二层的计算,把第一层得到的结果作为原始图像进行计算。
2.图像轮廓
cv.findContours(img,mode,method)
最常用的mode:
RETR_TREE,检测所有的轮廓,并重构嵌套轮廓的整个层次
最常用的method:
CHAIN_APPROX_NONE:以Freeman链码的方式输出轮廓,所有其他方法输出多边形(顶点的序列)
CHAIN_APPROX_SIMPLE:压缩水平的、垂直的和斜的部分,也就是函数只保留他们的终点部分。
①寻找轮廓
函数返回的第一个参数contours就是我们所需要的轮廓信息。它是一个列表的形式。每一个元素都是数组形式。一个图像中可能有多个轮廓,并且会有外轮廓以及内轮廓,均可通过返回的contours调用。
②轮廓特征
通过调用不同的函数可以求得轮廓的面积以及周长等。
③轮廓绘制
第一个参数就是要画上去的图,第二个是轮廓信息,第三个是轮廓的索引,第四个是使用的颜色通道,第五个是线条的宽度。
也可以画出轮廓的边界矩形或者外接圆:
3.模板匹配
模板匹配 模板在原图像上,从原点开始滑动,计算模板与图像被模板覆盖的地方的差别程度,这个差别程度在opencv里有6种,然后将每次计算的结果放在一个矩阵里,作为结果输出。假如原图像是AB,模板是ab大小,则输出结果是(A-a+1) * (B-b+1)
TM_SQDIFF:平方差异,越小越相关
TM_CCORR:相关性,越大越相关
TM_CCOEFF:相关系数,越大越相关
TM_SQDIFF_NORMED:归一化平方不同,越接近0越相关
TM_CCORR_NORMED:归一化相关性,越接近1越相关
TM_CCOEFF_NORMED:归一化相关系数,越接近1越相关
建议:尽量使用归一化的方法
①模板匹配
读取图片以及需要匹配的模板,并将其进行灰度化处理:
下面得到的h,w就是模板的长和宽
通过matchTemplate的方法进行匹配:
②匹配框线绘制
对于匹配所得的返回值,通过minMaxLoc得到最小值和最大值,以及各自对应的坐标。根据选择的方法不同,所需要的目标值不同。比如TM_SQDIFF_NORMED:归一化平方不同,就是越接近0越相关,即越小越好。
得到了最佳的值以及坐标,就可以画出来矩形框。
在rectangle方法中,参数依次是:要画框的图片,框的左上角坐标,框的右下角坐标,框的亮度,框的线条粗细。结果如下:
③多对象匹配
模板匹配也可匹配多个对象,若图片中有多个和模板匹配的内容,cv.matchTemplate返回的内容中会有多个分数高的结果,设定阈值后,把分数高的结果的坐标,按同样的方式处理,把方框全部画出来即可。
4.直方图统计
①直方图绘制
可直接通过plt.hist方法,将图像矩阵扁平化之后,绘制不同的像素出现的频率直方图。
②直方图统计
cv2.calcHist(images,channels,mask,histSize,ranges)
参数中:
imges
:传入的图像
channels
:颜色通道,如果是灰度图就是[0],如果是彩色可以是[0],[1],[2]。分别对应着BGR。
mask
:掩膜,如果需要对图像进行掩膜处理可以传入此参数。
histSize
:就是bin的数目,可以直接填入[256]
ranges
:像素值范围,常为:[0,256]
注意:传入参数时,都需要用中括号括起来。
calcHist返回值是对应颜色的统计值。当i是0的时候,就是B,1对应G,2对应R
③直方图的mask操作
创建mask,此处使用图片的长宽作为mask的长宽,并把需要展示的地方置为1,其他地方置为0即可。
通过bitwise_and,即“与”操作,即可实现掩膜操作。
把Mask应用到图片中,并画出直方图:
④直方图均衡化
通过cv.equalizeHist方法,可以对直方图进行均衡化
直方图前后对比如下:
对应的图像发生的变化如下:
以上的方式是对全局直接进行均衡化。可以看出图中雕像的脸变得模糊。通过自适应直方图均衡化可解决此问题,自适应均衡化是通过将图片分成不同的小块,对每一小块进行各自的均衡化。
5.傅里叶变换
低通滤波是保留低频,图像会变得模糊。高通滤波是保留高频,图像的细节会增强。
在opencv中主要是cv2.dft()和cv2.idft(),输入图像需要先转换成np.float32的格式 得到的结果中,频率为0的部分会在左上角,通常要转换到中心位置,可以通过shift变换来实现 cv2.dft()得到的结果是双通道的(实部、虚部),通常还需要转换成图像格式才能展示(0,255)
上图是将图片转换到频域之后,转换成灰度图并且展示的形式。
在低通滤波中,当转换到频域并把低频的放到中间后,只需要设置一个掩膜,即可把图像高频滤除掉。然后在通过逆转换,还原图像即可。具体代码如下:
在高通滤波器中,只需要把上面的代码中的掩膜转换一下,把0换成1,1换成0即可实现高通滤波。最终的图片展示如下:
可以看出,图片只保留了高频,也就是变化剧烈的部分,也就是图像中的边缘。
来源:https://blog.csdn.net/Swayzzu/article/details/120872759


猜你喜欢
- 一、List移除某个值remove以Python 3.x版本为主remove:列表值移除方法1、函数编号函数名说明1remove移除列表中匹
- python检查值是否已经存在于字典列表中a = [ {'main_color': 're
- 在开发T-SQL时,经常会需要对字符串进行各种各样的操作,下面介绍常用的字符串函数。一、编码转换1、获取字符的ASCII码:asciiASC
- hasOwnPropertyhasOwnProperty是javascript中用于检测对象是否包含某个属性的方法,返回一个布尔值。var
- 前言:多态的实现必须满足两个前提条件1.继承:多态一定是发生在子类和父类之间2.重写:多态子类重写了父类的方法记住这两点再结合代码示例有助于
- 免责声明:本教程所有资源均来源于网络;仅用于学习交流,请勿用于任何商业行为;如需要,请使用正版授权;侵权联删。此篇教程通过无限重置试用期持续
- TypeScriptTypeScript是一种由微软开发的自由和开源的编程语言。它是JavaScript的一个超集,而且本质上向这个语言添加
- 前言:在 Go 语言中,同时声明多个常量、变量,或者导入多个包时,可采用分组的方式进行声明。例如下面的代码:import "fmt
- 前言设置mysql最大连接数的方法:首先打开mysql的控制台;然后输入语句【set GLOBAL max_connections=1000
- 一、Tornado简介Tornado 是 FriendFeed 的 Web 服务器及其常用工具的开源版本。Tornado 和现在的主流 We
- 如果直接使用base64_encode和base64_decode方法的话,生成的字符串可能不适用URL地址。下面的方法可以解决该问题:UR
- 跨浏览器方法function getStyle(elem, cssprop, cssprop2){ if(elem.currentStyle
- 1. 引言在日常工作中,大家都需要进行字典的相关操作,对于某些初学者,经常会写一堆繁琐的代码来实现某项简单的功能。本篇文章重点介绍一些在Py
- 下载https://downloads.mysql.com/archives/community/下载上面的,下面的不行解压我的解压路径 E
- 如下所示:var table_name = table.render({});page_size = table_name.config.l
- python中的列表是可以直接进行逆序排列的,但是在 python中,逆序排列也是有一定规则的,一般是按升序排序,也就是从左到右。比如 li
- 本文实例讲述了Python面向对象程序设计。分享给大家供大家参考,具体如下:示例1:#encoding:utf-8''
- 1. 需求:用户答题练习,当用户获取所有题目的同时,需要判断用户是否已经做过该题目,如果做过,需要render的时候添加一个“回顾”按钮。2
- 项目输出项目先决条件要使用python构建井字游戏,我们需要tkinter模块和python的基本概念Tkinter模块是用于渲染图形的标准
- 前言:我目前使用的服务器为centos6.x 系统自带的python的版本为2.6.x,但是目前无论是学习还是使用python,python