详解Python OpenCV图像分割算法的实现
作者:double@AI 发布时间:2022-11-28 13:15:44
前言
图像分割是指根据灰度、色彩、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域。
最简单的图像分割就是将物体从背景中分割出来
1.图像二值化
cv2.threshold是opencv-python中的图像二值化方法,可以实现简单的分割功能。
retval, dst = cv2.threshold(src, thresh, maxval, thresholdType[, dst])
•src:原图像,要求必须是灰度图像
•dst:结果图像
•thresh:阈值
•maxVal:结果图中像素最大值
•thresholdType:二值化类型
然而,threshold用法,有两个问题:
问题一:
•根据全图统一的阈值对像素进行判断,并非在所有情况下效果都好
•例如,如果图像在不同区域具有不同的光照条件
问题二:
•阈值需要手动设定,不同的图片合适的阈值可能不同,更换图片可能就需要调整代码
针对于全图统一阈值的问题,可以使用自适应阈值分割法
•自适应阈值分割算法基于像素周围的局部区域确定像素的阈值
•同一图像的不同区域具有不同的阈值
•为光照变化的图像提供更好的分割效果
2.自适应阈值分割算法
dst= cv2.adaptiveThreshold(src, maxValue, adaptiveMethod,thresholdType, blockSize, C, dst=None)
参数解释如下:
•src:原图像,它必须是灰度图像
•maxValue:结果图中像素的最大值,一般设置为255
•adaptiveMethod:阈值的计算方法,包括以下两种计算方式:
•thresholdType:二值化方式,例如cv2.THRESH_BINARY、cv2.THRESH_TRUNC、
cv2.THRESH_TOZERO等
•blockSize:局部区域的大小
•C:阈值计算中减去的常数
缺点:blockSize要手动指定,但物体的大小有差异
3.Otsu阈值分割算法
自动根据图像内容计算阈值:
Otsu阈值分割算法
大津法
直方图技术
retval, dst = cv2.threshold(src, thresh, maxval, thresholdType[, dst])
参数解释如下:
src:原图像,要求必须是灰度图像
dst:结果图像
thresh:阈值(无作用)
maxVal:像素灰度最大值
thresholdType:阈值类型,在原有参数值基础上多传递一个参数值,即cv2.THRESH_OTSU
比如cv2.THRESH_BINARY+cv2.THRESH_OTSU
利用固定阈值算法进行分割,适用的图片较为局限
同一个阈值,在一些图像上表现好,在其他图片上效果不佳
如:
利用Otsu阈值算法进行分割,适用的图片范围较广
对每张图片,Otsu阈值算法自动找到针对性的阈值
如:
4.基于轮廓的字符分离
分割步骤
1. 检测出图像中字符的轮廓
2. 得到每一条轮廓的包围框,根据包围框坐标提取ROI
4.1轮廓检测
contours, hierarchy = cv2.findContours(image, mode, method)
参数解释如下:
contours:返回的轮廓列表,每条轮廓包含构成这条轮廓上的一系列点的坐标
hierarchy:轮廓之间的层级关系
image:原始图像,需要是二值图
mode:轮廓的检索模式
method:轮廓的近似办法
4.2轮廓绘制
cv2.drawContours(image, contours, contourIdx, color, thickness)
image:指定在哪张图片上绘制轮廓
contours:轮廓列表
contourIdx:定绘制轮廓list中的哪条轮廓,如果是-1,则绘制其中的所有轮廓
color:轮廓颜色
thickness(可选):轮廓宽度
import cv2
img=cv2.imread("D:\\desk\\images\\car_license\\test1.png")
#去噪
image=cv2.GaussianBlur(img,(3,3),0)
#转为灰度图
gray1 = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
#Ostu阈值分割
ret, th1 = cv2.threshold(gray1, 127,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
'''轮廓检测与绘制'''
#检测轮廓(外轮廓)
th1=cv2.dilate(th1,None) #膨胀,保证同一个字符只有一个外轮廓
contours,hierarchy=cv2.findContours(th1,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
#轮廓可视化
th1_bgr=cv2.cvtColor(th1,cv2.COLOR_GRAY2BGR) #转为三通道图
cv2.drawContours(th1_bgr,contours,-1,(0,0,255),2) #轮廓可视化
cv2.imshow("th1_bgr",th1_bgr)
cv2.waitKey()
4.3包围框获取
rect= cv2.boundingRect(points)
points:一系列点的坐标
rect:能够包围住这些点的最小外接矩形信息,格式为(x,y,width,height)
4.4矩形绘制
cv2.rectangle(img, pt1, pt2, color[, thickness)
img:指定要绘制的图片
pt1:矩形的某个顶点的坐标
pt2:和pt1相对的顶点坐标
color:矩形的颜色
thickness(可选):矩形轮廓的宽度
基于轮廓的字符分离完整代码如下:
import cv2
img=cv2.imread("D:\\desk\\images\\car_license\\test1.png")
#去噪
image=cv2.GaussianBlur(img,(3,3),0)
#转为灰度图
gray1 = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
#Ostu阈值分割
ret, th1 = cv2.threshold(gray1, 127,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
'''轮廓检测与绘制'''
#检测轮廓(外轮廓)
th1=cv2.dilate(th1,None) #膨胀,保证同一个字符只有一个外轮廓
contours,hierarchy=cv2.findContours(th1,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
#轮廓可视化
th1_bgr=cv2.cvtColor(th1,cv2.COLOR_GRAY2BGR) #转为三通道图
# cv2.drawContours(th1_bgr,contours,-1,(0,0,255),2) #轮廓可视化
'''包围框获取'''
words=[] #保存包围框信息
height,width=th1.shape
for contour in contours: #对于每一条轮廓
rest=cv2.boundingRect(contour) #得到这条轮廓的外接矩阵
#只有高宽比在1.5到3.5之间,且高 度比图片高度大于0.3的矩阵才保留
if rest[3]/rest[2]>1.5 and rest[3]/rest[2]<3.5 and rest[3]/height>0.3:
words.append(rest) #将当前矩形加入矩形列表
cv2.rectangle(th1_bgr,(rest[0],rest[1]),(rest[0]+rest[2],rest[1]+rest[3]),(0,0,255),3) #绘制矩形
#显示
# cv2.imshow("img",img)
cv2.imshow("th1",th1)
cv2.imshow("th1_bgr",th1_bgr)
cv2.waitKey()
来源:https://blog.csdn.net/m0_59405106/article/details/126274399
猜你喜欢
- 两张表 组织架构表(Organise) 和 工资发放历史记录表 (WagePerMonthHis) 两张表通过 Organise.Item_
- SQL Server Extended Events(下面简称XEvent)是SQL Server 2008里新加的事件处理系统,用来取代S
- 提叻一个代码段,要人帮助解释一下。代码如下:declare type t_indexby is ta
- insert into testtable(recordnumber,currentdate) values (i,sysdate); pr
- Adodb.Stream是ADO的Stream对象,提供存取二进制数据或者文本流,从而实现对流的读、写和管理等操作. 组件:&qu
- <?php # 设置 $domain 为你的域名 (注意没有www) $domain = "aspxhome.com&quo
- 今天在推上看到一条获取PHP类私有属性的推文,感觉很有意思:顺着推文联想,还有其他方式吗?经过自己的测试及网上答案,总结出三种方法:1. 反
- javascript实现翻页效果:<html> <head> <title>上下翻页看 - aspxho
- 本文实例讲述了php打印输出棋盘的两种实现方法。分享给大家供大家参考。具体实现方法如下:例子1,代码如下:<?php /** &nbs
- 这篇文章主要介绍了微信小程序顶部导航栏可滑动并选中放大,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋
- strip_tags定义和用法strip_tags() 函数剥去字符串中的 HTML、XML 以及 PHP 的标签。注释:该函数始终会剥离
- 1.世界地图绘制演示先给大家看下效果图哈。① 世界地图数据准备地图数据如下:因为是世界地图,所以对标的国家,我设置了 2 组,里面的数据是随
- 本文实例讲述了微信扫码支付模式。分享给大家供大家参考,具体如下:背景:因为微信占据众多的用户群,作为程序开发,自然而然也成了研究的重点。毕竟
- 本文介绍了用ASP的AdoDb.Stream读取/写入UTF-8编码格式的文件的方法:函数名称:ReadTextFile 作用:利用AdoD
- 前言:在Python里面,只要类型对象实现了__iter__,那么它的实例对象就被称为可迭代对象(Iterable),比如字符串、元组、列表
- 本文主要给大家介绍了关于webpack中publicPath路径问题的相关内容,分享出来供大家参考学习,下面来看看详细的介绍:output:
- 这是由十几位视觉设计师设计的挂历,每个月份都是不同的风格,就像每个月都有不同温度和心情一样,思维跳跃性很大,可以作为挂历设计参考。当然,如果
- 在平时,常常会提醒自己要做一个善于发现的人,时刻发现细节,这样才会更加懂得生活、会让生活更加精彩。在学习上也是如此,我们常常会发现有很多网站
- 运动模糊:由于相机和物体之间的相对运动造成的模糊,又称为动态模糊Opencv+Python实现运动模糊,主要用到的函数是cv2.filter
- 科学设计你的网站网页:来自 Eye-Tracking研究的23节必修课 ——Christina Laun在网络设计领域关于Eye-