Python 第三方opencv库实现图像分割处理
作者:清&轻 发布时间:2023-07-25 02:33:54
前言
所需要安装的库有:
pip install opencv-python
pip install matplotlib
Python接口帮助文档网址:https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html
本文所用到的图片素材:
首先,导入所用到的库:
import cv2
import os,shutil
from matplotlib import pyplot as plt
1.加载图片
注意:这里在传入图像路径时,路径中不能包含有中文名,否则会报错!!!
###1,加载图片
filepath = './testImage.png' ###图像路径,注意:这里的路径不能包含有中文名
img = cv2.imread(filepath)
cv2.imshow('Orignal img', img) ###显示图片
cv2.waitKey(0) ###防止一闪而过,是一个键盘绑定函数(0表示按下任意键终止)
2.对图片做灰度处理
###2,将彩色图片变为灰色(进行灰度处理)
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow('img_gray', img_gray)
cv2.waitKey(0)
3.对图片做二值化处理
thresh=220是自定义设定的阈值(通过分析print(img_gray)的图像数据大概得到的),像素值大于220被置成了0,小于220的被置成了255。
maxval=与 THRESH_BINARY 和 THRESH_BINARY_INV 阈值一起使用的最大值,可理解是填充色,范围为(0~255)。
type:参数类型阈值类型( cv2.THRESH_BINARY 大于阈值的部分被置为255,小于部分被置为0(黑白二值) cv2.THRESH_BINARY_INV 大于阈值部分被置为0,小于部分被置为255(黑白二值反转——白黑) 等其它的类型...... )
###3,将图片做二值化处理
'''
thresh=220是自定义设定的阈值(通过分析print(img_gray)的图像数据大概得到的),像素值大于220被置成了0,小于220的被置成了255
maxval=与 THRESH_BINARY 和 THRESH_BINARY_INV 阈值一起使用的最大值,可理解是填充色,范围为(0~255)。
type:参数类型阈值类型(
cv2.THRESH_BINARY 大于阈值的部分被置为255,小于部分被置为0(黑白二值)
cv2.THRESH_BINARY_INV 大于阈值部分被置为0,小于部分被置为255(黑白二值反转——白黑)
等其它的类型......
)
'''
ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV)
cv2.imshow('img_inv', img_inv)
cv2.waitKey(0)
3.1.自定义阈值
###阈值对比(全局阈值(v = 127),自适应平均阈值,自适应高斯阈值)
def threshContrast():
filepath = './testImage.png'
img = cv2.imread(filepath)
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
img_gray = cv2.medianBlur(img_gray, 5)
ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
title = ['原始图像(灰度)','全局阈值(v = 127)','自适应平均阈值','自适应高斯阈值']
images = [img_gray, th1, th2, th3]
for i in range(4):
plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
# plt.title(title[i]) ###plt绘图时不能使用中文
plt.xticks([]), plt.yticks([])
plt.show()
4.提取轮廓
img_inv是寻找轮廓的图像;
cv2.RETR_EXTERNAL:表示只检索极端外部轮廓;
cv2.CHAIN_APPROX_SIMPLE:压缩水平, 垂直和对角线方向的元素,只保留它们的端点坐标,例如,一个直立的矩形轮廓用 4 个点进行编码。
###4,提取轮廓
'''
https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html
img_inv是寻找轮廓的图像;
cv2.RETR_EXTERNAL:表示只检索极端外部轮廓;
cv2.CHAIN_APPROX_SIMPLE:压缩水平, 垂直和对角线方向的元素,只保留它们的端点坐标,例如,一个直立的矩形轮廓用 4 个点进行编码。
'''
contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
print(f'检测出轮廓数量有:{len(contours)}个')
print('返回值为各层轮廓的索引:\n', hierarchy)
5.对轮廓画矩形框
###5,找出每一个轮廓绘画出的矩形位置
br = []
cntid = 0
for cnt in contours:
'''cnt表示输入的轮廓值,x,y, w, h 分别表示外接矩形的x轴和y轴的坐标,以及矩形的w宽和h高,'''
x, y, w, h = cv2.boundingRect(cnt)
cntid += 1
print(f'检测出第{cntid}个轮廓画出的矩形位置为:x={x},y={y},w={w},h={h}')
br.append(cv2.boundingRect(cnt))
'''img表示输入的需要画的图片(这里就是在原图上绘制轮廓),cnt表示输入的轮廓值,-1表示contours中轮廓的索引(这里绘制所有的轮廓),(0, 0, 255)表示rgb颜色——红色,2表示线条粗细'''
cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2)
cv2.imshow('cnt', img)
cv2.waitKey(0)
br.sort() ###将列表中的每一个元组里面的进行升序排序(这里其实想的是按照对应的x轴坐标进行升序)
对每个字符画轮廓的过程(顺序从右到左画,期间也有可能断续,如下图)。
6.分割图片并保存
###6,分割图片并保存(这里对前面处理过的二值化图片数据(img_inv)进行分割)
if not os.path.exists('./imageSplit'):
os.mkdir('./imageSplit')
else:
shutil.rmtree('./imageSplit')
os.mkdir('./imageSplit')
for x,y,w,h in br:
# print(x,y,w,h)
# split_image = img_inv[y:y + h, x:x + w]
split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2] ###这样分割感觉好看些
cv2.imshow('split_image', split_image)
cv2.waitKey(0)
save_filepath = './imageSplit/'
filename = f'{x}.jpg' ###这里由每张图片对应的x轴坐标命名
cv2.imwrite(save_filepath + filename, split_image)
print(f'\033[31m{filename}图片分割完毕!\033[0m')
这里是对前面处理过的二值化图片数据(img_inv)进行一个一个字符分割展示的过程。
这里是这行代码的意思,下面的图是手动绘制的,太丑了,哈哈哈!!!
# split_image = img_inv[y:y + h, x:x + w]
7.查看分割图片
最后,我们在pyplot上来查看我们分割图片后的效果,也就终于完成了。
###7,用pyplot来查看我们分割完成后的图片
imagefile_list = os.listdir('./imageSplit')
imagefile_list.sort(key=lambda x: int(x[:-4]))
for i in range(len(imagefile_list)):
img = cv2.imread(f'./imageSplit/{imagefile_list[i]}')
plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray')
plt.title(imagefile_list[i])
plt.xticks([]), plt.yticks([])
plt.show()
8.完整代码
import cv2
import os,shutil
from matplotlib import pyplot as plt
'''
这是使用文档网址:https://docs.opencv.org/4.5.2/index.html
这是提供的Python接口教程网址:https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html
'''
def imageSplit():
###1,加载图片
filepath = './testImage.png' ###图像路径,注意:这里的路径不能包含有中文名
img = cv2.imread(filepath)
cv2.imshow('Orignal img', img) ###显示图片
cv2.waitKey(0) ###防止一闪而过,是一个键盘绑定函数(0表示按下任意键终止)
###2,将彩色图片变为灰色(进行灰度处理)
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow('img_gray', img_gray)
cv2.waitKey(0)
###3,将图片做二值化处理
'''
thresh=220是自定义设定的阈值(通过分析print(img_gray)的图像数据大概得到的),像素值大于220被置成了0,小于220的被置成了255
maxval=与 THRESH_BINARY 和 THRESH_BINARY_INV 阈值一起使用的最大值,可理解是填充色,范围为(0~255)。
type:参数类型阈值类型(
cv2.THRESH_BINARY 大于阈值的部分被置为255,小于部分被置为0(黑白二值)
cv2.THRESH_BINARY_INV 大于阈值部分被置为0,小于部分被置为255(黑白二值反转——白黑)
等其它的类型......
)
'''
ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV)
cv2.imshow('img_inv', img_inv)
cv2.waitKey(0)
###4,提取轮廓
'''
https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html
img_inv是寻找轮廓的图像;
cv2.RETR_EXTERNAL:表示只检索极端外部轮廓;
cv2.CHAIN_APPROX_SIMPLE:压缩水平, 垂直和对角线方向的元素,只保留它们的端点坐标,例如,一个直立的矩形轮廓用 4 个点进行编码。
'''
contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
print(f'检测出轮廓数量有:{len(contours)}个')
print('返回值为各层轮廓的索引:\n', hierarchy)
###5,找出每一个轮廓绘画出的矩形位置
br = []
cntid = 0
for cnt in contours:
'''cnt表示输入的轮廓值,x,y, w, h 分别表示外接矩形的x轴和y轴的坐标,以及矩形的w宽和h高,'''
x, y, w, h = cv2.boundingRect(cnt)
cntid += 1
print(f'检测出第{cntid}个轮廓画出的矩形位置为:x={x},y={y},w={w},h={h}')
br.append(cv2.boundingRect(cnt))
'''img表示输入的需要画的图片(这里就是在原图上绘制轮廓),cnt表示输入的轮廓值,-1表示contours中轮廓的索引(这里绘制所有的轮廓),(0, 0, 255)表示rgb颜色——红色,2表示线条粗细'''
cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2)
cv2.imshow('cnt', img)
cv2.waitKey(0)
br.sort() ###将列表中的每一个元组里面的进行升序排序(这里其实想的是按照对应的x轴坐标进行升序)
###6,分割图片并保存(这里对前面处理过的二值化图片数据(img_inv)进行分割)
if not os.path.exists('./imageSplit'):
os.mkdir('./imageSplit')
else:
shutil.rmtree('./imageSplit')
os.mkdir('./imageSplit')
for x,y,w,h in br:
# print(x,y,w,h)
# split_image = img_inv[y:y + h, x:x + w]
split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2] ###这样分割感觉好看些
cv2.imshow('split_image', split_image)
cv2.waitKey(0)
save_filepath = './imageSplit/'
filename = f'{x}.jpg' ###这里由每张图片对应的x轴坐标命名
cv2.imwrite(save_filepath + filename, split_image)
print(f'\033[31m{filename}图片分割完毕!\033[0m')
cv2.destroyAllWindows() ###删除所有窗口
###7,用pyplot来查看我们分割完成后的图片
imagefile_list = os.listdir('./imageSplit')
imagefile_list.sort(key=lambda x: int(x[:-4]))
for i in range(len(imagefile_list)):
img = cv2.imread(f'./imageSplit/{imagefile_list[i]}')
plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray')
plt.title(imagefile_list[i])
plt.xticks([]), plt.yticks([])
plt.show()
print('\nperfect!!!')
###阈值对比(全局阈值(v = 127),自适应平均阈值,自适应高斯阈值)
def threshContrast():
filepath = './testImage.png'
img = cv2.imread(filepath)
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
img_gray = cv2.medianBlur(img_gray, 5)
ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
title = ['原始图像(灰度)','全局阈值(v = 127)','自适应平均阈值','自适应高斯阈值']
images = [img_gray, th1, th2, th3]
for i in range(4):
plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
# plt.title(title[i]) ###plt绘图时不能使用中文
plt.xticks([]), plt.yticks([])
plt.show()
if __name__ == '__main__':
imageSplit()
###阈值对比
# threshContrast()
来源:https://blog.csdn.net/qq_59142194/article/details/125022159


猜你喜欢
- 一、描述在利用django做网络开发的时候我们会遇到一个问题就是,我们建立了多张数据表,但是多张数据表中的内容是不一样的,但是之间有着联系比
- 来看看效果图对比:字符验证码: → 加法验证码:优点:①与纯字符验证码相比,本程序效防止了绝大部分(99%以上)广告机的自动识别。即使是中文
- 需求:1. 可输入代码,并且代码语法高亮2. 支持编辑和不可编辑模式3. 提交到后端到代码内容为字符串格式实现在gitbug上找到vue-p
- 前言最近因为工作的需要,需要写个短链服务,用到了10->62进制,网上找了一个,可以转换最多76位进制的博客,现在分享出来,下面话不多
- 有的同学会说,可以使用源代码搜索的办法。的确,对于一个相对简单的页面,这个方法时常奏效。但是,对于构成相对复杂的页面(比如页面嵌入很多脚本文
- 一、前期准备1.1 案例分析适用场景:单例布局1.2 方 * V视图 HTML+CSS+调试C js实现控制流程D数据 优化扩展二、代码结构&
- 本文实例讲述了CentOS 6/7环境下通过yum安装php7的方法。分享给大家供大家参考,具体如下:安装php7已经是现在linux服务器
- 本章所讲内容: 1、钉钉报警设置
- 一、模块模块可以看成是一堆函数的集合体。一个py文件内部就可以放一堆函数,因此一个py文件就可以看成一个模块。如果这个py文件的文件名为mo
- Python内置函数isdigit()使用今天简单介绍一下Python中的isdigit()函数的用法:判断单个字符是否为数字判断字符串中是
- 这篇文章主要介绍了如何在mac环境中用python处理protobuf,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学
- 定义本地站点在Dreamweaver中制作网站,您必须定义一个本地站点,它是您的计算机上任意位置的一个
- 问:怎样才能指定MySQL只监听某个特定地址?答:比较常见的办法是,在my.cnf之mysqld节,添加bind-address=127.0
- ps:不曾想还有那么好用的方法。汗一个先。Div即父容器不根据内容自适应高度,我们看下面的代码:<div id="main&
- 分页设计我们经常会见到,这里有30个分页设计,以供大家欣赏欣赏借鉴。
- 1、概述python * 殊方法(魔术方法)是被python解释器调用的,我们自己不需要调用它们,我们统一使用内置函数来使用。例如:特殊方法_
- 目标在本节中,将学习根据立体图像创建深度图基础在上一节中,看到了对极约束和其他相关术语等基本概念。如果有两个场景相同的图像,则可以通过直观的
- 什么是docstring在软件工程中,其实编码所占的部分是非常小的,大多是其它的事情,比如写文档。文档是沟通的工具。 在Python中,比较
- 说明1、Matplotlib函数可以绘制图形,使用plot函数绘制曲线。2、需要将200个点的x坐标和Y坐标分别以序列的形式输入plot函数
- 1. 用 Numpy ndarray 作为数据传入 plyimport numpy as npimport matplotlib as mp