三分钟教会你用Python+OpenCV批量裁剪xml格式标注的图片
作者:18岁小白想成大牛 发布时间:2023-07-09 14:11:01
标签:opencv,批量,裁剪
前言
在目标检测中,数据集常常使用labelimg标注,会生成xml文件。本文旨在根据xml标注文件来裁剪目标,以达到去除背景信息的目的。
xml文件格式
以下是一个标注好的图片生成的xml文件。具体含义见代码注释。
<annotation> <!--xml所属文件夹-->
<folder>JPEGImages</folder> <!--对应图片所属文件夹-->
<filename>408.bmp</filename>
<path>E:\JPEGImages\408.bmp</path>
<source>
<database>Unknown</database>
</source>
<size> <!--整张图片宽,高,3通道彩色-->
<width>413</width>
<height>342</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object><!--标注的目标,一共5个框-->
<name>bad_part</name><!--名称,也就是类别-->
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox> <!--坐标,左上,左下,右上,右下-->
<xmin>339</xmin>
<ymin>103</ymin>
<xmax>398</xmax>
<ymax>173</ymax>
</bndbox>
</object>
<object>
<name>bad_part</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>265</xmin>
<ymin>15</ymin>
<xmax>364</xmax>
<ymax>74</ymax>
</bndbox>
</object>
<object>
<name>bad_part</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>118</xmin>
<ymin>33</ymin>
<xmax>195</xmax>
<ymax>52</ymax>
</bndbox>
</object>
<object>
<name>bad_part</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>113</xmin>
<ymin>103</ymin>
<xmax>177</xmax>
<ymax>147</ymax>
</bndbox>
</object>
<object>
<name>bad_part</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>224</xmin>
<ymin>298</ymin>
<xmax>287</xmax>
<ymax>326</ymax>
</bndbox>
</object>
</annotation>
代码思想
获取到标签文件路径和图片文件路径;
遍历图片文件夹获取到图片,并分割文件名;
根据图片的文件名加后缀xml得到具体的标签文件;
通过xml.etree.ElementTree读取xml文件;
遍历所有的目标框,获取到[];
通过cv2裁剪目标(先高后宽 参考文章:https://www.jb51.net/article/211183.htm中的第二中裁剪方法);
将裁剪好的图片保存到指定文件目录。
完整代码
'''
根据xml标签裁剪目标
1.文件夹中可以有除了图片格式或标签格式的文件,有判断可以忽略其他文件
2.图片未标注没有对应的xml文件自动忽略不会报错
3.同一个图片有多个真实框,会按名称_0,名称_1 …… 排列
4.图片本身的命名无规律会按3中的命名规则加上名称后缀重新命名。
'''
import cv2
import xml.etree.ElementTree as ET
import os
img_path = r'E:/JPEGImages' #图片路径
xml_path = r'E:/Annotations' #标签路径
obj_img_path = r'E:/cut' #目标裁剪图片存放路径
for img_file in os.listdir(img_path): #遍历图片文件夹
if img_file[-4:] in ['.bmp', '.jpg','.png']: #判断文件是否为图片格式
img_filename = os.path.join(img_path, img_file) #将图片路径与图片名进行拼接
img_cv = cv2.imread(img_filename) #读取图片
img_name = (os.path.splitext(img_file)[0]) #分割出图片名,如“000.png” 图片名为“000”
xml_name = xml_path + '\\' + '%s.xml'%img_name #利用标签路径、图片名、xml后缀拼接出完整的标签路径名
if os.path.exists(xml_name): #判断与图片同名的标签是否存在,因为图片不一定每张都打标
root = ET.parse(xml_name).getroot() #利用ET读取xml文件
count = 0 #目标框个数统计,防止目标文件覆盖
for obj in root.iter('object'): #遍历所有目标框
name = obj.find('name').text #获取目标框名称,即label名
xmlbox = obj.find('bndbox') #找到框目标
x0 = xmlbox.find('xmin').text #将框目标的四个顶点坐标取出
y0 = xmlbox.find('ymin').text
x1 = xmlbox.find('xmax').text
y1 = xmlbox.find('ymax').text
obj_img = img_cv[int(y0):int(y1), int(x0):int(x1)] #cv2裁剪出目标框中的图片
cv2.imwrite(obj_img_path + '\\' + '%s_%s'%(img_name, count) + '.jpg', obj_img) #保存裁剪图片
count += 1 #目标框统计值自增1
print("裁剪完成!")
效果展示
总结
ET解析树基本上是xml标注文件必备的解析库。
labelimg→ \rightarrow→xml→ \rightarrow→VOC数据集
labelme→ \rightarrow→json→ \rightarrow→COCO数据集
json是字典形式,内存小;xml是DTD文档,格式统一跨平台
去除背景信息是很重要的一环,可以避免模型监督学习时学习到相似的错误信息。
来源:https://blog.csdn.net/qq_36584673/article/details/117301833
0
投稿
猜你喜欢
- python中使用input()函数来获取用户输入函数 input() 让程序暂停运行,等待用户输入一些文本,获取用户的输入后,Python
- 今天给大伙分享一下 Python 爬虫的教程,这次主要涉及到的是关于某 APP 的逆向分析并抓取数据,关于 APP 的反爬会麻烦一些,比如
- #!/bin/ksh INTERVAL=5 PREFIX=$INTERVAL-sec-status touch /tmp/running R
- 一、简介 transitions库pip install transitions状态机 state:状态节点transition:
- Pandas 按周、月、年、统计数据介绍将日期转为时间格式 并设置为索引import pandas as pddata=pd.read_ex
- 知识点图像模块 (Image.Image)Image模块的功能Image模块的方法ImageChops模块ImageColor模块基础使用图
- 本讲的内容是使用ASP的ActiveX Server Components(组件),说实话下面的内置组件我们用的很少。一、 Browser
- 变量不需要声明Python的变量不需要声明,你可以直接输入:>>>a = 10那么你的内存里就有了一个变量a, 它的值是1
- 1、ul标签在Mozilla中默认是有padding值的,而在IE中只有margin有值。 2、同一个的class选择符可以在一个
- 如下:data = pd.read_csv('20180201.txt',sep = '|',dtype =
- endswith()方法返回true,如果字符串以指定后缀结尾,否则返回(False可选限制的匹配从给定的索引开始和结束)。语法
- 前言今天在开发时发现一个奇怪的问题,我手动改完数据库竟然不生效,反复确认环境无误后猜测是缓存的问题,因为是新接手的项目,代码还不熟悉,仔细一
- Ubuntu16.04自带python2.7与python3.5,某个项目编译却要求python版本大于等于3.7,遂考虑在原系统基础上再安
- 取得 Oracle 10g 安装程序,或从 Oracle 技术网(OTN)下载光盘映像。在评估阶段您可以免费下载和使用无技术限制的全功能 O
- 前言Logistic回归涉及到高等数学,线性代数,概率论,优化问题。本文尽量以最简单易懂的叙述方式,以少讲公式原理,多讲形象化案例为原则,给
- 中文文本中可能出现的标点符号来源比较复杂,通过匹配等手段对他们处理的时候需要格外小心,防止遗漏。以下为在下处理中文标点的时候采用的两种方法:
- overflow:hidden这个CSS样式是大家常用到的CSS样式,但是大多数人对这个样式的理解仅仅局限于隐藏溢出,而对于清除浮动这个含义
- 这是我的第一个真正意思上的自动化脚本。1、练习的测试用例为:打开百度首页,搜索“胡歌”,然后检索列表,有无“胡歌的新浪微博”这个链接 2、在
- 前言yolo算法作为one-stage领域的佼佼者,采用anchor-based的方法进行目标检测,使用不同尺度的anchor直接回归目标框
- github指路作业要求友情提示ldw老师给の友情提示(虽然感觉也还好/dbq其实还挺有用的)课上讲的例子是图片展示器(能够实现打开图片+镜