将数据集制作成VOC数据集格式的实例
作者:attitude_yu 发布时间:2023-05-16 06:00:15
标签:数据集,VOC,格式
在做目标检测任务时,若使用Github已复现的论文时,需首先将自己的数据集转化为VOC数据集的格式,因为论文作者使用的是公开数据集VOC 2007、VOC2012、COCO等类型数据集做方法验证与比对。
一、VOC数据集格式
--VOCdevkit2007
--VOC2007
--Annotations (xml格式的文件)
--000001.xml
--ImageSets
--Layout
--Main
--train.txt
--test.txt
--val.txt
--trainval.txt
--Segmentation
--JPEGImages (训练集和测试集图片)
--000001.jpg
--results
二、转换过程步骤
1. 使用标注工具标注图片目标检测框,生成JSON格式的标注文件(本人使用此生成类型的标注工具,也可使用(LabelImg等标注工具);
2. 批量修改图片和标注文件名称,从000001.jpg、000001.json标号开始;
#coding='utf-8'
import os
import numpy as np
def imgs_rename(imgs_path):
imgs_labels_name = np.array(os.listdir(imgs_path)).reshape(-1,2)
# 从 000001开始
i = 1
for img_label_name in imgs_labels_name:
if img_label_name[0].endswith('.jpg'):
# 修改图片名称
img_old_name = os.path.join(os.path.abspath(imgs_path), img_label_name[0])
# 类别+图片编号 format(str(i),'0>3s') 填充对齐
img_new_name = os.path.join(os.path.abspath(imgs_path), '00' + format(str(i),'0>4s') + '.jpg')
os.rename(img_old_name, img_new_name)
# 修改json文件名称
label_old_name = os.path.join(os.path.abspath(imgs_path), img_label_name[1])
label_new_name = os.path.join(os.path.abspath(imgs_path), '00' + format(str(i), '0>4s') + '.json')
os.rename(label_old_name, label_new_name)
i = i + 1
if __name__=='__main__':
# 读取json文件的路径
root = "read_file_path"
imgs_rename(root)
3. 提取图片和标注文件到不同文件夹下,并将读取的标注框转化为txt文件格式(本人的图片和JSON文件在同一目录下生成);
import json
import os
import numpy as np
import cv2
#读取json格式文件,返回坐标
def read_json(file_name):
file = open(file_name,'r',encoding='utf-8')
set = json.load(file)
# print("读取完整信息:",set)
coord = set['objects'][0]['seg'] # 只读取第一个标注的车牌
return coord
def save_imgs(imgs_jsons_files, imgs_path):
# 提取图片文件夹中的jpg文件名称
for idx in range(len(imgs_jsons_list)):
if imgs_jsons_list[idx][-3:]=='jpg':
img_name = imgs_jsons_list[idx]
read_img_path = os.path.join(imgs_jsons_files, img_name)
img = cv2.imread(read_img_path)
save_img_path = os.path.join(imgs_path, img_name)
cv2.imwrite(save_img_path, img)
def save_labels(imgs_jsons_files, labels_path):
# 提取图片文件夹中的json文件名称
for idx in range(len(imgs_jsons_list)):
if imgs_jsons_list[idx][-4:] == 'json':
json_name = imgs_jsons_list[idx]
# 操作每一个json文件,读取并保存坐标
json_path = os.path.join(imgs_jsons_files, json_name)
json_coord = read_json(json_path)
if len(json_coord) > 8:
print("标注坐标多于四个点的文件名称:", json_name)
# 提取左上和右下坐标
roi_coord = []
for idx in range(len(json_coord)):
if idx == 0 or idx == 1 or idx == 4 or idx == 5:
roi_coord.extend([json_coord[idx]])
# 保存roi坐标到txt文件中
label_path = labels_path + json_name[:6] + '.txt'
np.savetxt(label_path, roi_coord)
if __name__=='__main__':
print("loading......")
# 读取jpg json文件的路径
imgs_jsons_files = "Jpg_json_file_path"
# 保存读取的真实标签路径
labels_path = "save_labels_path"
if not os.path.exists(labels_path):
os.mkdir(labels_path)
# 保存读取的图片
imgs_path = "sabe_imgs_path"
if not os.path.exists(imgs_path):
os.mkdir(imgs_path)
imgs_jsons_list = os.listdir(imgs_jsons_files)
save_imgs(imgs_jsons_files, imgs_path)
save_labels(imgs_jsons_files, labels_path)
print("done!!!")
4. 转化标注框txt格式为xml格式;
# encoding = utf-8
import os
import numpy as np
import codecs
import cv2
def read_txt(label_path):
file = open(label_path,'r',encoding='utf-8')
label_lines = file.readlines()
label = []
for line in label_lines:
one_line = float(line.strip().split('\n')[0])
label.extend([one_line])
return np.array(label,dtype=np.float64)
def covert_xml(label,xml_path, img_name, img_path):
# 获得图片信息
img = cv2.imread(img_path)
height, width, depth = img.shape
x_min,y_min,x_max,y_max = label
xml = codecs.open(xml_path, 'w', encoding='utf-8')
xml.write('<annotation>\n')
xml.write('\t<folder>' + 'VOC2007' + '</folder>\n')
xml.write('\t<filename>' + img_name + '</filename>\n')
xml.write('\t<source>\n')
xml.write('\t\t<database>The VOC 2007 Database</database>\n')
xml.write('\t\t<annotation>Pascal VOC2007</annotation>\n')
xml.write('\t\t<image>flickr</image>\n')
xml.write('\t\t<flickrid>NULL</flickrid>\n')
xml.write('\t</source>\n')
xml.write('\t<owner>\n')
xml.write('\t\t<flickrid>NULL</flickrid>\n')
xml.write('\t\t<name>faster</name>\n')
xml.write('\t</owner>\n')
xml.write('\t<size>\n')
xml.write('\t\t<width>' + str(width) + '</width>\n')
xml.write('\t\t<height>' + str(height) + '</height>\n')
xml.write('\t\t<depth>' + str(depth) + '</depth>\n')
xml.write('\t</size>\n')
xml.write('\t\t<segmented>0</segmented>\n')
xml.write('\t<object>\n')
xml.write('\t\t<name>plate</name>\n')
xml.write('\t\t<pose>Unspecified</pose>\n')
xml.write('\t\t<truncated>0</truncated>\n')
xml.write('\t\t<difficult>0</difficult>\n')
xml.write('\t\t<bndbox>\n')
xml.write('\t\t\t<xmin>' + str(x_min) + '</xmin>\n')
xml.write('\t\t\t<ymin>' + str(y_min) + '</ymin>\n')
xml.write('\t\t\t<xmax>' + str(x_max) + '</xmax>\n')
xml.write('\t\t\t<ymax>' + str(y_max) + '</ymax>\n')
xml.write('\t\t</bndbox>\n')
xml.write('\t</object>\n')
xml.write('</annotation>')
if __name__=='__main__':
labels_file_path = "D:/Code_py/VOC2007/labels/"
imgs_file_path = "D:/Code_Py/VOC2007/imgs/"
xmls_file_path = "D:/Code_py/VOC2007/xmls/"
if not os.path.exists(xmls_file_path):
os.mkdir(xmls_file_path)
labels_name = os.listdir(labels_file_path)
for label_name in labels_name:
label_path = os.path.join(labels_file_path, label_name)
label = read_txt(label_path)
xml_name = label_name[:6]+'.xml'
xml_path = os.path.join(xmls_file_path, xml_name)
img_name = label_name[:6]+'.jpg'
img_path = os.path.join(imgs_file_path, img_name)
covert_xml(label, xml_path, img_name, img_path)
5. 切分数据集为训练集、验证集和测试集,仅保存图片的名称到txt问价下即可;
import os
import numpy as np
if __name__=='__main__':
root = "save_path"
train = open(root+"train.txt", 'w', encoding='utf-8')
train_val = open(root+"trainval.txt", 'w', encoding='utf-8')
test = open(root+"test.txt", 'w', encoding='utf-8')
val = open(root+"val.txt", 'w', encoding='utf-8')
imgs_path = os.path.join(root, "imgs")
imgs_name = os.listdir(imgs_path)
# 首先切分训练验证集和测试集
train_val_img_info = []
for img_name in imgs_name:
x = np.random.uniform(0,1)
img_info = str(img_name).strip().split('.')[0]
# 随机选取1/2比例的数据为测试集
if x>0.5:
train_val_img_info.append(img_info)
train_val.writelines(img_info)
else:
test.writelines(img_info+'\n')
# 然后切分训练验证集为训练集和验证集
for img_name in train_val_img_info:
x = np.random.uniform(0,1)
if x>0.5:
train.writelines(img_name+'\n')
else:
val.writelines(img_name+'\n')
来源:https://blog.csdn.net/attitude_yu/article/details/81905927


猜你喜欢
- 我们知道,session是一种会话技术,用来实现跨脚本共享数据或者检测跟踪用户状态。session的工作原理(1)当一个session第一次
- time库是python中处理时间的标准库。计算机时间的表达:time()、ctime()、gmtime();提供获取系统时间并格式化输出功
- 自动化处理PDF文件使用Python完成简单的PDF文件处理操作,如PDF文件的批量合并、拆分、加密以及添加水印等。1. 批量合并PDF文件
- 本次我们选择的安卓游戏对象叫“单词英雄”,大家可以先下载这个游戏。游戏的界面是这样的:通过选择单词的意思进行攻击,选对了就正常攻击,选错了就
- 使用MySQL,安全问题不能不注意。以下是MySQL提示的23个注意事项:1。如果客户端和服务器端的连接需要跨越并通过不可信任的网络,那么就
- 我们可以把全体人数当作一个集合,想要往其中加入新人有不同的增加方式。可以一周增加一次,也可以集中到月底一起加入集体。我们今天所要讲的在pyt
- 本文实例讲述了Django利用cookie保存用户登录信息的方法。分享给大家供大家参考,具体如下:设置cookieresponse对象.se
- 内容摘要:图片切换效果在网页制作中经常被使用,好的切换效果不仅增加了网站的实用行也提升了网站的趣味性。而图片切换方法有的使用flash来实现
- 前言今天为大家分享Echarts在Python 的Django框架中的使用项目仓库为https://gitcode.net/sabian2/
- 今天刚看到ChinaUI.com新改版的网站,觉得优艾网是越来越漂亮了,这次的变化的确是挺大的。一早大概的看了一下就关了,后来晚上又打开看时
- 本文主要介绍了python opencv 找出图像中的最大轮廓并填充,分享给大家,具体如下:import cv2import numpy a
- 单向链表单向链表也叫单链表,是链表中最简单的一种形式,它的每个节点包含两个域,一个信息域(元素域)和一个链接域。这个链接指向链表中的下一个节
- 初学python,抓取搜狗微信公众号文章存入mysqlmysql表:代码:import requestsimport jsonimport
- 我们写程序的目的就是使它在任何情况下都可以稳定工作。一个运行的很快但是结果错误的程序并没有任何用处。在程序开发和优化的过程中,我们必须考虑代
- 如何将产生的密码记录并发送给用户?这里使用了cdonts邮件组件来发送邮件,前提服务器得支持cdonts组件。好了,看看具体实现方法吧,不是
- 1、获取元素 2、获取数据 3、绑定数据 4、隔行换色&
- 最近一个项目中遇到ASP对FoxPro库表(*.DBF)的操作问题。现实中确有许多应用软件使
- ---- 一、 引言: ---- 回滚段是数据库的一部分,它记录数据库变更的信息。使用这些信息实现数据库的读一致性及其恢复。若回滚段出现故障
- (1) 展示了ASP * 站设计的一些最基本的方法,相信通过实践各位对ASP已经有了最基本的了解,本篇在答复大家所提问题的同时,将进一步介绍
- kelon 问:格式如下:s="地,在要,大,奇功,不知,但是,不示"我想把它split分出來,变成数组來循环,但是不知