Python OpenCV图像指定区域裁剪的实现
作者:SongpingWang 发布时间:2021-12-30 01:41:35
标签:Python,OpenCV,图像裁剪
在工作中。在做数据集时,需要对图片进行处理,照相的图片我们只需要特定的部分,所以就想到裁剪一种所需的部分。当然若是图片有规律可循则使用opencv对其进行膨胀腐蚀等操作。这样更精准一些。
一、指定图像位置的裁剪处理
import os
import cv2
# 遍历指定目录,显示目录下的所有文件名
def CropImage4File(filepath,destpath):
pathDir = os.listdir(filepath) # 列出文件路径中的所有路径或文件
for allDir in pathDir:
child = os.path.join(filepath, allDir)
dest = os.path.join(destpath,allDir)
if os.path.isfile(child):
image = cv2.imread(child)
sp = image.shape #获取图像形状:返回【行数值,列数值】列表
sz1 = sp[0] #图像的高度(行 范围)
sz2 = sp[1] #图像的宽度(列 范围)
#sz3 = sp[2] #像素值由【RGB】三原色组成
#你想对文件的操作
a=int(sz1/2-64) # x start
b=int(sz1/2+64) # x end
c=int(sz2/2-64) # y start
d=int(sz2/2+64) # y end
cropImg = image[a:b,c:d] #裁剪图像
cv2.imwrite(dest,cropImg) #写入图像路径
if __name__ == '__main__':
filepath ='F:\\\maomi' #源图像
destpath='F:\\maomi_resize' # resized images saved here
CropImage4File(filepath,destpath)
二、批量处理—指定图像位置的裁剪
我这个是用来截取发票的印章区域,用于图像分割(公司的数据集保密)
各位可以用自己的增值发票裁剪。适当的更改截取区域
"""
处理数据集 和 标签数据集的代码:(主要是对原始数据集裁剪)
处理方式:分别处理
注意修改 输入 输出目录 和 生成的文件名
output_dir = "./label_temp"
input_dir = "./label"
"""
import cv2
import os
import sys
import time
def get_img(input_dir):
img_paths = []
for (path,dirname,filenames) in os.walk(input_dir):
for filename in filenames:
img_paths.append(path+'/'+filename)
print("img_paths:",img_paths)
return img_paths
def cut_img(img_paths,output_dir):
scale = len(img_paths)
for i,img_path in enumerate(img_paths):
a = "#"* int(i/1000)
b = "."*(int(scale/1000)-int(i/1000))
c = (i/scale)*100
time.sleep(0.2)
print('正在处理图像: %s' % img_path.split('/')[-1])
img = cv2.imread(img_path)
weight = img.shape[1]
if weight>1600: # 正常发票
cropImg = img[50:200, 700:1500] # 裁剪【y1,y2:x1,x2】
#cropImg = cv2.resize(cropImg, None, fx=0.5, fy=0.5,
#interpolation=cv2.INTER_CUBIC) #缩小图像
cv2.imwrite(output_dir + '/' + img_path.split('/')[-1], cropImg)
else: # 卷帘发票
cropImg_01 = img[30:150, 50:600]
cv2.imwrite(output_dir + '/'+img_path.split('/')[-1], cropImg_01)
print('{:^3.3f}%[{}>>{}]'.format(c,a,b))
if __name__ == '__main__':
output_dir = "../img_cut" # 保存截取的图像目录
input_dir = "../img" # 读取图片目录表
img_paths = get_img(input_dir)
print('图片获取完成 。。。!')
cut_img(img_paths,output_dir)
三、多进程(加快处理)
#coding: utf-8
"""
采用多进程加快处理。添加了在读取图片时捕获异常,OpenCV对大分辨率或者tif格式图片支持不好
处理数据集 和 标签数据集的代码:(主要是对原始数据集裁剪)
处理方式:分别处理
注意修改 输入 输出目录 和 生成的文件名
output_dir = "./label_temp"
input_dir = "./label"
"""
import multiprocessing
import cv2
import os
import time
def get_img(input_dir):
img_paths = []
for (path,dirname,filenames) in os.walk(input_dir):
for filename in filenames:
img_paths.append(path+'/'+filename)
print("img_paths:",img_paths)
return img_paths
def cut_img(img_paths,output_dir):
imread_failed = []
try:
img = cv2.imread(img_paths)
height, weight = img.shape[:2]
if (1.0 * height / weight) < 1.3: # 正常发票
cropImg = img[50:200, 700:1500] # 裁剪【y1,y2:x1,x2】
cv2.imwrite(output_dir + '/' + img_paths.split('/')[-1], cropImg)
else: # 卷帘发票
cropImg_01 = img[30:150, 50:600]
cv2.imwrite(output_dir + '/' + img_paths.split('/')[-1], cropImg_01)
except:
imread_failed.append(img_paths)
return imread_failed
def main(input_dir,output_dir):
img_paths = get_img(input_dir)
scale = len(img_paths)
results = []
pool = multiprocessing.Pool(processes = 4)
for i,img_path in enumerate(img_paths):
a = "#"* int(i/10)
b = "."*(int(scale/10)-int(i/10))
c = (i/scale)*100
results.append(pool.apply_async(cut_img, (img_path,output_dir )))
print('{:^3.3f}%[{}>>{}]'.format(c, a, b)) # 进度条(可用tqdm)
pool.close() # 调用join之前,先调用close函数,否则会出错。
pool.join() # join函数等待所有子进程结束
for result in results:
print('image read failed!:', result.get())
print ("All done.")
if __name__ == "__main__":
input_dir = "D:/image_person" # 读取图片目录表
output_dir = "D:/image_person_02" # 保存截取的图像目录
main(input_dir, output_dir)
来源:https://blog.csdn.net/wsp_1138886114/article/details/82778409


猜你喜欢
- 主要实现的部分是利用NameGeneratorType读入系列图像,见头文件#include "itkNumericSeriesF
- 本文实例讲述了Python中列表元素转为数字的方法。分享给大家供大家参考,具体如下:有一个数字字符的列表:numbers = ['2
- INI介绍INI是英文“初始化”(initialization)的缩写,被用来对操作系统或特定程序初
- 对于许多想学习JavaScript的朋友来说,无疑如何选择入门的书籍是他们最头疼的问题,或许也是他们一直畏惧,甚至放弃学习JavaScrip
- 在scipy.linalg的函数中,往往会提供两种参数,其一是check_finite,当为True时将进行有限检查,另一类是overwri
- python time模块计算时间之间的差距练习题1. 当前月1号对应的0点的时间戳# 定义一个当前月分的一号0点字符串格式的时间 now_
- 目录技术背景打格点算法实现打格点算法加速总结概要技术背景在数学和物理学领域,总是充满了各种连续的函数模型。而当我们用现代计算机的技术去处理这
- clock()方法返回当前的处理器时间,以秒表示Unix上一个浮点数。精度取决于具有相同名称的C函数,但在任何情况下,这是使用于
- 前言时隔108天,何同学在B站发布了最新的视频,《【何同学】我用108天开了个灯…》。那么就让我们用爬虫,爬取视频的弹
- 说明本文根据https://github.com/liuchengxu/blockchain-tutorial的内容,用python实现的,
- 最简单的方法:取整后判断是否和原值相等!javascript的取整函数是:parseIntif(parseInt(value)==value
- 1. JWT 介绍jwt( JSON Web Tokens ),是一种开发的行业标准 RFC 7519 ,用于安全的表示双方之间的声明。目前
- pycharm确实要比Spyder功能全面,但是anaconda的环境配置实在太方便了,所以想take both,其实很简单,利用pycha
- 字符串占位符的"{0:2}"看到这么奇怪的占位符,估计都是一脸懵逼。而且网上搜不到。其实很简单,试一下就知道了。prin
- 大家都是用的哪一款远程控制工具呢?向日葵确实还可以,支持多平台、跨网络,但是必须要注册 Oray账号才行。虽然与免费版,但是用过的都知道,还
- 阅读上一篇:W3C优质网页小贴士(三)明智地选择 URI没有什么比走到你最喜欢的商店门口,却发现店门紧闭,而且没有看见店面搬迁告示这种事情还
- 一、使用ddt和data装饰器的大致框架如下,每个test_开头的方法,代表一条测试用例from ddt import ddt,dataim
- 函数调用方法:numpy.zeros(shape, dtype=float)各个参数意义:shape:创建的新数组的形状(维度)。dtype
- 一、常见模型分类1.1、循环服务器模型循环接收客户端请求,处理请求。同一时刻只能处理一个请求,处理完毕后再处理下一个。优点:实现简单,占用资
- 前言怎么样使用Python提高自己的工作效率,今天就给大家分享这个吧。我们经常用pandas读入读写excel文件,经常会遇到一个excel