opencv模板匹配相同位置去除重复的框
作者:Bubble_water 发布时间:2022-03-09 04:06:14
使用opencv自带的模板匹配
1、目标匹配函数:cv2.matchTemplate()
res=cv2.matchTemplate(image, templ, method, result=None, mask=None)
image:待搜索图像
templ:模板图像
result:匹配结果
method:计算匹配程度的方法,主要有以下几种:
CV_TM_SQDIFF 平方差匹配法:该方法采用平方差来进行匹配;最好的匹配值为0;匹配越差,匹配值越大。
CV_TM_CCORR 相关匹配法:该方法采用乘法操作;数值越大表明匹配程度越好。
CV_TM_CCOEFF 相关系数匹配法:1表示完美的匹配;-1表示最差的匹配。
CV_TM_SQDIFF_NORMED 计算归一化平方差,计算出来的值越接近0,越相关
CV_TM_CCORR_NORMED 计算归一化相关性,计算出来的值越接近1,越相关
CV_TM_CCOEFF_NORMED 计算归一化相关系数,计算出来的值越接近1,越相关
待检测的图片如下,需要检测里面金币的位置
需要检测金币的模板如下:
2、基本的多对象模板匹配效果代码如下:
import cv2
import numpy as np
img_rgb = cv2.imread('mario.jpg')
img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)
template = cv2.imread('mario_coin.jpg', 0)
h, w = template.shape[:2]
res = cv2.matchTemplate(img_gray, template, cv2.TM_CCOEFF_NORMED)
threshold = 0.8
# 取匹配程度大于%80的坐标
loc = np.where(res >= threshold)
#np.where返回的坐标值(x,y)是(h,w),注意h,w的顺序
for pt in zip(*loc[::-1]):
bottom_right = (pt[0] + w, pt[1] + h)
cv2.rectangle(img_rgb, pt, bottom_right, (0, 0, 255), 2)
cv2.imwrite("001.jpg",img_rgb)
cv2.imshow('img_rgb', img_rgb)
cv2.waitKey(0)
检测效果如下:
通过上图可以看到对同一个图有多个框标定,需要去重,只需要保留一个
解决方案:对于使用同一个待检区域使用NMS进行去掉重复的矩形框
3、使用NMS对模板匹配出来的矩形框进行去掉临近重复的,代码如下:
import cv2
import time
import numpy as np
def py_nms(dets, thresh):
"""Pure Python NMS baseline."""
#x1、y1、x2、y2、以及score赋值
# (x1、y1)(x2、y2)为box的左上和右下角标
x1 = dets[:, 0]
y1 = dets[:, 1]
x2 = dets[:, 2]
y2 = dets[:, 3]
scores = dets[:, 4]
#每一个候选框的面积
areas = (x2 - x1 + 1) * (y2 - y1 + 1)
#order是按照score降序排序的
order = scores.argsort()[::-1]
# print("order:",order)
keep = []
while order.size > 0:
i = order[0]
keep.append(i)
#计算当前概率最大矩形框与其他矩形框的相交框的坐标,会用到numpy的broadcast机制,得到的是向量
xx1 = np.maximum(x1[i], x1[order[1:]])
yy1 = np.maximum(y1[i], y1[order[1:]])
xx2 = np.minimum(x2[i], x2[order[1:]])
yy2 = np.minimum(y2[i], y2[order[1:]])
#计算相交框的面积,注意矩形框不相交时w或h算出来会是负数,用0代替
w = np.maximum(0.0, xx2 - xx1 + 1)
h = np.maximum(0.0, yy2 - yy1 + 1)
inter = w * h
#计算重叠度IOU:重叠面积/(面积1+面积2-重叠面积)
ovr = inter / (areas[i] + areas[order[1:]] - inter)
#找到重叠度不高于阈值的矩形框索引
inds = np.where(ovr <= thresh)[0]
# print("inds:",inds)
#将order序列更新,由于前面得到的矩形框索引要比矩形框在原order序列中的索引小1,所以要把这个1加回来
order = order[inds + 1]
return keep
def template(img_gray,template_img,template_threshold):
'''
img_gray:待检测的灰度图片格式
template_img:模板小图,也是灰度化了
template_threshold:模板匹配的置信度
'''
h, w = template_img.shape[:2]
res = cv2.matchTemplate(img_gray, template_img, cv2.TM_CCOEFF_NORMED)
start_time = time.time()
loc = np.where(res >= template_threshold)#大于模板阈值的目标坐标
score = res[res >= template_threshold]#大于模板阈值的目标置信度
#将模板数据坐标进行处理成左上角、右下角的格式
xmin = np.array(loc[1])
ymin = np.array(loc[0])
xmax = xmin+w
ymax = ymin+h
xmin = xmin.reshape(-1,1)#变成n行1列维度
xmax = xmax.reshape(-1,1)#变成n行1列维度
ymax = ymax.reshape(-1,1)#变成n行1列维度
ymin = ymin.reshape(-1,1)#变成n行1列维度
score = score.reshape(-1,1)#变成n行1列维度
data_hlist = []
data_hlist.append(xmin)
data_hlist.append(ymin)
data_hlist.append(xmax)
data_hlist.append(ymax)
data_hlist.append(score)
data_hstack = np.hstack(data_hlist)#将xmin、ymin、xmax、yamx、scores按照列进行拼接
thresh = 0.3#NMS里面的IOU交互比阈值
keep_dets = py_nms(data_hstack, thresh)
print("nms time:",time.time() - start_time)#打印数据处理到nms运行时间
dets = data_hstack[keep_dets]#最终的nms获得的矩形框
return dets
if __name__ == "__main__":
img_rgb = cv2.imread('mario.jpg')#需要检测的图片
img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)#转化成灰色
template_img = cv2.imread('mario_coin.jpg', 0)#模板小图
template_threshold = 0.8#模板置信度
dets = template(img_gray,template_img,template_threshold)
count = 0
for coord in dets:
cv2.rectangle(img_rgb, (int(coord[0]),int(coord[1])), (int(coord[2]),int(coord[3])), (0, 0, 255), 2)
cv2.imwrite("result.jpg",img_rgb)
检测效果如下所示:
参考资料:
https://blog.csdn.net/qq_39507748/article/details/104598222
https://docs.opencv.org/3.4/d4/dc6/tutorial_py_template_matching.html
https://blog.csdn.net/mdjxy63/article/details/81037860
https://github.com/rbgirshick/fast-rcnn/blob/master/lib/utils/nms.py
https://www.pyimagesearch.com/2015/02/16/faster-non-maximum-suppression-python/
来源:https://blog.csdn.net/fengxinzioo/article/details/115837036


猜你喜欢
- 1 以下代码的输出结果为:print(round(-3.6))A.-4B.-4.0C.-3D. -3.02 以下代码的输出结果为(Pytho
- eval函数接收一个参数s,如果s不是字符串,则直接返回s。否则执行s语句。如果s语句执行结果是一个值,则返回此值,否则返回undefine
- 前言在学习操作系统的时候,我们应该都学习过临界区、互斥锁这些概念,用于在并发环境下保证状态的正确性。比如在秒杀时,100 个用户同时抢 10
- 通过Vue-cli进行webpack打包的坑Vue-cli为Vue项目搭建的脚手架的确很方便,但打包时容易出现空白页,或者对应的静态资源加载
- 在JS/TS项目里,除了能看到==操作符来判断两个变量是否相等外,我们还会看到===操作符,这两者有什么区别吗?先上结论,对于String,
- 在数据处理过程中,经常会出现对某列批量做某些操作,比如dataframe df要对列名为“values”做大于等于30设置为1,小于30设置
- 一、用 ftplib 模块连接远程服务器ftplib模块常用方法ftp登陆连接from ftplib import FTP #加
- 上篇博客转载了关于感知器的用法,遂这篇做个大概总结,并实现一个简单的感知器,也为了加深自己的理解。感知器是最简单的神经网络,只有一层。感知器
- 近期被问到一个问题,在你们项目中使用的是Vue的SPA(单页面)还是Vue的多页面设计?这篇文章主要围绕Vue的SPA单页面设计展开。 关于
- 简述和GNU一样,YAML是一个递归着说“不”的名字。不同的是,GNU对UNIX说不,YAML说不的对象是XML。YAML不是XML。为什么
- Anaconda是Python的一个开源发行版本,主要面向科学计算,预装了丰富强大的库。使用Anaconda可以轻松管理多个版本的Pytho
- css的流行导致了标签的流行,很直观,看起来很清爽。流行的一部分,还有很多种功能强大且美观的导航。。。1. Change.org2. N.D
- 本文实例讲述了Python进程间通信Queue消息队列用法。分享给大家供大家参考,具体如下:进程间通信-QueueProcess之间有时需要
- 一、概述切片(Slice)是一个拥有相同类型元素的可变长度的序列。它是基于数组类型做的一层封装。它非常灵活,支持自动扩容。切片是一个引用类型
- 本文实例讲述了Python面向对象编程基础。分享给大家供大家参考,具体如下:1、类的定义Python中类的定义与对象的初始化如下,pytho
- 说明视频剪辑时需要为视频添加字幕,添加字幕方法之一:根据字幕文本文件批量生成透明底只有字幕内容的图片文件,如下图,然后将这些图片文件添加到视
- 1.输入命令 mysqld --skip-grant-tables (前提关闭mysql.exe的进程 net stop mys
- Sql Server为每个触发器都创建了两个专用表:Inserted表和Deleted表。这两个表由系统来维护,它们存在于内存中
- 简介Node2vec是一种用于图嵌入(Graph Embedding)的方法,可用于节点分类、社区发现和连接预测等任务。实现过程
- 本文实例讲述了MySQL 表数据的导入导出操作。分享给大家供大家参考,具体如下:数据导出1. 使用 SELECT ..