Python使用背景差分器实现运动物体检测
作者:ReadyGo!!! 发布时间:2023-06-21 09:37:22
前言
目前,许多运动检测技术都是基于简单的背景差分概念的,即假设摄像头(视频)的曝光和场景中的光照条件是稳定的,当摄像头捕捉到新的帧时,我们可以从参考图像中减去该帧,并取这个差的绝对值,以获得帧中每个像素位置的运动测量值。如果帧的任何区域与参考图像有很大的不同,我们就认为给定区域中是一个运动物体。
本文主要简单介绍基本背景差分器,详细介绍MOG背景差分器,KNN背景差分器。
一、基本背景差分器
首先,基本背景差分器可以很好地实现运动物体的检测,代码实现参考此链接
其特点是:此脚本不会动态更新背景图像,即当一个运动的物体静止后,此脚本仍然会标记此物体,除非此物体消失在窗口中,甚至当摄像头运动或者光线变化时,此脚本会直接标记整个窗口直到程序结束。
如果我们希望脚本能够动态的更新背景模型,即当运动物体静止后,静止物体会被纳入背景,标记会逐渐消失,这时,我们就可以采用更灵活、更智能的背景差分器(如MOG背景差分器、KNN背景差分器)。
二、MOG背景差分器
OpenCV提供了一个名为 cv2.BackgroundSubtractor 的类,它有实现各种背景差分算法的子类。
对于MOG背景差分器,OpenCV有两种实现,分别命名为:cv2.BackgroundSubtractorMOG 和 cv2.BackgroundSubtractorMOG2,后者是最新改进的实现,增加了对阴影检测的支持,我们将使用它。
流程
1.导入OpenCV,初始化MOG背景差分器,定义erode(腐蚀)、dilate(膨胀)运算的核大小
import cv2
bg_subtractor = cv2.createBackgroundSubtractorMOG2(detectShadows=True)
erode_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (3, 3))
dilate_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (7, 7))
初始化函数中接收一个参数detectShadows,将其设置为True,就会标记出阴影区域,而不会标记为前景的一部分。
使用腐蚀与膨胀的形态学操作是为了抑制一些细微的振动频率。
2.捕捉摄像头帧,并使用MOG差分器获得背景掩膜
cap = cv2.VideoCapture(0)
success, frame = cap.read()
while success:
fg_mask = bg_subtractor.apply(frame)
当我们把每一帧传递给背景差分器的 apply 方法时,差分器就会更新它的内部背景模型,然后返回一个掩膜。
其中,前景部分的掩膜是白色(255),阴影部分的掩膜是灰色(127),背景部分的掩膜是黑色(0)
3.然后对掩膜应用阈值来获得纯黑白图像,并通过形态学运算对阈值化图像进行平滑处理。
_, thresh = cv2.threshold(fg_mask, 244, 255, cv2.THRESH_BINARY)
cv2.erode(thresh, erode_kernel, thresh, iterations=2)
cv2.dilate(thresh, dilate_kernel, thresh, iterations=2)
(本示例中,我们开启了阴影检测,但我们仍然想把阴影认为是背景,所以对掩膜应用一个接近白色(244)的阈值)
4.现在,如果我们直接查看阈值化后的图像,会发现运动物体呈现白色斑点,我们想找到白色斑点的轮廓,并在其周围绘制轮廓。其中,我们将应用一个基于轮廓面积的阈值,如果轮廓太小,就认为它不是真正的运动物体(或者不使用此阈值),检测轮廓与绘制边框的代码:
contours, hier = cv2.findContours(thresh, cv2.RETR_EXTERNAL,
cv2.CHAIN_APPROX_SIMPLE)
for c in contours:
if cv2.contourArea(c) > 1000:
x, y, w, h = cv2.boundingRect(c)
cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 255, 0), 2)
5.显示掩膜图像/阈值化图像/检测结果图像,继续读取帧,直到按下ESC退出。
cv2.imshow('mog', fg_mask)
cv2.imshow('thresh', thresh)
cv2.imshow('detection', frame)
k = cv2.waitKey(30)
if k == 27: # Escape
break
success, frame = cap.read()
代码编写
import cv2
OPENCV_MAJOR_VERSION = int(cv2.__version__.split('.')[0])
bg_subtractor = cv2.createBackgroundSubtractorMOG2(detectShadows=True)
erode_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (3, 3))
dilate_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (7, 7))
cap = cv2.VideoCapture(0)
success, frame = cap.read()
while success:
fg_mask = bg_subtractor.apply(frame)
_, thresh = cv2.threshold(fg_mask, 244, 255, cv2.THRESH_BINARY)
cv2.erode(thresh, erode_kernel, thresh, iterations=2)
cv2.dilate(thresh, dilate_kernel, thresh, iterations=2)
if OPENCV_MAJOR_VERSION >= 4:
# OpenCV 4 or a later version is being used.
contours, hier = cv2.findContours(thresh, cv2.RETR_EXTERNAL,
cv2.CHAIN_APPROX_SIMPLE)
else:
# OpenCV 3 or an earlier version is being used.
# cv2.findContours has an extra return value.
# The extra return value is the thresholded image, which is
# unchanged, so we can ignore it.
_, contours, hier = cv2.findContours(thresh, cv2.RETR_EXTERNAL,
cv2.CHAIN_APPROX_SIMPLE)
for c in contours:
if cv2.contourArea(c) > 1000:
x, y, w, h = cv2.boundingRect(c)
cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 255, 0), 2)
cv2.imshow('mog', fg_mask)
cv2.imshow('thresh', thresh)
cv2.imshow('detection', frame)
k = cv2.waitKey(30)
if k == 27: # Escape
break
success, frame = cap.read()
cap.release()
cv2.destroyAllWindows()
注意:当我们启用阴影检测时,我们可以通过一个阈值来移除掩膜上的阴影和反射部分,从而使得检测能够准确地框选到实际运动物体(本示例)。如果我们禁用阴影检测,那么倒影或者反射部分可能都会被框选,从而影响检测真正运动物体的准确性。
三、KNN背景差分器
通过修改MOG背景差分脚本的很一小部分代码,即可使用不同的背景差分算法以及不同的形态学参数。
1.用cv2.createBackgroundSubtractorKNN替换cv2.createBackgroundSubtractorMOG2,就可以使用基于KNN聚类(而不是MOG聚类)的背景差分器:
bg_subtractor = cv2.createBackgroundSubtractorKNN(detectShadows=True)
(注意:KNN背景差分器仍然支持detectShadows参数与apply方法)
修改完成之后,就可以使用KNN背景差分器了,可见修改量非常少。
2.当然,此处我们可以使用稍微好点的适应于水平细长物体的形态学核(本例中检测的是运动的汽车,视频地址(GitHub,可下载):traffic.flv),并使用此视频作为输入
erode_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (7, 5))
dilate_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (17, 11))
cap = cv2.VideoCapture('E:/traffic.flv')
3.最后一个小细节,我们将掩膜窗口标题从“mog”更改为“knn”
cv2.imshow('knn', fg_mask)
来源:https://blog.csdn.net/qq_45832961/article/details/122791351
猜你喜欢
- 前言现在我能一整天都严肃地盯着屏幕,看起来就像在很认真地工作,利用摸鱼,打开小说,可实行完美摸鱼,实时保存进度用PYQT5 Mock一个摸鱼
- bool是Boolean的缩写,只有真(True)和假(False)两种取值bool函数只有一个参数,并根据这个参数的值返回真或者假。1.当
- defaultdict 主要用来需要对 value 做初始化的情形。对于字典来说,key 必须是 hashable,immutable,un
- 最近一直在做Dnn模块的开发,过程中碰到这么一个问题,需要同时插入N条数据,不想在程序里控制,但是SQL Sever又不支持数组参数.所以只
- 问题:在使用mask_rcnn预测自己的数据集时,会出现下面错误:ResourceExhaustedError: OOM when allo
- 1.检查重复元素下面的方法可以检查给定列表中是否有重复的元素。它使用了 set() 属性,该属性将会从列表中删除重复的元素。def all_
- 前言:经过上一篇JavaScript 数据结构之集合创建(2)的学习,数据结构的集合部分已经完结了。那么下面我们又要认识一个新的数
- 1. 将Oracle 10g client安装包copy到本地才能安装:2. 双击setup 的到:3. 稍后进入安装界面:4. 选择下一步
- 1. SELECT…FOR UPDATE 是什么?作用是什么?select for update 即排他锁,排他锁又称
- 前言本篇来学习下柱状图的实现柱状图实现步骤ECharts 最基本的代码结构准备x轴的数据准备 y 轴的数据准备 option , 将 ser
- python+selenium编写实现爬虫过程:1.爬虫循环处理table表,2.table表分页处理,3.网页table所有内容循环处理4
- 迭代器跟生成器,与上篇文章讲的装饰器一样,都是属于我的一个老大难问题。通常就是遇到的时候就去搜一下,结果在一大坨各种介绍博客中看了看,回头又
- PyMongo下载PyMongo下载地址:http://pypi.python.org/pypi/pymongo/#downloads当前可
- 在python中我们可以使用openCV给图片添加水印,这里注意openCV无法添加汉字水印,添加汉字水印上可使用PIL库给图片添加水印一:
- 你是否有时想知道什么人访问你的站点,什么时间,IP地址等。下面我就这个问题向大家来阐述一下。这个例子使用文本文件来写入用户的信息创建一个lo
- /*Bresenham画圆算法*/var arc = function(x0,y0,r){/*起点坐标x0,y
- 在教材实例编写雷达图时出现ValueError,具体如下:ValueError: The number of FixedLocator lo
- 现在基于WEB页的HTML的编辑器在新闻系统,文章系统中用得越来越广,一个网页一粘就可以保持原来的样式,同时图片也可以在这个页中保持。但是在
- 数据概况Fashion-mnist经典的MNIST数据集包含了大量的手写数字。十几年来,来自机器学习、机器视觉、人工智能、深度学习领域的研究
- 前言在使用vue过程中,总会用到这样哪样的UI框架,在install这些框架时,往往还需要安装其要求的依赖,或是相关的编译环境,下面将记录描