Python使用背景差分器实现运动物体检测
作者:ReadyGo!!! 发布时间:2023-06-21 09:37:22
前言
目前,许多运动检测技术都是基于简单的背景差分概念的,即假设摄像头(视频)的曝光和场景中的光照条件是稳定的,当摄像头捕捉到新的帧时,我们可以从参考图像中减去该帧,并取这个差的绝对值,以获得帧中每个像素位置的运动测量值。如果帧的任何区域与参考图像有很大的不同,我们就认为给定区域中是一个运动物体。
本文主要简单介绍基本背景差分器,详细介绍MOG背景差分器,KNN背景差分器。
一、基本背景差分器
首先,基本背景差分器可以很好地实现运动物体的检测,代码实现参考此链接
其特点是:此脚本不会动态更新背景图像,即当一个运动的物体静止后,此脚本仍然会标记此物体,除非此物体消失在窗口中,甚至当摄像头运动或者光线变化时,此脚本会直接标记整个窗口直到程序结束。
如果我们希望脚本能够动态的更新背景模型,即当运动物体静止后,静止物体会被纳入背景,标记会逐渐消失,这时,我们就可以采用更灵活、更智能的背景差分器(如MOG背景差分器、KNN背景差分器)。
二、MOG背景差分器
OpenCV提供了一个名为 cv2.BackgroundSubtractor 的类,它有实现各种背景差分算法的子类。
对于MOG背景差分器,OpenCV有两种实现,分别命名为:cv2.BackgroundSubtractorMOG 和 cv2.BackgroundSubtractorMOG2,后者是最新改进的实现,增加了对阴影检测的支持,我们将使用它。
流程
1.导入OpenCV,初始化MOG背景差分器,定义erode(腐蚀)、dilate(膨胀)运算的核大小
import cv2
bg_subtractor = cv2.createBackgroundSubtractorMOG2(detectShadows=True)
erode_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (3, 3))
dilate_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (7, 7))
初始化函数中接收一个参数detectShadows,将其设置为True,就会标记出阴影区域,而不会标记为前景的一部分。
使用腐蚀与膨胀的形态学操作是为了抑制一些细微的振动频率。
2.捕捉摄像头帧,并使用MOG差分器获得背景掩膜
cap = cv2.VideoCapture(0)
success, frame = cap.read()
while success:
fg_mask = bg_subtractor.apply(frame)
当我们把每一帧传递给背景差分器的 apply 方法时,差分器就会更新它的内部背景模型,然后返回一个掩膜。
其中,前景部分的掩膜是白色(255),阴影部分的掩膜是灰色(127),背景部分的掩膜是黑色(0)
3.然后对掩膜应用阈值来获得纯黑白图像,并通过形态学运算对阈值化图像进行平滑处理。
_, thresh = cv2.threshold(fg_mask, 244, 255, cv2.THRESH_BINARY)
cv2.erode(thresh, erode_kernel, thresh, iterations=2)
cv2.dilate(thresh, dilate_kernel, thresh, iterations=2)
(本示例中,我们开启了阴影检测,但我们仍然想把阴影认为是背景,所以对掩膜应用一个接近白色(244)的阈值)
4.现在,如果我们直接查看阈值化后的图像,会发现运动物体呈现白色斑点,我们想找到白色斑点的轮廓,并在其周围绘制轮廓。其中,我们将应用一个基于轮廓面积的阈值,如果轮廓太小,就认为它不是真正的运动物体(或者不使用此阈值),检测轮廓与绘制边框的代码:
contours, hier = cv2.findContours(thresh, cv2.RETR_EXTERNAL,
cv2.CHAIN_APPROX_SIMPLE)
for c in contours:
if cv2.contourArea(c) > 1000:
x, y, w, h = cv2.boundingRect(c)
cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 255, 0), 2)
5.显示掩膜图像/阈值化图像/检测结果图像,继续读取帧,直到按下ESC退出。
cv2.imshow('mog', fg_mask)
cv2.imshow('thresh', thresh)
cv2.imshow('detection', frame)
k = cv2.waitKey(30)
if k == 27: # Escape
break
success, frame = cap.read()
代码编写
import cv2
OPENCV_MAJOR_VERSION = int(cv2.__version__.split('.')[0])
bg_subtractor = cv2.createBackgroundSubtractorMOG2(detectShadows=True)
erode_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (3, 3))
dilate_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (7, 7))
cap = cv2.VideoCapture(0)
success, frame = cap.read()
while success:
fg_mask = bg_subtractor.apply(frame)
_, thresh = cv2.threshold(fg_mask, 244, 255, cv2.THRESH_BINARY)
cv2.erode(thresh, erode_kernel, thresh, iterations=2)
cv2.dilate(thresh, dilate_kernel, thresh, iterations=2)
if OPENCV_MAJOR_VERSION >= 4:
# OpenCV 4 or a later version is being used.
contours, hier = cv2.findContours(thresh, cv2.RETR_EXTERNAL,
cv2.CHAIN_APPROX_SIMPLE)
else:
# OpenCV 3 or an earlier version is being used.
# cv2.findContours has an extra return value.
# The extra return value is the thresholded image, which is
# unchanged, so we can ignore it.
_, contours, hier = cv2.findContours(thresh, cv2.RETR_EXTERNAL,
cv2.CHAIN_APPROX_SIMPLE)
for c in contours:
if cv2.contourArea(c) > 1000:
x, y, w, h = cv2.boundingRect(c)
cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 255, 0), 2)
cv2.imshow('mog', fg_mask)
cv2.imshow('thresh', thresh)
cv2.imshow('detection', frame)
k = cv2.waitKey(30)
if k == 27: # Escape
break
success, frame = cap.read()
cap.release()
cv2.destroyAllWindows()
注意:当我们启用阴影检测时,我们可以通过一个阈值来移除掩膜上的阴影和反射部分,从而使得检测能够准确地框选到实际运动物体(本示例)。如果我们禁用阴影检测,那么倒影或者反射部分可能都会被框选,从而影响检测真正运动物体的准确性。
三、KNN背景差分器
通过修改MOG背景差分脚本的很一小部分代码,即可使用不同的背景差分算法以及不同的形态学参数。
1.用cv2.createBackgroundSubtractorKNN替换cv2.createBackgroundSubtractorMOG2,就可以使用基于KNN聚类(而不是MOG聚类)的背景差分器:
bg_subtractor = cv2.createBackgroundSubtractorKNN(detectShadows=True)
(注意:KNN背景差分器仍然支持detectShadows参数与apply方法)
修改完成之后,就可以使用KNN背景差分器了,可见修改量非常少。
2.当然,此处我们可以使用稍微好点的适应于水平细长物体的形态学核(本例中检测的是运动的汽车,视频地址(GitHub,可下载):traffic.flv),并使用此视频作为输入
erode_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (7, 5))
dilate_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (17, 11))
cap = cv2.VideoCapture('E:/traffic.flv')
3.最后一个小细节,我们将掩膜窗口标题从“mog”更改为“knn”
cv2.imshow('knn', fg_mask)
来源:https://blog.csdn.net/qq_45832961/article/details/122791351
猜你喜欢
- 上次还是CSDN里的朋友回答的,我复制了下来。原文如下 =========================== 利用统计文章字数,然后达到一
- 检查图片是否损坏日常工作中,时常会需要用到图片,有时候图片在下载、解压过程中会损坏,而如果一张一张点击来检查就太不Cool了,因此我想大家都
- 本文实例为大家分享了python定时提取实时日志的具体代码,供大家参考,具体内容如下这是一个定时读取 实时日志文件的程序。目标文件是targ
- 正如你现在所看到的一样,网页的布局设计变得越来越重要。访问者不愿意再看到只注重内容的站点。虽然内容很重要,但只有当网页布局和网页内容成功接合
- 本文实例讲述了python函数enumerate,operator和Counter使用技巧。分享给大家供大家参考,具体如下:最近看人家的代码
- Ubuntu16.04自带python2.7与python3.5,某个项目编译却要求python版本大于等于3.7,遂考虑在原系统基础上再安
- 1.锦短情长为什么选择这个标题,借鉴了一封情书里面的情长纸短,还吻你万千。锦短情长都只谓人走茶凉,怎感觉锦短情长?一提起眼泪汪汪,是明月人心
- 利用OpenCV练习读取图片的时候,图片总是一闪而过,不利于观察,这个时候需要利用到waitKey函数。waitKey函数:用来等待按键,当
- 目录1. 首先2. 编程惯用法3. 基础用法4. 库的使用5. 设计模式6. 内部机制7. 使用工具辅助项目开发8. 性能剖析与优化1. 首
- 首先说明,Supervisor 只能安装在 Python 2.x 环境中!但是基本上所有的 Linux 都同时预装了 Python 2.x
- 装饰器的价值不言而喻,可以用来增强函数功能、简化代码、减少代码冗余。它的使用场景同样很多,比较简单的场景包含打印日志、统计运行时间,这类例子
- 前言上一篇暴力破解文章:一个简单的Python暴力破解网站登录密码脚本测试靶机为Pikachu漏洞练习平台暴力破解模块下的 &ldq
- 使用PHP开发应用程序,尤其是网站程序,常常需要生成随机密码,如用户注册生成随机密码,用户重置密码也需要生成一个随机的密码。随机密码也就是一
- 在上一篇《服务器XMLHTTP(Server XMLHTTP in ASP)基础》中我介绍了一下ServerX
- 体系结构 Microsoft按照客户/服务器体系结构的分布进行操作。这种方法产生不必要的代价和复杂性。在Internet中,Oracle已经
- 一个朋友给她的朋友买礼物。撕心裂肺、绞尽脑汁。最后蹦出来一个主意:“送打火机”我不知道小妞们通过哪的投票,就这么断定男人都喜欢打火机。导致一
- 大家都用过企业管理器中的--“收缩数据库”,里面的功能的确可以收缩数据库的日志文件(.ldf)和数据文件(.mdf),但都会发现同样的问题,
- 本博客将为各位分享Python Helium库,其是在 Selenium库基础上封装的更加高级的 Web 自动化工具,它能够通过网页端可见的
- 自Python3.1中,整数bit_length方法允许查询二进制的位数或长度。常规做法:>>> bin(256)'
- 大家好,我是小五前一阵给大家分享了,Python如何给图片加水印。评论区就有小伙伴问,可不可使用Python去除图片水印的方法呢?这个肯定有