Python编程OpenCV和Numpy图像处理库实现图片去水印
作者:朱小五是凹凸君呀 发布时间:2023-10-10 15:12:44
大家好,我是小五
前一阵给大家分享了,Python如何给图片加水印。评论区就有小伙伴问,可不可使用Python去除图片水印的方法呢?
这个肯定有啊,不过由于图片水印的种类有很多,今天我们先讲最简单的一种。
即上图中的①类水印,这种水印存在白色背景上的文档里,水印是灰色,需要保留的文字是黑色。
这种通常可以进行简单的亮度/对比度转换,直到水印消失并降低亮度以进行补偿。
参考别人的方法,我发现可以用多种方法去除水印。大致原理比较相似,下面先讲OpenCV的方法。
OpenCV + Numpy
本方法需要使用的库:cv2、numpy。cv2是基于OpenCV的图像处理库,可以对图像进行腐蚀,膨胀等操作;Numpy这是一个强大的处理矩阵和维度运算的库。
函数简介
介绍一下cv2的三个基本函数:使用cv2.imread()
,cv2.imshow()
,cv2.imwrite()
分别可以读取、显示和保存图像。
img = cv2.imread('test.png')
cv2.imshow('test.png',img)
cv2.waitKey(0)
cv2.imwrite('test_2.png', img)
对于Numpy呢,则要用到np.clip()
,它是一个截取函数,用于截取数组中小于或者大于某值的部分,并使得被截取部分等于固定值。
np.clip(a, a_min, a_max, out=None):
具体用法:
可以看到,数组x中的所有数限定到范围0和5之间。为啥要介绍这些函数呢,接着往下看。
色彩转换
回到本文一开始,我们想去除文档图片中的水印。
上图中我选取了三个点,这三个像素点分别对应背景白色、黑色字体以及灰色的水印。
我们现在要做的事,就是想办法把水印转换成白色背景。换言之,就是把图片中[217,217,217]的像素点转换成[255,255,255]。
当然这个[217,217,217]也不是固定的,只是一个范围。为了方便调整,我选取了一些像素点,做了一个线性回归。
希望把图片整体的像素颜色做一个改变,原有黑色字体尽量跟原来一致,而水印部分则一定要≥255,然后就可以通过np.clip()
限定区间,使之都变成[255,255,255]。
说干就干
import cv2
import numpy as np
img = cv2.imread('test.png')
new = np.clip(1.4057577998008846*img-38.33089999653017, 0, 255).astype(np.uint8)
cv2.imwrite('removed.png', new)
下面我们看看调整后的效果(左侧是转换前,右侧是转换后)。
处理效果还是不错的,说明对于这类文档图片水印,通过几行Python代码就可以轻松去除水印。
不过通过线性回归改变整体图片颜色,也会影响原有的黑色文本,导致其颜色发生了微微变化。
那我们能不能简单粗暴一点!只改变水印的颜色呢?
也可以试试。
PIL + itertools
PIL也是一个Python 图像处理库,其中Image模块是在Python PIL图像处理中常见的模块,对图像进行基础操作的功能基本都包含于此模块内。
itertools
之前更是被我们称为一个 零差评的 Python 内置库。其中itertools.product
用来产生多个列表和迭代器的(积)。
还是跟之前一个原理,我们希望将图片中[217,217,217]的像素点转换成[255,255,255]。
那就简单粗暴一点,也就是像素值相加大概600(217+217+217)以上的像素点,都改成[255,255,255]就好了。
from itertools import product
from PIL import Image
img = Image.open('test.png')
width, height = img.size
for pos in product(range(width), range(height)):
if sum(img.getpixel(pos)[:3]) > 600:
img.putpixel(pos, (255,255,255))
img.save('removed_1.png')
运行结果,对比一下。
与第一种方法对比,肉眼也没看出来太明显差别。
那大家就喜欢那种方法就用哪个吧!
来源:https://blog.csdn.net/zhuxiao5/article/details/119842129


猜你喜欢
- python新手一枚,操作系统Win10 64 bit,Python版本,3.7因为某个脚本需要用到win32con 和win32api模块
- 看完了这个你就可以用asp修改注册表了!大名鼎鼎的WSH听说过吗? 它就是Windows script Host的缩写形式,WSH是Wind
- 前言聚簇索引就是innodb默认创建的基于主键的索引结构,而且表里的数据就是直接放在聚簇索引里,作为叶节点的数据页:基于主键的数据搜索:从聚
- 早上我偶然看见一篇介绍两个Python脚本的博文,其中一个效率更高。这篇博文已经被删除,所以我没办法给出文章链接,但脚本基本可以归结如下:f
- tf.gather和gather_nd从params中收集数值,tf.scatter_nd 和 tf.scatter_nd_update用u
- 有台服务器,访问量挺大,每天近250w动态pv,数据库查询平均每秒近600次 另一台服务器,跑的程序跟这台一样,不过只有每天约40w动态pv
- 如下所示:#!/usr/bin/python# -*- coding:utf8 -*-import xlwtimport osworkboo
- 这篇文章主要介绍了python通过移动端访问查看电脑界面,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的
- 今天为大家介绍Python当中一个很好用也是很基础的工具库,叫做collections。collection在英文当中有容器的意思,所以顾名
- 问题:生产环境的操作系统和数据库可能是英文版的,而我们的母语是中文,如果英语能力差点,可能有时对英语环境下的数据库脚本报错的英文提示看不懂,
- 本文实例讲述了JS数组中对象去重操作。分享给大家供大家参考,具体如下:<!DOCTYPE html><html lang=
- 处理办法,删除该文件,或清空该文件内容;我的处理是清空后,再设置该文件权限为Everyone拒绝访问。
- Pytorch中torch.nn.Softmax的dim参数使用含义涉及到多维tensor时,对softmax的参数dim总是很迷,下面用一
- 1.双击setup.exe.(出现安装向导界面) 2.在安装向导界面:选"基本安装",并选好主目录位置;创建启动数据库(
- 官网下载就好, https://www.python.org/downloads/release/python-352/用installer
- 原始值->基本类型Number String Boolean undefined null存储在栈(stack)中的简单数据段,也就是
- Pandas 处理数据的效率还是很优秀的,相对于大规模的数据集只要掌握好正确的方法,就能让在数据处理时间上节省很多很多的时间。Pandas
- 平时在PL/SQL中的编程中遇到一些问题,这里以问答的形式来进行把它们总结下来,以供大家分享。1、当需要向表中装载大量的数据流或者需要处理大
- 目录总体思路:判断链接是否指向文件:下载文件:获取 url 下的所有链接:最近维基 jie mi 彻底公开了网站的全部文件,我就在想如何使用
- 目录一、运行效果二、实现方法1. 爬虫部分2.Tkinter部分三、打包四、代码获取今天咱们用Python爬虫和Tkinter界面来做一个翻