运用python去除图片水印
作者:程序员启航 发布时间:2021-05-06 10:54:20
由于图片水印的种类有很多,今天我们先讲最简单的一种。
即上图中的①类水印,这种水印存在白色背景上的文档里,水印是灰色,需要保留的文字是黑色。
这种通常可以进行简单的亮度/对比度转换,直到水印消失并降低亮度以进行补偿[1]。参考别人的方法,我发现可以用多种方法去除水印。大致原理比较相似,下面先讲OpenCV的方法。
OpenCV + Numpy
本方法需要使用的库:cv2、numpy。cv2是基于OpenCV的图像处理库,可以对图像进行腐蚀,膨胀等操作;Numpy这是一个强大的处理矩阵和维度运算的库。
函数简介
介绍一下cv2的三个基本函数:使用
img = cv2.imread('test.png')
cv2.imshow('test.png',img)
cv2.waitKey(0)
cv2.imwrite('test_2.png', img)
对于Numpy呢,则要用到np.clip()
,它是一个截取函数,用于截取数组中小于或者大于某值的部分,并使得被截取部分等于固定值。
np.clip(a, a_min, a_max, out=None):
具体用法:
可以看到,数组x中的所有数限定到范围0和5之间。为啥要介绍这些函数呢,接着往下看。
色彩转换
回到本文一开始,我们想去除文档图片中的水印。
上图中我选取了三个点,这三个像素点分别对应背景白色、黑色字体以及灰色的水印。
我们现在要做的事,就是想办法把水印转换成白色背景。换言之,就是把图片中[217,217,217]的像素点转换成[255,255,255]。
当然这个[217,217,217]也不是固定的,只是一个范围。为了方便调整,我选取了一些像素点,做了一个线性回归。
希望把图片整体的像素颜色做一个改变,原有黑色字体尽量跟原来一致,而水印部分则一定要≥255,然后就可以通过np.clip()
限定区间,使之都变成[255,255,255]。
说干就干
import cv2
import numpy as np
img = cv2.imread('test.png')
new = np.clip(1.4057577998008846*img-38.33089999653017, 0, 255).astype(np.uint8)
cv2.imwrite('removed.png', new)
下面我们看看调整后的效果(左侧是转换前,右侧是转换后)。
左:转换前 右:转换后
处理效果还是不错的,说明对于这类文档图片水印,通过几行Python代码就可以轻松去除水印。
不过通过线性回归改变整体图片颜色,也会影响原有的黑色文本,导致其颜色发生了微微变化。
那我们能不能简单粗暴一点!只改变水印的颜色呢?
也可以试试。
PIL + itertools
PIL也是一个Python 图像处理库,其中Image模块是在Python PIL图像处理中常见的模块,对图像进行基础操作的功能基本都包含于此模块内。
itertools
之前更是被我们称为一个零差评的Python内置库。其中itertools.product
用来产生多个列表和迭代器的(积)。
还是跟之前一个原理,我们希望将图片中[217,217,217]的像素点转换成[255,255,255]。
那就简单粗暴一点,也就是像素值相加大概600(217+217+217)以上的像素点,都改成[255,255,255]就好了。
from itertools import product
from PIL import Image
img = Image.open('test.png')
width, height = img.size
for pos in product(range(width), range(height)):
if sum(img.getpixel(pos)[:3]) > 600:
img.putpixel(pos, (255,255,255))
img.save('removed_1.png')
运行结果,对比一下。
左:转换前 右:转换后
与第一种方法对比,肉眼也没看出来太明显差别。
那大家就喜欢那种方法就用哪个吧!
来源:https://blog.csdn.net/aaahtml/article/details/119777122?utm_medium=distribute.pc_feed.none-task-blog-hot-11.nonecase&depth_1-utm_source=distribute.pc_feed.none-task-blog-hot-11.nonecase


猜你喜欢
- 使用TensorFlow的一个优势是,它可以维护操作状态和基于反向传播自动地更新模型变量。 TensorFlow通过计算图来更新变量和最小化
- 一、注释当前行注释:# 被注释内容多行注释:""" 被注释内容 """二、用户输
- Mac安装软件时提示已损坏的解决方法从网上下载的SecureCRT、Principle等设计软件,以及输入法等常用软件,安装时可能会提示&a
- 一、前言别问我为啥题目是英文,因为…高大上(bushi。刷视频的时候偶然刷到了一个关于生日悖论的,当场就觉得不可思议,
- 前提条件1.了解Python语言,并会安装第三方库2.了解Python Web Flask框架3.了解PyTorch深度学习框架实验环境Py
- 1、使用字符串函数replace>>> a = 'hello world'>>> a.r
- 一、数据库的操作1、新建数据库2、打开数据库右键或者双击就可以了。3、删除数据库右键–>删除数据库4、修改数据库右键–>数据库属
- 本文为大家分享了Linux环境下mysql5.6.24自动安装脚本代码,供大家参考,具体内容如下说明:一、本脚本仅供测试使用,若正式环境想要
- 一 概念1. 原理2. 好处不同项目可能用到的环境不同,运用虚拟环境能将不同环境分隔开二 virtualenvvirtual 虚拟的1. 安
- 在云计算大行其道的时代,当你要部署一个网站时第一选择肯定是各式各样的云端服务。那么究竟使用什么样的云端服务才能够以最快捷的方式部署一个 AS
- table a(id, type):id type --------------------
- 本文实例讲述了jQuery选择器用法。分享给大家供大家参考,具体如下:jQuery 使用两种方式来选择 html 的 element,第一种
- 并发是一个很酷的话题,一旦你掌握了它,就会成为一笔巨大的财富。说实话,我一开始很害怕写这篇文章,因为我自己直到最近才对并发性不太适应。我已经
- sort包简介官方文档Golang的sort包用来排序,二分查找等操作。本文主要介绍sort包里常用的函数,通过实例代码来快速学会使用sor
- 按下键的时候,焦点要落在窗口上,不能落在cmd窗口上。另外,一般在imshow()后要使用waitKey(),给图像绘制留下时间,不然窗口会
- 一、安装首先根据自己的python版本下载pyqt4离线包,现在连接:https://www.lfd.uci.edu/~gohlke/pyt
- 迭代器是一种支持next()操作的对象。它包含一组元素,当执行next()操作时,返回其中一个元素;当所有元素都被返回后,生成一个StopI
-   MySQL行转列,对经常处理数据的同学们来说,一定是不陌生的,甚至是印象深刻,因为它大概率困扰过你,
- 很多初学者会使用windows作为开发机使用, 今天就来看下如何在win10和Linux下分别安装Python虚机环境。虚机环境有非常多的优
- 关于数据库性能的故事面试时多多少少会讲到数据库上的事情,“你对数据库的掌握如何?”,什么时候最考验数据库的性能,答应主要方面上讲就是大数据量