python简单实现图片文字分割
作者:上不了山的小非洲 发布时间:2023-07-31 23:36:24
标签:python,图片文字,分割
本文实例为大家分享了python简单实现图片文字分割的具体代码,供大家参考,具体内容如下
原图:
图片预处理:图片二值化以及图片降噪处理。
# 图片二值化
def binarization(img,threshold):
#图片二值化操作
width,height=img.size
im_new = img.copy()
for i in range(width):
for j in range(height):
a = img.getpixel((i, j))
aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
if (aa <= threshold):
im_new.putpixel((i, j), (0, 0, 0))
else:
im_new.putpixel((i, j), (255, 255, 255))
# im_new.show() # 显示图像
return im_new
# 图片降噪处理
def clear_noise(img):
# 图片降噪处理
x, y = img.width, img.height
for i in range(x-1):
for j in range(y-1):
if sum_9_region(img, i, j) < 600:
# 改变像素点颜色,白色
img.putpixel((i, j), (255,255,255))
# img = np.array(img)
# # cv2.imwrite('handle_two.png', img)
# # img = Image.open('handle_two.png')
img.show()
return img
# 获取田字格内当前像素点的像素值
def sum_9_region(img, x, y):
"""
田字格
"""
# 获取当前像素点的像素值
a1 = img.getpixel((x - 1, y - 1))[0]
a2 = img.getpixel((x - 1, y))[0]
a3 = img.getpixel((x - 1, y+1 ))[0]
a4 = img.getpixel((x, y - 1))[0]
a5 = img.getpixel((x, y))[0]
a6 = img.getpixel((x, y+1 ))[0]
a7 = img.getpixel((x+1 , y - 1))[0]
a8 = img.getpixel((x+1 , y))[0]
a9 = img.getpixel((x+1 , y+1))[0]
width = img.width
height = img.height
if a5 == 255: # 如果当前点为白色区域,则不统计邻域值
return 2550
if y == 0: # 第一行
if x == 0: # 左上顶点,4邻域
# 中心点旁边3个点
sum_1 = a5 + a6 + a8 + a9
return 4*255 - sum_1
elif x == width - 1: # 右上顶点
sum_2 = a5 + a6 + a2 + a3
return 4*255 - sum_2
else: # 最上非顶点,6邻域
sum_3 = a2 + a3+ a5 + a6 + a8 + a9
return 6*255 - sum_3
elif y == height - 1: # 最下面一行
if x == 0: # 左下顶点
# 中心点旁边3个点
sum_4 = a5 + a8 + a7 + a4
return 4*255 - sum_4
elif x == width - 1: # 右下顶点
sum_5 = a5 + a4 + a2 + a1
return 4*255 - sum_5
else: # 最下非顶点,6邻域
sum_6 = a5+ a2 + a8 + a4 +a1 + a7
return 6*255 - sum_6
else: # y不在边界
if x == 0: # 左边非顶点
sum_7 = a4 + a5 + a6 + a7 + a8 + a9
return 6*255 - sum_7
elif x == width - 1: # 右边非顶点
sum_8 = a4 + a5 + a6 + a1 + a2 + a3
return 6*255 - sum_8
else: # 具备9领域条件的
sum_9 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9
return 9*255 - sum_9
经过二值化和降噪后得到的图片
对图片进行水平投影与垂直投影:
# 传入二值化后的图片进行垂直投影
def vertical(img):
"""传入二值化后的图片进行垂直投影"""
pixdata = img.load()
w,h = img.size
ver_list = []
# 开始投影
for x in range(w):
black = 0
for y in range(h):
if pixdata[x,y][0] == 0:
black += 1
ver_list.append(black)
# 判断边界
l,r = 0,0
flag = False
t=0#判断分割数量
cuts = []
for i,count in enumerate(ver_list):
# 阈值这里为0
if flag is False and count > 0:
l = i
flag = True
if flag and count == 0:
r = i-1
flag = False
cuts.append((l,r))#记录边界点
t += 1
#print(t)
return cuts,t
# 传入二值化后的图片进行水平投影
def horizontal(img):
"""传入二值化后的图片进行水平投影"""
pixdata = img.load()
w,h = img.size
ver_list = []
# 开始投影
for y in range(h):
black = 0
for x in range(w):
if pixdata[x,y][0] == 0:
black += 1
ver_list.append(black)
# 判断边界
l,r = 0,0
flag = False
# 分割区域数
t=0
cuts = []
for i,count in enumerate(ver_list):
# 阈值这里为0
if flag is False and count > 0:
l = i
flag = True
if flag and count == 0:
r = i-1
flag = False
cuts.append((l,r))
t += 1
return cuts,t
这两段代码目的主要是为了分割得到水平和垂直位置的每个字所占的大小,接下来就是对预处理好的图片文字进行分割。
# 创建获得图片路径并处理图片函数
def get_im_path():
OpenFile = tk.Tk()#创建新窗口
OpenFile.withdraw()
file_path = filedialog.askopenfilename()
im = Image.open(file_path)
# 阈值
th = getthreshold(im) - 16
print(th)
# 原图直接二值化
im_new1 = binarization(im, th)
im_new1.show()
# 直方图均衡化
im1 = his_bal(im)
im1.show()
im_new_np = np.array(his_bal(im))
th1 = getthreshold(im1) - 16
print(th1)
# 二值化
im_new = binarization(im1, th1)
# 降噪
im_new_cn = clear_noise(im_new)
height = im_new_cn.size[1]
print(height)
# 算出水平投影和垂直投影的数值
v, vt = vertical(im_new1)
h, ht = horizontal(im_new1)
# 算出分割区域
a = []
for i in range(vt):
a.append((v[i][0], 0, v[i][1], height))
print(a)
im_new.show() # 直方图均衡化后再二值化
# 切割
for i, n in enumerate(a, 1):
temp = im_new_cn.crop(n) # 调用crop函数进行切割
temp.show()
temp.save("c/%s.png" % i)
至此大概就完成了。
接下来是文件的全部代码:
import numpy as np
from PIL import Image
import queue
import matplotlib.pyplot as plt
import tkinter as tk
from tkinter import filedialog#导入文件对话框函数库
window = tk.Tk()
window.title('图片选择界面')
window.geometry('400x100')
var = tk.StringVar()
# 创建获得图片路径并处理图片函数
def get_im_path():
OpenFile = tk.Tk()#创建新窗口
OpenFile.withdraw()
file_path = filedialog.askopenfilename()
im = Image.open(file_path)
# 阈值
th = getthreshold(im) - 16
print(th)
# 原图直接二值化
im_new1 = binarization(im, th)
im_new1.show()
# 直方图均衡化
im1 = his_bal(im)
im1.show()
im_new_np = np.array(his_bal(im))
th1 = getthreshold(im1) - 16
print(th1)
# 二值化
im_new = binarization(im1, th1)
# 降噪
im_new_cn = clear_noise(im_new)
height = im_new_cn.size[1]
print(height)
# 算出水平投影和垂直投影的数值
v, vt = vertical(im_new1)
h, ht = horizontal(im_new1)
# 算出分割区域
a = []
for i in range(vt):
a.append((v[i][0], 0, v[i][1], height))
print(a)
im_new.show() # 直方图均衡化后再二值化
# 切割
for i, n in enumerate(a, 1):
temp = im_new_cn.crop(n) # 调用crop函数进行切割
temp.show()
temp.save("c/%s.png" % i)
# 传入二值化后的图片进行垂直投影
def vertical(img):
"""传入二值化后的图片进行垂直投影"""
pixdata = img.load()
w,h = img.size
ver_list = []
# 开始投影
for x in range(w):
black = 0
for y in range(h):
if pixdata[x,y][0] == 0:
black += 1
ver_list.append(black)
# 判断边界
l,r = 0,0
flag = False
t=0#判断分割数量
cuts = []
for i,count in enumerate(ver_list):
# 阈值这里为0
if flag is False and count > 0:
l = i
flag = True
if flag and count == 0:
r = i-1
flag = False
cuts.append((l,r))#记录边界点
t += 1
#print(t)
return cuts,t
# 传入二值化后的图片进行水平投影
def horizontal(img):
"""传入二值化后的图片进行水平投影"""
pixdata = img.load()
w,h = img.size
ver_list = []
# 开始投影
for y in range(h):
black = 0
for x in range(w):
if pixdata[x,y][0] == 0:
black += 1
ver_list.append(black)
# 判断边界
l,r = 0,0
flag = False
# 分割区域数
t=0
cuts = []
for i,count in enumerate(ver_list):
# 阈值这里为0
if flag is False and count > 0:
l = i
flag = True
if flag and count == 0:
r = i-1
flag = False
cuts.append((l,r))
t += 1
return cuts,t
# 获得阈值算出平均像素
def getthreshold(im):
#获得阈值 算出平均像素
wid, hei = im.size
hist = [0] * 256
th = 0
for i in range(wid):
for j in range(hei):
gray = int(0.3 * im.getpixel((i, j))[0] + 0.59 * im.getpixel((i, j))[1] + 0.11 * im.getpixel((i, j))[2])
th = gray + th
hist[gray] += 1
threshold = int(th/(wid*hei))
return threshold
# 直方图均衡化 提高对比度
def his_bal(im):
#直方图均衡化 提高对比度
# 统计灰度直方图
im_new = im.copy()
wid, hei = im.size
hist = [0] * 256
for i in range(wid):
for j in range(hei):
gray = int(0.3*im.getpixel((i,j))[0]+0.59*im.getpixel((i,j))[1]+0.11*im.getpixel((i,j))[2])
hist[gray] += 1
# 计算累积分布函数
cdf = [0] * 256
for i in range(256):
if i == 0:
cdf[i] = hist[i]
else:
cdf[i] = cdf[i - 1] + hist[i]
# 用累积分布函数计算输出灰度映射函数LUT
new_gray = [0] * 256
for i in range(256):
new_gray[i] = int(cdf[i] / (wid * hei) * 255 + 0.5)
# 遍历原图像,通过LUT逐点计算新图像对应的像素值
for i in range(wid):
for j in range(hei):
gray = int(0.3*im.getpixel((i,j))[0]+0.59*im.getpixel((i,j))[1]+0.11*im.getpixel((i,j))[2])
im_new.putpixel((i, j), new_gray[gray])
return im_new
# 图片二值化
def binarization(img,threshold):
#图片二值化操作
width,height=img.size
im_new = img.copy()
for i in range(width):
for j in range(height):
a = img.getpixel((i, j))
aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
if (aa <= threshold):
im_new.putpixel((i, j), (0, 0, 0))
else:
im_new.putpixel((i, j), (255, 255, 255))
# im_new.show() # 显示图像
return im_new
# 图片降噪处理
def clear_noise(img):
# 图片降噪处理
x, y = img.width, img.height
for i in range(x-1):
for j in range(y-1):
if sum_9_region(img, i, j) < 600:
# 改变像素点颜色,白色
img.putpixel((i, j), (255,255,255))
# img = np.array(img)
# # cv2.imwrite('handle_two.png', img)
# # img = Image.open('handle_two.png')
img.show()
return img
# 获取田字格内当前像素点的像素值
def sum_9_region(img, x, y):
"""
田字格
"""
# 获取当前像素点的像素值
a1 = img.getpixel((x - 1, y - 1))[0]
a2 = img.getpixel((x - 1, y))[0]
a3 = img.getpixel((x - 1, y+1 ))[0]
a4 = img.getpixel((x, y - 1))[0]
a5 = img.getpixel((x, y))[0]
a6 = img.getpixel((x, y+1 ))[0]
a7 = img.getpixel((x+1 , y - 1))[0]
a8 = img.getpixel((x+1 , y))[0]
a9 = img.getpixel((x+1 , y+1))[0]
width = img.width
height = img.height
if a5 == 255: # 如果当前点为白色区域,则不统计邻域值
return 2550
if y == 0: # 第一行
if x == 0: # 左上顶点,4邻域
# 中心点旁边3个点
sum_1 = a5 + a6 + a8 + a9
return 4*255 - sum_1
elif x == width - 1: # 右上顶点
sum_2 = a5 + a6 + a2 + a3
return 4*255 - sum_2
else: # 最上非顶点,6邻域
sum_3 = a2 + a3+ a5 + a6 + a8 + a9
return 6*255 - sum_3
elif y == height - 1: # 最下面一行
if x == 0: # 左下顶点
# 中心点旁边3个点
sum_4 = a5 + a8 + a7 + a4
return 4*255 - sum_4
elif x == width - 1: # 右下顶点
sum_5 = a5 + a4 + a2 + a1
return 4*255 - sum_5
else: # 最下非顶点,6邻域
sum_6 = a5+ a2 + a8 + a4 +a1 + a7
return 6*255 - sum_6
else: # y不在边界
if x == 0: # 左边非顶点
sum_7 = a4 + a5 + a6 + a7 + a8 + a9
return 6*255 - sum_7
elif x == width - 1: # 右边非顶点
sum_8 = a4 + a5 + a6 + a1 + a2 + a3
return 6*255 - sum_8
else: # 具备9领域条件的
sum_9 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9
return 9*255 - sum_9
btn_Open = tk.Button(window,
text='打开图像', # 显示在按钮上的文字
width=15, height=2,
command=get_im_path) # 点击按钮式执行的命令
btn_Open.pack()
# 运行整体窗口
window.mainloop()
来源:https://blog.csdn.net/weixin_43898483/article/details/110950073
0
投稿
猜你喜欢
- 数据库的访问是所有编程语言中最重要的部分,C#提供了ADO.Net部件用于对数据库进行访问。我们将从最简单易用的微软Access数据库入手讨
- Atom是一款功能强大的跨平台编辑器,插件化的解决方案为atom社区的繁荣奠定了基础。任何人都可以把自己做的组件贡献在github上,并能方
- SymPy是符号数学的Python库。它的目标是成为一个全功能的计算机代数系统,同时保持代码简洁、易于理解和扩展#coding:utf-8&
- 不要使用Logrus这其实和泛型有关。因为Go语言是一门强类型的静态语言,所以你不可能像NodeJS或者PHP那样绕过数据类型。那如果我们还
- 前言如何从图像中提取特征?第一次听说“特征提取”一词是在 YouTube 上的机器学习视频教程中,它
- 最近需要用python根据收集到的数据进行绘图,决定使用rrd数据库,然后配合rrdtool来绘图,故学习一下rrdtool的用法。用法如下
- 如何制作一个弹出式的调查窗口?执行下面这段ASP代码: <% &n
- 本教程为大家分享了Fly Bird小游戏的制作流程,供大家参考,具体内容如下1.分析页面结构,理清需求和功能游戏有三个界面,分别是开始界面,
- 本文研究的主要是Python内建模块struct的相关内容,具体如下。Python中变量的类型只有列表、元祖、字典、集合等高级抽象类型,并没
- 我很久前在YAHOO上扣的代码,兼容性很好,在Windows下的主流浏览器中可以正常运行。大家先不要急着下载代码,你随时都可以下,我们来分
- 实例如下所示:# -*- coding:utf-8 -*- #os模块中包含很多操作文件和目录的函数 import os #获取目标文件夹的
- 目录Python的安装VS Code配置Hello World测试调用Python函数string.split()第一次尝试第二次尝试第三次
- 在安装依然主机管理系统时,因为当时导入MSSQL时有点问题,所以,为了赶快能用上管理功能,所以就暂时先用了Access数据库。不过一直以来都
- Tesseract介绍tesseract是一个挺不错的OCR引擎,目前的问题是最新的中文资料相对较少,过时、不准确的信息偏多。tessera
- 网上考试设计思路是怎样的?为了运行这个应用程序,我们需要在global.asa文件里进行设置数据库的连接。global.asa <&n
- 检测文件夹,拷贝有更新的文件到对应目录 2016.5.19亲测可用,若有借鉴请修改下文件路径;学习python小一个月后写的这个功能,属于初
- 前言PyTorch是一个开源的深度学习框架,基础教学从开始安装学起,一步一个脚印。提示:以下是本篇文章正文内容,下面案例可供参考一、Pyor
- MySQL 如何从表中取出随机数据 以前在群里讨论过这个问题,比较的有意思.mysql的语法真好玩. 他们原来都想用P
- 本文实例为大家分享了python实现最大优先队列的具体代码,供大家参考,具体内容如下说明:为了增强可复用性,设计了两个类,Heap类和Pri
- 前言之前写过一篇关于阿里的低代码工具LowCodeEngine 的文章,发现大家还是挺感兴趣的。最近又发现了一款很有意思的低代码工具Yao,