软件编程
位置:首页>> 软件编程>> C#编程>> C#使用Tesseract进行Ocr识别的方法实现

C#使用Tesseract进行Ocr识别的方法实现

作者:杆楷  发布时间:2022-12-15 06:54:23 

标签:C#,Ocr,识别

1.Nuget搜索Tesseract

C#使用Tesseract进行Ocr识别的方法实现

2.项目安装Tesseract

C#使用Tesseract进行Ocr识别的方法实现

3.引用命名空间

using Tesseract;

C#使用Tesseract进行Ocr识别的方法实现

4.上Github下载别人的训练库

https://github.com/tesseract-ocr/tessdata 这里下载中文的chi_sim.traineddata,放到了D盘根目录

C#使用Tesseract进行Ocr识别的方法实现

5.选择图片进行识别

我把图片命名为image.jpg放在了D盘根目录

//图片文件路径
string imageFileName = @"D:\image.png";
//创建位图对象
Bitmap image = new Bitmap(imageFileName);

//Tesseract.Page
Page page = new TesseractEngine(@"D:\", "chi_sim", EngineMode.Default).Process(PixConverter.ToPix(image));
//释放程序对图片的占用
image.Dispose();

//打印识别率
Console.WriteLine(String.Format("{0:P}", page.GetMeanConfidence()));
//打印识别文本 //替换'/n'为'(空)'//替换'(空格)'为'(空)'
Console.WriteLine(page.GetText().Replace("\n", "").Replace(" ", ""));

C#使用Tesseract进行Ocr识别的方法实现

识别率为百分之84,识别文字为立白liby

来源:https://blog.csdn.net/weixin_46616558/article/details/125179506

0
投稿

猜你喜欢

手机版 软件编程 asp之家 www.aspxhome.com