C

程序员有二十年 2024-11-04 11:42:44

本文将介绍如何使用C#代码来实现OCR功能。

一、在VS中新建一个控制台应用,选择.net框架,.net6.0~8.0均可。

创建好的项目如下图,然后在配置管理器中修改活动解决方案平台为x64,以及项目平台设置为x64。

二、安装 PaddleOCRSharp包

在nuget包管理器中,搜索PaddleOCRSharp,并安装最新版本,当前最新版本4.4.0.2。

三、编写代码

在main()方法中,键入以下代码:并准备好一张用于测试的图片,

//使用缺省OCR模型(PPOCR中英文V4模型)进行文字识别,并输出结果 Console.WriteLine(new PaddleOCRSharp.PaddleOCREngine().DetectText("D:\\test.jpg").Text); //等待输入,用于控制台不直接退出。 Console.ReadKey()

然后按F5运行,查看识别结果。

你学会了吗?赶快动手实践吧!!!

四、PaddleOCRSharp简介

PaddleOCRSharp 是一个基于百度飞桨PaddleOCR的开源代码修改并优化的.NET版本OCR可离线使用类库。项目核心组件PaddleOCR.dll,由C++编写,根据百度飞桨PaddleOCR的C++代码修改并优化而成。目前已经支持C++、.NET、Python、Golang、Rust等众多开发语言的直接API接口调用。项目包含文本识别、文本检测、表格识别功能。本项目针对小图识别不准的情况下做了优化,同时做了其他优化,比飞桨原代码识别准确率有所提高,速度更快。包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持中英文、纯英文以及多种语言文本检测识别。

PaddleOCRSharp封装极其简化,实际调用仅几行代码,极大的方便了中下游开发者的使用和降低了PaddleOCR的使用入门级别,同时提供不同的.NET框架使用,方便各个行业应用开发与部署。Nuget包即装即用,可以离线部署,不需要网络就可以识别的高精度中英文OCR。

本项目支持官方所有公开的通用OCR模型,PPOCRV2、PPOCRV3、PPOCRV4。如果使用v2模型,请设置OCR识别参数OCRParameter对象的属性rec_img_h=32 ,最新版本默认使用V4模型,默认rec_img_h=48:

本项目支持在x86的CPU上使用,CPU指令集需要包含avx指令集。

★windows系统支持:win7SP1、win10、win11、winserver2012R2、winserver2016、winserver2019、winserver2022等

★linux系统支持(有偿服务):统信UOS、麒麟、ubuntu、CentOS8等绿色离线部署。

本项目目前支持以下.NET框架:

net35;net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;net481;netstandard2.0;netcoreapp3.1;net5.0;net6.0;net7.0;net8.0

五、结束语

PaddleOCR部署采用C++编码,具有以下特点:

高性能:

PaddleOCR基于PaddlePaddle深度学习框架,后者具有强大的计算性能和高效的并行计算能力。这使得PaddleOCR能够快速处理大规模的文本识别任务,尤其适用于需要高速处理大量图像数据的场景。

通过C++的部署方案,PaddleOCR能够进一步利用C++的高性能特性,优化内存管理和计算效率,从而提升整体性能。

多功能性:

PaddleOCR支持多种文本识别任务,包括文字检测、文字识别、场景文字识别等。这些功能通过C++的部署方案同样可以得到支持,满足不同场景下的文字识别需求。

此外,PaddleOCR还支持多种语言和手写体的识别,进一步扩展了其应用场景。

易用性:

PaddleOCR提供了简洁易用的API接口,方便开发者在C++环境中快速部署和使用OCR功能。

同时,PaddleOCR还提供了详细的文档和示例代码,帮助开发者快速上手并进行二次开发。

开源免费:

PaddleOCR是开源项目,其代码和模型都可以免费获取和使用。这意味着开发者可以根据自己的需求自由修改和定制PaddleOCR,以满足特定的应用场景。

支持定制化和扩展:

开发者可以根据自己的需求选择合适的PaddleOCR模型,并进行定制化和扩展。例如,可以通过训练自己的模型来优化特定场景下的识别效果。

此外,PaddleOCR还支持多种后端和前端技术的集成,方便开发者将其嵌入到自己的应用系统中。

通过结合PaddlePaddle深度学习框架的强大功能和C++的高性能特性,PaddleOCR能够为用户提供高效、准确、易用的OCR解决方案。

其他文章:

超赞!PaddleOCR在国产麒麟系统中的离线绿色部署

如何5分钟上手使用PaddleSeg人像抠图

图像处理技术OpencvSharp入门课程

0 阅读:0

程序员有二十年

简介:感谢大家的关注