0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

将扫描的PDF转换为可搜索的PDF

倩倩 ? 来源:哲想软件 ? 作者:哲想软件 ? 2022-09-19 09:55 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

将扫描的PDF转换为可搜索的文档

快速精确的基于神经网络的引擎

纠正低质量扫描

120多种语言

.Net2.0+、.Net5、标准、核心

将扫描的PDF转换为可搜索的PDF

4行代码,仅此而已

703028b0-37b0-11ed-ba43-dac502259ad0.png

多亏了简单的API,您可以使用几行代码将扫描的PDF 转换为可搜索的文档。

顺便说一句,不仅仅是PDF。将JPEG、多页TIFF 或 PNG转换为可搜索的 PDF到您的应用程序现在只需几分钟,而不是几小时或几天。

阅读 120多种语言的多种图像格式

Tesseract.NET SDK 可以准确识别120多种语言的文本,支持多语言文本,并且可以通过训练使用以前未知的语言。支持的标准包括英语、法语、意大利语、德语、西班牙语、阿拉伯语、中文、希伯来语、日语、俄语、泰语等。

706ea540-37b0-11ed-ba43-dac502259ad0.png

7093750a-37b0-11ed-ba43-dac502259ad0.png

正确的低质量扫描

例如,去歪斜输入过滤器会自动旋转图像,因此它是正确的向上和正交的。如果页面过于倾斜,则Tesseract的线分割质量会显着降低,这会严重影响OCR 的质量。

70cb1e88-37b0-11ed-ba43-dac502259ad0.png

7115b93e-37b0-11ed-ba43-dac502259ad0.png

Patagames OCR SDK 内置的用于增强OCR性能的输入过滤器包括:二值化、对比度和对比度标准化、去偏斜、增强分辨率、腐蚀和扩张、膨胀和放气、反转、移除边框、旋转、ToGray和白色背景。

为您的.Net 应用程序配备OCR 功能的最佳方式

虽然Tesseract 无疑是迄今为止最好的OCR 库,但Tesseract.NET SDK是为您的应用程序配备文本识别功能的最佳方式之一。

Tesseract.Net SDK 结合了易于部署、卓越的识别精度、快速OCR 和各种输出选项(包括PDF、HOCR、UNLV和纯文本),提供灵活简单的API 以及许多高级和低级文本识别程序。

多亏了简单的API,您可以用几行代码将给定的图像转换为可搜索的文本。如果您需要更详细地了解文本的组成部分,Tesseract.NETSDK API 提供了许多类来检索单个字母、单词、段落甚至字体参数。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • PDF
    PDF
    +关注

    关注

    1

    文章

    173

    浏览量

    34648
  • 代码
    +关注

    关注

    30

    文章

    4908

    浏览量

    71265
  • 应用程序
    +关注

    关注

    38

    文章

    3339

    浏览量

    59239

原文标题:Patagames:正方体.NetSDKC# OCR 库

文章出处:【微信号:哲想软件,微信公众号:哲想软件】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何通过VCOM4个CAN FD消息转换为SLCAN?

    通过VCOM接口M460系列微控制器(MCU)的4条CAN FD消息转换为SLCAN协议,并发送到计算机。
    发表于 08-19 06:23

    【HarmonyOS 5】鸿蒙应用实现发票扫描、文档扫描输出PDF图片或者表格的功能

    【HarmonyOS 5】鸿蒙应用实现发票扫描、文档扫描输出PDF图片或者表格的功能 ##鸿蒙开发能力 ##HarmonyOS SDK应用服务##鸿蒙金融类应用 (金融理财# 一、前言 图(1-1
    的头像 发表于 07-11 18:16 ?433次阅读
    【HarmonyOS 5】鸿蒙应用实现发票<b class='flag-5'>扫描</b>、文档<b class='flag-5'>扫描</b>输出<b class='flag-5'>PDF</b>图片或者表格的功能

    无法Tensorflow Lite模型转换为OpenVINO?格式怎么处理?

    Tensorflow Lite 模型转换为 OpenVINO? 格式。 遇到的错误: FrontEnd API failed with OpConversionFailure:No translator found for TFLite_Detection_PostP
    发表于 06-25 08:27

    YOLOv4模型转换为IR的说明,无法模型转换为TensorFlow2格式怎么解决?

    遵照 YOLOv4 模型转换为 IR 的 说明,但无法模型转换为 TensorFlow2* 格式。 YOLOv4 darknet
    发表于 03-07 07:14

    ONNX模型转换为IR后报错,怎么解决?

    运行模型优化器,以 ONNX 模型转换为 IR。 收到错误:[ ERROR ] The ExpandDims node Unsqueeze_333 has more than 1 input
    发表于 03-05 09:11

    使用myriad_compileIR模型转换为blob后收到错误怎么解决?

    使用模型优化器将自定义 TensorFlow* 2 模型转换为中间表示 (IR)。 使用 myriad_compile IR 模型转换为 blob 并收到错误: 遇到未知输入类型的循环 v5
    发表于 03-05 08:27

    EE-133:ADSP-218x的传统架构文件转换为链接器描述文件

    电子发烧友网站提供《EE-133:ADSP-218x的传统架构文件转换为链接器描述文件.pdf》资料免费下载
    发表于 01-13 16:34 ?0次下载
    EE-133:<b class='flag-5'>将</b>ADSP-218x的传统架构文件<b class='flag-5'>转换为</b>链接器描述文件

    使用pdfDocs提高工作效率,改进PDF工作流程

    pdfDocs? 通常PDF文档很难正确编辑、整理或编辑。这意味着,许多法律专业人士依靠手工方法复杂的PDF文档合并在一起,在MS Word中编辑文本,然后将其转换为
    的头像 发表于 12-21 15:31 ?540次阅读
    使用pdfDocs提高工作效率,改进<b class='flag-5'>PDF</b>工作流程

    基于TPS40055的设计在15安培时12V总线转换为1.8V

    电子发烧友网站提供《基于TPS40055的设计在15安培时12V总线转换为1.8V.pdf》资料免费下载
    发表于 12-16 09:25 ?2次下载
    基于TPS40055的设计在15安培时<b class='flag-5'>将</b>12V总线<b class='flag-5'>转换为</b>1.8V

    基于TPS40051的设计12V总线转换为15A时的1.8V(slup195)

    电子发烧友网站提供《基于TPS40051的设计12V总线转换为15A时的1.8V(slup195).pdf》资料免费下载
    发表于 12-16 09:19 ?0次下载
    基于TPS40051的设计<b class='flag-5'>将</b>12V总线<b class='flag-5'>转换为</b>15A时的1.8V(slup195)

    单开关反激式电路+5 VDC转换为+/-12 VDC,适用于RS-232和RS-422

    电子发烧友网站提供《单开关反激式电路+5 VDC转换为+/-12 VDC,适用于RS-232和RS-422.pdf》资料免费下载
    发表于 10-24 09:40 ?0次下载
    单开关反激式电路<b class='flag-5'>将</b>+5 VDC<b class='flag-5'>转换为</b>+/-12 VDC,适用于RS-232和RS-422

    DN-46高效、低功率DC-DC逆变器5V输入转换为-3V输出

    电子发烧友网站提供《DN-46高效、低功率DC-DC逆变器5V输入转换为-3V输出.pdf》资料免费下载
    发表于 10-22 10:20 ?0次下载
    DN-46高效、低功率DC-DC逆变器<b class='flag-5'>将</b>5V输入<b class='flag-5'>转换为</b>-3V输出

    通过数字隔离器SPI转换为GPIO

    电子发烧友网站提供《通过数字隔离器SPI转换为GPIO.pdf》资料免费下载
    发表于 09-21 10:20 ?0次下载
    通过数字隔离器<b class='flag-5'>将</b>SPI<b class='flag-5'>转换为</b>GPIO

    具有平均输入电流限制的升压转换简化条形码扫描仪的设计应用说明

    电子发烧友网站提供《具有平均输入电流限制的升压转换简化条形码扫描仪的设计应用说明.pdf》资料免费下载
    发表于 09-09 14:33 ?0次下载
    具有平均输入电流限制的升压<b class='flag-5'>转换</b>器<b class='flag-5'>将</b>简化条形码<b class='flag-5'>扫描</b>仪的设计应用说明

    使用逻辑和转换优化机械扫描激光雷达

    电子发烧友网站提供《使用逻辑和转换优化机械扫描激光雷达.pdf》资料免费下载
    发表于 09-03 09:27 ?0次下载
    使用逻辑和<b class='flag-5'>转换</b>优化机械<b class='flag-5'>扫描</b>激光雷达