0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于算力魔方与PP-OCRv5的OpenVINO智能文档识别方案

jf_23871869 ? 来源:刘力 ? 作者:刘力 ? 2025-06-12 21:19 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:算力魔方创始人/英特尔创新大使刘力

一,引言

随着人工智能技术的快速发展,光学字符识别(OCR)技术已从传统的模式识别方法演进到基于深度学习的端到端解决方案。百度飞桨(PaddlePaddle)团队最新推出的PP-OCRv5模型在精度和效率上实现了显著突破,结合Intel OpenVINO工具套件的硬件加速能力,能够为各类文档处理场景提供更强大的支持。

wKgZO2hK04OAbz6DAAN7J7Meu-o969.png

二,算力魔方简介

算力魔方是一款可以DIY的迷你主机,采用了抽屉式设计,后续组装、升级、维护只需要拔插模块。通过选择不同算力的计算模块,再搭配不同的 IO 模块可以组成丰富的配置,适应不同场景。

性能不够时,可以升级计算模块提升算力;IO 接口不匹配时,可以更换 IO 模块调整功能,而无需重构整个系统。

本文以下所有步骤将在带有Intel i5-1165G7处理器的算力魔方上完成验证。

三,实施步骤

1,准备工作

安装Miniconda并创建虚拟环境:

conda create -n PP-OCRv5_OpenVINO python=3.11 #创建虚拟环境

conda activate PP-OCRv5_OpenVINO #激活虚拟环境

python -m pip install --upgrade pip #升级pip到最新版本

pip install -r requirements.txt # 安装所需的软件包

wKgZPGhK05KARlVoAAIV0LmXzmM172.png

wKgZO2hK05KAKyxOAAEqOmMHnF0235.png

2,模型部署

下载并安装PaddlePaddle 和 PaddleOCRpip install paddlepaddle #安装

paddlepaddlepip install paddleocr #安装

paddleocrpip install onnx==1.16.0 #安装

onnxpaddleocr install_hpi_deps cpu #调用并运行组件

wKgZPGhK05qAAa-_AAU8OF6013E961.png

3,下载PP-OCRv5_server 预训练模型

wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_server_det_infer.tar && tar -xvf PP-OCRv5_server_det_infer.tar # 下载并解压 PP-OCRv5_server_det 预训练模型

Wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_server_rec_infer.tar && tar -xvf PP-OCRv5_server_rec_infer.tar # 下载并压缩 PP-OCRv5_server_rec 预训练模型

wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-LCNet_x1_0_doc_ori_infer.tar && tar -xvf PP-LCNet_x1_0_doc_ori_infer.tar # 下载并压缩 PP-OCRv5_server_cls 预训练模型

wKgZO2hK06GAFGybAALFU9HQb8g892.png

4,将PP-OCRv5_server 模型导出至 ONNX

paddlex --paddle2onnx --paddle_model_dir ./PP-OCRv5_server_det_infer --onnx_model_dir ./PP-OCRv5_server_det_onnx# 将 PP-OCRv5_server_det 导出到 ONNX

paddlex --paddle2onnx --paddle_model_dir ./PP-OCRv5_server_rec_infer --onnx_model_dir ./PP-OCRv5_server_rec_onnx# 将 PP-OCRv5_server_rec 导出到 ONNX

paddlex --paddle2onnx --paddle_model_dir ./PP-LCNet_x1_0_doc_ori_infer --onnx_model_dir ./PP-OCRv5_server_cls_onnx# 将 PP-OCRv5_server_cls 导出到 ONNX

wKgZPGhK06eAd3EPAAQyb69tJUQ588.png

5,运行脚本

要快速开始使用 PP-OCRv5_OpenVINO 项目,请执行以下步骤:

python main.py --image_dir images/handwrite_en_demo.png #运行python代码调用推理

--det_model_dir PP-OCRv5_server_det_onnx/inference.onnx

--det_model_device CPU

--rec_model_dir PP-OCRv5_server_rec_onnx/inference.onnx

--rec_model_device CPU

后续程序会将识别到的文本结果直接打印到控制台

wKgZO2hK062AUh9tAAK0f84tXxc550.png

视频链接:基于算力魔方与PP-OCRv5的OpenVINO智能文档识别方案 (qq.com)

四, 结论


本文详细介绍了基于PP-OCRv5和OpenVINO的智能文档信息提取解决方案的部署流程。新版本的PP-OCRv5在精度和速度上都有显著提升,结合OpenVINO的硬件加速能力,能够实现高效的文档处理。该方案特别适合需要处理大量文档的企业场景,如金融票据识别、合同审核、档案数字化等应用。

如果你有更好的文章,欢迎投稿!

稿件接收邮箱:nami.liu@pasuntech.com

更多精彩内容请关注“算力魔方?”!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1809

    文章

    49151

    浏览量

    250608
  • OpenVINO
    +关注

    关注

    0

    文章

    115

    浏览量

    512
  • DeepSeek
    +关注

    关注

    2

    文章

    804

    浏览量

    1821
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PP-OCRv3优化策略详细解读

    PP-OCR是PaddleOCR团队自研的超轻量OCR系统,面向OCR产业应用,权衡精度与速度。近期,PaddleOCR团队针对PP-OCRv2的检测模块和识别模块,进行共计9个方面的升级,打造出一款全新的、效果更优的超轻量OC
    的头像 发表于 05-12 09:21 ?4226次阅读

    基于C#和OpenVINO?在英特尔独立显卡上部署PP-TinyPose模型

    OpenVINO,将 PP-TinyPose 模型部署在英特尔独立显卡上。 1.1 PP-TinyPose 模型简介 PP-TinyPose 是飞桨 PaddleDetecion
    的头像 发表于 11-18 18:27 ?3058次阅读

    使用OpenVINO C# API轻松部署飞桨PP-OCRv4模型

    ? 作者:魔方创始人/英特尔创新大使刘 《超4万6千星的开源OCR黑马登场,PaddleOCR凭什么脱颖而出?》 收到了读者热烈反响,很多读者提出:如何在C#中部署飞桨
    的头像 发表于 02-12 10:42 ?1501次阅读
    使用<b class='flag-5'>OpenVINO</b> C# API轻松部署飞桨<b class='flag-5'>PP-OCRv</b>4模型

    如何在C#中部署飞桨PP-OCRv4模型

    《超4万6千星的开源OCR黑马登场,PaddleOCR凭什么脱颖而出?》收到了读者热烈反响c,很多读者提出:如何在C#中部署飞桨PP-OCRv4模型?本文从零开始详细介绍整个过程。
    的头像 发表于 02-17 10:58 ?1857次阅读
    如何在C#中部署飞桨<b class='flag-5'>PP-OCRv</b>4模型

    使用OpenVINO优化并部署飞桨PP-OCRv4模型

    作者:魔方创始人/英特尔创新大使刘 一,什么是PaddleOCR工具库? PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库,助力开发者训练出更好的模型,并应用
    的头像 发表于 04-03 18:07 ?1275次阅读
    使用<b class='flag-5'>OpenVINO</b>优化并部署飞桨<b class='flag-5'>PP-OCRv</b>4模型

    智能规模超通用,大模型对智能提出高要求

    的缩写,即每秒所能够进行的浮点运算数目(每秒浮点运算量)。 ? 可以分为通用智能
    的头像 发表于 02-06 00:08 ?7349次阅读

    魔方复原

    项目说明:单片机控制6路步进电机,分别控制魔方的六个轴,该模块可以手动操作旋转,也可以接受指令进行旋转。数码管显示时间与步数。自动复原由软件操作,平台为labVIEW,通过摄像头进行颜色识别,并建立
    发表于 11-11 22:39

    使用OpenVINO?在魔方上加速stable diffusion模型

    魔方一款可以DIY的迷你主机,采用了抽屉式设计,后续组装、升级、维护只需要拔插模块。通过选择计算模块的版本,再搭配不同额IO模块可以组成丰富的配置,适应不同场景。
    的头像 发表于 05-25 14:34 ?1116次阅读
    使用<b class='flag-5'>OpenVINO</b>?在<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>上加速stable diffusion模型

    基于软件的魔方

    电子发烧友网站提供《基于软件的魔方器.zip》资料免费下载
    发表于 07-06 09:10 ?0次下载
    基于软件的<b class='flag-5'>魔方</b>解<b class='flag-5'>算</b>器

    使用OpenVINO 2024.4在魔方上部署Llama-3.2-1B-Instruct模型

    前面我们分享了《三步完成Llama3在魔方的本地量化和部署》。2024年9月25日,Meta又发布了Llama3.2:一个多语言大型语言模型(LLMs)的集合。
    的头像 发表于 10-12 09:39 ?1512次阅读
    使用<b class='flag-5'>OpenVINO</b> 2024.4在<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>上部署Llama-3.2-1B-Instruct模型

    机器人“大脑+小脑”范式:魔方赋能智能自主导航

    和实时调整。 这种分工明确的架构不仅提高了机器人的自主性和适应性,还为机器人在复杂环境中的应用提供了更多可能。 一, 魔方 ? : 机 器人“大脑”的强大
    的头像 发表于 01-20 13:35 ?596次阅读

    C#中使用OpenVINO?:轻松集成AI模型!

    作者:魔方创始人/英特尔创新大使刘 C#不仅在PC游戏开发、大型商业系统领域应用广泛,还成为开源测控、机器视觉与运动控制,以及PC数集与分析领域中的主流开发语言! 在开源测控、机
    的头像 发表于 02-07 14:05 ?895次阅读
    C#中使用<b class='flag-5'>OpenVINO</b>?:轻松集成AI模型!

    魔方IO扩展模块介绍 网络篇1

    一,魔方简介 魔方?AIPC是目前市面上唯一的模块化迷你电脑,在巴掌大小的空间提供强大的
    的头像 发表于 04-09 14:33 ?364次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>IO扩展模块介绍 网络篇1

    基于魔方智能文档信息提取方案

    的进步,使得自动化和智能化的文档信息提取成为现实。本方案结合了Intel OpenVINO平台的性能优化优势与百度飞桨(PaddlePaddle)提供的
    的头像 发表于 05-15 10:37 ?241次阅读
    基于<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>的<b class='flag-5'>智能</b><b class='flag-5'>文档</b>信息提取<b class='flag-5'>方案</b>