0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于LockAI视觉识别模块:C++目标检测

福州市凌睿智捷电子有限公司 ? 2025-06-06 13:56 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文档基于瑞芯微RV1106的LockAI凌智视觉识别模块,通过C++语言做的目标检测实验。

本文档展示了如何使用 lockzhiner_vision_module::PaddleDet 类进行目标检测,并通过lockzhiner_vision_module::Visualize 函数将检测结果可视化。

源代码网址:https://gitee.com/LockzhinerAI/LockzhinerVisionModule/tree/master/Cpp_example/D01_test_detection


1. 基础知识讲解

1.1 目标检测的基本介绍

目标检测是计算机视觉领域中的一个关键任务,它不仅需要识别图像中存在哪些对象,还需要定位这些对象的位置。具体来说,目标检测算法会输出每个检测到的对象的边界框(Bounding Box)以及其所属类别的概率或置信度得分。

应用场景:目标检测技术广泛应用于多个领域,包括但不限于安全监控、自动驾驶汽车、智能零售和医疗影像分析。

1.2 PaddleDetection 的基本介绍

PaddleDetection 是基于百度飞桨深度学习框架开发的一个高效的目标检测库,支持多种先进的目标检测模型,如 YOLO 系列、SSD、Faster R-CNN、Mask R-CNN 等。它提供了简单易用的接口,使得开发者能够快速部署高性能的目标检测应用。

特点:

高性能:优化了推理速度,在保持高精度的同时实现了快速响应。

灵活性:支持多种预训练模型,可以根据具体需求选择合适的模型架构。

易于集成:提供 C++ API,便于嵌入式系统或桌面应用程序中使用。

丰富的模型库:涵盖单阶段(One-stage)和双阶段(Two-stage)检测模型,满足不同场景的需求。

适用场景:适用于需要对视频流或图像进行实时分析的应用场景,例如安防监控、智能交通系统、工业自动化等。


2. API 文档

2.1 PaddleDetection 类

2.1.1 头文件

#include

2.1.2 构造函数

lockzhiner_vision_module::PaddleDetection();

作用:

创建一个 PaddleDetection 对象,并初始化相关成员变量。

参数:

返回值:

2.1.3 Initialize函数

boolInitialize(conststd::string&model_path);

作用:

加载预训练的 PaddleDetection 模型。

参数:

model_path:模型路径,包含模型文件和参数文件。

返回值:

true:模型加载成功。

false:模型加载失败。

2.1.4 SetThreshold函数

voidSetThreshold(floatscore_threshold=0.5,floatnms_threshold=0.3);

作用:

设置目标检测的置信度阈值和NMS阈值。

参数:

score_threshold:置信度阈值,默认值为0.5。

nms_threshold:NMS阈值,默认值为0.3。

返回值:

2.1.5 Predict函数

std::vector<lockzhiner_vision_module::DetectionResult>Predict(constcv::Mat&image);

作用:

使用加载的模型对输入图像进行目标检测,返回检测结果。

参数:

input_mat (const cv::Mat&): 输入的图像数据,通常是一个 cv::Mat 变量。

返回值:

返回一个包含多个 DetectionResult 对象的向量,每个对象表示一个检测结果。

2.2 DetectionResult 类

2.2.1 头文件

#include

2.2.2 box函数

lockzhiner_vision_module::Rectbox()const;

作用:

获取目标检测结果的边界框。

参数:

返回值:

返回一个 lockzhiner_vision_module::Rect 对象,表示目标检测结果的边界框。

2.2.3 score函数

floatscore()const;

作用:

获取目标检测结果的置信度得分。

参数:

返回值:

返回一个 float 类型的置信度得分。

2.2.4 label_id函数

作用:

获取目标检测结果的标签ID。

参数:

返回值:

返回一个整数,表示目标检测结果的标签ID。

2.3 Visualize 函数

2.3.1 头文件

#include

2.3.2 函数定义

voidlockzhiner_vision_module::Visualize(
constcv::Mat&input_mat,
cv::Mat&output_image,
conststd::vector<lockzhiner_vision_module::DetectionResult>&results,
conststd::vector<std::string>&labels={},
floatfont_scale=0.4
);

作用:

将目标检测结果可视化到输入图像上,并返回可视化后的图像。

参数:

input_mat (const cv::Mat&): 输入图像。

output_image (cv::Mat&): 输出图像,包含标注后的结果。

results (const std::vectorlockzhiner_vision_module::DetectionResult&): 检测结果列表。

labels (const std::vectorstd::string&): 可选的标签列表,用于标注类别名称,默认为空。

font_scale (float): 字体大小比例,默认为 0.4。

返回值:


3. 示例代码解析

3.1 流程图

0042e8c8-429b-11f0-986f-92fbcf53809c.png

3.2 核心代码解析

初始化模型

lockzhiner_vision_module::PaddleDetmodel;
if(!model.Initialize(argv[1])) {
std::cout<<"Failed to initialize model."<<std::endl;
return1;
}

模型推理

autoresults=model.Predict(input_mat);

可视化推理结果

cv::Matoutput_image;
lockzhiner_vision_module::Visualize(input_mat,output_image,results);

edit.Print(output_image);

3.3 完整代码实现

#include
#include
#include
#include
#include
#include

usingnamespacestd::chrono;

intmain(intargc,char*argv[]) {
if(argc!=2) {
std::cerr<<"Usage: Test-PaddleDet model_path"<<std::endl;
return1;
}

// 初始化模型
lockzhiner_vision_module::PaddleDetmodel;
if(!model.Initialize(argv[1])) {
std::cout<<"Failed to initialize model."<<std::endl;
return1;
}
lockzhiner_vision_module::Editedit;
if(!edit.StartAndAcceptConnection()) {
std::cerr<<"Error: Failed to start and accept connection."<<std::endl;
returnEXIT_FAILURE;
}
std::cout<<"Device connected successfully."<<std::endl;
// 打开摄像头
cv::VideoCapturecap;
cap.set(cv::CAP_PROP_FRAME_WIDTH,640);
cap.set(cv::CAP_PROP_FRAME_HEIGHT,480);
cap.open(0);

if(!cap.isOpened()) {
std::cerr<<"Error: Could not open camera."<<std::endl;
return1;
}

cv::Matinput_mat;
while(true) {
// 捕获一帧图像
cap>>input_mat;
if(input_mat.empty()) {
std::cerr<<"Warning: Captured an empty frame."<<std::endl;
continue;
}

// 调用模型进行预测
high_resolution_clock::time_pointstart_time=high_resolution_clock::now();
autoresults=model.Predict(input_mat);
high_resolution_clock::time_pointend_time=high_resolution_clock::now();

// 计算推理时间
autotime_span=duration_cast<milliseconds>(end_time-start_time);
std::cout<<"Inference time: "<<time_span.count()<<" ms"<<std::endl;

// 可视化结果
cv::Matoutput_image;
lockzhiner_vision_module::Visualize(input_mat,output_image,results);

edit.Print(output_image);
}

cap.release();
return0;
}


4. 编译过程

4.1 编译环境搭建

请确保你已经按照开发环境搭建指南正确配置了开发环境。

同时以正确连接开发板。

4.2 Cmake介绍

cmake_minimum_required(VERSION3.10)

project(D01_test_detection)

set(CMAKE_CXX_STANDARD17)
set(CMAKE_CXX_STANDARD_REQUIRED ON)

# 定义项目根目录路径
set(PROJECT_ROOT_PATH"${CMAKE_CURRENT_SOURCE_DIR}/../..")
message("PROJECT_ROOT_PATH = "${PROJECT_ROOT_PATH})

include("${PROJECT_ROOT_PATH}/toolchains/arm-rockchip830-linux-uclibcgnueabihf.toolchain.cmake")

# 定义 OpenCV SDK 路径
set(OpenCV_ROOT_PATH"${PROJECT_ROOT_PATH}/third_party/opencv-mobile-4.10.0-lockzhiner-vision-module")
set(OpenCV_DIR"${OpenCV_ROOT_PATH}/lib/cmake/opencv4")
find_package(OpenCV REQUIRED)
set(OPENCV_LIBRARIES"${OpenCV_LIBS}")

# 定义 LockzhinerVisionModule SDK 路径
set(LockzhinerVisionModule_ROOT_PATH"${PROJECT_ROOT_PATH}/third_party/lockzhiner_vision_module_sdk")
set(LockzhinerVisionModule_DIR"${LockzhinerVisionModule_ROOT_PATH}/lib/cmake/lockzhiner_vision_module")
find_package(LockzhinerVisionModule REQUIRED)

add_executable(Test-detection test_detection.cc)
target_include_directories(Test-detection PRIVATE${LOCKZHINER_VISION_MODULE_INCLUDE_DIRS})
target_link_libraries(Test-detection PRIVATE${OPENCV_LIBRARIES}${LOCKZHINER_VISION_MODULE_LIBRARIES})

install(
TARGETS Test-detection
RUNTIME DESTINATION .
)

4.3 编译项目

使用 Docker Destop 打开 LockzhinerVisionModule 容器并执行以下命令来编译项目

# 进入Demo所在目录
cd/LockzhinerVisionModuleWorkSpace/LockzhinerVisionModule/Cpp_example/D01_test_detection
# 创建编译目录
rm-rfbuild &&mkdirbuild &&cdbuild
# 配置交叉编译工具链
exportTOOLCHAIN_ROOT_PATH="/LockzhinerVisionModuleWorkSpace/arm-rockchip830-linux-uclibcgnueabihf"
# 使用cmake配置项目
cmake ..
# 执行编译项目
make-j8&&makeinstall

在执行完上述命令后,会在build目录下生成可执行文件。


5. 例程运行示例

5.1 运行

chmod777Test-detection
# 在实际应用的过程中LZ-Picodet需要替换为下载的或者你的rknn模型
./Test-detection LZ-Picodet

5.2 结果展示

可以看到我们正确识别了绿色的方块,同时打印了标签和置信度。

00572fc2-429b-11f0-986f-92fbcf53809c.png

6. 总结

本文档详细介绍了目标检测的基础知识及 PaddleDetection 的基本概念,并提供了详细的API文档说明,帮助开发者理解和实现目标检测与可视化功能。通过上述流程,可以构建高效的实时目标检测系统,满足多种应用场景的需求。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式系统
    +关注

    关注

    41

    文章

    3686

    浏览量

    131598
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281263
  • 视觉识别
    +关注

    关注

    3

    文章

    109

    浏览量

    17099
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于LockAI视觉识别模块C++图像采集例程

    本文主要演示如何使用LockAI视觉识别模块进行视频流的读取,同时使用Edit模块进行图像传输。 例程源代码地址:https://gitee
    发表于 04-30 10:52

    基于LockAI视觉识别模块C++轮廓检测

    方法,展示了如何通过边缘检测、直线检测、圆检测以及多边形拟合等技术对摄像头捕获的视频流进行分析。同时使用传统视觉方法进行图像识别,对环境非常
    发表于 05-22 10:05

    基于LockAI视觉识别模块C++二维码识别

    二维码识别视觉模块经常使用到的功能之一。我们将演示如何使用基于瑞芯微RV1106的LockAI视觉识别
    发表于 05-26 09:57

    基于LockAI视觉识别模块C++条码识别

    条码识别视觉模块经常使用到的功能之一,经常用于识别超市的货物信息。本文我们将演示如何基于瑞芯微RV1106的LockAI
    发表于 05-27 10:26

    基于LockAI视觉识别模块C++目标检测

    本文档基于瑞芯微RV1106的LockAI凌智视觉识别模块,通过C++语言做的目标
    发表于 06-06 14:43

    基于LockAI视觉识别模块C++人脸识别

    本文基于RV1106做成的LockAI视觉识别模块,采用 LZ-Picodet 模型训练的人脸检测模型 LZ-Face,以及ArcFace人
    发表于 07-01 12:01

    基于LockAI视觉识别模块C++图像采集例程

    本文主要演示如何使用LockAI视觉识别模块进行视频流的读取,同时使用Edit模块进行图像传输。基础知识讲解1.1OpenCV简介OpenC
    的头像 发表于 04-30 18:23 ?279次阅读
    基于<b class='flag-5'>LockAI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b><b class='flag-5'>模块</b>:<b class='flag-5'>C++</b>图像采集例程

    基于LockAI视觉识别模块C++图像的基本运算

    在图像处理中,理解图像的基本操作是掌握计算机视觉技术的关键。本文章将介绍基于LockAI视觉识别模块下OpenCV中图像的基本运算方法,包括
    的头像 发表于 05-06 16:20 ?266次阅读
    基于<b class='flag-5'>LockAI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b><b class='flag-5'>模块</b>:<b class='flag-5'>C++</b>图像的基本运算

    基于LockAI视觉识别模块C++使用图像的统计信息

    在图像处理中,统计信息可以帮助我们了解图像的特性,例如区域内的像素分布、颜色转换以及特定区域的分析。本文将介绍基于LockAI视觉识别模块如何提取兴趣区域(ROI)、转换颜色通道、计算
    的头像 发表于 05-08 10:09 ?276次阅读
    基于<b class='flag-5'>LockAI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b><b class='flag-5'>模块</b>:<b class='flag-5'>C++</b>使用图像的统计信息

    # 基于LockAI视觉识别模块C++寻找色块

    在传统计算机视觉场景中,颜色识别目标检测和分割的重要手段之一。通过识别特定颜色的色块,可以在相对纯净的背景下快速定位
    的头像 发表于 05-12 14:27 ?242次阅读
    # 基于<b class='flag-5'>LockAI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b><b class='flag-5'>模块</b>:<b class='flag-5'>C++</b>寻找色块

    基于LockAI视觉识别模块C++轮廓检测

    本文档展示了如何使用OpenCV进行图像处理和特征检测,包括边缘检测、直线检测、圆检测以及多边形拟合。通过这些技术,可以实现对摄像头捕获的实时视频流进行分析,并标记出
    的头像 发表于 05-22 09:31 ?284次阅读
    基于<b class='flag-5'>LockAI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b><b class='flag-5'>模块</b>:<b class='flag-5'>C++</b>轮廓<b class='flag-5'>检测</b>

    基于LockAI视觉识别模块C++二维码识别

    二维码识别视觉模块经常使用到的功能之一。我们将演示如何使用基于瑞芯微RV1106的LockAI视觉识别
    的头像 发表于 05-26 09:42 ?324次阅读
    基于<b class='flag-5'>LockAI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b><b class='flag-5'>模块</b>:<b class='flag-5'>C++</b>二维码<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块C++条码识别

    条码识别视觉模块经常使用到的功能之一,经常用于识别超市的货物信息。本文我们将演示如何基于瑞芯微RV1106的LockAI
    的头像 发表于 05-27 09:32 ?199次阅读
    基于<b class='flag-5'>LockAI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b><b class='flag-5'>模块</b>:<b class='flag-5'>C++</b>条码<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块:手写数字识别

    手写数字识别是一种经典的模式识别和图像处理问题,旨在通过计算机自动识别用户手写的数字。本文将教会你如何使用基于RV1106的LockAI视觉
    的头像 发表于 06-30 15:44 ?491次阅读
    基于<b class='flag-5'>LockAI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b><b class='flag-5'>模块</b>:手写数字<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块C++人脸识别

    本文基于RV1106做成的LockAI视觉识别模块,采用LZ-Picodet模型训练的人脸检测模型LZ-Face,以及ArcFace人脸
    的头像 发表于 07-01 10:09 ?192次阅读
    基于<b class='flag-5'>LockAI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b><b class='flag-5'>模块</b>:<b class='flag-5'>C++</b>人脸<b class='flag-5'>识别</b>