基于LockAI视觉识别模块：C++目标检测-电子发烧友网

本文档基于瑞芯微RV1106的LockAI凌智视觉识别模块，通过C++语言做的目标检测实验。

本文档展示了如何使用 lockzhiner_vision_module::PaddleDet 类进行目标检测，并通过lockzhiner_vision_module::Visualize 函数将检测结果可视化。

源代码网址：https://gitee.com/LockzhinerAI/LockzhinerVisionModule/tree/master/Cpp_example/D01_test_detection

1. 基础知识讲解

1.1 目标检测的基本介绍

目标检测是计算机视觉领域中的一个关键任务，它不仅需要识别图像中存在哪些对象，还需要定位这些对象的位置。具体来说，目标检测算法会输出每个检测到的对象的边界框（Bounding Box）以及其所属类别的概率或置信度得分。

应用场景：目标检测技术广泛应用于多个领域，包括但不限于安全监控、自动驾驶汽车、智能零售和医疗影像分析。

1.2 PaddleDetection 的基本介绍

PaddleDetection 是基于百度飞桨深度学习框架开发的一个高效的目标检测库，支持多种先进的目标检测模型，如 YOLO 系列、SSD、Faster R-CNN、Mask R-CNN 等。它提供了简单易用的接口，使得开发者能够快速部署高性能的目标检测应用。

特点：

高性能：优化了推理速度，在保持高精度的同时实现了快速响应。

灵活性：支持多种预训练模型，可以根据具体需求选择合适的模型架构。

易于集成：提供 C++ API，便于嵌入式系统或桌面应用程序中使用。

丰富的模型库：涵盖单阶段（One-stage）和双阶段（Two-stage）检测模型，满足不同场景的需求。

适用场景：适用于需要对视频流或图像进行实时分析的应用场景，例如安防监控、智能交通系统、工业自动化等。

2. API 文档

2.1 PaddleDetection 类

2.1.1 头文件

#include

2.1.2 构造函数

lockzhiner_vision_module::PaddleDetection();

作用：

创建一个 PaddleDetection 对象，并初始化相关成员变量。

参数：

无

返回值：

无

2.1.3 Initialize函数

boolInitialize(conststd::string&model_path);

作用：

加载预训练的 PaddleDetection 模型。

参数：

model_path：模型路径，包含模型文件和参数文件。

返回值：

true：模型加载成功。

false：模型加载失败。

2.1.4 SetThreshold函数

voidSetThreshold(floatscore_threshold=0.5,floatnms_threshold=0.3);

作用：

设置目标检测的置信度阈值和NMS阈值。

参数：

score_threshold：置信度阈值，默认值为0.5。

nms_threshold：NMS阈值，默认值为0.3。

返回值：

无

2.1.5 Predict函数

std::vector<lockzhiner_vision_module::DetectionResult>Predict(constcv::Mat&image);

作用：

使用加载的模型对输入图像进行目标检测，返回检测结果。

参数：

input_mat (const cv::Mat&): 输入的图像数据，通常是一个 cv::Mat 变量。

返回值：

返回一个包含多个 DetectionResult 对象的向量，每个对象表示一个检测结果。

2.2 DetectionResult 类

2.2.1 头文件

#include

2.2.2 box函数

lockzhiner_vision_module::Rectbox()const;

作用：

获取目标检测结果的边界框。

参数：

无

返回值：

返回一个 lockzhiner_vision_module::Rect 对象，表示目标检测结果的边界框。

2.2.3 score函数

floatscore()const;

作用：

获取目标检测结果的置信度得分。

参数：

无

返回值：

返回一个 float 类型的置信度得分。

2.2.4 label_id函数

作用：

获取目标检测结果的标签ID。

参数：

无

返回值：

返回一个整数，表示目标检测结果的标签ID。

2.3 Visualize 函数

2.3.1 头文件

#include

2.3.2 函数定义

voidlockzhiner_vision_module::Visualize(
constcv::Mat&input_mat,
cv::Mat&output_image,
conststd::vector<lockzhiner_vision_module::DetectionResult>&results,
conststd::vector<std::string>&labels={},
floatfont_scale=0.4
);

作用：

将目标检测结果可视化到输入图像上，并返回可视化后的图像。

参数：

input_mat (const cv::Mat&): 输入图像。

output_image (cv::Mat&): 输出图像，包含标注后的结果。

results (const std::vectorlockzhiner_vision_module::DetectionResult&): 检测结果列表。

labels (const std::vectorstd::string&): 可选的标签列表，用于标注类别名称，默认为空。

font_scale (float): 字体大小比例，默认为 0.4。

返回值：

无

3. 示例代码解析

3.1 流程图

3.2 核心代码解析

初始化模型

lockzhiner_vision_module::PaddleDetmodel;
if(!model.Initialize(argv[1])) {
std::cout<<"Failed to initialize model."<<std::endl;
return1;
}

模型推理

autoresults=model.Predict(input_mat);

可视化推理结果

cv::Matoutput_image;
lockzhiner_vision_module::Visualize(input_mat,output_image,results);

edit.Print(output_image);

3.3 完整代码实现

#include
#include
#include
#include
#include
#include

usingnamespacestd::chrono;

intmain(intargc,char*argv[]) {
if(argc!=2) {
std::cerr<<"Usage: Test-PaddleDet model_path"<<std::endl;
return1;
}

// 初始化模型
lockzhiner_vision_module::PaddleDetmodel;
if(!model.Initialize(argv[1])) {
std::cout<<"Failed to initialize model."<<std::endl;
return1;
}
lockzhiner_vision_module::Editedit;
if(!edit.StartAndAcceptConnection()) {
std::cerr<<"Error: Failed to start and accept connection."<<std::endl;
returnEXIT_FAILURE;
}
std::cout<<"Device connected successfully."<<std::endl;
// 打开摄像头
cv::VideoCapturecap;
cap.set(cv::CAP_PROP_FRAME_WIDTH,640);
cap.set(cv::CAP_PROP_FRAME_HEIGHT,480);
cap.open(0);

if(!cap.isOpened()) {
std::cerr<<"Error: Could not open camera."<<std::endl;
return1;
}

cv::Matinput_mat;
while(true) {
// 捕获一帧图像
cap>>input_mat;
if(input_mat.empty()) {
std::cerr<<"Warning: Captured an empty frame."<<std::endl;
continue;
}

// 调用模型进行预测
high_resolution_clock::time_pointstart_time=high_resolution_clock::now();
autoresults=model.Predict(input_mat);
high_resolution_clock::time_pointend_time=high_resolution_clock::now();

// 计算推理时间
autotime_span=duration_cast<milliseconds>(end_time-start_time);
std::cout<<"Inference time: "<<time_span.count()<<" ms"<<std::endl;

// 可视化结果
cv::Matoutput_image;
lockzhiner_vision_module::Visualize(input_mat,output_image,results);

edit.Print(output_image);
}

cap.release();
return0;
}

4. 编译过程

4.1 编译环境搭建

请确保你已经按照开发环境搭建指南正确配置了开发环境。

同时以正确连接开发板。

4.2 Cmake介绍

cmake_minimum_required(VERSION3.10)

project(D01_test_detection)

set(CMAKE_CXX_STANDARD17)
set(CMAKE_CXX_STANDARD_REQUIRED ON)

# 定义项目根目录路径
set(PROJECT_ROOT_PATH"${CMAKE_CURRENT_SOURCE_DIR}/../..")
message("PROJECT_ROOT_PATH = "${PROJECT_ROOT_PATH})

include("${PROJECT_ROOT_PATH}/toolchains/arm-rockchip830-linux-uclibcgnueabihf.toolchain.cmake")

# 定义 OpenCV SDK 路径
set(OpenCV_ROOT_PATH"${PROJECT_ROOT_PATH}/third_party/opencv-mobile-4.10.0-lockzhiner-vision-module")
set(OpenCV_DIR"${OpenCV_ROOT_PATH}/lib/cmake/opencv4")
find_package(OpenCV REQUIRED)
set(OPENCV_LIBRARIES"${OpenCV_LIBS}")

# 定义 LockzhinerVisionModule SDK 路径
set(LockzhinerVisionModule_ROOT_PATH"${PROJECT_ROOT_PATH}/third_party/lockzhiner_vision_module_sdk")
set(LockzhinerVisionModule_DIR"${LockzhinerVisionModule_ROOT_PATH}/lib/cmake/lockzhiner_vision_module")
find_package(LockzhinerVisionModule REQUIRED)

add_executable(Test-detection test_detection.cc)
target_include_directories(Test-detection PRIVATE${LOCKZHINER_VISION_MODULE_INCLUDE_DIRS})
target_link_libraries(Test-detection PRIVATE${OPENCV_LIBRARIES}${LOCKZHINER_VISION_MODULE_LIBRARIES})

install(
TARGETS Test-detection
RUNTIME DESTINATION .
)

4.3 编译项目

使用 Docker Destop 打开 LockzhinerVisionModule 容器并执行以下命令来编译项目

# 进入Demo所在目录
cd/LockzhinerVisionModuleWorkSpace/LockzhinerVisionModule/Cpp_example/D01_test_detection
# 创建编译目录
rm-rfbuild &&mkdirbuild &&cdbuild
# 配置交叉编译工具链
exportTOOLCHAIN_ROOT_PATH="/LockzhinerVisionModuleWorkSpace/arm-rockchip830-linux-uclibcgnueabihf"
# 使用cmake配置项目
cmake ..
# 执行编译项目
make-j8&&makeinstall

在执行完上述命令后，会在build目录下生成可执行文件。

5. 例程运行示例

5.1 运行

chmod777Test-detection
# 在实际应用的过程中LZ-Picodet需要替换为下载的或者你的rknn模型
./Test-detection LZ-Picodet

5.2 结果展示

可以看到我们正确识别了绿色的方块，同时打印了标签和置信度。

6. 总结

本文档详细介绍了目标检测的基础知识及 PaddleDetection 的基本概念，并提供了详细的API文档说明，帮助开发者理解和实现目标检测与可视化功能。通过上述流程，可以构建高效的实时目标检测系统，满足多种应用场景的需求。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

嵌入式系统

嵌入式系统

+关注

关注
41

文章
3686

浏览量
131598
AI

AI

+关注

关注
88

文章
35476

浏览量
281263
视觉识别

视觉识别

+关注

关注
3

文章
109

浏览量
17099

搜索历史

基于LockAI视觉识别模块：C++目标检测

1. 基础知识讲解

1.1 目标检测的基本介绍

1.2 PaddleDetection 的基本介绍

2. API 文档

2.1 PaddleDetection 类

2.1.1 头文件

2.1.2 构造函数

2.1.3 Initialize函数

2.1.4 SetThreshold函数

2.1.5 Predict函数

2.2 DetectionResult 类

2.2.1 头文件

2.2.2 box函数

2.2.3 score函数

2.2.4 label_id函数

2.3 Visualize 函数

2.3.1 头文件

2.3.2 函数定义

3. 示例代码解析

3.1 流程图

3.2 核心代码解析

3.3 完整代码实现

4. 编译过程

4.1 编译环境搭建

4.2 Cmake介绍

4.3 编译项目

5. 例程运行示例

5.1 运行

5.2 结果展示

6. 总结

评论