0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

大大通 ? 2025-05-06 14:15 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在2025年,人工智能(AI) 与边缘计算(Edge Computing) 将迎来一个崭新的里程碑。DeepX 推出了一款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达 25 TOPS 的卓越运算性能,以及高准确度、低功耗、低温度等性能表现。


通过结合 Orange Pi 5 Plus(Rockchip RK3588) 与 DeepX AI 加速卡,这套解决方案以极高性价比为基础,能够为工业电脑提供即插即用的便捷体验,并以「平台升级,迎接AI智能时代」为设计理念,助力开发者轻松迈向人工智能领域,为 AI 应用开启了全新篇章。

wKgZPGgZpcqAMZ8OAAGkLKRNzt4905.jpg

图1 基于 DeepX AI 加速卡结合 Rockchip RK3588 多路物体检测解决方案优势示意图


同时,提供丰富的软件资源与主流深度学习框架 ( 例如 TensorFlow、PyTorch 和 ONNX ) 的全面支持,无论是初学者还是专业人士,都能迅速掌握操作技巧,轻松完成 AI 模型的部署,让更多人能够参与其中。人工智能的应用开发中,促使创新变得更加触手可及。


其中 边缘计算(Edge Computing) 与 神经运算处理芯片(Neural Processing Unit, NPU) 将是掀起这项浪潮的关键指标得以将智能设备更贴近人们的日常生活。


AI技术的进一步发展,更多的创新应用将逐步落地,彻底重塑我们的日常应用,于以下领域:

智能监控:通过实时目标检测、行为分析与入侵预警,强化城市安全与监控系统。

智慧零售:通过顾客行为分析与智能货架管理,提升购物体验,优化销售策略。

医疗影像分析:运用 AI 协助医生进行疾病诊断(如肿瘤检测),提高医疗准确性。

工业质检:自动化检测产品瑕疵,提高制造业质量管控与生产效率。

高级辅助驾驶系统(ADAS):通过 AI 视觉技术,分析道路、行人等状况,以实现行车安全的目标。

农业监测:监测作物健康状况,检测病虫害,优化农业管理,提高产量和品质。

自走车:通过传感器和 AI 算法,自主导航并避开障碍物,应用于物流、巡检等多种场景。

机械手臂:结合 AI 与视觉系统,能精确地执行组装、焊接等任务,提高生产效率和产品质量。

自动送餐系统:外卖平台如 Uber Eats,正在美国多个城市部署由 Serve Robotics 开发的送餐机器人,这些机器人配备 AI 技术,能自主导航至顾客所在地,提供高效的送餐服务。

无人机影像分析:AI 驱动的视觉系统使无人机能够进行地形物体检测、灾害评估和基础设施检查,提供高效的数据收集和分析。

wKgZO2gZpcqAXEW-AAFKu1jxoIA239.jpg

图2 AI应用方向示意图,出处 ChatGPT 生成


另外,可以通过 DeepX 的卓越运算性能,可以轻松打造 多路(Multi-Streamer) 的物体检测(Object Detection) 应用。无论是使用普通 USB 摄像头,还是通过网络流媒体来源,都能完美整合到各种智能场景中。由于目前 Orange Pi 5 Plus 的摄像头极限大约为 16 路 480p 流媒体输入,如果采用更高端的 NVR 作为主平台,更能发挥出 DX-M1 的极限。因此,更能适用于小型商场、停车场、会展中心商品防盗、车辆安全管控、人流统计等应用中。

wKgZO2gZpcqANIYLAAF1OtvNPDU533.jpg

图3 多路物件检测解决方案应用示意图,出处 ChatGPT 生成



DeepX:引领智能新浪潮的造势者

在边缘计算浪潮中,DeepX 是韩国的一家初创公司,拥有约 240 多项智能专利。并在 CES 2024 一次荣获嵌入式、机器人、电脑整合三项创新奖等大奖。甚至被美国消费者技术协会 (CTA)评为“必访公司”,成为全球市场的焦点。


DeepX DX-M1 AI 加速卡强势来袭,能够提供每瓦 5 TOPS 的计算性能,拥有强大的边缘计算能力 (25TOPS) 以及IQ8(Intelligent Quantization Integer 8) 独有的量化技术,足够媲美 GPU 的准确度,在拥有 INT8 的极致效率的同时也能享受到 FP32 准确度,实现无与伦比的 AI 精度。


其内置搭配 4 GB 的内存(DDR) 用于访问模块,不会占用主系统的资源,大幅度减轻系统集成的负担。其卓越的性能表现成为智能监控、智慧医疗、智能制造等边缘 AI 应用的唯一首选。

wKgZPGgZpcqAEkqNAACpK40jkwY635.jpg

图4 DeepX AI 芯片规格示意图



软件持续优化更新:打造最佳用户体验

DeepX 不仅拥有强大的硬件性能,并且打造了一个完整且友好的软件生态系统,为开发者提供全方位的支持。其生态系统包含详细的快速入门指南(Quick Start Guide)、功能强大的软件开发工具包(SDK)、丰富的模型资源库(Model Zoo),以及多样化的示例应用程序。这些资源能有效协助开发者迅速整合并优化 AI 模型的运行,缩短开发时间,同时提升应用性能,让 AI 创新变得更加轻松实现。


软件由三大核心组件构成,分别是量化器(Quantizer)、编译器(DX-COM Compiler) 以及 运行时环境(DX-RT Runtime),共同驱动旗下的 DeepX AI SoC 系列产品。这些组件相互协作,形成一个高效的人工智能计算平台,为各种应用场景提供强大的支持。以下图示范说明其架构:

wKgZPGgZpcqAFBzPAAJaNQuIozM980.png

图5 DeepX 开发环境示意图,出处官方文件



卓越的AI性能

利用 DeepX DX-M1 芯片运行当前最热门的 YOLOv5s (640x640) 目标检测算法,可轻松达到每秒约 330 张。

wKgZO2gZpcqAOwEkAABji45aqSA341.jpg

图6 DeepX DX-M1 芯片性能数据表


下列表格是 GPU 与 DX-M1 的准确度分析,其中绿色字体表示 Full Precision 代表 GPU,蓝色字体表示 IQ8 代表 DeepX NPU。

wKgZO2gZpcqAICFfAAF_8wiZgbc459.png

图7 DeepX DX-M1与GPU准确度比较表,出处官方文件



丰富的 AI 应用

DeepX 致力于推动人工智能技术的普及,提供多样化的 AI 示例与教学资源,循序渐进地引导开发者掌握 AI 应用的实现过程。通过示例,开发者不仅能深入了解人工智能的核心技术,还能学习如何将其灵活运用于实际场景,从而加速创新与技术落地。

wKgZPGgZpcuAIH67AAHKZRAJd9Q590.jpg

图8 DeepX 实际应用示意图



场景应用图

wKgZO2gZpcyAC8lVAAPFvW1bctQ809.png


展示板照片

wKgZPGgZpcyAT0MyAAtjPHiP3aw190.png


方案方块图

wKgZPGgZpcyAaj2gAABhID65b4Q820.jpg


核心技术优势

1. 采用 IQ8 (Intelligent Quantization Integer 8) 量化技术,媲美 GPU 的准确度:

DeepX 的 IQ8 技术需要配合数据集 (DataSet) 校正,即可轻松拥有 INT8 的极致效率的同时也能享受到 FP32 准确度,实现媲美 GPU 的 AI 准确度。


2. 不占用系统内存:

模块采用独立内存架构进行运作,其内建 4GB 存取容量,完全不依赖主系统的 RAM 资源,成功减轻了对系统整体性能的负担。


3. 最佳数据流优化,最大限度减少数据移动:

采用数据传输流优化设计,将内存设计于加速卡中,能够大幅度减少数据在主系统传输次数,从而显著提升处理速度并大幅降低延迟。


4. 高性价比与低功耗解决方案:

将主平台 Orange Pi 5 Plus 搭配 DeepX DX-M1 的 AI 芯片,即可无痛升级为更高阶的 AI 平台,每秒能够运行约 480 帧 (YOLOv5s) 的物体检测;且 DX-M1 拥有 5 TOPS/W 的性能表现,整套多路物体检测解决方案仅耗电约 14 W。


5. 多路应用的新概念:

随着边缘计算技术的快速发展,若将其结合区域化的应用场景,或许能开创出一种创新且具成本效益的解决方案。通过使用易于获取的摄像头,搭配一台智能工业主机以及 DeepX M.2 加速卡,便能实现多样化的应用需求。


此外,前端的摄像头还可根据实际需求进行灵活更换与配置,进一步提升系统的适应性与灵活性,为各个行业提供了更多可能性。



方案规格

1.主平台开发板采用 RockChip RK3588 平台为基础,搭载四颗 Cortex-A76 处理器与四颗 Cortex-A55 处理器,并提供高性能图像处理器 Arm Mali-G610 与神经运算处理器 NPU 等强大核心架构。


2.I/O Board 开发板提供强大的周边配置,如千兆以太网(Gigabit Ethernet)、HDMI 高清多媒体接口、USB Type A/C 3.0 通用串行总线接口、M.2 E-Key 传输接口、M.2 M-Key 传输接口,并能够通过扩展的 40 pin 针脚来模拟常用的 UARTI2C、SPI、CAN信号


3.DeepX DX-M1 芯片提供强大的 AI 运算能力(25 TOPS),采用 PCIe Gen3 M.2 2280 M-Key 接口设计,搭载高性能的 DX-M1 芯片,展现出每瓦高达 5 TOPS 的卓越低功耗运算能力。此外,内置 4GB 动态随机存取存储器(DRAM),确保模块访问的高效性与稳定性。该加速卡全面支持 Linux 与 Windows 操作系统,并为开发者提供丰富的软件资源,方便快速集成与应用。


参考网站:

DeepX 官网

DeepX DX-M1 产品介绍

DeepX 开发网站

Orange Pi 5 Plus网站


欢迎关注大大通博主:ATU 伊布小编 (一部)

了解MPU技术整合、深度学习、电脑视觉技术与人工智能(AI)的发展等更多相关内容!

登录大大通网站查看原文:https://www.wpgdadatong.com.cn/reurl/viYnyi ,下载术文档,了解更多资讯!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NPU
    NPU
    +关注

    关注

    2

    文章

    333

    浏览量

    19807
  • RK3588
    +关注

    关注

    7

    文章

    425

    浏览量

    5960
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RK这2款旗舰芯片RK3588 PK RK3576,谁是最优选

    AI 边缘计算领域,瑞芯微的 RK3588RK3576 都是备受瞩目的处理器。在中国半导体产业的版图中,瑞芯微作为国内 SoC 芯片领跑者,凭借其在处理器芯片设计领域的深厚积
    发表于 07-10 18:24

    RK3576 vs RK3588:为何越来越多的开发者转向RK3576?

    高端平板、边缘计算)。 NPU 算力相同,但 RK3588 支持更复杂的 AI 计算(如 INT4/FP16)。 2. 多媒体与存储:满足主流需求 [td]项目RK3576RK3588
    发表于 05-30 08:46

    轻松上手边缘AI:MemryX MX3+结合Orange Pi 5 Plus的C/C++实战指南

    AI边缘计算快速发展的时代,MemryX MX3+ 加速卡凭借其 20 TOPS 的强大性能和低功耗(5 TFLOPS/W),成为边缘智能应用的理想选择。
    的头像 发表于 05-28 08:01 ?612次阅读
    轻松上手<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>:MemryX MX3+<b class='flag-5'>结合</b>Orange Pi 5 Plus的C/C++实战指南

    6TOPS算力NPU加持!RK3588如何重塑8K显示的边缘计算新边界

    与复杂运算。明远智睿推出的RK3588芯片,以6TOPS算力的NPU为核心,为这一难题提供了突破性的解决方案。 从硬件架构来看,RK3588的NPU采用了先进的神经网络处理器设计,支持
    发表于 04-18 15:32

    RK3588核心板在边缘AI计算中的颠覆性优势与场景落地

    AOI质检 旧方案:使用工控机+外置GPU处理4K图像,延迟>200ms,难以满足高速产线需求。 RK3588方案:通过双MIPI CSI-2接口接入8K工业相机,NPU实时执行缺陷检测
    发表于 04-15 10:48

    边缘AI新突破:MemryX AI加速卡RK3588打造高效多路物体检测方案

    方案特别结合了 Orange Pi 5 Plus (Rockchip RK3588) 与 MemryX AI
    的头像 发表于 03-06 10:45 ?726次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>新突破:MemryX <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>与<b class='flag-5'>RK3588</b>打造高效<b class='flag-5'>多路</b><b class='flag-5'>物体检测</b><b class='flag-5'>方案</b>

    Banana Pi开源社区基于瑞芯微RK3588开发板,DeepSeek开发利器

    已升级为PCIe3.0 4通道和PCIe2.1 1-lan。 []() Banana Pi BPI-M7 采用Rockchip RK3588,板载8/16/32G RAM内存和 64/
    发表于 02-19 18:27

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    :这无疑是 RK3588 的核心亮点。NPU 专为 AI 计算而生,能以极低功耗实现高达 6TOPS(每秒一万亿次操作)的算力。在边缘计算场景中,它能快速处理海量 AI 推理任务,大
    发表于 02-14 17:42

    [求职] RK3588核心板,寻找志同道合的电子发烧友!

    基本信息 姓名: RK3588核心板 性别: 男 年龄: 新鲜出炉 联系方式: 13632965530 期望职位: 智能硬件开发平台、边缘计算平台、AIoT应用开发平台 期望薪资
    发表于 02-11 10:49

    RK3588 原厂设计资料首次公开(规格书+原理图+设计说明+DDR参考),速抢

    的NEON协处理器。 视频处理方面: 提供了硬件加速RK3588支持H.265和VP9解码器通过8K@60fps, H.264解码器8K@30fps和AV1解码器4K@60fps,也支持H.264
    发表于 02-05 16:52

    米尔RK3576和RK3588怎么选?-看这篇就够了

    / USB2.0/双网口/多路串口,满足不同的产品应用需求。 总结:性价比极高的RK3576 综合性能来讲,RK3588的CPU性能更强,强AI需求建议使用
    发表于 12-27 11:44

    迅为瑞芯微RK35883588S如何选型硬件区别

    1路HDMI_TX、1路千兆以太网、3路MIPI 摄像头接口、2路USB2.0等,虽然也支持多种接口,但相对来说,它的接口类型更加传统和经典。 迅为RK3588S开发板: 大家在选择处理器时,一定要
    发表于 09-11 11:31

    基于迅为RK3568/RK3588开发板的AI图像识别方案

    https://www.bilibili.com/video/BV1G54y1A7nf/?spm_id_from=333.999.0.0 迅为RK3568/RK3588开发板AI识别演
    发表于 08-28 09:50

    基于迅为RK3588开发板的AI图像识别方案

    迅为RK3568/RK3588开发板AI识别演示方案包括 01_官方模型测试 02_人脸识别 03_口罩检测 04_工地防护 05_扑克牌
    发表于 08-13 11:26

    三星将为DeepX量产5nm AI芯片DX-M1

    人工智能半导体领域的创新者DeepX宣布,其第一代AI芯片DX-M1即将进入量产阶段。这一里程碑式的进展得益于与三星电子代工设计公司Gaonchips的紧密合作。双方已正式签署量产合同,标志着
    的头像 发表于 08-10 16:50 ?1560次阅读