0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU软件栈五层模型(二)典型软件框架案例

中科驭数(北京)科技有限公司 ? 2022-06-13 15:50 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、NVIDIA DOCA软件框架

1)设计目的

NVIDIA BlueField DPU的核心目的是解决数据中心中基于CPU计算的基础设施的算力问题,主要涉及网络、存储、安全及基础设施管理这个几个方面。而DOCA是为了将BlueField DPU提供的硬件能力做软件抽象和封装,以SDK Library的形式提供友好的可编程接口,提高应用开发的效率。

2)技术细节

DOCA架构如下图所示,DOCA有三个模块,分别是:

(1)DOCA drivers:是对DPU硬件资源的低层次封装,其提供的low-level API是对硬件卸载能力的访问,主要包含网络卸载、安全卸载、存储卸载等算力的访问,同时支持DPDK, RDMA,Virtio-net(网络虚拟化),Virtio-blk(存储虚拟化),PCIe等通用能力。

(2)DOCA libs:是基于DOCA drivers为上层应用封装的high-level API,这些API是面向应用层所需的功能,例如面向网络应用的Flow,Data Integrity, UPF(User Plane Function), VNF(Network Functions Virtualization);面向存储应用的SPDK;面向安全应用的DPI(Deep Packet Inspection), Host introspection等。

(3)DOCA services:封装了基础设施的控制和管理功能,如DPU设备的管理,SDN(Software-Defined Network)的控制接口,存储管理,Network Telemetry等。

pYYBAGKm0iyAML9dAAGXkY67n5Q280.png

图DOCA软件栈

3)功能分析

从纵向的功能角度来看,DOCA SDK提供了网络加速、安全加速、存储加速和基础设施管理加速的功能,相关的技术细节如下:

(1)网络加速SDK:支持ASAP2 (Accelerated Switching and Packet Processing) SDN、VirtIO、OVS (open virtual switching)、P4编程、RDMA。

(2)安全加速SDK:支持Inline encryption、DPI(Deep Packet Inspection)、TLS、IPSec。

(3)存储加速SDK:支持SPDK、VirtIO、NVMe-oF、数据加解密和数据压缩等。

(4)基础设施管理加速SDK:支持DPU management、Traffic telemetry、Packet filtering。

二、Intel OneAPI软件框架

1)设计目的

OneAPI设计的目的是通过实现一个跨平台,开放的,标准的通用编程模型及接口来提高在异构加速器架构下的开发效率。OneAPI本身并不提供DPU设备,而是构建一个软件框架来整合业界现有的异构计算设备11。

2)技术细节

OneAPI抽象出两层APIs,分为L0 (Low-level) API和L1 (High-Level) API。其结构如下图所示。

pYYBAGKm0iyAFItpAAJosKmEWfo080.png

图OneAPI软件栈

L0 API: OneAPI的L0 API整合并封装了业界流行的异构计算设备(如GPUAIFPGA等)及其软件框架(如CUDA,OpenCL),并提供统一的针对硬件资源访问的low-level API。这样,不同的硬件平台对上层应用开发来说是透明的,从而起到了跨平台的作用。

L1 API:OneAPI的L1 API提供了一系列针对特定应用场景的High-level API,这些API主要服务于机器学习、数据分析、并行计算、视频处理等特定领域,有Deep Learning API, Data Science API, Data Analysis API,Multiple Thread API, Video Processing API等。

基于上述两层的抽象和封装,上层应用程序可以利用L1 API进行特定领域的数据处理加速,也可以直接访问L0 API进行编程来服务更加广泛的场景。

三、中科驭数HADOS?软件框架

驭数DPU的软件框架是基于上述五层模型构建的,整体架构如下图所示:

poYBAGKm0tKAAzORACM-uOwKVNw516.png

图 驭数异构计算系统架构

DSA设备层集成了驭数自研DPU芯片加速卡设备,分别是针对数据计算、软件定义网络、软件定义存储以及安全相关的的硬件设备。这些硬件设备在物理上是由驭数DPU芯片、内存、存储、I/O通道和KPU指令集等共同构成;DSA操作层是一个为支撑基于DPU设备开发的软件操作平台,即DPU操作平台,该平台提供了DPU资源访问、调度、监控和管理的功能,同时也提供了完备友好的开发工具库;计算引擎层为针对数据计算应用软件封装的一个通用的数据计算加速引擎,它基于DPU操作平台提供的计算能力,实现了硬件卸载的算子及相应算子的软件优化器,这些算子分为计算类算子、网络类算子和存储类算子;应用服务层为使用驭数DPU进行加速的数据处理平台、网络服务平台和存储服务平台,如大数据领域的Spark,数据库领域的PostgreSQL,机器学习领域的XGBoost,微服务架构中负责远程通信的gRPC框架,Web服务平台Nginx以及分布式存储平台Ceph等;业务开发层为驭数数据计算加速产品所服务的业务系统,主要来自对计算、网络、存储性能敏感的领域,如金融计算、交易、数据分析、云服务等。在上述五层架构中,DPU操作平台与数据计算加速引擎共同构建了驭数为支撑DPU异构计算而打造的专用软件框架,即敏捷异构软件开发平台,Heterogenous Agile Developing & Operating System,简称“HADOS?”。

四、DOCA,OneAPI与HADOS比较分析

整体来看,这三款软件框架的出发点是相似的,都是在异构计算的架构下提供一套通用且编程友好的软件开发框架。它们在设计这套软件框架时都采用了分层抽象的思路,目的是使各层职责清晰,对上层提供足够简单且功能完备的接口。

具体到功能实现上,它们都是在网络、计算、存储、安全这些范畴内做了相应的支持,不过由于它们待解决的问题及根本目的存在差异,所以在架构设计和功能实现上的侧重点有所不同。简单来说,DOCA侧重点是支持基于Blue Field DPU的数据中心基础设施服务加速的场景;OneAPI侧重点是构建设备无关的资源访问库和编程接口;HADOS侧重点是支持基于YusurDPU的网络、计算、存储服务加速的场景。

下表针对这三款软件框架在设计目的、五层架构模型及各自特点上做了详细比较。

pYYBAGKm0uOAYVAHACvIG-wzwQE067.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    394

    浏览量

    25085
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中软国际正式启动鸿蒙软件工场

    自2024年HarmonyOS NEXT版本起,HarmonyOS应用框架更新为鸿蒙“单框架”,正式告别了对Android应用框架、内核的依赖。2025年,鸿蒙生态进入规模化发展期,
    的头像 发表于 06-17 15:44 ?473次阅读

    润和软件StackRUNS异构分布式推理框架的应用案例

    江苏润和软件股份有限公司(以下简称“润和软件”)自主研发的StackRUNS异构分布式推理框架已在实际场景中取得显著成效,成功应用于大型园区多模态模型演练及高校满血版DeepSeek-
    的头像 发表于 06-13 09:11 ?624次阅读
    润和<b class='flag-5'>软件</b>StackRUNS异构分布式推理<b class='flag-5'>框架</b>的应用案例

    润和软件发布StackRUNS异构分布式推理框架

    当下,AI模型规模持续膨胀、多模态应用场景日益复杂,企业正面临异构算力资源碎片化带来的严峻挑战。为应对行业痛点,江苏润和软件股份有限公司(以下简称“润和软件”)正式发布自主研发的StackRUNS异构分布式推理
    的头像 发表于 06-13 09:10 ?612次阅读
    润和<b class='flag-5'>软件</b>发布StackRUNS异构分布式推理<b class='flag-5'>框架</b>

    RISC-V架构下AI融合算力及其软件实践

    。目前,进迭时空已经取得了显著的进展,成功推出了第一个版本的智算核(带AI融合算力的智算CPU)以及配套的AI软件软件简介AI算法部署旨在将抽象描述的多
    的头像 发表于 06-06 17:04 ?608次阅读
    RISC-V架构下AI融合算力及其<b class='flag-5'>软件</b><b class='flag-5'>栈</b>实践

    第三届NVIDIA DPU黑客松开启报名

    碰撞的绝佳机会。本次竞赛采用开放式主题,参与者将通过 NVIDIA DOCA 软件框架构建创新的加速应用程序,充分挖掘 NVIDIA BlueField DPU 在 AI、网络、存储和安全等领域的强大潜能。
    的头像 发表于 05-27 10:16 ?518次阅读

    润和软件发布鲲鹏+openGauss全智能体解决方案

    近日,江苏润和软件股份有限公司(以下简称“润和软件”)携手鲲鹏,于鲲鹏开发者创享日上海站共同发布“以鲲鹏算力为基座、深度协同openGauss开源数据库”的AgentRUNS全智能体解决方案,赋能企业打造场景驱动的智能业务引擎
    的头像 发表于 05-14 12:01 ?618次阅读

    润和软件AIRUNS 3.0通过鲲鹏生态全兼容认证,全面适配国产软硬件环境

    近日,江苏润和软件股份有限公司(以下简称“润和软件”)自主研发的企业级全流程AI模型工艺平台AIRUNS 3.0,顺利完成了与鲲鹏生态的全兼容认证,标志着其在底层硬件、操作系统、中间
    的头像 发表于 05-13 09:48 ?546次阅读
    润和<b class='flag-5'>软件</b>AIRUNS 3.0通过鲲鹏生态全<b class='flag-5'>栈</b>兼容认证,全面适配国产软硬件环境

    润和软件AIRUNS智能中枢平台接入DeepSeek大模型

    近日,江苏润和软件股份有限公司(以下简称“润和软件”)自主研发的AIRUNS智能中枢平台已全面接入国内领先的大模型DeepSeek,为企业提供从模型训练、推理优化到业务落地的全
    的头像 发表于 02-07 11:06 ?1220次阅读
    润和<b class='flag-5'>软件</b>AIRUNS智能中枢平台接入DeepSeek大<b class='flag-5'>模型</b>

    利用NVIDIA DPF引领DPU加速云计算的未来

    DPU 的强大功能,并优化 GPU 加速计算平台。作为一种编排框架和实施蓝图,DPF 使开发者、服务提供商和企业能够无缝构建 BlueField 加速的云原生软件平台。
    的头像 发表于 01-24 09:29 ?864次阅读
    利用NVIDIA DPF引领<b class='flag-5'>DPU</b>加速云计算的未来

    井芯微电子WENOS-PROTO协议簇软件详解

    WENOS-PROTO协议簇软件是井芯微自研的以太、三商用网络交换及路由协议解决方案。
    的头像 发表于 01-23 16:01 ?2127次阅读
    井芯微电子WENOS-PROTO协议簇<b class='flag-5'>软件</b>详解

    商汤参与基于昇思AI框架的大模型原生开发成果发布

    近日,昇思人工智能框架峰会暨成果发布会在北京举办。AI框架作为大模型开发及产业落地的基础软件,在人工智能技术中起到使能算法开发、释放硬件性
    的头像 发表于 12-17 15:04 ?906次阅读

    大语言模型开发框架是什么

    大语言模型开发框架是指用于训练、推理和部署大型语言模型软件工具和库。下面,AI部落小编为您介绍大语言模型开发
    的头像 发表于 12-06 10:28 ?596次阅读

    OSI七模型的每一功能

    开放系统互联(OSI)模型是一个概念性框架,用于标准化网络通信过程,以便不同的计算机系统和网络能够相互通信。OSI模型分为七,每一都有其
    的头像 发表于 11-24 10:46 ?1804次阅读

    OSI七模型详解 OSI七模型与TCP/IP模型比较

    OSI(Open System Interconnect)七模型是一种将计算机网络通信协议划分为七个不同层次的标准化框架,每一都负责不同的功能,从物理连接到应用程序的处理。以下是对
    的头像 发表于 11-24 10:44 ?1424次阅读

    亚信电子于IAS 2024展出最新IO-Link主站&amp;设备软件协议解决方案

    亚信电子即将于IAS 2024展示最新的亚信IO-Link主站/设备软件协议、集成亚信IO-Link主站软件协议的AX58400 EtherCAT转IO-Link网关,以及AXM5
    的头像 发表于 09-18 15:28 ?777次阅读
    亚信电子于IAS 2024展出最新IO-Link主站&amp;设备<b class='flag-5'>软件</b>协议<b class='flag-5'>栈</b>解决方案