0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU特征结构系列(一)DPU是以数据为中心IO密集的专用处理器

中科驭数(北京)科技有限公司 ? 2022-04-27 14:41 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从应用特征来看,可以把应用分为“IO密集型”和“计算密集型”两类,如下图所示。IO密集型应用,通常体现为较高的输入和输出带宽,数据直接来自于IO,数据通常具备流式特征,数据局部性不显著,如果处理性能与带宽匹配,片上缓存的作用就可以弱化。例如处理路由转发、数据加密、压缩等。计算密集型应用,体现为较高的计算密度,通常浮点性能突出,数据来自主存,数据局部性显著,复用性高,主存的大小对于问题求解的性能有直接影响。例如求解线性代数方程组,大规模神经网络训练、推理等。

pYYBAGJo3EOAddbKAAhA9nkSZ-c278.png

图不同类型的处理器的特征结构

一个处理器芯片是“IO密集”还是“计算密集”只部分决定了芯片的结构特征,并不能完全定义芯片的主体架构。无论是IO密集,还是计算密集,即可以以通用CPU为核心构造主体计算架构,也可以以专用加速器为核心构造主体计算架构。前者可称之为以控制为中心(control-centric)的模式,后者称之为以数据为中心(data-centric)的模式。控制为中心的核心是实现“通用”,数据为中心的核心是通过定制化实现“高性能”。以应用特征和架构特征这两个维度粗略划分处理器芯片类型分布,如图2-1所示。

通用CPU是偏向于控制为中心结构,理论上看就是要“图灵完备”,要支持完备的指令集,通过编程指令序列来定义计算任务,通过执行指令序列来完成计算任务,因此具备极其灵活的编程支持,可以任意定义计算的逻辑实现“通用”——这也是CPU最大的优势。同时,为了提高编程的开发效率,降低编译器复杂度,缓存管理和细粒度并行度的开发通常都是由硬件来完成。类似的,还有大量的用于各种嵌入式、移动设备的微控制器MCU,并不强调高带宽,也是以控制为中心的结构。NP,DSP也是便向于基于通用处理器来做专用化扩展,但是非常注重高通量的性能属性。例如,NP要支持数Tbps的转发带宽,所以大体可以视为控制为中心、但是IO密集的处理器类型。

GPU是以数据为中心的结构,形式上更倾向于专用加速器。GPU的结构称之为数据并行(data-parallel)结构,优化指令并行度并不是提升性能的重点,通过大规模同构核进行细粒度并行来消化大的数据带宽才是重点。例如,最新的NVIDIA TITAN RTX GPU有4608个CUDA核、576个Tensor核,而且单片GPU通常配置数十GB的超大显存。同时缓存管理多采用软件显示管理,降低硬件复杂度。这类超众核结构是以数据为中心、执行计算密集型任务的代表性架构。

DPU也偏向于数据为中心的结构,形式上集成了更多类别的专用加速器,牺牲一定的指令灵活性以获得更极致的性能。但是与GPU不同,DPU要应对更多的网络IO,既包括外部以太网,也包括内部虚拟IO,所以DPU所面临的数据并行更多可能是数据包并行,而不是图像中的像素、像块级并行。而且DPU也会配置少数通用核(如ARM,MIPS)来处理一定的控制面的任务,运行轻量级操作系统来管理DPU上的众多的异构核资源,所以体现了一定“通用”性,但性能优势主要不源于这些通用核,而是大量专用计算核。早期的一些网络处理器采用过类似Tile64的通用众核结构,以增加核的数量来应对多路处理的数据,实现并发处理,但单路延迟性能通常都比较差。因此,DPU更偏向于以数据为中心,执行IO密集任务。

DPU是软件定义的技术路线下的重要产物。在软件定义网络中,将数据面与控制面分离是最核心的思想。DPU被定义为强化了数据面性能的专用处理器,配合控制面的CPU,可以实现性能与通用性的更佳的平衡。

来源:专用数据处理器(DPU)技术白皮书,中国科学院计算技术研究所,鄢贵海等

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    394

    浏览量

    25090
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    第三届NVIDIA DPU黑客松开启报名

    第三届 NVIDIA DPU 中国虚拟黑客松(Hackathon)将于 6 月 28 日 - 6 月 30 日正式开启!作为备受广大开发者期待的年度赛事,它将提供与 NVIDIA 加速网络技术深度
    的头像 发表于 05-27 10:16 ?523次阅读

    中科驭数携DPU全栈产品亮相福州数博会,赋能智算时代算力基建

    会”)也拉开帷幕。共有150多家企业参展,展会吸引了八万多名观众参观。作为国内DPU领域领军企业,中科驭数携三大产品线亮相展会,其创新的DPU技术方案成为专业观众关注焦点。据大会报告的数据显示,我国算力总规模已达280EFLOP
    的头像 发表于 05-23 11:01 ?281次阅读
    中科驭数携<b class='flag-5'>DPU</b>全栈产品亮相福州数博会,赋能智算时代算力基建

    DPU232—高度集成USB到UART桥接控制 国产替代方案

    DPU232是款高度集成的USB到UART桥接控制,提供了种简单的解决方案,可以使用最少的元器件和PCB空间,将RS232接口转换为USB接口。
    发表于 04-01 10:53

    专用协议硬件 + R-IN引擎的微处理器RZ/N1L系列数据手册

    。 *附件:带专用协议硬件 + R-IN引擎的微处理器RZ N1L系列数据手册.pdf 特性 中央处理器(CPU):Cortex-M3(主频
    的头像 发表于 03-13 15:09 ?553次阅读
    带<b class='flag-5'>专用</b>协议硬件 + R-IN引擎的微<b class='flag-5'>处理器</b>RZ/N1L<b class='flag-5'>系列</b><b class='flag-5'>数据</b>手册

    FE1.1S的国产替代芯片DPU1.1S 高性能、低功耗4口高速USB2.0HUB控制芯片 USB拓展坞等应用之选

    DPU1.1S是款高性能、低功耗4口高速 USB2.0 HUB 控制,上行端口兼容高速 480MHz和全速12MHz两种模式,4个下行端口兼容高速480MHz、全速12MHz、低速1.5MHz
    发表于 01-24 12:16

    恩智浦i.MX 94应用处理器如何变革工业和汽车连接

    恩智浦半导体发布i.MX 94系列用处理器工业和汽车连接设定了新的标准。作为i.MX 9系列用处理器的最新成员,i.MX 94旨在提
    的头像 发表于 01-17 10:51 ?1050次阅读

    在NVIDIA BlueField-3 DPU上运行WEKA客户端的实际优势

    WEKA是可扩展软件定义数据平台的先驱,NVIDIA 正在与其合作,将 WEKA 先进的数据平台解决方案与功能强大的NVIDIA BlueField DPU相结合。
    的头像 发表于 01-07 09:43 ?765次阅读
    在NVIDIA BlueField-3 <b class='flag-5'>DPU</b>上运行WEKA客户端的实际优势

    中科驭数凭借在DPU芯片领域的积累被认定为北京市知识产权优势单位

    。 作为DPU新型算力基础设施领军企业,中科驭数直致力于推动DPU领域的技术创新和最佳实践,并将知识产权视为推动企业发展的重要力量之。以DPU
    的头像 发表于 12-31 18:49 ?821次阅读
    中科驭数凭借在<b class='flag-5'>DPU</b>芯片领域的积累被认定为北京市知识产权优势单位

    走进北大 | 算能RISC-V通用处理器设计成功开课

    近日,北京大学集成电路学院贾天宇老师开设的《现代SoC处理器架构设计》如期进行,算能首席科学家杨柳西博士、处理器架构师张明俊受邀,北大博士讲授了RXU高性能通用处理器设计的课程。《现
    的头像 发表于 12-06 01:06 ?1158次阅读
    走进北大 | 算能RISC-V通<b class='flag-5'>用处理器</b>设计成功开课

    恩智浦发布i.MX 94系列用处理器

    恩智浦半导体发布i.MX 9系列用处理器的新成员i.MX 94系列。该系列旨在用于工业控制、可编程逻辑控制(PLC)、远程信息
    的头像 发表于 11-26 17:48 ?1746次阅读

    RK3566高性能低功耗四核应用处理器数据手册

    电子发烧友网站提供《RK3566高性能低功耗四核应用处理器数据手册.pdf》资料免费下载
    发表于 10-24 16:53 ?4次下载

    安谋科技发布“玲珑”DPU和新代VPU

    安谋科技(中国)有限公司在自研技术道路上再迈坚实步伐,近日震撼发布首款“玲珑”系列DPU数据处理单元)及新代VPU(视频处理单元)。此次
    的头像 发表于 09-24 14:33 ?724次阅读

    DPU232—高度集成的USB到UART桥接控制

    DPU232是款高度集成的USB到UART桥接控制,提供了种简单的解决方案,可以使用最少的元器件和PCB空间,将RS232接口转换为USB接口。
    的头像 发表于 09-13 10:55 ?723次阅读
    <b class='flag-5'>DPU</b>232—高度集成的USB到UART桥接控制<b class='flag-5'>器</b>

    ARM处理器结构和特点

    ARM处理器,全称Advanced RISC Machines,是种基于精简指令集(RISC)架构的微处理器。其结构和特点在嵌入式系统、移动设备、物联网等多个领域具有显著优势。以下将
    的头像 发表于 09-10 11:09 ?3675次阅读