0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RAPIDS加速器v21.08的功能应用

星星科技指导员 ? 来源:NVIDIA ? 作者:Eric Rife ? 2022-04-20 14:58 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

介绍

用于Apache Spark 的 RAPIDS 加速器 8 月版( 21.08 )现已发布。自 NVIDIA GTC 2020 首次发布以来,已经有很长时间了。我们在许多方面都有所改进,特别是在易用性方面, Apache Spark 应用程序的代码更改很少甚至没有。去年,该团队一直专注于添加功能和持续改进性能。为了证明这一点,我们使用 NVIDIA 数据科学( NDS )基准测试了定期测量在 3000 ( 3 TB 未压缩)的比例因子下的性能和功能。在此版本中,除了添加新功能外,我们非常自豪地在提高所有通过查询的端到端速度和降低 NVIDIA EGX 服务器的总体拥有成本方面取得了进展。

基准更新

NVIDIA 决策支持( NDS )是我们对 Apache Spark 社区常用的行业标准数据科学基准的改编。 NDS 包含与行业标准基准测试 TPC-DS 相同的 105 个 SQL 查询,但修改了数据集生成和执行脚本的部分。在 GTC 2021 更新中,有 95 个查询通过。在 21.08 版本中,通过核心外分组方式、窗口排名和密集排名等新功能,我们已经能够在 GPU 上运行所有 105 个查询。

基准设置

比例因子 -3K (带浮点数的 3TB 数据集)

Systems: 4x NVIDIA 认证 EGX 服务器

EGX 服务器硬件规格: 4-node Dell R740xd, each with (2) 24-core CPUs, 512GB RAM, HDFS on NVMe, (1) CX-6 Dx 25/100Gb NIC, 2x NVIDIA A30 GPU

CPU 硬件规格: 4-node dell r740xd , each with ( 2 ) 24-core CPU s , 512GB ram , hdfs on nvme ,( 1 ) cx-6 dx 25 / 100gb nic

软件: RAPIDS 加速器 v21.08.0 、 cuDF 21.08.0 、 Apache Spark 3.1.1 、 UCX 1.10.1

pYYBAGJfrzaARpzXAAChsgig6dI213.png

图 1 : EGX 服务器上的 NDS 查询速度: GPU vs CPU 。

基于此版本,我们很高兴地向大家展示,所有 105 个查询现在都可以在 GPU 上运行,而无需任何代码更改。

用于这些基准测试的基准服务器对于四台没有 GPU s 的服务器的成本略低于 170000 美元,而在每台服务器中包含一台 NVIDIA A100 GPU 的成本则低于 220000 美元。

简单来说,基准 GPU 服务器的成本是 CPU 服务器的 1.29 倍。

如上图所示(图 1 ),超过 95 个查询现在比 GPU 快 1.29 倍,因此运行起来更便宜。

GPU 上一些速度较慢的查询目前正在解决中,我们正在不懈地努力改进这些查询并提高总体速度。

用户可以很容易地推断出 GPU 的加速从 1x 到 18x 不等,因此建议用户确认 GPU 的正确用例。

如果用户不确定 GPU 的正确用例,鉴定工具将是一个方便的资产。有关鉴定工具的更多信息,请参阅以下章节。

分析和鉴定工具

分析与鉴定工具于 21.06 发布,获得了用户社区的积极反馈以及对新功能的要求。在 21.08 中,鉴定工具现在能够处理 Apache Spark 2.x 版本生成的事件日志。该工具还将支持 AWS EMR 6.3.0 、 Google Dataproc 2. 0 、 Microsoft Azure Synapse 以及 DataRicks 7.3 和 8.2 运行时生成的事件日志。鉴定工具不再需要 Spark 运行时。用户现在只需在机器上使用 Apache Spark 3.x JAR 即可使用鉴定工具。最新版本还具有选择事件日志的新过滤功能。该工具还查找插件不支持的读取数据格式和类型,并从分数中删除这些格式和类型(基于 SQL Dataframe 操作中的总任务时间)。输出将以简洁的格式报告在终端上,对每个已处理事件日志的详细分析将存储为 csv 输出。

新功能

此版本为数组和结构添加了更多功能。我们现在可以对多层结构数据类型进行联合,也可以以拼花格式编写数组数据类型。我们在现有的超前、滞后和行号功能中添加了秩和密集秩窗口功能。有了这一新增功能, RAPIDS 加速器现在可以支持 SQL 中最常用的窗口运算符。对于时间戳操作符,我们添加了对遗留时间戳的支持。使用此功能,用户可以读取 Spark 2.0 中支持的传统时间戳格式。对于 Databricks 用户,我们添加了在 GPU 中缓存数据的功能(所有其他平台都支持这种功能)。

我们通过处理 GPU 内存溢出的数据集以进行分组和窗口操作,继续改善用户体验。这一改进将节省用户创建分区的时间,以避免 GPU 上出现内存不足错误。类似地, UCX 1.11 的采用改进了 RAPIDS Spark 加速洗牌管理器的错误处理。

关于作者

Eric Rife 是 NVDIA 数据科学公司的技术营销经理。他是一名高级专业人员,拥有 25 年的管理和工程经验,设计和管理全天候关键任务企业系统,包括 Unix / Linux / Windows 服务器、应用程序服务器和多 PB 存储解决方案。他目前领导 NVIDIA 的工作,帮助基础设施经理和数据科学家重新思考如何加快 AI 在企业业务应用中的应用。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    9860

    浏览量

    88429
  • WINDOWS
    +关注

    关注

    4

    文章

    3618

    浏览量

    91766
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可扩展 NVMe? RAID 存储解决方案

    Technology Inc.(微芯科技公司)推出 Adaptec ? ?SmartRAID 4300 系列 NVMe? RAID 存储加速器。这是一款功能丰富又安全的支持RAID的高性能软件定义存储(SDS)解决方案
    的头像 发表于 08-06 16:31 ?4153次阅读
    Microchip推出Adaptec? SmartRAID 4300 系列<b class='flag-5'>加速器</b> 提供安全的可扩展 NVMe? RAID 存储解决方案

    高压放大器在粒子加速器研究中的应用

    粒子加速器是现代科学研究中不可或缺的大型实验装置,广泛应用于物理学、化学、材料科学、生物学等多个领域。其核心原理是利用电场和磁场对带电粒子进行加速和约束,使粒子达到极高的能量,从而为研究微观世界
    的头像 发表于 06-19 17:09 ?235次阅读
    高压放大器在粒子<b class='flag-5'>加速器</b>研究中的应用

    粒子加速器?——?科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境中对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器技术现已发展成为集高能物理、核物理、
    的头像 发表于 06-19 12:05 ?997次阅读
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心装置

    小型加速器中子源监测系统解决方案

    小型加速器中子源是一种基于先进加速器技术的中子产生装置,凭借体积小、成本低、安全性高的优势,在医学、工业、科研、安全、能源等多个领域展现出巨大的应用潜力和价值。无论是用于医学领域的精准放疗,还是工业
    的头像 发表于 03-13 11:19 ?780次阅读
    小型<b class='flag-5'>加速器</b>中子源监测系统解决方案

    Sapphire Rapids与OpenVINO?工具套件是否兼容?

    无法确定 Sapphire Rapids 与 OpenVINO? 工具套件的兼容性
    发表于 03-05 06:55

    NVIDIA助力FinCatch开发智能投资辅助系统

    本案例中通过 NVIDIA GPU 和 RAPIDS 加速平台,FinCatch 实现了投资研究流程的全面智能化,提升数据分析速度和准确性,帮助投资者快速获取可操作的投资洞察。
    的头像 发表于 01-07 09:23 ?582次阅读

    从版本控制到全流程支持:揭秘Helix Core如何成为您的创意加速器

    加速器
    龙智DevSecOps
    发布于 :2024年11月26日 13:42:47

    NVIDIA加速计算引入Polars

    Polars 近日发布了一款由 RAPIDS cuDF 驱动的全新 GPU 引擎,该引擎可将 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使数据科学家仅在一台机器上就能实现在数秒内处理数亿行数据。
    的头像 发表于 11-20 10:03 ?825次阅读
    将<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>计算引入Polars

    RAPIDS cuDF将pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 当前已能够为 950 万 pandas 用户带来 GPU 加速,且无需修改代码。
    的头像 发表于 11-20 09:52 ?743次阅读
    <b class='flag-5'>RAPIDS</b> cuDF将pandas提速近150倍

    AMD Alveo V80计算加速器网络研讨会

    欢迎参加本次网络研讨会,我们将深入探讨 AMD Alveo V80 计算加速器如何帮助您处理高性能计算、数据分析、金融科技、网络安全、存储加速、AI 计算等领域的内存密集型工作负载。Alveo
    的头像 发表于 11-08 09:35 ?710次阅读

    贸泽开售适用于高性能计算应用的AMD Alveo V80加速器

    2024 年 9 月 25 日 – 专注于引入新品的全球电子元器件和工业自动化产品授权代理商贸泽电子 (Mouser Electronics) 即日起供应AMD的Alveo? V80计算加速器卡。该
    发表于 09-27 14:59 ?401次阅读

    NVIDIA Parabricks v4.3.1版本的新功能

    会(ESHG)上发布,其加入了新的体细胞数据变异检测功能,并将业内领先的工具升级到最新版本。这个版本是继在 NVIDIA GTC 2024 大会上发布 Parabricks v4.3 之后推出的新版本。
    的头像 发表于 09-10 10:22 ?914次阅读
    <b class='flag-5'>NVIDIA</b> Parabricks <b class='flag-5'>v</b>4.3.1版本的新<b class='flag-5'>功能</b>

    利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

    DolphinDB 是一家高性能数据库研发企业,也是 NVIDIA 初创加速计划成员,其开发的产品基于高性能分布式时序数据库,是支持复杂计算和流数据分析的实时计算平台,适用于金融、电力、物联网和零售等行业。
    的头像 发表于 09-09 09:57 ?963次阅读
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平台提升计算性能

    具有边沿速率加速器的TXB和TXS电压电平转换的注意事项

    电子发烧友网站提供《具有边沿速率加速器的TXB和TXS电压电平转换的注意事项.pdf》资料免费下载
    发表于 09-04 09:52 ?0次下载
    具有边沿速率<b class='flag-5'>加速器</b>的TXB和TXS电压电平转换<b class='flag-5'>器</b>的注意事项

    利用边沿速率加速器和自动感应电平转换

    电子发烧友网站提供《利用边沿速率加速器和自动感应电平转换.pdf》资料免费下载
    发表于 09-02 11:58 ?1次下载
    利用边沿速率<b class='flag-5'>加速器</b>和自动感应电平转换<b class='flag-5'>器</b>