0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RAPIDS 25.06版本新增多项功能

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 2025-09-09 09:54 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

RAPIDS 是一套面向 Python 数据科学的 NVIDIA CUDA-X 库,最新发布的 25.06 版本引入了多项亮眼新功能,其中包括 Polars GPU 流执行引擎——这是一种面向图神经网络(GNN)的统一 API,以及无需更改代码即可实现的支持向量机加速功能。在本篇博客中,我们将介绍其中的几项重要更新。

Polars GPU 引擎更新

2024 年 9 月,NVIDIA 与 Polars 团队合作推出了基于 NVIDIA cuDF 开发的 Polars GPU 引擎。此次发布的 25.06 版对 Polars GPU 引擎的功能进行了重大更新。

流执行器现已进入实验阶段

25.06 版在 Polars GPU 引擎中引入了流执行功能。流执行器利用数据分区和并行处理技术,能够处理超出显存容量的数据集。要使用这个新的流执行器,用户可以将恰当配置的 GPUEngine 对象传递给 Polars 的 collect 调用。

这种新的流模式还能让用户将数据处理工作流扩展到多个 GPU,有助于加速分析数百 GB 到 TB 级的数据集。对于需要在分区之间移动数据的操作(例如连接和分组),新引入的数据混洗(shuffle)机制可在设备之间重新分配数据。多 GPU 执行通过 Dask 分布式调度器进行编排,使用前需要先设置一个 Dask 客户端。

流执行器目前仍在积极开发中,尚未支持的操作将自动回退到内存执行器。

支持滚动聚合及更多列操作

最新版本还包含了对 Polars GPU 引擎中一些关键新 DataFrame 功能的支持。首先,我们在 Polars 中添加了对 .rolling() 操作的支持,允许用户基于一些 DataFrame 中的其他列创建滚动组。这在处理时间序列数据集时尤为实用。

此外 GPU 引擎现在支持更丰富的日期时间列表达式,目前已支持的新方法包括 .strftime() 和 .cast_time_unit()。随着我们继续扩展整体 API 覆盖范围,未来版本还将支持更多方法。

统一的 GNN API

NVIDIA cuGraph-PyG 进一步集成了 WholeGraph 以加速特征提取,形成了我们所说的统一 API。这个新 API 现在允许用户在单 GPU 工作流中使用 WholeGraph 的加速特征存储,同时无需修改脚本即可用于多 GPU 或多节点工作流。

借助统一 API,在单 GPU 上进行原型开发时使用相同的 GNN 训练脚本就能在具有多个 GPU 的单节点以及多节点上运行。通过 PyTorch 的 torchrun 命令管理进程设置,使得大多数 PyTorch 用户都可以熟练地使用统一 API。

无需更改代码的 cuML 增强功能

今年 3 月,NVIDIA 推出了由 cuML 驱动、用于 scikit-learn 的无需更改代码的加速器,该加速器已进入公测阶段。在 25.06 版本中,cuML 为用户带来了更多无需更改代码的功能。

无需更改代码的支持向量机

NVIDIA cuML 扩展了其无需更改代码的加速功能,新增了对支持向量机的支持。支持向量分类(SVC)和支持向量回归(SVR)这两种强大的算法在 GPU 上执行时,能很好地处理高维数据并显著地提升速度。通过在 cuML 的零代码变更接口中添加这些估计器,利用支持向量机的现有 scikit-learn 工作流无需修改即可加速。cuML 和 scikit-learn 在 SVC 和 SVR 的实现上存在一些关键差异,还请用户加以了解。

改进的 scikit-learn 兼容性

25.06 版本对 cuML 加速 scikit-learn 估计器的方式进行了重大重构,增强了 scikit-learn 一致性,还改进了参数验证和异常处理。此外,通过这次重新设计,cuML 也增强了与 scikit-learn API 的兼容性,可以更轻松地加速目前与 scikit-learn 集成的第三方库。

随机森林与更新后的森林推理库(FIL)集成

通过集成更快、更强大的森林推理库(FIL),cuML 的随机森林估计器得到了升级,在保持向后兼容性的同时,提供了更高的性能和更好的内存管理。

需注意,旧版特有的一些 API 调节参数(knobs)现已弃用,并将在即将发布的 25.08 版本中移除。

RAPIDS 内存管理器与NVIDIABlackwell 解压缩引擎的兼容性

RAPIDS 内存管理器(RMM)库增加了全新功能,确保用户能够使用最新的 NVIDIA 硬件功能。在最新版本中,RMM 异步内存资源可支持兼容 NVIDIA Blackwell GPU 上基于硬件的解压缩引擎,让 IO 密集型工作流中的性能得到提升。

此外,RMM 现在以一个预编译共享库的形式存在,取代了之前的仅包含头文件的库。我们相信这一变化将为未来解锁新功能奠定基础。

平台更新:Python 和NVIDIA CUDA 支持

25.06 版本为所有 RAPIDS 库添加了对 Python 3.13 的支持,同时也是最后一个支持 CUDA 11 的版本。从 25.08 版开始,RAPIDS 将不再支持 CUDA 11。如需继续使用 CUDA 11,可以固定使用 25.06 版本。

结语

RAPIDS 25.06 版为新的机器学习算法带来了零代码变更功能、新的 Polars GPU 流引擎、异步内存资源的硬件解压缩功能等多项功能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5396

    浏览量

    107262
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5008

    浏览量

    132662
  • 引擎
    +关注

    关注

    1

    文章

    367

    浏览量

    23184

原文标题:RAPIDS 新增 GPU Polars 流执行等多项新功能

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    匠芯创发布新版GUI开发工具 新增多国语言设置等功能

    。此次版本更新,为用户带来了诸多实用的新功能,进一步提升了设计体验和开发效率。在V1.3.0版本中,AiUIBuilder新增了多国语言切换功能
    的头像 发表于 08-07 15:36 ?518次阅读
    匠芯创发布新版GUI开发工具 <b class='flag-5'>新增多</b>国语言设置等<b class='flag-5'>功能</b>

    匠芯创发布新版GUI开发工具 新增多国语言设置等功能

    。此次版本更新,为用户带来了诸多实用的新功能,进一步提升了设计体验和开发效率。 在V1.3.0版本中,AiUIBuilder新增了 多国语言切换功能
    发表于 07-16 13:54

    NVIDIA DOCA 3.0版本的亮点解析

    NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,每个版本都扩展了
    的头像 发表于 07-04 14:27 ?610次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 3.0<b class='flag-5'>版本</b>的亮点解析

    CANoe产品体系19版本新特性及新增Option(上)

    版本持续助力当前车辆E/E架构中ECU开发验证,同时赋能后续智能网联电动车型预研验证。新版本CANoe产品体系新增数据驱动的DDS、车辆互联服务和高效电机模型库,进一步支持CANXL
    的头像 发表于 06-11 10:03 ?1877次阅读
    CANoe产品体系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    NVIDIA在ICRA 2025展示多项最新研究成果

    在亚特兰大举行的国际机器人与自动化大会 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控领域的多项研究成果。
    的头像 发表于 06-06 14:56 ?873次阅读

    NVIDIA虚拟GPU 18.0版本的亮点

    NVIDIA 虚拟 GPU(vGPU)技术可在虚拟桌面基础设施(VDI)中解锁 AI 功能,使其比以往更加强大、用途更加广泛。vGPU 通过为各种虚拟化环境中的 AI 驱动工作负载提供动力,提高了
    的头像 发表于 04-07 11:28 ?857次阅读

    Altium Designer 25.4.2版本的新功能

    在原理图元件的属性中,新增了对动态(条目级)参数的可见性支持。这些动态参数的值可以在源数据库 / PLM系统中进行更改,并同步到已放置的工作区库元件中,而无需创建这些元件的新修订版本。现在,当在
    的头像 发表于 03-24 11:34 ?1342次阅读
    Altium Designer 25.4.2<b class='flag-5'>版本</b>的新<b class='flag-5'>功能</b>

    Sapphire Rapids与OpenVINO?工具套件是否兼容?

    无法确定 Sapphire Rapids 与 OpenVINO? 工具套件的兼容性
    发表于 03-05 06:55

    SOLIDWORKS 2025引入了多项新增工具和增强功能

    在工程设计领域,SOLIDWORKS一直以其强大的功能和灵活的操作性赢得了广泛的认可。随着SOLIDWORKS 2025版本的发布,这款三维CAD设计软件再次以一系列令人瞩目的新增工具和增强
    的头像 发表于 12-17 15:23 ?893次阅读

    NVIDIA DOCA 2.9版本的亮点解析

    NVIDIA DOCA通过为开发者提供全面的软件框架以利用硬件加速来增强 NVIDIA 网络平台的功能,从而提高性能、安全性和效率。其 API、库和工具生态系统简化了数据中心基础设施的开发,实现了工作负载卸载、加速和隔离,以支持
    的头像 发表于 11-27 11:15 ?1040次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 2.9<b class='flag-5'>版本</b>的亮点解析

    RAPIDS cuDF将pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 当前已能够为 950 万 pandas 用户带来 GPU 加速,且无需修改代码。
    的头像 发表于 11-20 09:52 ?831次阅读
    <b class='flag-5'>RAPIDS</b> cuDF将pandas提速近150倍

    NVIDIA Research在ECCV 2024上展示多项创新成果

    在米兰举行的欧洲计算机视觉国际会议 (ECCV) 上,NVIDIA Research 展示了多项突破性的创新成果,共发表了 14 篇论文。
    的头像 发表于 11-19 15:07 ?928次阅读

    英国比克新推出了PicoScope7软件的稳定新版本

    兼容性的更新,为用户带来更加流畅和高效的使用体验。PicoScope7.1.39版本新增功能包括:1、注释功能:用户可以在图形内添加说明,并通过箭头突出显示和解
    的头像 发表于 11-09 01:08 ?936次阅读
    英国比克新推出了PicoScope7软件的稳定新<b class='flag-5'>版本</b>

    Linux微信4.0.0版发布,功能再升级

    近日,备受瞩目的Linux微信4.0.0版本终于迎来了正式发布。此次版本更新不仅带来了多项实用功能,还实现了与Windows、macOS公测版本
    的头像 发表于 11-06 10:59 ?994次阅读

    浅谈Xpedition 2409版本的新功能

    在《创新不止|Xpedition 2409版本功能揭秘(上)》一文中,我们了解了Xpedition 2409版本的部分改进部分。今天,我们继续看Xpedition 2409新版本给我
    的头像 发表于 10-31 15:33 ?3663次阅读