0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RAPIDS cuDF如何赋能AI加速数据科学

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 2025-01-24 09:26 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着 AI 正帮助各行各业推动创新和提高效率,基于海量的高质量数据来训练各种模型是充分发挥 AI 应用潜力的必经之路,正因如此,数据科学家们面临着日益增长的工作负载需求,迫切需求寻找高效趁手的工具以应对挑战。

Pandas 是一个灵活而强大的 Python 数据分析和处理库,由于其是一款非常易于使用的 API,成为了数据科学家的首选。然而,随着数据集大小的增长,Pandas 在纯 CPU 系统中的处理速度和效率方面就会遇到困难。

对于面向数据分析工作的 DataFrame 软件库,除了 Pandas,目前还有一颗冉冉上升的开源新星——Polars。相比于主要依赖单线程执行的 Pandas,Polars 在处理大数据集时的速度通常比其快 5 到 10 倍。

尽管 Pandas 和 Polars 在数据处理领域各有所长,但是处理超大数据集不仅需要极致发挥 CPU 的能力,也需要 GPU 发挥作用。在这一背景下,NVIDIA 发布了 RAPIDS cuDF 库,用于加载、连接、聚合、过滤和以其他方式操作数据,充分利用了 GPU 大规模并行处理能力的优势。

RAPIDS 是一套开源的 GPU 加速 Python 程序库,旨在改进数据科学和分析工作流。RAPIDS cuDF 是一个 GPU DataFrame 程序库,其提供了一个类似 Pandas 的 API,用于加载、过滤和操作数据。cuDF 的早期版本只适用于 GPU 开发工作流程。而 NVIDIA 也在持续对这一应用进行更新。

现在 RAPIDS cuDF 可以为 950 万 Pandas 用户带来 GPU 加速,而无需他们更改代码,根据数据集大小为 5 GB 的分析基准测试结果,处理时间缩短到原来的 1/150。而由 RAPIDS cuDF 驱动的全新 GPU 引擎已经可将 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,这意味着仅在一台机器上数据科学家就能实现在数秒内处理数亿行数据。

借助 RAPIDS cuDF,数据科学家现在可以在他们首选的代码库上全速运行数据处理。此外,随着数据集规模不断增长,处理工作占用更多内存,在 NVIDIA RTX 加持的 AI 工作站和 PC 上的运行也实现了显著的速度提升。相比于基于传统 CPU 的解决方案,在工作站中配合使用 cuDF 和 NVIDIA RTX 5880 Ada 架构 GPU,可以将性能提升多达 100 倍。

通过以下博客了解更多关于 RAPIDS cuDF 的最新信息,解锁在 AI 应用与解决方案中加速数据分析探索的创新灵感。

无需更改代码即可将 Pandas 提速近 150 倍

Pandas 是 Python 生态系统中最流行的 DataFrame 程序库,但它的速度会随着 CPU 上数据量的增加而变慢。现在只需一条命令,用户就可以在无需更改代码的情况下,使用 cuDF 将加速计算引入到其 Pandas 工作流中。根据数据集大小为 5 GB 的分析基准测试结果,处理时间缩短到原来的 150 分之一。

点击阅读《无需更改代码,RAPIDS cuDF 将 Pandas 提速近 150 倍》了解更多 cuDF 将统一的 CPU/GPU 体验引入 Pandas 工作流并为其带来顶尖性能的详细信息。

RAPIDS cuDF 驱动的 Polars GPU 引擎

最高提速 13 倍

RAPIDS cuDF 驱动的 Polars GPU 引擎现已发布公测版,为各行各业的数据科学家和工程师提供了一种适用于中等规模数据处理的强大工具。该引擎最高能够将 NVIDIA GPU 上的 Polars 工作流速度提速 13 倍,可以在不产生分布式系统开销的情况下,高效处理数亿行规模的数据集。Polars GPU 引擎直接内置在 Polars API 中,使所有用户都能轻松访问。

点击阅读《RAPIDS cuDF 驱动的 Polars GPU 引擎发布公测版》了解更多将 NVIDIA 加速计算引入 Polars 显著提升加速性能的详细介绍。

使用 RAPIDS cuDF 加速预处理工作流

突破数据科学的瓶颈

随着 AI 和数据科学的不断发展,快速处理和分析大量数据集的能力将成为各行业实现突破的关键差异化因素。无论是开发复杂的机器学习模型、执行复杂的统计分析还是探索生成式 AI,RAPIDS cuDF 都可为新一代数据处理奠定基础。

点击阅读《解密 AI 如何加速数据科学工作流》了解更多相关信息,预见 RTX AI 将如何为未来的工程师创造无限可能。

GTC 2025 将于2025 年 3 月 17 至 21 日在美国加州圣何塞及线上同步举行。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5324

    浏览量

    106644
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4968

    浏览量

    131675
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281298
  • 数据科学
    +关注

    关注

    0

    文章

    168

    浏览量

    10513

原文标题:合集详解 RAPIDS cuDF 如何赋能 AI 加速数据科学

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展。NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 A
    的头像 发表于 05-27 14:03 ?410次阅读

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI开发

    NVIDIA GTC 推出新一代专业级 GPU 和 AI 的开发者工具—同时,ChatRTX 更新现已支持 NVIDIA NIM,RTX
    的头像 发表于 03-28 09:59 ?662次阅读

    Cadence 利用 NVIDIA Grace Blackwell 加速AI驱动的工程设计和科学应用

    融合设计专业知识与加速计算,推动科技创新、实现效和工程生产力方面的突破性进展,引领全球生活新范式 内容提要 ●?Cadence 借助 NVIDIA 最新 Blackwell 系统,将求解器的速度
    的头像 发表于 03-24 10:14 ?819次阅读

    英伟达GTC2025亮点:NVIDIA认证计划扩展至企业存储领域,加速AI工厂部署

    全新的存储认证和参考架构让企业 IT 部门更轻松地选择和部署 AI 基础设施,实现最优的性能和效。 AI 部署的成功依靠速度、数据和规模
    的头像 发表于 03-21 19:38 ?1180次阅读

    英伟达GTC2025亮点:Oracle与NVIDIA合作助力企业加速代理式AI推理

    Oracle 数据库与 NVIDIA AI 相集成,使企业能够更轻松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,
    的头像 发表于 03-21 12:01 ?768次阅读
    英伟达GTC2025亮点:Oracle与<b class='flag-5'>NVIDIA</b>合作助力企业<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b>推理

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    Oracle 数据库与 NVIDIA AI 相集成,使企业能够更轻松、快捷地采用代理式 AI ? ? ? 美国加利福尼亚州圣何塞 —— GTC? —— 2025 年 3 月 18 日
    发表于 03-19 15:24 ?374次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作助力企业<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理

    借助NVIDIA AI Foundry平台推动医疗健康与生命科学行业发展

    借助 NVIDIA AI Foundry,全球领先的临床研究与商业服务提供商 IQVIA 将为其全球生命科学领域的客户提供 AI 智能体,助力加速
    的头像 发表于 01-17 09:59 ?769次阅读

    NVIDIA加速计算引入Polars

    Polars 近日发布了一款由 RAPIDS cuDF 驱动的全新 GPU 引擎,该引擎可将 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使数据
    的头像 发表于 11-20 10:03 ?780次阅读
    将<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>计算引入Polars

    RAPIDS cuDF将pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 当前已能够为 950 万 pandas 用户带来 GPU 加速
    的头像 发表于 11-20 09:52 ?705次阅读
    <b class='flag-5'>RAPIDS</b> <b class='flag-5'>cuDF</b>将pandas提速近150倍

    使用NVIDIA RAPIDS cuDF加速预处理工作流

    AI 正帮助各行各业推动创新和提高效率,但要充分发挥其潜力,必须基于海量的高质量数据对各种模型进行训练。数据科学家在准备这类数据方面发挥着关
    的头像 发表于 11-19 15:58 ?672次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b> <b class='flag-5'>cuDF</b><b class='flag-5'>加速</b>预处理工作流

    NVIDIA加速AI在日本各行各业的应用

    企业借助基于 NVIDIA AI Enterprise 与 Omniverse 工业 AI 构建的创新中心和服务加速 AI 转型。
    的头像 发表于 11-19 15:45 ?825次阅读

    日本企业借助NVIDIA产品加速AI创新

    日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。
    的头像 发表于 11-19 14:34 ?996次阅读

    华为云徐峰:AI 应用现代化,加速软件生产力跃升

    2024 年 9 月 19 日,在华为全联接大会 2024 的“AI 应用现代化,加速软件生产力跃升”论坛上,华为云 PaaS 服务产品部部长徐峰发表了主题演讲,介绍了未来应用智能
    的头像 发表于 10-14 09:45 ?1009次阅读
    华为云徐峰:<b class='flag-5'>AI</b> <b class='flag-5'>赋</b><b class='flag-5'>能</b>应用现代化,<b class='flag-5'>加速</b>软件生产力跃升

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    高效地筛选出具有潜力的药物候选分子,加速新药上市的进程。在基因测序与编辑领域,AI技术将提高基因数据的处理速度和准确性,为个性化医疗和精准医疗提供有力支持。此外,AI技术还将推动生命
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据
    发表于 10-14 09:12