0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA CUDA-X库加速科学和工程发展

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 2025-03-25 15:11 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

超级芯片架构上的库可将计算工程工具的运算速度提升至原来的 11 倍,并可处理计算规模达 5 倍的任务。

借助由 NVIDIA 超级芯片提供支持的NVIDIA CUDA-X库,各类科学家和工程师能够更快地解决棘手问题。

NVIDIA GTC 全球 AI 大会上宣布,开发者现在可以通过 CUDA-X 与新一代超级芯片架构的协同,实现 CPUGPU 资源间深度自动化整合与调度,相较于传统加速计算架构,该技术可使计算工程工具运行速度提升至原来的 11 倍,计算规模增加至 5 倍。

这极大地加速并改进了工程模拟、设计优化等方面的工作流程,帮助科学家和研究人员更快地取得突破性成果。

NVIDIA 于 2006 年推出了 CUDA,开启了加速计算的应用新纪元。历经多年发展,NVIDIA 已经构建了 900 多个专业领域的 NVIDIA CUDA-X 库和 AI 模型,推动加速计算的应用,并催生多项重大的科学突破。如今,CUDA-X 将加速计算拓展至一系列新的工程领域,包括天文学、粒子物理学、量子物理学、汽车、航空航天及半导体设计。

NVIDIA Grace CPU 架构可显著提升显存带宽,同时降低功耗。NVIDIANVLink-C2C互连技术可提供超高带宽,使 GPU 和 CPU 能够共享存储单元,从而让开发者简化专用代码编写、处理更大规模的计算任务,并提高应用性能。

借助 NVIDIA cuDSS 加速工程求解器

NVIDIA 的超级芯片架构使用户能够更高效地利用 CPU 和 GPU 处理能力,从而可以从相同的底层 GPU 中获得更高的性能。

NVIDIA cuDSS库专为解决涉及稀疏矩阵的大型工程模拟问题而设计,可广泛用于设计优化、电磁模拟工作流程等应用。cuDSS 通过 Grace GPU 显存与高带宽 NVLink-C2C 互连技术,实现对超出设备显存容量限制的大型矩阵的分解和求解,从而使用户能够在极短时间内解决极其庞大的问题。

GPU 和 Grace GPU 之间的一致共享存储单元可最大限度地减少数据迁移,从而显著降低大型系统的运行开销。对于各类大规模计算工程问题,通过 Grace CPU 存储单元和超级芯片架构,在相同 GPU 和 cuDSS 混合显存技术下,可将最耗时的求解环节速度提升至原来的 4 倍。

Ansys 已将 cuDSS 集成到其 HFSS 求解器中,显著增强了电磁模拟的性能。借助 cuDSS,HFSS 软件可将矩阵求解器速度提升至原来的 11 倍。

Altair OptiStruct 采用了 cuDSS Direct Sparse Solver 库,极大加速了其有限元分析的工作负载。

这些性能的提升是通过优化 GPU 上的关键操作,同时智能地使用 CPU 进行共享存储单元以及异构 CPU 和 GPU 执行来实现的。cuDSS 可自动检测利用 CPU 能提供额外优势的区域,从而进一步提高效率。

借助超级芯片显存以超快速度进行扩展

NVLink-CNC 互联技术可提供 CPU 和 GPU 之间的显存一致性,从而在单个 GPU 上扩展显存受限的应用程序。

许多工程模拟都受到规模的限制,需要进行大量模拟才能生成设计包含复杂组件(如飞机引擎)的设备所需的分辨率。通过利用在 CPU 和 GPU 显存之间无缝读写的能力,工程师可以轻松实现核外求解器来处理更大的数据。

NVIDIA cuQuantum 助力量子计算研究

量子计算机有望加速解决许多科学和工业学科的核心问题。缩短有用量子计算的时间,很大程度上取决于模拟极其复杂的量子系统的能力。

模拟使研究人员能够在当下开发新算法,以适应未来的量子计算机规模。此外,它们还在优化量子处理器、运行复杂的性能仿真,以及新量子比特设计的噪声特性方面发挥着关键作用。

量子算法的所谓状态向量模拟需要对存储在显存中的指数级大规模向量执行矩阵运算。而张量网络模拟则通过张量收缩来模拟量子算法,对于特定重要类别的应用,能够实现成百上千个量子比特的模拟规模。

NVIDIA cuQuantum库可加速这些工作负载。cuQuantum 与每个领先的量子计算框架集成,因此所有量子研究人员都可以在不更改代码的情况下利用模拟性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5324

    浏览量

    106656
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4969

    浏览量

    131723
  • AI
    AI
    +关注

    关注

    88

    文章

    35506

    浏览量

    281394
  • 超级芯片
    +关注

    关注

    0

    文章

    38

    浏览量

    9113

原文标题:GTC25 | NVIDIA 借助由超级芯片提供支持的 CUDA-X 库加速科学和工程发展

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA助力欧洲金融服务行业智能化发展

    NVIDIA AI 与数据科学帮助欧洲大陆加速金融机构欺诈检测、实时风险建模及客户服务应用。
    的头像 发表于 06-19 14:28 ?549次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 AI 应用的
    的头像 发表于 05-27 14:03 ?413次阅读

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如 NVIDIA cuDSS 和
    的头像 发表于 05-27 13:59 ?517次阅读

    NVIDIA Cosmos加速机器人和自动驾驶汽车物理AI发展

    NVIDIA Cosmos 通过可预测未来世界状态的世界基础模型加速物理 AI 的发展
    的头像 发表于 04-24 11:01 ?607次阅读
    <b class='flag-5'>NVIDIA</b> Cosmos<b class='flag-5'>加速</b>机器人和自动驾驶汽车物理AI<b class='flag-5'>发展</b>

    Cadence 利用 NVIDIA Grace Blackwell 加速AI驱动的工程设计和科学应用

    融合设计专业知识与加速计算,推动科技创新、实现能效和工程生产力方面的突破性进展,引领全球生活新范式 内容提要 ●?Cadence 借助 NVIDIA 最新 Blackwell 系统,将求解器的速度
    的头像 发表于 03-24 10:14 ?819次阅读

    英伟达GTC2025亮点:NVIDIA Blackwell加速计算机辅助工程软件,实现实时数字孪生性能数量级提升

    。 有了这些加速的软件和用于进一步优化性能的 NVIDIA CUDA-X 和蓝图,汽车、航空航天、能源、制造业和生命科学等行业可在保持能效
    的头像 发表于 03-21 15:12 ?734次阅读

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    Oracle 数据NVIDIA AI 相集成,使企业能够更轻松、快捷地采用代理式 AI ? ? ? 美国加利福尼亚州圣何塞 —— GTC? —— 2025 年 3 月 18 日
    发表于 03-19 15:24 ?375次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作助力企业<b class='flag-5'>加速</b>代理式 AI 推理

    简述NVIDIA Isaac的重要更新

    在 2025 CES,NVIDIA 宣布了对NVIDIA Isaac的重要更新。NVIDIA Isaac 是一个由加速、应用框架和 AI
    的头像 发表于 01-17 09:57 ?1111次阅读
    简述<b class='flag-5'>NVIDIA</b> Isaac的重要更新

    NVIDIA预测2025年AI行业发展

    NVIDIA 加速计算、数据科学和研究领域专家预测,多模态模型将推动行业创新和效率提升。
    的头像 发表于 12-18 13:49 ?1301次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    监控/利用率、选择可用GPU卡子集等内容。 6. 故障排除:针对NVIDIA驱动安装、多GPU设置、GPU模式、硬件识别、CUDA错误、TCC模式等问题给出了相应的解决方法。
    发表于 12-16 14:25

    NVIDIA将在越南开设首个研发中心以推动AI发展

    从事软件开发等工作,借助越南丰富的 STEM(科学、技术、工程和数学)工程师人才,携手行业领袖、初创企业、政府机构、大学及学生,共同加速
    的头像 发表于 12-07 11:19 ?1189次阅读

    NVIDIA加速全球大多数超级计算机推动科技进步

    HPCwire 读者和编辑选择奖。 自 2006 年发布 CUDA 以来,NVIDIA 不断推动 AI 和加速计算的进步,最新发布的全球最强超级计算机 TOP500 榜单突显了该公司在超算领域取得的瞩目成就
    的头像 发表于 11-24 14:38 ?724次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>全球大多数超级计算机推动科技进步

    NVIDIA发布cuPyNumeric加速计算

    加速计算帮助科研人员无缝地扩展到强大的计算集群,并且无需修改 Python 代码,推进科学发现。
    的头像 发表于 11-21 10:05 ?681次阅读

    有没有大佬知道NI vision 有没有办法通过gpu和cuda加速图像处理

    有没有大佬知道NI vision 有没有办法通过gpu和cuda加速图像处理
    发表于 10-20 09:14

    怎么在TMDSEVM6678: 6678自带的FFT接口和CUDA提供CUFFT函数选择?

    请教一下gpgpu上包括4个Riscv cpu和一个DPU, 没有6678,要替换原来信号处理用的6678,该怎么在6678自带的FFT接口和CUDA提供CUFFT函数选择?
    发表于 09-27 07:20