0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Blackwell白皮书:NVIDIA Blackwell Architecture Technical Brief

向上 ? 2025-03-20 18:35 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA Blackwell 架构为生成式 AI加速计算带来的突破性进步。Blackwell 基于多代** NVIDIA 技术构建,以出众的性能、效率和规模揭开了生成式 AI 领域的新篇章。

NVIDIA Blackwell Architecture Technical Brief免费下载
*附件:NVIDIA Blackwell Architecture Technical Brief.doc

新型 AI 超级芯片

Blackwell 架构 GPU 具有 2080 亿个晶体管,采用专门定制的台积电 4NP 工艺制造。所有 Blackwell 产品均采用双倍光刻极限尺寸的裸片,通过 10 TB/s 的片间互联技术连接成一块统一的 GPU。

第二代 Transformer 引擎

第二代 Transformer 引擎将定制的 Blackwell Tensor Core技术与 NVIDIA? TensorRT? -LLM 和 NeMo? 框架创新相结合,加速大语言模型 (LLM) 和专家混合模型 (MoE) 的推理和训练。

为了强效助力 MoE 模型的推理 Blackwell Tensor Core增加了新的精度 (包括新的社区定义的微缩放格式),可提供较高的准确性并轻松替换更大的精度。Blackwell Transformer 引擎利用称为微张量缩放的细粒度缩放技术,优化性能和准确性,支持 4 位浮点 (FP4) AI。这将内存可以支持的新一代模型的性能和大小翻倍,同时保持高精度

安全 AI

Blackwell 内置 NVIDIA 机密计算技术,可通过基于硬件的强大安全性保护敏感数据和 AI 模型,使其免遭未经授权的访问。Blackwell 是业内首款具备可信执行环境 (TEE) I/O 功能的 GPU,它不仅能够与具备 TEE-I/O 功能的主机一同提供性能卓越的机密计算解决方案,还能通过 NVIDIA? NVLink? 技术提供实时保护。与未加密模式相比, Blackwell 机密计算功能供了几乎相同的吞吐量性能。现在,除了保护 AI 知识产权 (IP) 和安全地实现机密 AI 训练、推理和联邦学习,企业甚至还能以高性能的方式保护最大的模型。

NVLink、NVSwitch 和 NVLink Switch 系统

是否能释放百亿亿级计算和万亿参数 AI 模型的全部潜力取决于服务器集群中每个 GPU 之间能否快速、顺畅的通信。第五代 NVIDIA? NVLink? 可扩展至 576 个 GPU,为万亿和数万亿参数 AI 模型释放加速性能。

NVIDIA NVLink 交换机芯片可在一个有 72 个 GPU 的 NVLink 域 (NVL72) 中实现 130TB/s 的 GPU 带宽,并通过 NVIDIA SHARP? 技术对 FP8 的支持实现 4 倍于原来的带宽效率。NVIDIA NVLink 交换机芯片能以惊人的 1.8TB/s 互连速度为多服务器集群提供支持。采用 NVLink 的多服务器集群可以在计算量增加的情况下同步扩展 GPU 通信,因此 NVL72 可支持的 GPU 吞吐量是单个 8 卡 GPU 系统的 9 倍。

解压缩引擎

过去,数据分析和数据库工作流依赖 CPU 进行计算。加速数据科学可以显着提高端到端分析性能,加速价值创造,同时降低成本。Apache Spark 等数据库在接手、处理和分析大量数据等数据分析工作上发挥着关键作用。

Blackwell 拥有的解压缩引擎以及通过 900GB/s 双向带宽的高速链路访问 NVIDIA Grace? CPU 中大量内存的能力,可加速整个数据库查询工作流,从而在数据分析和数据科学方面实现更高性能。Blackwell 支持 LZ4、Snappy 和 Deflate 等最新压缩格式。

可靠性、可用性和可服务性 (RAS) 引擎

Blackwell 通过专用的可靠性、可用性和可服务性 (RAS) 引擎增加了智能恢复能力,以识别早期可能发生的潜在故障,从而更大限度地减少停机时间。NVIDIA AI 驱动的预测管理功能持续监控硬件和软件中数千个数据点的整体运行状况,以预测和拦截停机时间和低效的来源。这建立了智能可靠性技术,节省时间、能源和计算成本。

NVIDIA 的 RAS 引擎提供深入的诊断信息,可以识别关注领域并制定维护计划。RAS 引擎通过快速定位问题来源缩短周转时间,并通过促进有效的补救最大限度地减少停机时间。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5324

    浏览量

    106635
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    能比上一代NVIDIA Hopper?提高了15倍。采用第二代Transformer引擎、定制的Blackwell Tensor Core技术、TensorRT?-LLM和Nemo?框架的创新,显著加速了
    发表于 05-13 17:16

    jAVA语言环境白皮书

    jAVA语言环境白皮书The Java Language Environment (A White Paper)1. Introduction to Java
    发表于 10-14 17:35

    最新的智能电网的白皮书资料

    ,因而遇到的这些问题并非那些打从资料、技术方案所能解决的,所以自己就养成了搜集各大公司智能电网的白皮书的习惯。 下面各大公司2010年最新的智能电网的白皮书资料,在这里分享出来,有需要的童鞋可以去看
    发表于 12-23 21:08

    ZigBee白皮书

    ZigBee白皮书
    发表于 08-20 09:50

    简仪科技怒对LabVIEW的白皮书

    本帖最后由 niezidong 于 2017-8-23 20:43 编辑 简仪科技最近搞的开源平台跟NI是针锋相对啊。近期的宣传都带火药味,还出了一本白皮书。见附件。这白皮书就差直接说搞LabVIEW没前途了。各位对此有何高见?
    发表于 08-11 15:55

    IPTV服务质量白皮书

    IPTV服务质量白皮书
    发表于 10-14 14:11

    物联网领域白皮书分享

    最近研究了一些物联网相关的白皮书,分享给各位电友
    发表于 03-30 14:48

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个,通过 NVIDIA NVLink可将多
    发表于 03-19 10:56 ?780次阅读
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Blackwell</b> 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell 超级芯片的 NVIDIA DGX Sup
    的头像 发表于 03-21 09:49 ?1431次阅读

    NVIDIA AI芯片Blackwell推迟发布引热议,公司强调Hopper需求强劲

    据8月5日最新消息,NVIDIA新款AI芯片Blackwell因被曝存在设计缺陷而推迟发布的消息,迅速在业界引发了广泛讨论与关注。面对这一市场传闻,NVIDIA官方迅速作出回应,强调其旗舰产品
    的头像 发表于 08-05 15:05 ?877次阅读

    NVIDIA未来1年的Blackwell订单已全部售罄

    10月12日资讯显示,Blackwell无疑已成为NVIDIA历史上极为成功的产品典范,其市场需求量已攀升至前所未有的高峰。   凭借在全球AI算力领域的领先地位,Blackwell吸引了微软、Meta、Oracle、Op
    的头像 发表于 10-12 16:20 ?1093次阅读

    NVIDIA向开放计算项目捐赠Blackwell平台设计

    近日,在美国加利福尼亚州举行的 OCP 全球峰会上,NVIDIA 宣布已把 NVIDIA Blackwell 加速计算平台的一些基础元素捐赠给开放计算项目(OCP),并扩大 NVIDIA
    的头像 发表于 11-19 15:30 ?701次阅读

    MediaTek与NVIDIA携手设计GB10 Grace Blackwell超级芯片

    MediaTek与NVIDIA近日宣布了一项重要合作,双方将共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款超级芯片将被应用于NVIDIA的个人AI超级计算
    的头像 发表于 01-13 10:48 ?620次阅读

    英伟达GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代

    英伟达GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代
    的头像 发表于 03-20 15:35 ?786次阅读

    NVIDIA Blackwell数据手册与NVIDIA Blackwell架构技术解析

    NVIDIA Blackwell数据手册与NVIDIA Blackwell 架构技术解析
    的头像 发表于 03-20 17:19 ?858次阅读