0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Nvidia GPU的风扇和电源报错解决方案

454398 ? 来源:网络整理 ? 作者:胡里糊涂 ? 2020-10-05 07:36 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

问题

最近在Ubuntu上使用Nvidia GPU训练模型的时候,没有问题,过一会再训练出现非常卡顿,使用nvidia-smi查看发现,显示GPU的风扇和电源报错:

解决方案

自动风扇控制

在nvidia论坛有人给出了解决方案,即问题的根源可能是风扇转速不足使GPU过热导致的。

首先开启GPU的persistent mode,再设置风扇的功率,重启即可生效。其中250代表的是风扇的最大功率限制,可以将其设置为最大,这样过热的时候风扇就会自动加大功率。

sudo nvidia-smi -pm 1

sudo nvidia-smi -pl 250

手动风扇控制

此外,还可以将GPU风扇的手动风速控制打开。方法为:

首先,使用sudo nvidia-xconfig --enable-all-gpus命令打开所有gpu在xserver中的设置(不使用sudo可能无权限写入新配置)

然后修改配置文件:sudo vim /etc/X11/xorg.conf,在其中的DeviceSection中加入Option “Coolbits” “4”如下图所示:

如果机器上有多块gpu,在第一步命令执行后,会在这个xorg.conf中出现多个DeviceSection,都依次执行第三步操作

重启机器后,命令行执行nvidia-settings,会打开设置界面,在其中的会显示所有GPU的设置选项,每个GPU控制选项下面都有一个Thermal settings,进入后打开enable GPU Fan Setting即可对风扇进行手动风速调整了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5353

    浏览量

    106861
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4981

    浏览量

    132125
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 ?27次阅读

    亚马逊基于NVIDIA技术实现创新型制造解决方案

    基于 NVIDIA 技术构建的创新型制造解决方案,使机械臂能够实现设备自主检测,并能将新产品无缝整合到生产线中。
    的头像 发表于 08-18 11:44 ?150次阅读

    Ansys使用NVIDIA技术优化CFD仿真解决方案

    领先的解决方案提供商正在使用 OpenUSD、RTX 和 NVIDIA Blackwell 实现实时物理数字孪生。
    的头像 发表于 08-05 16:08 ?460次阅读

    风扇灯PCBA方案开发原理及介绍

    致力于成为无刷马达驱动行业的“小巨人”,为智能制造提供高性价比解决方案。——深圳其利天下随着人们对高品质生活的不断追求,风扇灯需求量激增,成为家电行业中不可忽视的一部分。下面,我们一起探讨风扇灯在家
    的头像 发表于 06-11 15:05 ?549次阅读
    <b class='flag-5'>风扇</b>灯PCBA<b class='flag-5'>方案</b>开发原理及介绍

    利用NVIDIA技术构建从数据中心到边缘的智慧医院解决方案

    全球领先的电子制造商正在利用 NVIDIA 技术,构建从数据中心到边缘的智慧医院解决方案
    的头像 发表于 05-22 09:50 ?442次阅读

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI开发

    NVIDIA GTC 推出新一代专业级 GPU 和 AI 赋能的开发者工具—同时,ChatRTX 更新现已支持 NVIDIA NIM,RTX Remix 正式结束测试阶段,本月的 NVIDIA
    的头像 发表于 03-28 09:59 ?711次阅读

    NVIDIA GPU助力科研人员探索外星世界

    NVIDIA GPU 驱动的深度学习在短短几秒内解读出了卡西尼号土星探测器多年来收集的海量数据,为科研人员探索外星世界提供了更加智能的方式。
    的头像 发表于 02-27 10:37 ?632次阅读

    0xmd公司通过NVIDIA GPU打造医疗AI解决方案

    本案例中,0xmd 公司通过 NVIDIA GPU 打造医疗 AI 解决方案,覆盖影像分析和文本解读等领域。
    的头像 发表于 01-14 16:23 ?587次阅读

    NVIDIA技术助力Pantheon Lab数字人实时交互解决方案

    本案例中,Pantheon Lab(万想科技)专注于数字人技术解决方案,通过 NVIDIA 技术实现数字人实时对话与客户互动交流。借助 NVIDIA GPU
    的头像 发表于 01-14 11:19 ?697次阅读

    NVIDIA推出GeForce RTX 50系列台式机和笔记本电脑GPU

    NVIDIA 宣布为游戏玩家、创作者和开发者推出最先进的消费级 GPU——GeForce RTX 50 系列台式机和笔记本电脑 GPU
    的头像 发表于 01-08 11:05 ?1048次阅读

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 ?760次阅读

    借助NVIDIA GPU提升鲁班系统CAE软件计算效率

    本案例中鲁班系统高性能 CAE 软件利用 NVIDIA 高性能 GPU,实现复杂产品的快速仿真,加速产品开发和设计迭代,缩短开发周期,提升产品竞争力。
    的头像 发表于 12-27 16:24 ?782次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA
    发表于 12-16 14:25

    Supermicro推出直接液冷优化的NVIDIA Blackwell解决方案

    ,宣布推出高性能的SuperCluster。这一端对端AI数据中心解决方案采用NVIDIA Blackwell平台,专为兆级参数规模的生成式AI时代所设计。全新SuperCluster将可大幅增加液冷
    发表于 11-25 10:39 ?852次阅读
    Supermicro推出直接液冷优化的<b class='flag-5'>NVIDIA</b> Blackwell<b class='flag-5'>解决方案</b>

    AMD与NVIDIA GPU优缺点

    在图形处理单元(GPU)市场,AMD和NVIDIA是两大主要的竞争者,它们各自推出的产品在性能、功耗、价格等方面都有着不同的特点和优势。 一、性能 GPU的性能是用户最关心的指标之一。在高端市场
    的头像 发表于 10-27 11:15 ?3095次阅读