0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

UCR科研团队展示新技术:计算速度翻倍,能耗降低一半

微云疏影 ? 来源:综合整理 ? 作者:综合整理 ? 2024-02-25 15:39 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在第56届IEEE/ACM微体系结构国际研讨会上,来自加州大学河滨分校(UCR)的科研团队揭示了一项革命性的技术——仅需提升原来处理器的利用效率便能实现计算速度翻番且能耗减半。

据介绍,这一技术原则上适用于各种处理器及加速器,例如手机芯片至数据中心服务器,但需结合具体设备进行定制适配开发。

加利福尼亚大学电气与计算机工程学系副教授、此项研究共同作者曾宏伟(Tseng)解释道:“无需增加新处理器,即可在现有的计算机平台上应用我们的技术。它的重点在于更有效地利用已有硬件资源。”

他们所研发出的全新平台摒弃了传统的单线程编程方式,推出名为同步异构多线程(SHMT)的新型技术。SHMT以质量感知工作偷取(QAWS)调度策略实现平衡,以保证合适的计算质量和负载,从而降低资源消耗。

在SHMT运行时,系统会生成一系列虚拟操作(vops),并分割成一个或多个高级操作(hlop),允许在多种硬件资源间并发执行代码。通过选取正确的策略来加速SHMT的运算过程。

曾宏伟教授还就其团队构建的测试平台做了演示,展示了新软件工具库的实用性。他们创造出了一款融合了手机、个人电脑乃至服务器特征的新型设备。这个测试平台主要由一块安装有PCIe接口的主板,一块配备有NvidiaNanoJeston模块组合的‘计算单元’组成。同时,通过M.2 KeyE插槽与谷歌Edge加速器(TPU)相连。此外,该系统还配备了四核心ARM Cortex-A57处理器(CPU)和128个Maxwell架构图形内核(GPU)作为辅助工具。

而其对应的主内存配置为4GBLPDDR4,频率为1600MHz,带宽为25.6Gb/s,用以储存常规数据。该边缘TPU模块则额外拥有8MB内存容量,并默认选用Ubuntu Linux 18.04作为操作系统

在一个采用标准测试应用程序运行SHMT软件包的简便异构平台实验中发现,与基本计算分配方法相比,QAWS框架的计算速度增加了1.95倍,耗能却减少了51%。这样的成果如果可运用于数据中心,只需维持原有的硬件环境,便能获得更高的性能收益。虽然当前提出的解决方案仍有待进一步完善,但是其潜在价值已经引起了广泛关注。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19954

    浏览量

    237517
  • 服务器
    +关注

    关注

    13

    文章

    9860

    浏览量

    88428
  • 单线程
    +关注

    关注

    0

    文章

    18

    浏览量

    1846
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    村田中国亮相2025开放计算新技术大会:以创新技术驱动智能化发展

    ”的主题,重点展示了包括电源、电感、传感器以及崭新集成封装解决方案在内的多款产品。今年,村田的创新技术与产品再次获得OCP的认可,荣获“开放计算最佳创新奖”,村田将始终致力于为数据中心的绿色化发展和高效运行提供坚实支撑。 随着云
    的头像 发表于 08-07 16:09 ?232次阅读
    村田中国亮相2025开放<b class='flag-5'>计算</b>创<b class='flag-5'>新技术</b>大会:以创<b class='flag-5'>新技术</b>驱动智能化发展

    康尼新能源亮相2025走进小鹏新技术展示交流会

    近日,"2025走进小鹏新技术展示交流会"在广州小鹏汽车总部盛大启幕。本次交流会汇聚了产业链上下游众多领军企业,通过前沿技术展示、创新产品发布及深度
    的头像 发表于 06-28 16:20 ?704次阅读

    Sony机芯FCB-CR8530:科研团队的“标配视觉工具”

    科研领域,对高精度、高分辨率图像的需求日益增长。索尼FCB-CR8530机芯凭借其卓越的性能和先进的技术,逐渐成为科研团队的“标配视觉工具”。本文将深入探讨FCB-CR8530如何以
    的头像 发表于 04-21 17:23 ?292次阅读

    边缘网关如何降低能耗数据延迟?

    边缘计算网关在能耗数据采集场景中可以通过以下方式降低数据延迟: 1. 分布式计算架构:边缘计算网关采用分布式
    的头像 发表于 04-10 17:55 ?310次阅读

    在CM32M433R MCU上调用riscv_sqrt_f32()函数的计算速度比直接调用sqrtf()要慢,为什么?

    在CM32M433R MCU上调用riscv_sqrt_f32()函数的计算速度比直接调用sqrtf()要慢, 计算次riscv_sqrt_f32大概54 cycles;sqrtf()大概29 cycles,FPU宏已打开,求
    发表于 03-07 14:18

    曝英伟达一半员工净资产破亿

    英伟达一半员工净资产破亿的消息引起了广泛关注;还冲上百度热搜。据最新的统计数据显示,英伟达已有78%的员工成为了百万(美元)富翁,这数字令人咋舌。而更令人震惊的是,其中一半员工的净资产更是达到
    的头像 发表于 01-14 18:15 ?641次阅读

    关于逆变器的电流峰值控制,为啥电流波形只有一半

    我是用电流峰值控制方法去做反激式逆变器的。为啥我副边电流波形只有一半呢。硬件定是好的,软件是我自己写的,不知道是程序哪里出了问题,希望能解答
    发表于 12-10 16:24

    汉得利全方位展示新技术

    2024年11月,汉得利BESTAR在日本代理商 加賀FEI株式会社的引荐下,参加了日本某株式会社举办的内部私人技术展会。此次展会为汉得利BESTAR提供了展示其最新技术和产品的绝
    的头像 发表于 11-22 16:46 ?766次阅读

    ADS1258 AVSS 5ms内电压跳变后,读取加速度计的值变为原来的一半是为什么?

    时,ADS1258输出为正常情况下的一半(正常情况下测得加速度计为1G,故障发生时为0.5左右,且无论如何移动加速度计,转换后的值只发生小幅度变化)。测量过IX IY IZ及VX VY VZ在电源波动时的值未发生变化。CPU为T
    发表于 11-22 07:42

    ADS8686S读取值为实际值一半,是什么原因导致的?

    ADS8686S使用SPI串行通讯,软件模式;SDOA单线数据,终端配置±5V量程,刚开开始运行均正常,校准系数都对,突然code值变为一半;改变输入值也成比例变化,录波波形也正常,幅值也是一半
    发表于 11-18 07:48

    TPA3255如果仅使用一半,如何处理最好?

    TPA3255只用其中一半做BTL功放,A/B输入,A/B输出。请问C/D 输入端和C/D 输出端如何处理。还有,22、23、24、25、26、27、28、29、30、31(所有仅涉及C/D输入输出的引脚)如何处理,对于芯片比较安全。
    发表于 09-30 06:10

    在频率较高时,如果用50Ω进行匹配,那么电压是不是衰减一半

    在频率较高时,需要考虑阻抗匹配,如果用50Ω进行匹配,那么电压是不是衰减一半
    发表于 09-20 08:24

    如何将输出电压降低一半

    需要将输出电压降低一半,之前输出电压大概是0到10V左右,大家能给个方案吗?后面还要进行AD转换,所以需要精确,不要电阻分压。最好用TI的芯片。
    发表于 09-14 06:20

    使用VCA821进行可调增益倍数放大,输出的信号只有一半放大了,另一半没有变化,为什么?

    使用VCA821进行可调增益倍数放大,下面是VCA821的原理图,Vin是DA输出信号,Vg是可调的搞电平输出,Amax=20dB, 但是VCA821输出的信号只有一半放大了,另一半没有变化。这个是偏置的问题吗?有什么解决的方法吗? 输出波形:
    发表于 09-12 07:48

    LM319比较器接入增量式编码器的方波后,编码器信号的方波幅值降低一半,为什么?

    LM319比较器接入增量式编码器的方波后,编码器信号的方波幅值降低一半,电路如下图所示。是否与R34,R35或R39,R40的阻值的数量级有关呢?
    发表于 08-30 13:37