0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ARM发布全新架构CPU、GPU及AI内核 性能全面提升

DPVg_AI_era ? 来源:yxw ? 2019-05-29 17:11 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,ARM发布了下一代架构设计方案,三款重磅利器腾空出世:Cortex-A77 CPU、Mali-G77 GPU和ARM ML处理器,性能全面提升。ARM表示,新的旗舰级IP将定义2020年高端智能手机性能,提供新一代的人工智能体验。

ARM祭出了三把利器。

昨日,全球领先半导体知识产权(IP)提供商ARM重磅发布了下一代架构设计方案,其中包括:

Cortex-A77 CPU;

Mali-G77 GPU;

ARM ML处理器。

ARM表示,新的旗舰级IP将定义2020年高端智能手机性能,提供新一代的人工智能体验。

而在此前,新智元也报道了ARM宣布暂停与华为的合作的相关消息,或许此次ARM发布的旗舰级IP将与华为无缘。

不过,华为目前已经获得了ARM8架构的永久授权(ARM8是ARM公司的32/64位指令集,目前的处理器都是这一指令集的产物)。也有可能完全自主设计ARM处理器,并掌握核心技术和完整知识产权,具备长期自主研发ARM处理器的能力。

(对Cortex和Mali不了解?没关系,新智元在文末附了它俩的全家福!)

代号Deimos,新一代CPU性能大幅提升

去年的ARM发布的Cortex-A76其实是一个非常成功的核心架构,全新的架构体系与7nm TSMC工艺的结合,带来了巨大的性能和效率飞跃,麒麟980和骁龙855就是很好的例子。

但ARM真正的竞争对手主要来自苹果的CPU设计团队。仅从CPU来说,目前,苹果的A11、A12仍然有着较为明显的性能、效率优势。

ARM发布的Cortex-A77代号为Deimos(戴莫斯,畏惧之神),与上一代A76可谓是一脉相承,很大程度上保持了上一代的特性。

从官方给出的参数来看,有如下几个关键特性:

依旧采用Armv8.2架构,支持 AArch32 和 AArch64;

64KB L1指令和数据缓存;

256或512KB L2缓存;

以及高达4Mb L3缓存

ARM表示,Cortex-A77和Cortex-A76保持相同的3.GHz峰值频率目标。但预计厂商不会在新一代Soc达到这么高的频率。

Cortex-A77将更多的计算能力用于设备安全的边缘计算上。这些计算能力使用范围包括AI摄像机、视觉场景检测、3D扫描、生物特征用户ID(人脸识别)、语音识别、游戏中的ML和AR中的ML等。

从性能角度来看,Cortex-A77相比于A76有了许多性能上改进:

单线程性能提升20%;

FP性能提升35%;

内存宽带提升15%。

更高的性能也意味着能更好地响应支持AR的新应用程序以及带来的体验。通过Cortex-A77,手机游戏领域的增强现实技术在未来几年有望实现大幅增长。并且Cortex-A77还将支持5G,爱立信在2018年11月的移动报告中预测,到2024年,将有大约15亿台智能手机设备具备5G功能。

而众所周知,对于计算密集型ML、AR和其他新出现的设备来说,5G是一个基本需求。它将带来更快的速度、大带宽(5到20 Gbps)、8K分辨率的流媒体和360度视频

ARM GPU采用全新架构Valhall,性能大跃进

除了Cortex-A77之外,ARM还重磅发布了新一代Mali-G77。

划重点:Mali-G77采用了全新架构,Valhall。而在G71-G76采用的架构都是Bifrost。

Mali-G77在性能、密度和效率方面取得了一些重大改进。虽然去年的Mali-G76引入了对执行引擎计算架构的一些重大更改,但G77的改进更大,并且脱离了ARM相对不同寻常的计算核心设计。

据ARM官方宣称,Mali-G77较前代产品相比:

效能提升30%、性能提升30%、机器学习性能提升60%;

每mm?性能较A76预计提升1.4倍;

在相同的工艺和相同的性能下,实现30%的同比能效改进;

并且比Mali-G72节省50%的功耗。

从官方给出的性能来看,ARM Mali-G77的性能已然接近目前苹果A12的性能,同时也超过了高通Adreno 640的性能。

ARM ML NPU

随着智能手机和计算机继续利用AI来实现摄影中的场景识别或增强现实中的物体识别等功能。同时,许多公司也构建了专门的神经处理单元来处理这些任务,从而减轻了CPU和GPU的压力。

而此次,ARM还发布了其最新的NPU,提供了高达两倍的能效,并且是上一代内存压缩的三倍。与开源的ARM NN软件框架相结合,ARM表示该芯片的八核版本可提供高达32 TOP/s的性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9395

    浏览量

    379851
  • 内核
    +关注

    关注

    3

    文章

    1422

    浏览量

    41654
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11116

    浏览量

    218303
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4980

    浏览量

    132105

原文标题:ARM发布全新架构CPU、GPU及AI内核,华为或将无缘

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm KleidiAI与XNNPack集成实现AI性能提升

    Arm KleidiAI 首次集成到 XNNPack 已过去整整一年。KleidiAI 是一款高度优化的软件库,旨在加速 Arm CPU 上的人工智能 (AI) 推理。在过去一年中
    的头像 发表于 08-08 15:19 ?925次阅读
    <b class='flag-5'>Arm</b> KleidiAI与XNNPack集成实现<b class='flag-5'>AI</b><b class='flag-5'>性能</b><b class='flag-5'>提升</b>

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知
    发表于 06-18 19:31

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP
    的头像 发表于 05-29 10:12 ?1522次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    时间。 这不仅仅是工具的升级,更是迈向智能体化用户体验的关键基础设施。 天玑AI开发套件 2.0,全面释放天玑端侧AI能力 去年,天玑AI开发套件一经
    发表于 04-13 19:52

    全新STM32MP257开发板震撼发布!异核架构x接口丰富x边缘AI,助力ARM嵌入式工业4.0应用!

    全新STM32MP257开发板震撼发布!异核架构x接口丰富x边缘AI,助力ARM嵌入式工业4.0应用! ATK-DLMP257B开发板是正
    发表于 04-12 12:04

    芯原发布新一代Vitality架构GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架构的图形处理器(GPU)IP系列。这一新一代GPU架构以其卓越的计算
    的头像 发表于 12-24 10:55 ?1019次阅读

    芯原推出新一代高性能Vitality架构GPU IP系列

    芯原股份(芯原,股票代码:688521.SH)今日宣布推出全新Vitality架构的图形处理器(GPU)IP系列,具备高性能计算能力,广泛适用于云游戏、
    的头像 发表于 12-19 15:55 ?555次阅读

    芯原发布全新Vitality架构GPU IP系列

    芯原股份(芯原,股票代码:688521.SH)今日宣布推出全新Vitality架构的图形处理器(GPU)IP系列,具备高性能计算能力,广泛适用于云游戏、
    的头像 发表于 12-19 15:26 ?950次阅读

    《算力芯片 高性能 CPUGPUNPU 微架构分析》第3篇阅读心得:GPU革命:从图形引擎到AI加速器的蜕变

    在数据挖掘工作中,我经常需要处理海量数据的深度学习任务,这让我对GPU架构和张量运算充满好奇。阅读《算力芯片》第7-9章,让我对这些关键技术有了全新认识。 GPU
    发表于 11-24 17:12

    NPU技术如何提升AI性能

    设计的处理器,与传统的CPUGPU相比,它在执行深度学习任务时具有更高的效率和更低的能耗。NPU通过专门优化的硬件结构和指令集,能够更快地处理神经网络中的大量并行计算任务。 1. 优化硬件架构 NPU技术通过优化硬件
    的头像 发表于 11-15 09:11 ?1638次阅读

    GPU服务器AI网络架构设计

    众所周知,在大型模型训练中,通常采用每台服务器配备多个GPU的集群架构。在上一篇文章《高性能GPU服务器AI网络
    的头像 发表于 11-05 16:20 ?1362次阅读
    <b class='flag-5'>GPU</b>服务器<b class='flag-5'>AI</b>网络<b class='flag-5'>架构</b>设计

    Arm全面设计助力Arm架构生态发展

    ,通过该生态项目,Arm、三星晶圆代工厂 (Samsung Foundry)、ADTechnology 和 Rebellions 正在联手向市场推出人工智能 (AI) CPU 芯粒 (chiplet) 平台,面向云、高
    的头像 发表于 10-21 09:58 ?920次阅读

    《算力芯片 高性能 CPU/GPU/NPU 微架构分析》第1-4章阅读心得——算力之巅:从基准测试到CPU架构的深度探索

    。这一方法突显了现代超算的核心优势——并行计算能力。举一个具体实例来说,天河二号采用了异构架构,集成了英特尔至强处理器和中国自主研发的申威众核加速器。这种CPU与协处理器的结合不仅提升了整体计算
    发表于 10-19 01:21

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    GPU、NPU,给我们剖析了算力芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解算力芯片。 全书共11章,由浅入深,较系统全面进行讲解。下面目录对全书内容有一个整体了解
    发表于 10-15 22:08

    名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    和像素统一的G80到现在重金难求的H100;AMD的Zen系列CPU和RDNA系列GPU两线作战;中国的高性能计算芯片逐步获得更多TOP500排名;华为Ascend 910 NPU芯片也成为A
    发表于 09-02 10:09