0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为最强自研NPU问世!麒麟810“抛弃”寒武纪

WpOh_rgznai100 ? 来源:YXQ ? 2019-06-22 12:02 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“能效高、算子多、精度高”,华为消费者业务手机产品线总裁何刚用一句话总结了自研达芬奇架构给最新麒麟810芯片带来的变化。

6 月 21 日,在 HUAWEI Nova 5 系列新品发布会上,最大的亮点之一当属华为发布的麒麟 810 全新人工智能手机芯片,这是首款采用华为自研达芬奇架构的手机 AI 芯片。

去年 10 月,华为推出达芬奇架构的云端 AI 芯片昇腾 Ascend 910 和昇腾 Ascend 310 后,首次将达芬奇架构落地至终端芯片的 NPU,同时这也意味着,他们在 NPU 中抛弃了寒武纪 IP。

最新的麒麟 810 了采用业界最先进的 7nm 工艺制程,相比 8nm 工艺,能效提升 20%,晶体管密度提升 50%,这让它成为目前全球第三款采用该尖端工艺的手机 SoC 芯片,也是华为继麒麟980 之后推出的第二款 7nm 手机 SoC 芯片。

近年来,随着端侧AI高速发展,手机厂商对芯片的适配性和灵活性提出更高要求,而华为对此的探索处于一路领跑状态。

2017年,以麒麟 970 为代表的芯片首次采用独立NPU神经网络处理单元,业内也开始探索端侧人工智能应用。2018 年,麒麟 980 采用双核 NPU,进一步提升了端侧 AI 算力,带来 AI 人像留色、卡路里识别等丰富的 AI 应用。

此次,最新麒麟 810 再次领跑业界,首度采用华为自研达芬奇计算架构,再度提升端侧 AI 的性能,并且首次将旗舰级的 AI 性能在中高端手机中落地。

达芬奇架构是华为在 2018 年推出的全新自研AI计算架构,针对 AI 计算特点进行设计。不同于以往的二维运算模式,达芬奇架构以高性能 3D Cube 计算引擎为基础,针对矩阵运算进行加速,大幅提高单位面积下的AI算力,激发端侧 AI 的运算潜能。另外,麒麟 810 芯片具有端侧能效业界最优的 AI 运算单元。

根据 ETH Benchmark 测试,麒麟 810 NPU跑分 32280 分,远超骁龙 710(6556 分)、骁龙730(13908 分)和骁龙 855(25428 分)。

对于麒麟 810 搭载华为自研的达芬奇架构,最直接的受害者是寒武纪,因为麒麟 970 第一代的 NPU 用的是寒武纪架构,但实际上,华为要在手机 AI 芯片搭载自研架构早在意料之中,只是很多人可能没想到落地速度来得如此之快。正如徐直军此前所说,“寒武纪的(IP)也很好,但是它无法支持我们的全场景,我们需要从云、到端、到物联网终端的人工智能设备,因此我们要创造性地打造一款新的架构。而达芬奇架构能够解决极致的功耗与极致的算力需求。”

按照这个势头,麒麟 810 应该只是开始,我们有理由相信,无论是 600 系列还是 900 系列,未来也会很快走向全定制化架构,华为移动计算生态将进一步扩大

以下从 CPUGPU,拍照和通信方面的变化介绍麒麟 810 芯片:

CPU 方面,麒麟 810 采用全新系统级 AI 调频调度技术,2+6 大小核架构,即搭载两个基于Cortex-A76开发商用的大核,针对移动终端的使用场景进行深度优化,以及六个 Cortex-A55 小核实现能效升级。

据华为方面介绍,麒麟 810 全新 2+6 能效架构将提供更加精准的调度层次,让 CPU在 游戏、购物等重载场景,以及社交、浏览网页等轻载场景下灵活适配,大大降低 CPU 在实际应用场景中的功耗,实现更持久的续航和更流畅的操作体验。

GPU 则升级到 Mali-G52 定制,支持 Kirin Gaming+ 技术,游戏实力全面升级,通过系统级 AI 调频调度技术、60fps 高性能及 HD 画质和 GPU 负载优化全面升级游戏体验。

具体而言,AI 调频调度技术能够实时学习帧率、流畅度和触屏输入变化,预测手机任务负载,动态感知手机使用过程中存在的性能瓶颈,及时进行调频调度,预测准确性比传统预测方法提升 30% 以上;GPU 的系列优化技术,可减少重复指令及 GPU 过载,并加快 CPU、GPU 和内存之间的数据传输速度;HD 游戏特效优化可以提升游戏画质、清晰度、明暗对比度等,带给游戏玩家更接近真实世界的游戏体验。

拍照方面,麒麟 810 集成细节增强(DE)模块,支持最新一代自动白平衡算法(AWB)和 AR特征点云计算加速,ISP 性能和算法双提升,这将解决夜景照片出现的噪点和过曝问题,提升画面的细节处理能力和降噪效果。

通信方面,麒麟 810 延续旗舰芯片的通信能力,支持双卡双 VoLTE,让手机的双卡同时保持 4G 在线,将有效防御伪基站的骚扰,有效降低手机信号回落至 2G 网络的风险。

此外,麒麟 810 推出自研中间算子格式,算子数量多达 240+,支持Tensor, Vector, Scalar,更多算子、开源框架的支持以及提供更加完备的工具链将助力开发者快速转换集成基于不同AI框架开发出的模型,大幅增强华为 HiAI 的兼容性,易用性,以加速更多 AI 应用落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    216

    文章

    35261

    浏览量

    256554
  • 麒麟处理器
    +关注

    关注

    2

    文章

    83

    浏览量

    9091

原文标题:华为最强自研NPU问世,麒麟810“抛弃”寒武纪

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    寒武纪“炸裂”财报!一季度营收增长40倍,积极备货应对“爆单”?

    电子发烧友网报道(文/梁浩斌)寒武纪,交出一份炸裂财报!在4月18日,寒武纪公布了2024年年报和2025年一季度报告,其中2024年全年营收11.74亿元,同比增长65.56%;亏损4.52亿元
    的头像 发表于 04-22 09:07 ?1707次阅读
    <b class='flag-5'>寒武纪</b>“炸裂”财报!一季度营收增长40倍,积极备货应对“爆单”?

    寒武纪3000亿市值与GPU厂商密集IPO,AI芯片正是当打之年

    ? 电子发烧友网报道(文/黄晶晶)就在最近,寒武纪市值冲上3000亿元,创造了半导体企业的市值奇迹。2024年1月10日收盘当天寒武纪股价报729.97元,上涨2.48%,市值3047亿元。盘中最
    的头像 发表于 01-20 08:16 ?3946次阅读
    <b class='flag-5'>寒武纪</b>3000亿市值与GPU厂商密集IPO,AI芯片正是当打之年

    商汤大装置算力Mall重磅发布

    近日,商汤科技联合华为、库帕思、海光、寒武纪、曦望Sunrise、壁仞科技、麒麟软件、摩尔线程等十余家国产生态伙伴,共同发布“商汤大装置算力Mall”。
    的头像 发表于 08-05 10:05 ?41次阅读

    寒武纪联手阶跃星辰成立模芯生态创新联盟

    近日,阶跃星辰发布了新一代基础大模型Step 3。Step 3兼顾智能与效率,通过模型和系统联合创新,实现了行业前列的推理解码效率,将于7月31日面向全球企业和开发者开源。目前,寒武纪已初步实现对Step 3的支持。
    的头像 发表于 07-31 11:26 ?390次阅读

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推一体AI加速卡,基于寒武纪全新一代思元370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标准PCIe加速卡,适用于业内最新的CPU平台,可轻松搭载于最先进的人工智能服务器,快速实现 AI算力的部署。
    的头像 发表于 04-24 17:57 ?1720次阅读
    <b class='flag-5'>寒武纪</b>基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    寒武纪思元370芯片参数特性详解

    寒武纪首次采用chiplet技术将2颗AI计算芯粒封装为一颗AI芯片,通过不同芯粒组合规格多样化的产品,为用户提供适用不同场景的高性价比AI芯片。
    的头像 发表于 04-24 17:49 ?1532次阅读
    <b class='flag-5'>寒武纪</b>思元370芯片参数特性详解

    寒武纪一季度营收大涨4230% 净利润3.55亿 扭亏为盈

    4月18日晚间,国产AI芯片龙头寒武纪发布了财务报告,包括有2025年第一季度财务报告和2024年年度财务报告。 在2025年第一季度,寒武纪营收达到11.11亿,同比增长高达4230.22
    的头像 发表于 04-19 14:15 ?1237次阅读

    美国业务收入占比低,寒武纪等回应加征关税

    4月9日,寒武纪公告称,公司收入主要来自境内客户,境外收入占比较低,2023年及2024年公司境外客户收入占比均未超过1%。2022年12月美国商务部工业和安全局将公司列入实体清单,对公司采购美系
    发表于 04-12 00:59 ?694次阅读
    美国业务收入占比低,<b class='flag-5'>寒武纪</b>等回应加征关税

    寒武纪增资全资子公司上海寒武纪

    ,对上海寒武纪进行增资。 此次增资是基于募投项目的实施进展而做出的决策。寒武纪作为一家在人工智能芯片领域具有领先地位的企业,一直致力于推动相关技术的研发和应用。为了进一步提升公司的竞争力和市场份额,寒武纪不断投入资金进行
    的头像 发表于 02-05 13:44 ?980次阅读

    寒武纪发布2024年度业绩预告

    昨日晚间,国内领先的智能芯片设计企业寒武纪发布了其2024年度的业绩预告。据公告显示,公司预计全年营业收入将在10.7亿元至12亿元之间,与去年同期相比,实现了50.83%至69.16%的显著增长
    的头像 发表于 01-15 10:30 ?945次阅读

    比亚迪最快于11月实现算法量产,推进智驾芯片进程

    10月21日市场传出消息,比亚迪正计划整合其新技术院下的智能驾驶团队,目标是在今年11月实现智能驾驶算法的量产,并持续推进智能驾驶芯片的
    的头像 发表于 10-22 15:57 ?1516次阅读

    VCA810电路激的原因?

    我再用VCA810做压控放大时,当Vc调到-1.45左右时就出现了激的现象。Vc从-1.0变到-1.4的过程还好,但是一超过-1.45(左右)就激了。在社区上看过一些别的帖子,说是可能是因为在
    发表于 09-20 08:06

    VCA810无输入激怎么解决?

    各位专家:这是我第一次使用VCA810芯片。但是发现只要供电就会出现激,无信号输入,频率稳定在约38KHz。波形是一个削了上半边的正弦波。电源旁放置了10u的铝电解电容。VCA810电源旁放置了100n。Vc由DA通过一片低
    发表于 09-20 07:03

    小鹏智驾芯片:面向L4+AI大模型,集成40核+NPU+ISP

    电子发烧友网报道(文/梁浩斌)新能源汽车时代,车企芯片的路线,尽管目的各不相同,但已经成为新势力车企的共识。最早从比亚迪为了供应链自主化而MCU、功率模块等,到零跑在2020年
    的头像 发表于 09-06 00:17 ?1.1w次阅读
    小鹏<b class='flag-5'>自</b><b class='flag-5'>研</b>智驾芯片:面向L4+AI大模型,集成40核+<b class='flag-5'>NPU</b>+ISP

    VCA810产生激震荡的原因有哪些?

    VCA810产生激震荡的原因有哪些哦,我用VCA810做了个压控放大,但是当没输入时,输出端有负的一点多伏。当输入为24毫伏时VC为-1.6放大出来有一点多伏,这是为什么呢? Other Parts
    发表于 08-23 07:23