0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

寒武纪MLUv01架构采用台积电16FF,MLU-100芯片

SSDFans ? 来源:未知 ? 作者:工程师郭婷 ? 2018-07-28 10:37 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

寒武纪科技公司与华为海思合作,为麒麟970智能手机芯片组提供AI IP,并为数据中心创建了自己的系列芯片。

麒麟970内部的IP被称为Cambricon-1A,是该公司的第一个可授权IP。当时,查找寒武纪的信息非常困难:它的网站是一系列静态图像,中文嵌入图像本身。有趣的是,我们的AI加速翻译功能应用在华为Mate 10上来翻译网站内容。快进12-18个月,寒武纪网站现在可以互动并提供即将推出的产品的相关信息,包括一些最近发布的信息。

大芯片:走向数据中心

基于台积电16FF,MLU-100是一款80W芯片,在1.0 GHz,或'标准'模式下,使用机器学习算法中常用的8位整数度量,具有64 TFLOPS的传统半精度或128 TOPS功能。寒武纪的首席执行官陈天石博士表示,他们的新芯片具有1.30 GHz的高性能模式,允许83.2 TFLOPS(16位浮点)或166.4 TOPS( 8位整数),但功耗上升到110W。 这在技术上降低了能源效率,但是允许使用更快的芯片。 所有这些数据都依赖于启用稀疏数据模式。

该芯片背后的技术是寒武纪最新的MLUv01架构,该架构被理解为是用于麒麟芯片组的Cambricon-1A的一种变体,但规模更大更快。显然,与移动IP相比,必须对数据和电源管理实施额外的优化。 寒武纪也有它的1H架构和最新公布的1M架构,但是没有公开如何将数据传递到芯片。

WikiChip的David Schor指出,如果提供给商业合作伙伴,这可能是NVIDIA的首次机器学习ASIC竞赛。为此,寒武纪还在制造PCIe卡。

寒武纪MLUv01架构采用台积电16FF,MLU-100芯片

很明显,NVIDIA在这方面拥有强大的用户群和多代产品,以及利用其硬件优势的软件。 Cambricon没有详细说明他们计划如何支持新芯片的SDK,但是它的网站上有一系列的SDK,支持TensorFlow,Caffe和MXNet。

进入数据中心:PCIe

在数据中心中即插即用的最佳方式是通过PCIe卡。 Cambricon的MLU100加速器卡就是这样的:一个PCIe 3.0 x16实现256位16或32 GB DDR4-3200内存,这对于102.4 GB / s的带宽是有好处的。要在NVIDIA上获得大量内存,需要高端显卡,但这些显卡提供多倍的显存带宽。 MLU100卡上的存储器也启用了ECC。

迄今为止的报告称,联想将其卡作为ThinkSystem SR650双Intel Xeon服务器的附加产品; 每台机器最多两个。 从联想网站上看,它目前并不能使用。 鉴于华为在企业中的巨大影响力,我们很可能会看到这些系统中的芯片。

下一代:5TOPS/Watt

另外报道的是新的Cambricon-1M IP,尽管该公司没有提供细节。 WikiChip公司表示,这款新IP主要针对7nm制造,所以当华为/海思开始发布7nm移动处理器,然后进入下一代面向服务器的产品时,我们很可能会看到它。与ARM的IP所宣传的3 TOPS /瓦特相比,这个IP的目标是达到5 TOPS /瓦特。 寒武纪今年晚些时候会有一个培训和推理芯片计划,并在2019年再次进行更新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    460

    文章

    52624

    浏览量

    442793
  • 台积电
    +关注

    关注

    44

    文章

    5760

    浏览量

    170179
  • 机器学习
    +关注

    关注

    66

    文章

    8510

    浏览量

    134901

原文标题:华为的麒麟NPU IP制造商寒武纪,生产出一个大AI芯片和PCIe卡

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    寒武纪“炸裂”财报!一季度营收增长40倍,积极备货应对“爆单”?

    电子发烧友网报道(文/梁浩斌)寒武纪,交出一份炸裂财报!在4月18日,寒武纪公布了2024年年报和2025年一季度报告,其中2024年全年营收11.74亿元,同比增长65.56%;亏损4.52亿元
    的头像 发表于 04-22 09:07 ?1706次阅读
    <b class='flag-5'>寒武纪</b>“炸裂”财报!一季度营收增长40倍,积极备货应对“爆单”?

    寒武纪3000亿市值与GPU厂商密集IPO,AI芯片正是当打之年

    ? 电子发烧友网报道(文/黄晶晶)就在最近,寒武纪市值冲上3000亿元,创造了半导体企业的市值奇迹。2024年1月10日收盘当天寒武纪股价报729.97元,上涨2.48%,市值3047亿元。盘中最
    的头像 发表于 01-20 08:16 ?3945次阅读
    <b class='flag-5'>寒武纪</b>3000亿市值与GPU厂商密集IPO,AI<b class='flag-5'>芯片</b>正是当打之年

    寒武纪联手阶跃星辰成立模芯生态创新联盟

    近日,阶跃星辰发布了新一代基础大模型Step 3。Step 3兼顾智能与效率,通过模型和系统联合创新,实现了行业前列的推理解码效率,将于7月31日面向全球企业和开发者开源。目前,寒武纪已初步实现对Step 3的支持。
    的头像 发表于 07-31 11:26 ?388次阅读

    寒武纪基于思元370芯片MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推一体AI加速卡,基于寒武纪全新一代思元370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标
    的头像 发表于 04-24 17:57 ?1712次阅读
    <b class='flag-5'>寒武纪</b>基于思元370<b class='flag-5'>芯片</b>的<b class='flag-5'>MLU</b>370-X8 智能加速卡产品手册详解

    寒武纪思元370芯片参数特性详解

    寒武纪首次采用chiplet技术将2颗AI计算芯粒封装为一颗AI芯片,通过不同芯粒组合规格多样化的产品,为用户提供适用不同场景的高性价比AI芯片
    的头像 发表于 04-24 17:49 ?1529次阅读
    <b class='flag-5'>寒武纪</b>思元370<b class='flag-5'>芯片</b>参数特性详解

    寒武纪一季度营收大涨4230% 净利润3.55亿 扭亏为盈

    4月18日晚间,国产AI芯片龙头寒武纪发布了财务报告,包括有2025年第一季度财务报告和2024年年度财务报告。 在2025年第一季度,寒武纪营收达到11.11亿,同比增长高达4230.22
    的头像 发表于 04-19 14:15 ?1234次阅读

    美国业务收入占比低,寒武纪等回应加征关税

    4月9日,寒武纪公告称,公司收入主要来自境内客户,境外收入占比较低,2023年及2024年公司境外客户收入占比均未超过1%。2022年12月美国商务部工业和安全局将公司列入实体清单,对公司采购美系
    发表于 04-12 00:59 ?694次阅读
    美国业务收入占比低,<b class='flag-5'>寒武纪</b>等回应加征关税

    寒武纪增资全资子公司上海寒武纪

    ,对上海寒武纪进行增资。 此次增资是基于募投项目的实施进展而做出的决策。寒武纪作为一家在人工智能芯片领域具有领先地位的企业,一直致力于推动相关技术的研发和应用。为了进一步提升公司的竞争力和市场份额,
    的头像 发表于 02-05 13:44 ?978次阅读

    寒武纪发布2024年度业绩预告

    昨日晚间,国内领先的智能芯片设计企业寒武纪发布了其2024年度的业绩预告。据公告显示,公司预计全年营业收入将在10.7亿元至12亿元之间,与去年同期相比,实现了50.83%至69.16%的显著增长
    的头像 发表于 01-15 10:30 ?944次阅读

    4nm芯片量产

    据台湾《联合报》的消息,美国商务部长雷蒙多近日对英国路透社透露,最近几周已开始在美国亚利桑那州厂为美国客户生产先进的4纳米芯片。雷蒙多表示这是美国史上首度在本土由美国劳工制造4纳
    的头像 发表于 01-13 15:18 ?998次阅读

    高通明年骁龙8 Elite 2芯片全数交由代工

    芯片代工伙伴。上一次高通选择三星代工,还要追溯到2021年的骁龙8第一代芯片,当时采用的是三星的4纳米制程。 据悉,
    的头像 发表于 12-30 11:31 ?1170次阅读

    谷歌Tensor G系列芯片代工转向

    近日,谷歌Tensor G4将成为该公司最后一款由三星代工的手机芯片。从明年的Tensor G5开始,谷歌将选择作为其新的代工伙伴,并采用
    的头像 发表于 10-24 09:58 ?920次阅读

    美国工厂投产A16芯片,苹果成首批客户

    电位于美国亚利桑那州的Fab 21晶圆厂传来重大进展,据业内消息透露,该厂已正式投产,首批产品为采用N4P先进工艺的A16 SoC,专为苹果iPhone 14 Pro系列打造。这一
    的头像 发表于 09-19 17:24 ?938次阅读

    美国工厂启动生产苹果A16芯片

    全球领先的半导体制造商(TSMC)正式宣布,其位于美国亚利桑那州的先进代工厂已启动生产,首批产品即为苹果iPhone的核心芯片——A16
    的头像 发表于 09-19 16:09 ?1255次阅读

    X86架构处理器有哪些优点和缺点

    X86架构处理器作为计算机领域的重要组成部分,具有多个显著的优点和一定的缺点。以下是对X86架构处理器优缺点的详细分析。
    的头像 发表于 08-22 11:25 ?4992次阅读