0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最被看好的 AI 芯片初创公司之一,Tenstorrent加速卡出货

E4Life ? 来源:电子发烧友网 ? 作者:周凯扬 ? 2024-01-04 00:04 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)在 CRN 发布的 2023 年十大半导体初创公司的名单上,我们看到了不少AI 芯片厂商的名字,比如Cerebras Systems、SiMa.ai和Tenstorrent。其中Tenstorrent 最惹人关注,这家位于多伦多的初创企业如今由知名半导体业界大神 Jim Keller担任CEO。

Tenstorrent 在 2021 年收获了富达集团领投的 2 亿美元融资后,又在2023 年获得了来自现代汽车集团和三星催化剂基金会领投的 1 亿美元融资。但对于这家厂商的硬件产品,我们却很少得见真容,直到最近其开发套件开放订购和出货。

开发套件出货,新的 AI 硬件开发平台

从 Tenstorrent 的官网来看,目前已经开放订购的是其第一代 PCIe 4.0 AI 推理加速卡,e75 和 e150,两者的定价分别为 599 美元和 799 美元。e75 开发套件可用于基础的推理任务,采用了 1/2 PCIe长度的设计搭配了 Tenstorrent 的第一代 AI 芯片 Grayskull,集成了96 个 Tensix 核心、96MB 的 SRAM、8GB LPDDR4 内存,核心频率达到 1GHz,整个板卡的功耗约为75W。

e150 则是 3/4 长度的 PCIe 加速卡,同样搭载了一个 Grayskull 芯片,但核心数却达到了 120个,同时配备了120MB 的 SRAM,核心频率也提升至 1.2GHz,单卡功耗约为 200W.

e75 虽然只是入门级的推理硬件套件,却已经给到了完整的开发流程,开发者可以使用两种不同的软件实现方式,一套是从上至下的 TT-Buda,另一套是从下至上的TT-Metalium。TT-Buda适用于想要开箱即用,直接将任何模型投入量产的客户。而TT-Metalium则适用于想要充分了解 Tenstorrent软硬件,并借此定制开发模型的客户。

需要注意的是,e75 和 e150仅仅是 AI 加速卡而已,仍需要搭配一套通用计算系统才能精心开展 AI 开发。目前其仅支持 x86_64 架构和 Ubuntu 20.04 以上版本的系统,且需要 64GB 的内存和至少 100GB 的存储。

Tenstorrent 下一代 AI 芯片

除了第一代芯片 Grayskull 以外,Tenstorrent也公开了基于第二代芯片 Wormhole 的 PCIe AI 加速卡 n150 和 n300,n150 搭载了一个 Wormhole 芯片,而 n300 搭载了两个 Wormhole 芯片,因此两者的 Tensix 核心数存在较大差异,分别是 72 个和 128 个,单板功耗分别为 160W和 300W。

从内存配置上看,Wormhole也确实是面向更高性能的 AI 解决方案,将 Grayskull 的 LPDDR4 内存换成了带宽更高的 GDDR6 内存。根据Tenstorrent 提供的说明,GraySkull 和 Wormhole 已经支持了市面上主流的模型,比如 BERT、GPT-2、MobileNetV3、ResNet和YOLOv5等等,而性能更强的 Wormhole还提供了对 Falcon 和 Stable Diffusion 的支持。

不过,与可以单独购买单个开发套件的 e75 和 e150 相比,目前 n150 和 n300 只开放了批量购买,且并没有公布定价。要知道,无论是 Grayskull还是 Wormhole,都只是 Tenstorrent对 AI 芯片的早期设计与尝试,两者均基于 12nm 工艺开发,且实际算力差距并不大,都在 300TFLOPS@INT8左右,只是其他硬件资源配置上有些许不同。而后续即将推出的 Black Hole将基于 6nm 工艺打造,将算力提升至1000TFLOPS@INT8 左右。

在其产品路线图上,预计在今年公开发布的 Grendel才是其针对高端 AI 计算的杀手锏。Grendel采用了全新的 Chiplet 设计,且用到了自研的 RISC-V CPU 核心,结合 3nm 工艺的 AI&CPU Chiplet,以及 7nm 工艺的内存与 I/O Chiplet,将提供一个完整可扩展的 AI 硬件平台。

写在最后

对于任何一个新的 AI 开发平台而言,硬件开发套件和配套软件都是至关重要的,甚至决定了愿意尝试的开发者基数。Tenstorrent 在开放了 e75 和e150的购买后,无疑给不少还在观望其硬件架构的开发一个尝鲜的机会。而开箱即用的体验,想必也会吸引不少厂商对后续的高性能产品产生兴趣。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35758

    浏览量

    282453
  • 加速卡
    +关注

    关注

    1

    文章

    64

    浏览量

    11218
  • AI芯片
    +关注

    关注

    17

    文章

    1994

    浏览量

    36056
  • Tenstorrent
    +关注

    关注

    0

    文章

    13

    浏览量

    226
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI
    的头像 发表于 06-05 13:39 ?696次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在<b class='flag-5'>AI</b>战场上干掉GPU和TPU!

    410?基于?XCVU9P+?C6678?的?100G?光纤的加速卡

    基于 XCVU9P+ C6678 的 100G 光纤的加速卡
    的头像 发表于 05-08 08:32 ?318次阅读
    410?基于?XCVU9P+?C6678?的?100G?光纤的<b class='flag-5'>加速卡</b>

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    DeepX 推出了款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达 25 TOPS 的卓越运算性能,以及高准确度、低功耗、低温
    的头像 发表于 05-06 14:15 ?812次阅读
    边缘<b class='flag-5'>AI</b>运算革新 DeepX DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>结合Rockchip RK3588多路物体检测解决方案

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推AI加速卡,基于寒武纪全新代思元370芯片
    的头像 发表于 04-24 17:57 ?1959次阅读
    寒武纪基于思元370<b class='flag-5'>芯片</b>的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解

    边缘AI新突破:MemryX AI加速卡与RK3588打造高效多路物体检测方案

    本方案特别结合了 Orange Pi 5 Plus (Rockchip RK3588) 与 MemryX AI 加速卡,构建出套高性价比的智能解决方案。凭借 MemryX 提供的丰富软件资源
    的头像 发表于 03-06 10:45 ?770次阅读
    边缘<b class='flag-5'>AI</b>新突破:MemryX <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>与RK3588打造高效多路物体检测方案

    Tenstorrent拟在日本开展业务,专注尖端半导体设计

    近日,据相关报道,AI芯片领域的初创企业Tenstorrent正计划在日本拓展其业务版图,专注于设计尖端半导体产品。这战略举措不仅展示了
    的头像 发表于 12-11 09:57 ?681次阅读

    Tenstorrent获7亿美元融资,贝索斯参投挑战英伟达

    AI芯片初创公司Tenstorrent近日宣布获得高达7亿美元的融资,公司估值也随之攀升至26亿
    的头像 发表于 12-03 11:07 ?869次阅读

    S7t-VG6 VectorPath加速卡的特性和功能

    S7t-VG6 VectorPath加速卡是Achronix公司联合BittWare公司(Molex旗下的领先企业级FPGA加速器产品供应商)推出的
    的头像 发表于 11-14 11:19 ?901次阅读

    Tenstorrent与日本合作:五年内培训200名日本芯片工程师

    美国人工智能(AI芯片初创公司Tenstorrent近日宣布,已与日本政府达成了项重要协议。
    的头像 发表于 11-06 14:30 ?1075次阅读

    AMD推出新款纤薄尺寸电子交易加速卡

    UL3422 为交易商、做市商和金融机构提供了款针对机架空间和成本进行优化的纤薄型加速卡,旨在快速部署到各种服务器中。
    的头像 发表于 10-16 09:14 ?878次阅读

    博世携手Tenstorrent共研汽车芯片标准化方案

    Tenstorrent的高管透露,德国工业巨头博世将与美国的芯片初创企业Tenstorrent携手,共同打造个平台,旨在标准化汽车
    的头像 发表于 10-14 16:31 ?1174次阅读

    大模型向边端侧部署,AI加速卡朝高算力、小体积发展

    电子发烧友网报道(文/李弯弯)AI加速卡是专门用于处理人工智能应用中的大量计算任务的模块。它集成了高性能的计算核心和大量的内存,旨在加速机器学习、深度学习等算法的计算过程。当前,AI
    的头像 发表于 09-17 00:18 ?5295次阅读

    EPSON差分晶振SG3225VEN频点312.5mhz应用于AI加速卡

    AI加速卡,通常也被称为AI算力,是种专为加速人工智能(
    发表于 09-10 14:56 ?0次下载

    基于菲数科技FA728Q加速卡实现低时延LLT应用

    菲数科技使用Stratix 10 FPGA和开源的开放式FPGA堆栈(OFS)基础设施开发高性能FPGA加速卡
    的头像 发表于 08-30 17:13 ?1074次阅读
    基于菲数科技FA728Q<b class='flag-5'>加速卡</b>实现低时延LLT应用

    YXC高频差分晶振,频点312.5mhz,高精度.高稳定性,应用于AI加速卡

    AI加速卡中,扬兴推荐的YXC差分晶振YSO210PR系列,该系列频率范围为10MHz ~1500MHz,可满足高精度、高稳定度的需求,支持差分信号(LVDS/LVPECL)输出,以下为YSO210PR系列中OA2EIBW
    的头像 发表于 08-21 14:03 ?738次阅读
    YXC高频差分晶振,频点312.5mhz,高精度.高稳定性,应用于<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>