0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全球云市场稳步发展,云服务将迎来最好时代

独爱72H ? 来源:EEWORLD ? 作者:EEWORLD ? 2020-05-26 08:50 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:EEWORLD)

大规模部署、管理和编排计算加速芯片并不容易。相反,云提供商的经济权衡更倾向于加速器产品提供的非性能方面,比如操作系统驱动程序。LiftrInsights在过去一年中一直在跟踪四大基础设施即服务(IaaS)云提供商提供的实例类型和大小:阿里云、亚马逊云服务(AWS)、谷歌云平台(GCP)和微软Azure。

在最近的Linley会议上,KevinKrewell在他的演讲中提到了编译器专业知识的重要性。然而,应用程序对加速器硬件的高效使用只是跨云地理管理和编排加速器芯片所需的整个软件解决方案的一部分。

数据中心日益膨胀,运营商正在寻找新方法来加速大量数据驱动的工作负载,从深度学习到自然语言处理。在我们即将到来的数据中心特别项目中,我们将深入研究加速AI模型训练和推断、数据分析和其他分布式应用的敏捷和超聚合数据中心架构。

在排名前四的云服务商中,所有的加速器芯片(无论类型或制造商)在过去的一年里都只连接到英特尔的Xeon处理器上,除了最近在微软Azure上安装了AMD的EPYC。Azure在今年2月率先打破了这一格局,首次生产部署了带有AMD EPYC v2 Rome处理器的AMD Radeon Instinct MI25GPU。

超大规模的挑战是对对不同处理器模型的软件驱动程序支持,所述不同处理器模型运行不同的操作系统发行版本,且版本是针对每个加速器芯片的多个版本。阿里云平台的ecs服务器大多使用intel 至强处理器,而且大多是定制版,包括Platinum(铂金) 8163、Gold(金牌) 6150、Gold(金牌) 6149、E5-2682v4、E5-2680v3、E5-2667v4以及E3-1240v6等CPU

阿里云正式发布云服务器ECS企业级产品家族,目前已推出面向173种企业应用场景的19款实例。该系列适合在复杂的企业计算环境下,满足对于高性能、高可靠的计算需求。同时阿里云也新发布了该系列产品中采用25G网络与Skylake处理器的全新一代实例,性能持续领先。这是阿里云首次将云服务器产品线细分出企业级产品家族,与入门级产品家族相比,这一新家族实例具备更强的计算性能与可靠性,适合于核心生产业务需求的计算。

目前ECS企业级产品家族包含19款实例族,分为通用型(General Purpose Type)、计算性(Compute Type)、内存型(Memory Type)、高主频(High Frequency Compute Type)、本地SSD型(Local SSD Type)、大数据型(Big Data Network Enhancement Type)、GPU计算(GPU Compute Type)、FPGA计算(FPGA Compute Type)等类型,分别适用于包括AI、医疗、视频直播、金融、电商、IoT在内的173个应用场景。

虽然编译器和加速api必须是高性能,但是加速驱动程序必须是稳定可靠才行。超大规模的客户希望看到bug修复、防弹质量保证以及最重要的过程控制方面的快速转变。在处理器市场中,可靠性、可用性和可服务性(RAS)一直是采用Arm处理器的最大障碍之一。加速器也不例外。确保驱动程序RAS处于超大规模是一个与设计性能编译器截然不同的技能集。它需要时间来发展技能和过程控制来展示一个稳定的行为的历史。

英伟达的86%的实例类型由前四个云服务商提供。这一份额与FPGA(英特尔和Xilinx)、GPU(AMD部分产品和最近的Radeon Instinct)以及云自身的内部设计(谷歌云张量处理单元[TPU]和AWSInferentia)等高度分散的竞争领域形成了鲜明对比。在这里,仅仅在加速器的开发工具后面使用性能编译器是不够的。我们假设每个加速器芯片开发团队都有机会接触到相当优秀的编译器开发人员和普通的开发人员工具设计人员。

开发工具必须能够被大量的潜在客户使用,并且必须按照开发人员所期望的那样工作。Nvidia的CUDA为工具开发者提供了一个灵活的基础,使他们能够跨Nvidia的GPU产品线支持各种各样的开发工具。英伟达在加速器市场的份额在过去一年中略有增长,在前四大云计算中,基于加速器的整体部署增加了近70%。

Azure支持AMD的Radeon Instinct MI25在一个类型家族(NVasv4)中,但只在Windows上,类型家族的每个实例的部分GPU配置是典型的虚拟桌面环境。AMD已经展示了对实际企业桌面环境的强大支持,其先进的GPU虚拟化特性使其GPU在虚拟桌面方面具有竞争力。

只有通过深度学习框架,才能使用内部设计的深度学习加速器。谷歌允许开发人员通过TensorFlow和PyTorch访问其云TPU。AWS允许开发人员通过自己的AWS神经元软件开发工具包(SDK)访问它的“下一层”芯片,AWS已经集成了TensorFlow、PyTorch和MXNet。

Azure提供了一个基于IntelArria10FPGA实例类型(PB)。但是Azure只允许通过一组预先开发的深度学习推断模型来访问这一类型:ResNet50、ResNet152、DenseNet-121、VGG-16和SSD-VGG。Azure在2019年11月将其FPGA实例类型部署到生产中。

阿里云和AWS提供通用FPGA实例类型,并与第三方合作,在应用市场上提供FPGA开发工具和预先开发的应用程序。有两个挑战。首先,FPGA开发技能很少,不像GPU开发工具和深度学习建模框架。其次,FPGA市场应用程序必须比基于GPU的应用程序显示出明显的优势。

芯片产业的摩尔定律想必大家都不陌生,通俗版的解释是每18个月同等价格的芯片计算能力会翻倍。最近几年在PC和移动等个人芯片已满足大多数计算需求时,关于摩尔定律不再生效的论调也遍地都是。

实际上,传统计算硬件还在发展,只是速率慢了。随着大数据、人工智能的崛起,需要AI运算处理的数据,差不多每24个月就至少增长一倍,建构模型的复杂度是原来的五倍,与之相关,就需要计算能力强大十倍芯片能及时跟上,这一计算能力的提升,需要算法、软件和硬件工艺相互配合共同来完成。

为了应对量级增长的算力需求,百度发布了昆仑AI芯片,参数如下:14nm工艺;260Tops性能;512GB/s内存带宽;100+瓦特功耗。昆仑AI芯片具有高效、低成本和易用三大特征,其针对语音、NLP、图像等专门优化,同等性能下成本降低10倍,支持paddle等多个深度学习框架、编程灵活度高、灵活支持训练和预测。

在IaaS方面,在软件即服务的云中,Facebook正在与开放计算平台(OCP)加速器模块工作组(OAM)合作,开发标准化的培训和推理平台。OAM培训平台被设计用来容纳大范围的高瓦数、商业深度学习加速器,使用一个可互换的模块,集成了加速器芯片和散热器,包括AMD、Intel/HabanaGraphcore和Nvidia加速器。同样地,OAM推断平台被设计成在一个标准的M.2物理载体中容纳各种各样的小的低功率推断加速器。

Facebook已经设计了自己的Glow编译器,以优化在标准框架(如PyTorch)中开发的推断模型,使之适用于每个特定的基于m2的推断加速器。开放式基础设施,如OCP的OAM,将使低层云能够更好地与AWS、Azure、GCP和阿里云等巨头正在激烈竞争。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云服务
    +关注

    关注

    0

    文章

    857

    浏览量

    39830
  • 云技术
    +关注

    关注

    1

    文章

    190

    浏览量

    19270
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    观测:从时代走向AI时代

    过去十年,计算让企业的数据处理能力实现了指数级增长,而观测作为全栈监控观测平台,见证并参与了这一进程。通过强大的数据采集、处理与展示能力,观测帮助数百家企业实现了对 IT 基础设施、应用
    的头像 发表于 05-15 10:47 ?363次阅读

    GPU计算服务怎么样

    在当今数字化快速发展时代,高性能计算需求日益增长。为满足这些需求,GPU计算服务应运而生。那么,GPU计算
    的头像 发表于 02-05 15:01 ?523次阅读

    使用华为 Flexus 服务器 X 搭建部署茶叶商城小程序 uniapp

    在当今数字化时代,小程序以其便捷、高效的特点成为了众多商家拓展业务的重要渠道。 本文详细介绍如何使用新购买的华为 Flexus 服务
    的头像 发表于 01-13 13:35 ?487次阅读
    使用华为<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b><b class='flag-5'>服务</b>器 X 搭建部署茶叶商城小程序 uniapp

    华为征文 计算新纪元:Flexus 服务器 X 实例引领柔性算力时代,部署 Zabbix 运维监控

    Flexus 服务器 X 实例引领柔性算力时代 引言 随着计算技术的飞速发展,企业对于算力的需求日益多样化与精细化。传统的粗颗粒度弹性
    的头像 发表于 01-02 11:57 ?384次阅读
    华为<b class='flag-5'>云</b>征文 <b class='flag-5'>云</b>计算新纪元:Flexus <b class='flag-5'>云</b><b class='flag-5'>服务</b>器 X 实例引领柔性算力<b class='flag-5'>时代</b>,部署 Zabbix 运维监控

    华为 Flexus 服务器 X 实例的购买及使用体验

    前言 随着计算的不断发展服务的使用变得越来越方便。它不仅提高了我们的工作效率,还帮助我们提升了技术能力,增强了在职场中的竞争力。华为
    的头像 发表于 12-24 17:26 ?646次阅读
    华为<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b><b class='flag-5'>服务</b>器 X 实例的购买及使用体验

    Grab选定亚马逊科技为首选服务

    近日,在亚马逊科技2024年re:Invent全球大会上,一项重大合作宣布出炉。东南亚领先的超级应用程序Grab与亚马逊科技携手,宣布Grab已正式选定亚马逊科技作为其首选的
    的头像 发表于 12-24 10:22 ?531次阅读

    超级应用程序Grab选择亚马逊科技为首选服务

    亚马逊科技为首选服务商。借助亚马逊科技,Grab正在实施以技术为核心的发展战略,旨在推动其业务在出行、配送、以及包括新增的digiba
    的头像 发表于 12-19 15:31 ?653次阅读

    PingCAP选择亚马逊科技为首选服务商 加速全球业务拓展

    北京2024年12月18日 /美通社/ -- 亚马逊科技在2024 re:Invent全球大会上宣布,数据库即服务(DBaaS)产品TiDB Cloud的开发商PingCAP选择亚马逊
    的头像 发表于 12-18 17:42 ?613次阅读

    公有服务市场持续增长

    近日,根据Gartner的最新预测,全球终端用户在公有服务上的支出持续攀升。预计到2025年,这一数字将从2024年的5957亿美元增长至7234亿美元,实现21.5%的显著增长
    的头像 发表于 12-09 14:48 ?695次阅读

    美国服务器主机优势和缺点

    美国服务器主机在全球计算市场中占据重要地位,美国服务
    的头像 发表于 12-02 16:31 ?544次阅读

    印度央行计划2025年推出本土服务

    的IT公司共同打造这一平台,旨在打破国外服务巨头的垄断地位。亚马逊网络服务、微软Azure、谷歌云和IBM等国际知名
    的头像 发表于 11-19 13:57 ?616次阅读

    搭乘“数字快车”!双十一华为 Flexus 服务器 X 实例助力轻松上

    计算作为数字时代的新型基础设施,是整合科技创新资源,加快形成新质生产力的关键要素和构建现代化产业体系的底座支撑。据信通院发布的《计算白皮书(2024 年)》显示,2023 年,全球
    的头像 发表于 11-15 12:01 ?766次阅读
    搭乘“数字快车”!双十一华为<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b><b class='flag-5'>服务</b>器 X 实例助力轻松上<b class='flag-5'>云</b>

    独立服务器与服务器的区别

    随着互联网技术的飞速发展,企业对于服务器的需求日益增加,而服务市场也随之出现了多种类型的产品,其中最常见的是独立服务器和
    的头像 发表于 10-12 14:34 ?795次阅读

    服务器搭建详细过程

    随着计算技术的发展,越来越多的企业和个人开始选择使用服务器来部署自己的应用和服务。相比于传统的物理
    的头像 发表于 09-12 10:00 ?1109次阅读

    如何理解计算?

    和硬件资源。 在数字化时代,互联网已经成为基础设施。计算使得数据中心能够像一台计算机一样去工作。通过互联网算力以按需使用、按量付费的形式提供给用户,包括:计算、存储、网络、数据库、大数据计算
    发表于 08-16 17:02