0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

积算科技上线赤兔推理引擎服务,创新解锁FP8大模型算力

全球TMT ? 来源:全球TMT ? 作者:全球TMT ? 2025-07-30 21:44 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


北京2025年7月30日 /美通社/ -- 近日,北京积算科技有限公司(以下简称"积算科技")宣布其算力服务平台上线赤兔推理引擎。积算科技PowerFul-AI应用开发平台与赤兔合作,打造高性价比的模型轻量化部署方案。用户通过远程算力平台预置的模型镜像与AI工具,仅需50%的GPU算力即可解锁大模型推理、企业知识库搭建、智能体开发,加速大模型在智能问答、报告生成、客服助手、智能体等典型行业场景的落地。


赤兔推理引擎由北京清程极智科技有限公司(以下简称"清程极智")开发,并联合清华大学团队发布开源版本。其核心价值在于,打破了FP8模型原生部署时GPU必须支持FP8精度的要求。通过底层算子优化(如GeMM、MoE的指令级重构)和编译技术创新,赤兔早在今年三月即首次实现在非FP8精度卡上原生运行FP8高精度模型,并确保推理过程几乎零精度损失。

积算科技联合清程极智,完成了赤兔推理引擎在积算科技PowerFul-AI应用开发平台上的验证测试。测试结果表明,赤兔推理引擎在积算科技PowerFul-AI平台上运行稳定、性能表现优异,满足双方兼容性认证的各项标准,能够快速完成DeepSeek、Qwen等大模型推理部署,并支持基于非FP8精度GPU卡实现FP8模型部署,相比于使用BF16精度部署,GPU算力需求减半。以部署DeepSeek-R1-671B为例,原需4台8卡机2560GB显存,现仅需2台8卡机1280GB显存即可满足要求。

积算科技PowerFul-AI平台携手赤兔推理引擎,将为AI大模型应用开发打造"成本减半、零性能损耗"的解决方案,提供构建企业知识库开发、智能体搭建等功能,助力企业用户灵活快速构建大模型通用应用及个性化端到端解决方案。

PowerFul-AI是积算科技的大模型应用落地解决方案,能够为AI大模型落地应用提供高效、易用、安全的端到端开发平台,帮助企业及科研机构高效开发部署AI大模型应用。目前,PowerFul-AI已经全面适配DeepSeek R1、DeepSeek V3等模型。用户只需选择镜像和模型文件,并配置模型所需的算力资源,即可快速完成模型部署,实现DeepSeek的"分钟级"上线。

积算科技诞生于全球生成式AI浪潮,专注于智能算力服务市场,致力于成为中国最具价值的智能算力服务商,聚焦互联网、运营商、高校、新能源汽车等领域的多家头部客户提供算力服务。公司拥有万卡级先进智能算力资源池,提供裸金属、智能算力系统、专属智能算力系统等算力服务产品,适用于大模型训练与推理、算法研究、大数据分析、自动驾驶、智能科学计算等多元场景。其运维和服务团队具备大规模智能算力系统设计建设、大模型开发应用及性能优化能力,可提供全栈大模型应用开发服务支持,并根据客户需求提供灵活服务模式。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281279
  • 大模型
    +关注

    关注

    2

    文章

    3191

    浏览量

    4147
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    超低延时重构AI推理体验!白山云发布“大模型API”产品

    优势,打造超低延时、超稳定、简单易用的API接口服务,降低大模型应用成本和开发门槛,助力企业和个人用户快速开启AI创新之旅。专注边缘推理,构建“云边端”
    的头像 发表于 07-02 17:26 ?543次阅读
    超低延时重构AI<b class='flag-5'>推理</b>体验!白山云发布“大<b class='flag-5'>模型</b>API”产品

    芯片的生态突围与革命

    据的爆发式增长,大芯片已成为科技竞争的核心领域之一。 ? 大芯片的核心应用场景丰富多样。在人工智能训练与推理方面,大
    的头像 发表于 04-13 00:02 ?1794次阅读

    智能最具潜力的行业领域

    ?; 数据治理与联合创新?:民生银行与华为、阿里云等共建AI实验室,通过“数据湖+模型体系”提升服务精准度?; 需求驱动?:金融大
    的头像 发表于 04-11 08:20 ?442次阅读
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潜力的行业领域

    RAKsmart服务器如何重塑AI高并发格局

    在AI大模型参数量突破万亿级、实时推理需求激增的当下,传统服务器架构的并发处理能力已逼近物理极限。RAKsmart通过“硬件重构+软件定义”的双引擎
    的头像 发表于 04-03 10:37 ?354次阅读

    信而泰CCL仿真:解锁AI极限,智中心网络性能跃升之道

    引言 随着AI大模型训练和推理需求的爆发式增长,智中心网络的高效性与稳定性成为决定AI产业发展的核心要素。信而泰凭借自主研发的 CCL(集合通信库)评估工具 与 DarYu-X系列测试仪 ,为智
    的头像 发表于 02-24 17:34 ?500次阅读
    信而泰CCL仿真:<b class='flag-5'>解锁</b>AI<b class='flag-5'>算</b><b class='flag-5'>力</b>极限,智<b class='flag-5'>算</b>中心网络性能跃升之道

    DeepSeek对芯片的影响

    架构的核心理念是将整个模型划分为多个子模型(专家),每个子模型负责特定的任务,且在实际推理时并非激活所有专家,而是根据输入数据选择性激活需要的专家。对于芯片
    的头像 发表于 02-07 10:02 ?1178次阅读
    DeepSeek对芯片<b class='flag-5'>算</b><b class='flag-5'>力</b>的影响

    FP8在大模型训练中的应用

    越来越多的技术团队开始使用 FP8 进行大模型训练,这主要因为 FP8 有很多技术优势。比如在新一代的 GPU 上,FP8 相对于 BF16 对矩阵乘算子这样的计算密集型算子,NVID
    的头像 发表于 01-23 09:39 ?1236次阅读
    <b class='flag-5'>FP8</b>在大<b class='flag-5'>模型</b>训练中的应用

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?
    的头像 发表于 01-16 10:24 ?507次阅读

    家计算 开启贵州人工智能服务新篇章

    的贵州家计算服务有限公司(以下简称家计算)诞生,它依托其特有资源优势,提供专业AI计算服务,助力人工智能创新发展。 ? 【贵州
    的头像 发表于 12-27 00:37 ?672次阅读
    <b class='flag-5'>算</b>家计算 开启贵州人工智能<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服务</b>新篇章

    如何使用FP8新技术加速大模型训练

    利用 FP8 技术加速 LLM 推理和训练越来越受到关注,本文主要和大家介绍如何使用 FP8 这项新技术加速大模型的训练。 使用 FP8
    的头像 发表于 12-09 11:30 ?1142次阅读

    FP8数据格式在大型模型训练中的应用

    本文主要介绍了 FP8 数据格式在大型模型训练中的应用、挑战及最佳实践,展示了 FP8 在提升训练速度和效率方面的潜力和实际效果。
    的头像 发表于 11-19 14:54 ?1800次阅读
    <b class='flag-5'>FP8</b>数据格式在大型<b class='flag-5'>模型</b>训练中的应用

    FP8模型训练中Debug优化思路

    目前,市场上许多公司都积极开展基于 FP8 的大模型训练,以提高计算效率和性能。在此,我们整理并总结了客户及 NVIDIA 技术团队在 FP8 模型训练过程中的 debug 思路和方法
    的头像 发表于 09-06 14:36 ?993次阅读
    <b class='flag-5'>FP8</b><b class='flag-5'>模型</b>训练中Debug优化思路

    模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问
    发表于 08-20 09:04

    中科曙光入选2024服务产业图谱及服务产品名录

    近日,中国信通院公布首个《服务产业图谱(2024年)》及《服务产品名录(2024年)》。
    的头像 发表于 08-06 14:23 ?1424次阅读