0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为亮相2025金融AI推理应用落地与发展论坛

华为 ? 来源:华为 ? 2025-08-15 09:45 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,2025金融AI推理应用落地与发展论坛在上海举行。中国银联执行副总裁涂晓军、华为数字金融军团CEO曹冲出席本次论坛并发表致辞。论坛上,华为公司副总裁、数据存储产品线总裁周跃峰博士发布AI推理创新技术——UCM推理记忆数据管理器,旨在推动AI推理体验升级,提升推理性价比,加速AI商业正循环。同时,华为携手中国银联率先在金融典型场景开展UCM技术试点应用,并联合发布智慧金融AI推理加速方案应用成果。

当前,人工智能已步入发展深水区,AI推理正成为下一个爆发式增长的关键阶段,推理体验和推理成本成为了衡量模型价值的黄金标尺。周跃峰在论坛上强调:“AI时代,模型训练、推理效率与体验的量纲都以Token数为表征,Token经济已经到来”。为保障流畅的推理体验,企业需持续加大算力投入,但如何在推理效率与成本之间找到最佳平衡点,成为了全行业亟待解决的重要课题。

为此,华为重磅推出UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”:

更优的推理体验:依托UCM层级化自适应的全局前缀缓存技术,系统能直接调用KV缓存数据,避免重复计算,使首Token时延最大降低90%。同时,UCM将超长序列Cache分层卸载至外置专业存储,通过算法创新突破模型和资源限制,实现推理上下文窗口10倍级扩展,满足长文本处理需求。

更低的推理成本:UCM具备智能分级缓存能力,可根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动;同时融合多种稀疏注意力算法,实现存算深度协同,使长序列场景下TPS(每秒处理token数)提升2-22倍,显著降低每Token推理成本,为企业减负增效。

在与中国银联的联合创新技术试点中,UCM的技术价值得到充分验证。在中国银联“客户之声”业务场景下,借助UCM技术及工程化手段,大模型推理速度提升125倍,仅需10秒即可精准识别客户高频问题,促进服务质量提升。未来,中国银联将依托国家人工智能应用中试基地,联合华为等生态伙伴共建“AI+金融”示范应用,推动技术成果从“实验室验证”走向“规模化应用”。

论坛现场,华为正式公布了UCM开源计划。UCM通过开放统一的南北向接口,可适配多类型推理引擎框架、算力及存储系统。今年9月,UCM将正式开源,后续逐步贡献给业界主流推理引擎社区,携手全产业共同推动AI推理生态的繁荣发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    216

    文章

    35290

    浏览量

    256933
  • AI
    AI
    +关注

    关注

    88

    文章

    35736

    浏览量

    282342
  • 人工智能
    +关注

    关注

    1810

    文章

    49215

    浏览量

    251436

原文标题:破解效率与成本难题:华为UCM技术推动AI推理体验升级

文章出处:【微信号:huaweicorp,微信公众号:华为】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为破解HBM依赖!AI推理黑科技UCM上线,9月正式开源

    8月12日,在2025金融AI推理应落地发展论坛
    的头像 发表于 08-13 08:58 ?4973次阅读
    <b class='flag-5'>华为</b>破解HBM依赖!<b class='flag-5'>AI</b><b class='flag-5'>推理</b>黑科技UCM上线,9月正式开源

    开源赋能金融创新论坛成功举办

    日前,2025开放原子开源生态大会——开源赋能金融创新论坛在北京成功举办。论坛致力于推动金融行业拥抱开源、规范应用、协同创新,探索开源技术驱
    的头像 发表于 08-05 11:00 ?401次阅读

    润和软件智慧金融解决方案亮相WAIC 2025

    2025世界人工智能大会(WAIC 2025)上,作为深耕金融科技领域的领先服务商和人工智能领域的创新先锋企业,润和软件携JettoAI 测试智能助手平台、消保助手、研报助手等在内的系列智慧
    的头像 发表于 07-31 16:06 ?314次阅读
    润和软件智慧<b class='flag-5'>金融</b>解决方案<b class='flag-5'>亮相</b>WAIC <b class='flag-5'>2025</b>

    蚂蚁数科正式发布金融推理大模型

    7月26日,以“智能时代,同球共济”为主题的2025世界人工智能大会在上海开幕;亮点很多。我们看到在世界人工智能大会论坛上,蚂蚁数科正式发布了金融推理大模型Agentar-Fin-R1
    的头像 发表于 07-28 16:36 ?268次阅读

    睿赛德邀您共赴“2025AI商业落地论坛”:共探实效派AI的产业变革力量 | 活动预告

    作为全球人工智能领域的年度盛会,2025世界人工智能大会(WAIC)将于7月26日在上海盛大启幕。“AI商业落地论坛”是世界人工智能大会的重要系列
    的头像 发表于 07-21 20:15 ?313次阅读
    睿赛德邀您共赴“<b class='flag-5'>2025AI</b>商业<b class='flag-5'>落地</b><b class='flag-5'>论坛</b>”:共探实效派<b class='flag-5'>AI</b>的产业变革力量 | 活动预告

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    模态的技术特性,DeepSeek正加速推动AI金融、政务、科研及网络智能化等关键领域的深度应用。 信而泰:AI推理引擎赋能网络智能诊断新范式信而泰深度整合DeepSeek-R1大模型
    发表于 07-16 15:29

    奥托立夫亮相2025全球新能源汽车合作发展论坛

    6月24日-25日,由中国电动汽车百人会主办的2025全球新能源汽车合作发展(上海)论坛(GNEV2025?Shanghai ),在上海隆重举行。
    的头像 发表于 06-26 18:09 ?589次阅读

    GAITC2025|张科:端云一体大模型推理应用实战

    出席并在《行业大模型应用与发展论坛发表演讲,首次深入介绍京东零售在端云一体大模型推理架构的实战经验与技术探索,并分享AI推理方向的未来
    的头像 发表于 06-26 09:33 ?189次阅读

    研华科技亮相COMPUTEX 2025

    研华以“Edge Computing & WISE-Edge in Action”为主题亮相COMPUTEX 2025,双馆联展、论坛演讲、直播座谈多点联动,全面展现边缘AI在机器人、
    的头像 发表于 05-23 15:25 ?502次阅读

    华为亮相2025全球数据中心产业论坛

    近日,以“让数字世界坚定运行”为主题的2025全球数据中心产业论坛在沙漠之城迪拜隆重召开。全球超过500位智算产业领袖、技术专家和上下游生态伙伴齐聚一堂,围绕智算时代数据中心产业增长新机遇、发展新路径展开深度研讨,见证
    的头像 发表于 05-15 14:17 ?524次阅读

    2025华为乾崑车云车联网体验创新发展论坛成功举办

    随着全球智能网联汽车产业迈入高速发展期,车云、车联网技术与用户体验的创新融合成为行业突破的关键。值此2025年上海国际汽车展览会之际,由华为智能汽车解决方案主办的“2025
    的头像 发表于 04-28 10:30 ?488次阅读

    中软国际亮相2025华为四川智慧园区高峰论坛

    近日,由华为、中软国际联合主办的2025华为四川智慧园区高峰论坛成功举办,活动以“鸿蒙+AI,共建智慧园区2.0”为主题,汇聚众多客户、伙伴
    的头像 发表于 04-21 18:09 ?688次阅读

    华为AI WAN在智算边缘推理网络中的关键优势

    此前, 2025年3月24日至27日,MPLS&SRv6 AI Net World Congress 2025在法国巴黎会议中心举办。华为数据通信IP标准化高级代表李呈发表了题为“
    的头像 发表于 04-09 09:53 ?551次阅读

    华为加速AI时代数据存储产业发展

    近日,在华为中国合作伙伴大会2025上,华为数据存储产品线总裁周跃峰发表“共筑数智解决方案,共享数据存储产业大发展”主题演讲,深入探讨如何加速AI
    的头像 发表于 04-01 15:35 ?464次阅读

    一场圆桌论坛揭晓AI落地智慧园区的发展趋势

    日前,达实智能成立30周年庆典暨“AIoT平台+国产AI大模型”新品发布会隆重举办,现场进行一场以“AI技术落地与园区智能化系统发展趋势”为主题的圆桌
    的头像 发表于 03-31 10:11 ?398次阅读