近日,阿里通义千问发布了两款新版本30B(300亿参数)MoE大模型——Qwen3-30B-A3B-Instruct-2507 和 Qwen3-Coder-30B-A3B-Instruct。在搭载英特尔? 酷睿? Ultra 200H处理器和32GB内存的AI PC上,英特尔可变显存技术(Intel Variable VRAM Technology)可以将VRAM分配比例从57%提升到87%1,从而更加流畅地运行这两款大模型,为本地部署注入新活力的同时,带来“更聪明”的AI应用体验。AI PC智能助手Flowy AI率先实现了这两款模型的适配并开放下载,用户可即刻下载体验。
智能内存管理,动态按需分配
英特尔可变显存技术适配了 MoE 架构模型在专家节点切换时的显存波动特点,通过在软件层面的调优,实现了突破性的高显存分配率。该技术的核心在于其深度优化的、基于预留内存的动态调度机制,它打破了传统核显显存固定分配的限制,实现了VRAM(显存)的动态调节和高效利用。在搭载英特尔酷睿Ultra 200H处理器和32GB内存的AI PC上,用户只需简单操作,即可将系统内存的默认VRAM分配比例从57%提升到87%1。这意味着,一台配备 32GB 内存的笔记本设备,可使用的VRAM能够从目前市面通用的18GB提升到27GB。这一显著提升,进一步拓宽了PC端运行大模型的能力边界,让超过20B参数的大模型和复杂的AI应用也能顺畅运行,为用户带来更强大的AI体验。
用户可以在英特尔官网下载并安装最新版的显卡驱动程序( 32.0.101.6972 或以上版本),再通过 Intel Graphics Software 控制面板自定义设定显存比例,实现VRAM的动态调节。同时,该技术还针对酷睿Ultra 200H平台的硬件特性,对预留内存的读写路径进行了深度优化,通过提升内存带宽利用率和减少数据交换延迟,确保大模型在高占比预留内存调用时仍能保持流畅运行。
30B参数大模型轻松“装进口袋”,Flowy率先适配
目前,英特尔生态合作伙伴 Flowy AI 已率先完成英特尔可变显存技术的验证,在其 Flowy AI PC 软件中集成了 Qwen3-30B-2507 和 Qwen3-Coder-30B 两款模型。得益于英特尔可变显存技术,现在用户仅凭一台轻薄本,就能将 30B参数大模型 “装进口袋”,随时随地享受高效的本地 AI 服务。实际测试结果显示,在搭载英特尔酷睿Ultra 9 285H 处理器及 32GB 内存PC上,这两款 30B 参数大模型均可流畅运行,不仅支持 Q4、Q5、Q6 等更高精度的量化版本,还能实现毫秒级响应的离线交互,让用户无需再依赖高性能独显或云端算力,即可实现随时互联的移动办公和离线创作等丰富应用,以更低的成本部署成本,享受本地AI带来的精彩体验。
立刻体验:
英特尔支持可变显存的显卡驱动,32.0.101.6972 或以上版本:https://www.intel.cn/content/www/cn/zh/download/785597/intel-arc-iris-xe-graphics-windows.html
Flowy AI PC version:https://www.flowyaipc.com/download
注释:
1. 数据来源于英特尔支持可变显存的显卡驱动32.0.101.6972注释https://downloadmirror.intel.com/861295/ReleaseNotes_101.6972.pdf
审核编辑 黄宇
-
英特尔
+关注
关注
61文章
10212浏览量
175434 -
大模型
+关注
关注
2文章
3230浏览量
4223
发布评论请先 登录
阿里通义千问发布小尺寸模型Qwen3-4B,手机也能跑

Intel OpenVINO? Day0 实现阿里通义 Qwen3 快速部署

笔记本声音问题
利用英特尔OpenVINO在本地运行Qwen2.5-VL系列模型

英特尔赋能DeepSeek本地运行,助力汽车升级“最强大脑”
探索座舱“未至之境”:英特尔支持DeepSeek车内本地运行

2025款LG gram Pro笔记本首销
英特尔2025上半年将推24GB显存锐炫B580显卡
英特尔2025上半年或推24GB显存锐炫B580显卡
英特尔2025年推24GB显存“Battlemage”独显
英特尔推出全新英特尔锐炫B系列显卡

评论