0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里通义千问发布小尺寸模型Qwen3-4B,手机也能跑

Carol Li ? 来源:电子发烧友网 ? 作者:李弯弯 ? 2025-08-12 17:15 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网综合报道 8月7日,阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。目前新模型已在魔搭社区、HuggingFace正式开源。在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。官方表示,2507版本的Qwen3-4B模型对手机等端侧硬件部署尤为友好。


随着AI技术的广泛应用,不同场景对模型的需求呈现出多样化态势。在一些资源受限的边缘设备,如智能手机智能手表、物联网终端等,大尺寸模型由于计算资源需求大、内存占用高,难以有效部署和运行。同时,对于一些对实时性要求极高的应用场景,如自动驾驶的实时决策、工业生产中的即时质量控制等,大模型的高延迟也成为制约其应用的瓶颈。在此背景下,小尺寸、低延迟且具备一定性能的模型成为市场的新需求。阿里通义千问敏锐地捕捉到这一趋势,适时推出了Qwen3-4B模型。

Qwen3-4B,从名称便可知其规模相对较小,“4B”代表着该模型拥有约40亿的参数。相较于那些拥有千亿甚至万亿参数的“巨无霸”模型,Qwen3-4B堪称“小个子”。

在语言理解方面,Qwen3-4B展现出了出色的表现。它能够精准理解人类输入的各种复杂语句,无论是日常交流中的口语化表达,还是专业领域的术语和复杂逻辑语句,都能快速把握其中的语义和意图。例如,在医疗领域,面对医生输入的包含专业医学词汇和复杂诊断逻辑的语句,Qwen3-4B可以准确理解病情信息,为后续的辅助诊断提供可靠依据。在法律场景中,对于法律条文的解读和法律案例的分析,它也能深入理解其中的法律关系和关键要点。

其文本生成能力同样可圈可点。Qwen3-4B可以生成高质量、连贯且符合语境的文本内容。无论是撰写新闻稿、故事创作、诗歌生成,还是进行商业文案的策划,它都能根据给定的主题和要求,快速生成富有创意和逻辑性的文本。而且,生成的文本在语法准确性和语义合理性上都有较高水准,大大减少了人工后期修改的工作量。

在多模态交互方面,Qwen3-4B也有积极探索。它不仅能够处理文本信息,还能与图像、音频等多种模态数据进行交互。例如,在图像描述生成任务中,它可以根据输入的图像,生成准确、生动的文字描述,详细阐述图像中的场景、人物、物体及其相互关系。在语音交互场景中,它能够理解语音输入的内容,并给出相应的语音或文本回复,实现自然流畅的人机对话。

值得一提的是,Qwen3-4B还具备良好的可扩展性和适应性。开发人员可以根据具体的应用需求,对其进行微调和优化,使其更好地适配不同的业务场景。同时,由于其小尺寸的特点,它在部署和运行过程中对硬件资源的要求较低,能够在各种资源有限的设备上稳定运行,大大降低了应用成本。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里
    +关注

    关注

    6

    文章

    456

    浏览量

    33414
  • 通义千问
    +关注

    关注

    1

    文章

    37

    浏览量

    453
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    广和通加速通义Qwen3在端侧全面落地

    6月,广和通宣布:率先完成通义Qwen3系列混合推理模型在高通QCS8550平台端侧的适配部署。广和通通过定制化混合精度量化方案与创新硬
    的头像 发表于 06-25 15:35 ?469次阅读

    Arm CPU适配通义Qwen3系列模型

    近日,阿里巴巴开源了新一代通义模型 Qwen3,Arm 率先成为首批成功适配该
    的头像 发表于 05-12 16:37 ?803次阅读

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源的混合推理大语言模型 (LLM) 通义
    的头像 发表于 05-08 11:45 ?1812次阅读
    NVIDIA使用<b class='flag-5'>Qwen3</b>系列<b class='flag-5'>模型</b>的最佳实践

    后摩智能NPU适配通义Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列开源混合推理模型。用时不到1天,后摩智能自研NPU迅速实现Qwen3 系列模型
    的头像 发表于 05-07 16:46 ?708次阅读

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    似乎国内外AI竞争日趋白热化,就在阿里巴巴发布Qwen3通义
    的头像 发表于 04-30 16:08 ?879次阅读

    壁仞科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3
    的头像 发表于 04-30 15:19 ?892次阅读

    阿里最新消息:国家超算互联网平台、广州算力中心、多所高校接入通义模型

    ? 国家超算互联网平台 接入阿里通义模型 ? 3月10日,国家超算互联网平台接入
    的头像 发表于 03-14 11:54 ?859次阅读

    摩尔线程支持阿里通义QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义QwQ-32B。摩尔线程在该
    的头像 发表于 03-07 17:48 ?827次阅读
    摩尔线程支持<b class='flag-5'>阿里</b>云<b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>QwQ-32<b class='flag-5'>B</b>开源<b class='flag-5'>模型</b>

    阿里通义Qwen2.5-Max模型全新升级

    近期,阿里通义团队为用户带来了一个振奋人心的好消息:其旗舰版模型Qwen2.5-Max迎来了全新升级发布
    的头像 发表于 02-05 14:07 ?859次阅读

    阿里通义开源长文本新模型Qwen2.5-1M

    o-mini。 Qwen2.5-1M模型提供了7B和14B两种尺寸供用户选择,以满足不同场景下的需求。在处理长文本输入时,该
    的头像 发表于 02-05 14:01 ?586次阅读

    阿里通义发布Qwen2.5-Turbo开源AI模型

    近日,阿里通义官方宣布,经过数月的精心优化与改进,正式推出了Qwen2.5-Turbo开源AI模型
    的头像 发表于 11-19 18:07 ?1539次阅读

    阿里通义代码模型全系列开源

    近日,阿里通义模型团队宣布了一项重大决策:将通义代码
    的头像 发表于 11-14 15:26 ?1141次阅读

    阿里云开源Qwen2.5-Coder代码模型系列

    近日,阿里通义模型团队宣布开源其通义代码模型
    的头像 发表于 11-14 11:28 ?1100次阅读

    通义三款主力模型再降价

    阿里云百炼平台再次掀起降价风暴,三款通义主力模型——Qwen-Turbo、
    的头像 发表于 09-20 16:46 ?1644次阅读

    通义发布第二代视觉语言模型Qwen2-VL

    阿里巴巴旗下的通义近日宣布,其第二代视觉语言模型Qwen2-VL正式问世,并宣布旗舰
    的头像 发表于 09-03 16:31 ?932次阅读