0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zyphra推出Zamba2-mini 1.2B模型

CHANBAEK ? 来源:网络整理 ? 作者:网络整理 ? 2024-08-29 18:13 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,AI创新先锋Zyphra公司在科技界投下了一颗震撼弹,正式揭晓其最新力作——Zamba2-mini 1.2B模型。这款被誉为端侧SOTA(State-Of-The-Art)级别的小语言模型,以其卓越的性能参数和极致的压缩效率,成为了业界关注的焦点。

Zamba2-mini 1.2B携带着惊人的12亿参数量,却能在严苛的4bit量化条件下,将内存占用控制在惊人的700MB以下,这一成就无疑是对AI模型轻量化探索的一次重大突破。其背后,是Zyphra团队对模型架构的深度优化与大胆创新,成功融合了多种神经网络设计的精髓,既保留了大型密集变压器模型的高质量输出特性,又实现了小模型难以企及的计算与内存效率。

Zamba2-mini 1.2B的问世,不仅为端侧设备提供了更为强大的智能支持,更预示着AI技术在实际应用场景中的广泛落地与深度融合。随着这一技术的不断成熟与普及,我们有理由相信,未来的端侧AI将更加智能、高效,为人们的生活带来更多便利与惊喜。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 变压器
    +关注

    关注

    162

    文章

    7833

    浏览量

    140676
  • AI
    AI
    +关注

    关注

    88

    文章

    35760

    浏览量

    282528
  • 模型
    +关注

    关注

    1

    文章

    3547

    浏览量

    50739
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    在MAC mini4上安装Ollama、Chatbox及模型交互指南

    作者:算力魔方创始人/英特尔创新大使刘力 一,简介 本文将指导您如何在MAC mini4上安装Ollama和Chatbox,并下载Deepseek-r1:32b模型。Ollama是一个用于管理和运行
    的头像 发表于 03-11 17:17 ?917次阅读
    在MAC <b class='flag-5'>mini</b>4上安装Ollama、Chatbox及<b class='flag-5'>模型</b>交互指南

    壁仞科技推出阿里QWQ-32B模型一体机

    能力等关键测试中展现出卓越性能。 作为国产AI算力重要推动力量,壁仞科技不断测试与更新适配最先进大模型,联合生态合作伙伴共同推出QWQ-32B模型一体机。 在
    的头像 发表于 03-10 09:05 ?1336次阅读
    壁仞科技<b class='flag-5'>推出</b>阿里QWQ-32<b class='flag-5'>B</b>大<b class='flag-5'>模型</b>一体机

    摩尔线程支持阿里云通义千问QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义千问QwQ-32B。摩尔线程在该模型发布后2小时内,迅速且高效完成了对千问QwQ-32B的支持。
    的头像 发表于 03-07 17:48 ?835次阅读
    摩尔线程支持阿里云通义千问QwQ-32<b class='flag-5'>B</b>开源<b class='flag-5'>模型</b>

    OpenAI o3-mini模型思维链遭质疑

    近日,OpenAI公开了其大模型o3-mini的推理思维链,这一举措使得免费用户和付费用户都能深入了解模型的思考过程。这一透明度的提升,原本旨在增强用户对模型的信任和理解,然而却意外引
    的头像 发表于 02-08 10:57 ?745次阅读

    OpenAI:GPT-4o及4o-mini模型性能下降,正展开调查

    ,并承诺将尽快发布最新的调查结果和解决方案。这一事件不仅对OpenAI自身的技术声誉产生了影响,也引发了业界对于大型语言模型稳定性和可靠性的担忧。 GPT-4o及4o-mini作为OpenAI推出的先进语言
    的头像 发表于 01-21 10:34 ?720次阅读

    OpenAI或将推出o3 mini推理AI模型

    近日,据最新消息,OpenAI即将在几周内推出一款全新的推理AI模型——o3 mini。这一消息由OpenAI的首席执行官Sam Altman在1月17日通过社交媒体平台X发布的一篇文章中透露
    的头像 发表于 01-21 10:06 ?685次阅读

    OpenAI即将推出o3 mini推理AI模型

    计划在接下来的几周内正式推出这一创新成果。 这一消息无疑为人工智能领域注入了新的活力。作为OpenAI的最新力作,o3 mini推理AI模型在技术上实现了诸多突破,旨在为用户提供更加高效、精准的推理服务。通过采用先进的算法和
    的头像 发表于 01-20 10:54 ?623次阅读

    OpenAI即将推出o3-mini,降低高级推理门槛

    OpenAI在人工智能领域的探索与创新从未停歇,为开发者们带来了一个又一个惊喜。近日,OpenAI开发者体验负责人传来好消息,表示公司即将向广大开发者推出全新的o3-mini模型。 这一消息的发布
    的头像 发表于 01-18 11:23 ?894次阅读

    图森未来发布“Ruyi”视频大模型,Ruyi-Mini-7B版本现已开源

    重大献礼。 尤为值得一提的是,图森未来已经将Ruyi的Mini-7B版本正式开源,用户现在可以通过huggingface平台轻松下载并使用这一强大的工具。这一举措无疑将极大地推动视频大模型在更广泛领域的应用和发展。 “Ruyi”模型
    的头像 发表于 12-20 15:19 ?1477次阅读

    Meta推出Llama 3.3 70B,AI大模型竞争白热化

    在今年的AI领域,Meta也不甘落后,推出了其压轴之作——Llama 3.3 70B模型。与此同时,马斯克的xAI也宣布其Grok模型从今天起全球免费开放(但存在一定的使用限制)。
    的头像 发表于 12-09 14:50 ?855次阅读

    智谱推出四个全新端侧模型 携英特尔按下AI普及加速键

    ,GLM-Edge-4B-chat、GLM-Edge-1.5B-chat为端侧大语言模型,GLM-Edge-V-5B、GLM-Edge-V-2B
    的头像 发表于 12-02 17:13 ?655次阅读
    智谱<b class='flag-5'>推出</b>四个全新端侧<b class='flag-5'>模型</b> 携英特尔按下AI普及加速键

    阿里国际推出全球首个B2B AI搜索引擎Accio

    近日,在欧洲科技峰会Web Summit上,阿里国际正式推出了全球首个B2B领域的AI搜索引擎——Accio。这一创新产品面向全球商家开放,标志着阿里国际正式入局当前备受瞩目的AI Search赛道。
    的头像 发表于 11-15 16:53 ?1297次阅读

    PerfXCloud重磅升级 阿里开源最强视觉语言模型Qwen2-VL-7B强势上线!

    体验吧! Qwen2-VL Qwen2-VL模型由阿里推出,在描述图像、理解视频以及解答视觉相关问题等方面表现极为卓越。该模型提供
    的头像 发表于 10-23 11:07 ?829次阅读
    PerfXCloud重磅升级  阿里开源最强视觉语言<b class='flag-5'>模型</b>Qwen<b class='flag-5'>2-VL-7B</b>强势上线!

    英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

    英伟达公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,这个AI大模型是源自 Meta 公司的 Llama-3.1-70B
    的头像 发表于 09-26 17:30 ?1006次阅读

    马斯克旗下xAI对Grok-2-mini进行速度升级

    科技巨头马斯克旗下的xAI公司近日宣布了一项重大进展,其热门语言模型Grok-2-mini成功完成了速度升级。
    的头像 发表于 08-27 15:28 ?664次阅读