0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出AI模型Gemma 3 270M

谷歌开发者 ? 来源:谷歌开发者 ? 2025-09-11 15:09 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 小组产品经理 Olivier Lacombe、研究工程师 Kathleen Kenealy、Kat Black、Ravin Kumar、Francesco Visin、Jiageng Zhang

过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT,为单一云端和桌面加速器带来了最先进的性能。以移动设备优先的架构 Gemma 3n 的推出,能够将强大的实时多模态 AI 直接应用于边缘设备。我们的目标是为开发者提供使用 AI 进行构建的实用工具,也一直对大家共同创造的 Gemmaverse 生态系统蓬勃发展而倍感欣喜,目前下载量已经突破 2 亿次,让我们共同庆祝这一时刻。

现在,我们在 Gemma 3 工具包中新增了一款高度专业化的工具: Gemma 3 270M。此模型是拥有 2.7 亿参数的紧凑型模型,专为针对特定任务进行微调而设计,并且已内置强大的指令遵循和文本结构化能力。

Gemma 3 270M 为小尺寸模型带来强大的指令遵循能力。正如 IFEval 基准测试 (该测试用于检验模型遵循可验证指令的能力) 所示,它为同尺寸模型确立了新的性能水平,使复杂的 AI 功能更容易用于设备端和研究应用。

Gemma 3 270M 的核心能力

紧凑但功能强大的架构: 我们的新模型总共有 2.7 亿参数: 其中的 1.7 亿是嵌入参数 (因词汇量较大),另外的 1 亿参数用于我们的 Transformer 模块。得益于 256k token 的大词汇量,该模型可以处理特定和罕见的 token,使其成为可在特定领域和语言中进一步微调的强大基础模型。

极致的能效表现: Gemma 3 270M 的一个关键优势是其低功耗。在 Pixel 9 Pro SoC 上进行的内部测试显示,由于采用了 INT4 量化技术,该模型在 25 次对话中仅消耗了 0.75% 的电量,成为我们最节能的 Gemma 模型。

指令遵循: 我们同步发布了指令微调版模型和预训练检查点。虽然此模型并非专为复杂的对话用例而设计,但它是一个强大的模型,能够开箱即用直接遵循一般指令。

可用于生产环境的量化: 量化感知训练 (QAT) 检查点已正式推出,使您能够在 INT4 精度下运行模型,同时将性能损失降至最低,这对于在资源受限的设备上部署模型至关重要。

选择合适的工具

在工程领域,衡量成功的标准在于效率,而不仅仅是原始算力。避免 "大材小用",同样的道理也适用于使用 AI 进行构建。

Gemma 3 270M 体现了 "选择合适的工具" 这一理念。这是一款性能卓越的基础模型,开箱即用即可遵循指令,而通过微调更能释放其全部潜能。经过专业化设置后,模型能以惊人的准确率、速度和成本效益执行文本分类和数据提取等任务。从一款功能强大的紧凑型模型着手,您可以构建出精简、快速且显著降低运营成本的生产系统。

现实世界的成功蓝图

这种方法已经在现实世界中取得了令人惊叹的成果。Adaptive ML 与 SK Telecom 合作完成的项目便是一个绝佳的例证。面对复杂、多语言的内容审核这一挑战,他们选择了走专业化路线。Adaptive ML 没有使用大型通用模型,而是对 Gemma 3 4B 模型进行了微调。结果令人惊叹: 专业的 Gemma 模型在特定任务上的性能不仅比肩、甚至超越了更大规模的专有模型。

Gemma 3 270M 旨在让开发者更进一步地采用这种方法,从而更高效地处理明确的任务。该模型是打造小型专业模型的完美起点,因为每个模型都有各自擅长处理的任务类型。

而且,这种专业化的能力不仅适用于企业任务,还能赋能强大的创意应用。例如下面这款 "睡前故事生成器" Web 应用:

何时选择使用 Gemma 3 270M

Gemma 3 270M 沿袭了 Gemma 3 系列的先进架构和强大的预训练能力,为您的自定义应用奠定了坚实的基础。

理想应用场景如下:

您有大量明确的任务。非常适合情感分析、实体提取、查询路由、非结构化文本到结构化文本的转换、创意写作以及合规性检查等功能。

您需要充分利用每分每秒的时间。大幅降低或消除生产环境中的推理成本,并为用户提供更快的响应速度。经过微调的 270M 模型可以在轻量级、低成本的基础设施上运行,也可以直接在设备上运行。

您需要快速迭代和部署。Gemma 3 270M 体积小巧,可进行快速微调实验,帮助您在数小时而非几天内找到适合用例的理想配置。

您需要确保用户隐私。由于该模型可以完全在设备上运行,因此您可以构建处理敏感信息的应用,而无需将数据发送到云端。

您想拥有一系列能够处理各种任务的专业模型。构建并部署多个自定义模型,每个模型都针对不同的任务经过专业训练,并且不会超出您的预算。

微调入门

我们致力于让每一位开发者都能轻松地将 Gemma 3 270M 打造为专属的定制化解决方案。该模型采用与其他 Gemma 3 模型相同的架构,并配备了相关教程和工具,助您快速入门。您可以

在 Gemma 文档中查阅关于使用 Gemma 3 270M 进行全面微调的指南。

下载模型: 从 Hugging Face、Ollama、Kaggle、LM Studio 或 Docker 获取 Gemma 3 270M 模型。我们将发布经过预训练和指令微调的模型。

试用模型: 在 Vertex AI 或热门推理工具 (如 llama.cpp、Gemma.cpp、LiteRT、Keras 和 MLX) 上试用模型。

开始微调: 使用您最喜欢的工具,包括 Hugging Face、UnSloth 和 JAX。

部署解决方案: 微调完成后,您可以在任何地方部署您的专业模型,从您自己的本地环境到 Google Cloud Run。

Gemmaverse 建立在 "创新无关大小" 这一理念之上。借助 Gemma 3 270M,我们让开发者能够构建更智能、更迅捷、更高效的 AI 解决方案。我们热切期待您创建的专业模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    36381

    浏览量

    285268
  • 模型
    +关注

    关注

    1

    文章

    3580

    浏览量

    51016

原文标题:Gemma 3 270M 发布 | 兼具轻量化与卓越性能的 AI 模型

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌Gemma 3n模型的新功能

    从第一个 Gemma 模型于去年年初推出以来,已逐渐发展为生机勃勃的 Gemmaverse 生态系统,累计下载量突破 1.6 亿。这个生态系统包括十余款专业模型系列,涵盖从安全防护到医
    的头像 发表于 07-25 10:16 ?598次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemma</b> <b class='flag-5'>3</b>n<b class='flag-5'>模型</b>的新功能

    谷歌Gemma 3n预览版全新发布

    Gemma 3Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单一云端或桌面加速器上运行的能力,我们正在进一
    的头像 发表于 06-26 17:18 ?537次阅读

    树莓派5上的Gemma 2:如何打造高效的边缘AI解决方案?

    从数学基础到边缘实现,研究团队:Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成机器模型算法2.1模型架构2.2预训练2.3后训练
    的头像 发表于 06-20 16:57 ?1073次阅读
    树莓派5上的<b class='flag-5'>Gemma</b> 2:如何打造高效的边缘<b class='flag-5'>AI</b>解决方案?

    谷歌新一代生成式AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI推出新一代生成式 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 ?622次阅读

    谷歌新一代 TPU 芯片 Ironwood:助力大规模思考与推理的 AI 模型新引擎?

    电子发烧友网报道(文 / 李弯弯)日前,谷歌在 Cloud Next 大会上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。据悉,该芯片预计于今年晚些时候面向 Google
    的头像 发表于 04-12 00:57 ?2770次阅读

    Google Gemma 3开发者指南

    自首次推出以来,Gemma 模型的下载量已超过 1 亿次,社区为各种用例创建了超过 60,000 个变体1。我们很高兴推出 Gemma
    的头像 发表于 04-08 10:50 ?664次阅读
    Google <b class='flag-5'>Gemma</b> <b class='flag-5'>3</b>开发者指南

    Google发布最新AI模型Gemma 3

    Gemma 开放模型系列是 Google 推动实用 AI 技术普惠大众的重要基石。上个月,Gemma 迎来了首个生日。回望过去一年,其成果斐然:全球下载量突破 1 亿,社区欣欣向荣,衍
    的头像 发表于 03-18 09:51 ?1076次阅读

    技术文档:LMG3626 650V 270mΩ GaN FET,集成驱动器、保护和电流感应

    LMG3626 是一款 650V 270mΩ GaN 功率 FET,适用于开关模式电源应用。该 LMG3626 通过将 GaN FET 和栅极驱动器集成到 8mm x 5.3mm QFN 封装中
    的头像 发表于 02-24 11:13 ?982次阅读
    技术文档:LMG3626 650V <b class='flag-5'>270m</b>Ω GaN FET,集成驱动器、保护和电流感应

    技术文档:LMG3616 具有集成驱动器和保护功能的 650V 270mΩ GaN FET

    LMG3616 是一款 650V 270mΩ GaN 功率 FET,适用于开关模式电源应用。该 LMG3616 通过将 GaN FET 和栅极驱动器集成到 8mm x 5.3mm QFN 封装中,简化了设计并减少了元件数量。
    的头像 发表于 02-24 10:43 ?791次阅读
    技术文档:LMG3616 具有集成驱动器和保护功能的 650V <b class='flag-5'>270m</b>Ω GaN FET

    在龙芯3a6000上部署DeepSeek 和 Gemma2大模型

    run deepseek-r1:1.5b 3.运行Gemma 2大模型 如果想体验 Google Gemma 2 可以到下面的网站选择不同参数的大
    发表于 02-07 19:35

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗舰大模型 Gemini 2.0 P
    的头像 发表于 02-07 15:07 ?880次阅读

    广和通推出AI玩具大模型解决方案

    广和通推出AI玩具大模型解决方案,该方案深度融合豆包等AI模型、内置广和通Cat.1模组,助力智能玩具实现
    的头像 发表于 01-21 10:27 ?1179次阅读

    OpenAI即将推出o3 mini推理AI模型

    计划在接下来的几周内正式推出这一创新成果。 这一消息无疑为人工智能领域注入了新的活力。作为OpenAI的最新力作,o3 mini推理AI模型在技术上实现了诸多突破,旨在为用户提供更加高
    的头像 发表于 01-20 10:54 ?654次阅读

    谷歌发布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性,旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高
    的头像 发表于 12-12 10:13 ?786次阅读

    谷歌全新推出开放式视觉语言模型PaliGemma

    这种热烈的反响非常鼓舞人心,开发者们打造了一系列多样的项目,例如用于印度语言的多语言变体 Navarasa,以及设备端侧动作模型 Octopus v2。开发者们展示了 Gemma 在打造极具影响力且易于使用的 AI 解决方案方面
    的头像 发表于 10-15 17:37 ?1280次阅读