0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌Gemma 3n预览版全新发布

谷歌开发者 ? 来源:谷歌开发者 ? 2025-06-26 17:18 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 产品经理 Lucas Gonzalez 和软件工程师 Rakesh Shivanna

继 Gemma 3 和 Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单一云端或桌面加速器上运行的能力,我们正在进一步推进我们对可访问 AI 的愿景。Gemma 3 为开发者提供了强大的功能,现在我们正将这一愿景扩展到能够在您日常使用的设备 (您的手机、平板电脑和笔记本电脑) 上直接运行的高性能实时 AI。

为了驱动下一代的 On-device AI 并支持各种应用,包括提升 Gemini Nano 的能力,我们设计了一种全新的尖端架构。这个下一代基础架构是在与高通技术 (Qualcomm Technologies)、联发科 (MediaTek) 和三星系统 LSI (Samsung System LSI) 等移动硬件领导者的紧密合作下打造的,并针对闪电般快速的多模态 AI 进行了优化,从而能够在您的设备上直接实现真正个性化和私密的体验。

Gemma 3n 是我们首个基于此突破性的共享架构构建的开放模型,开发者即日起就可以在早期预览版中开始体验这项技术。同样的先进架构也为下一代 Gemini Nano 提供支持,它将这些功能带到 Google 应用和我们的 On-device 生态系统的广泛功能中,并将在今年晚些时候推出。Gemma 3n 使您能够开始在此基础上进行构建,该基础将应用于 Android 和 Chrome 等主要平台。

Gemma 3n 利用了 Google DeepMind 一项名为 Per-Layer Embeddings (PLE) 的创新技术,该技术显著降低了 RAM 的使用量。虽然原始参数规模为 5B 和 8B,但这项创新允许您在移动设备上运行更大的模型,或从云端进行实时流式传输,其内存消耗与 2B 和 4B 模型相当,这意味着这些模型可以在仅 2GB 和 3GB 的动态内存占用下运行。

通过探索 Gemma 3n,开发者可以提前预览开放模型的核心功能以及将通过 Gemini Nano 在 Android 和 Chrome 上提供的移动优先架构创新。

在本文中,我们将探讨 Gemma 3n 的新功能、我们负责任的开发方法,以及如何访问预览版。

Gemma 3n 的关键功能

Gemma 3n 专为在本地运行的快速、低占用空间的 AI 体验而设计,提供:

优化的 On-Device 性能和效率: 与 Gemma 3 4B 相比,Gemma 3n 在移动设备上的响应速度提升了约 1.5 倍,质量显著提高,并通过 Per Layer Embeddings、KVC sharing 和高级 activation quantization 等创新技术降低了内存占用。

Many-in-1 灵活性: 一个具有 4B 活跃内存占用 (active memory footprint) 的模型,原生包含一个嵌套的先进 2B 活跃内存占用子模型 (这要归功于 MatFormer 训练)。这提供了在运行中动态权衡性能和质量的灵活性,而无需托管单独的模型。我们还在 Gemma 3n 中引入了 mix'n'match 能力,可以从 4B 模型中动态创建子模型,以最佳地适应您的特定用例以及相关的质量/延迟权衡。敬请关注我们即将发布的技术报告中有关此研究的更多信息。

Privacy-First 和 Offline Ready: 即使没有互联网连接,也可以在本地执行能够实现尊重用户隐私并可靠运行的功能。

通过音频扩展的多模态理解: Gemma 3n 可以理解和处理音频、文本和图像,并提供显著增强的视频理解能力。其音频能力使模型能够执行高质量的自动语音识别 (转录) 和翻译 (语音到翻译文本)。此外,该模型还接受跨模态的交错输入,从而能够理解复杂的多模态交互。(相关功能即将公开发布)

改进的多语言能力: 提升了多语言性能,特别是在日语、德语、韩语、西班牙语和法语方面。在多种语言基准测试中表现出色,例如在 WMT24++ (ChrF) 上取得了 50.1% 的优异成绩。

解锁全新 On-the-go 体验

Gemma 3n 将通过以下方式赋能新一代智能 On-the-go 应用,使开发者能够:

构建实时的互动体验,能够理解并响应用户环境中的实时视觉和听觉信息。

利用组合的音频、图像、视频和文本输入 (全部在设备上私密处理) 来实现更深层次的理解和基于上下文的文本生成。

开发先进的以音频为中心的应用,包括实时语音转录、翻译和丰富的语音驱动互动。

携手共建负责任的 AI

我们对负责任的 AI 开发的承诺至关重要。与所有 Gemma 模型一样,Gemma 3n 经过了严格的安全评估、数据治理以及与我们的安全政策进行微调对齐。我们以谨慎的风险评估方式对待开放模型,并在 AI 领域不断发展的同时持续完善我们的实践。

开始使用: 立即预览 Gemma 3n

您可以通过预览版率先体验 Gemma 3n 的强大功能:

初始访问 (现已可用):

通过 Google AI Studio 进行基于云的探索: 无需任何配置,您可直接通过浏览器访问 Google AI Studio,即刻上手试用 Gemma 3n。立即探索其文本输入能力。

使用 Google AI Edge 进行 On-Device 开发: 对于希望在本地集成 Gemma 3n 的开发者,Google AI Edge 提供了工具和库。您即刻就可以开始使用文本和图像理解/生成能力。

Gemma 3n 标志着在普及前沿且高效 AI 的道路上又迈出了新的一步。我们非常期待能看到,随着这项技术的预览版开始逐步开放,您将构建出怎样的精彩应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1791

    浏览量

    59146
  • Gemini
    +关注

    关注

    0

    文章

    68

    浏览量

    7945
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281262
  • 模型
    +关注

    关注

    1

    文章

    3531

    浏览量

    50571

原文标题:Gemma 3n 预览版发布: 强劲性能,高效运行,专为移动设备而生

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌Gemma 3n模型的新功能

    从第一个 Gemma 模型于去年年初推出以来,已逐渐发展为生机勃勃的 Gemmaverse 生态系统,累计下载量突破 1.6 亿。这个生态系统包括十余款专业模型系列,涵盖从安全防护到医疗应用的各领
    的头像 发表于 07-25 10:16 ?282次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemma</b> <b class='flag-5'>3n</b>模型的新功能

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTX 与 NVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助 RTX 和 NVIDIA Jetson 加速运行。
    的头像 发表于 07-16 09:16 ?469次阅读

    NVIDIA Isaac Sim和Isaac Lab现已推出早期开发者预览版

    NVIDIA 发布了机器人仿真参考应用 Isaac Sim 和机器人学习框架 Isaac Lab 的开发者预览版。开发者现在可以通过 GitHub 访问早期版本,抢先体验先进功能,用于在基于物理的仿真环境中构建、训练和测试 AI 驱动的机器人。
    的头像 发表于 07-04 14:23 ?574次阅读

    Google Gemma 3开发者指南

    自首次推出以来,Gemma 模型的下载量已超过 1 亿次,社区为各种用例创建了超过 60,000 个变体1。我们很高兴推出 Gemma 3,这是 Gemma 开放模型系列中最强大、最先
    的头像 发表于 04-08 10:50 ?388次阅读
    Google <b class='flag-5'>Gemma</b> <b class='flag-5'>3</b>开发者指南

    Google发布最新AI模型Gemma 3

    Gemma 开放模型系列是 Google 推动实用 AI 技术普惠大众的重要基石。上个月,Gemma 迎来了首个生日。回望过去一年,其成果斐然:全球下载量突破 1 亿,社区欣欣向荣,衍生模型超过 6 万个1。Gemma 生态的蓬
    的头像 发表于 03-18 09:51 ?905次阅读

    在龙芯3a6000上部署DeepSeek 和 Gemma2大模型

    run deepseek-r1:1.5b 3.运行Gemma 2大模型 如果想体验 Google Gemma 2 可以到下面的网站选择不同参数的大模型https://ollama.com
    发表于 02-07 19:35

    谷歌推出Android XR SDK开发者预览版

    近期推出的 Android XR SDK 开发者预览版是一款适用于 Android XR 的综合开发工具套件。它是 Android 系列中最新的平台,专为扩展现实 (XR) 头显设备 (以及未来
    的头像 发表于 01-10 10:13 ?706次阅读

    谷歌推出Android 16首个开发者预览版

    Android 16 首个开发者预览版现已推出,可用于测试您的应用。此后,Android 会开始增加 API 的发布频次,助力应用和设备的加速创新。
    的头像 发表于 12-18 09:25 ?1282次阅读

    微软预览版Copilot Vision AI功能上线

    微软公司近日宣布,将面向美国地区的Copilot Pro用户推出预览版的Copilot Vision AI功能。这一创新功能旨在通过人工智能技术,进一步提升用户的网页浏览体验。 Copilot
    的头像 发表于 12-09 14:38 ?674次阅读

    微软发布DirectSR新预览版:整合FSR 3.1超分辨率技术

    微软近期发布了一项专为游戏开发者设计的全新API技术——DirectSR的预览版。这项技术的核心在于,它能够帮助开发者在开发过程中一次性兼容当前市场上的主流超分辨率技术,极大地简化了开发流程
    的头像 发表于 10-25 13:54 ?589次阅读

    Linux上的编解码器移植TMS320DM365预览版

    电子发烧友网站提供《Linux上的编解码器移植TMS320DM365预览版.pdf》资料免费下载
    发表于 10-14 10:53 ?0次下载
    Linux上的编解码器移植TMS320DM365<b class='flag-5'>预览版</b>

    KaihongOS 4.1.2开发者预览版正式上线,诚邀开发者免费试用!

    独特的抢先体验机会,涵盖了原生应用开发、分布式能力、原子化服务等核心功能特性,助力开发者探索国产操作系统的更多可能性。此次发布预览版适配RK3568、RK358
    的头像 发表于 09-28 08:07 ?786次阅读
    KaihongOS 4.1.2开发者<b class='flag-5'>预览版</b>正式上线,诚邀开发者免费试用!

    KaihongOS 4.1.2开发者预览版正式上线,诚邀开发者免费试用!

    开发者提供了独特的抢先体验机会,涵盖了原生应用开发、分布式能力、原子化服务等核心功能特性,助力开发者探索国产操作系统的更多可能性。 此次发布预览版适配RK3568、RK3588、ESP32等开发板设备,下载和安装步骤简便易行。开发者通过开鸿开发服务平台登录开鸿账号后,
    的头像 发表于 09-26 15:59 ?787次阅读

    苹果推出visionOS 2.1的开发者预览版Beta 2

     今日,苹果公司针对Vision Pro用户群体,正式推出了visionOS 2.1的开发者预览版Beta 2,其内部版本编号为22N5553d。此次快速迭代,距离上一Beta或RC版本的发布仅短短
    的头像 发表于 09-24 16:16 ?941次阅读

    Apple Watch迎来watchOS 11.1 Beta 1开发者预览版

    苹果公司今日正式宣布,为Apple Watch用户推送了watchOS 11.1的开发者预览版Beta 1更新(内部版本号为22R5545g),此次快速迭代距离上一版本发布仅8天,彰显了苹果在智能手表操作系统领域的敏捷响应与不懈优化决心。
    的头像 发表于 09-18 16:01 ?1733次阅读