0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Llama 3 王者归来,Airbox 率先支持部署

算能开发者社区 ? 2024-04-22 08:33 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前天,智算领域迎来一则令人振奋的消息:Meta 正式发布了备受期待的开源大模型——Llama 3。

ed9ee800-003f-11ef-9118-92fbcf53809c.png

Llama 3 的卓越性能

Meta 表示,Llama 3 在多个关键基准测试中展现出卓越性能,超越了业内先进的同类模型。无论是在代码生成、复杂推理,还是在遵循指令和可视化想法方面,Llama 3 都实现了全面领先。该模型在以下五个基准测试中均表现出色:

MMLU(学科知识理解)

GPQA(一般问题解答)

HumanEval(代码能力)

GSM-8K(数学能力)

MATH(高难度数学问题)

无论是 8B 规格的 Llama3 还是 70B 规格,它们都较市场上其他优秀大模型表现更佳。

edb0b3c8-003f-11ef-9118-92fbcf53809c.png

纵向对比显示,Llama 3 的性能大幅领先于前代产品 Llama 2,尤其是在 8B 规格上,远超过 Llama 2 时代的 13B 和 70B 规格;新的 70B 规格更是展现出与 GPT-4 早期版本相媲美的能力。

指令调优模型

Benchmark

Llama 3

8B

Llama 2

7B

Llama 2

13B

Llama 3

70B

Llama 2

70B

MMLU

(5-shot)

68.434.147.88252.9

GPQA

(0-shot)

34.221.722.339.521

HumanEval

(0-shot)

62.27.91481.725.6

GSM-8K

(8-shot, CoT)

79.625.777.49357.5

MATH

(4-shot, CoT)

303.86.750.411.6

瑞莎 Airbox 快速支持 Llama 3

面对 Llama 3 如此激动人心的性能,Airbox 团队积极响应,快速将 Llama 8B 移植并成功在 Airbox 上运行。以下视频展示了 Llama 8B 在 Airbox 上的运行情况:


(注:Llama 3 8B 知识更新到 2023 年 3 月)

可以看到,Llama 3 8B 在 Airbox 上的运行表现极为流畅,达到了 9.6 token/s 的处理速度,已充分展现出其实用价值。与其他应用结合使用时,更开辟了广阔的应用前景和创新可能性。Airbox 团队后续会对 Llama 3 8B 做更多测试并公布结果。

关于瑞莎 Fogwise Airbox

瑞莎智算盒子 Fogwise Airbox 是一款面向侧端生成式智算的边缘计算微型服务器,基于算能最新专为生成式智算打造的 SG2300X 处理器设计,具有开箱即用,本地离线部署,注重数据隐私,多精度支持,高能效比,高性价比,系统/文档/工具链开源等特点,是当前为数不多甚至是唯一的低成本在边缘侧部署生成式智算的方案。

瑞莎 Fogwise Airbox 现已准备就绪,即将在近期发售,敬请期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 基准测试
    +关注

    关注

    0

    文章

    21

    浏览量

    7713
  • 开源
    +关注

    关注

    3

    文章

    3755

    浏览量

    43992
  • 大模型
    +关注

    关注

    2

    文章

    3191

    浏览量

    4147
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    用Ollama轻松搞定Llama 3.2 Vision模型本地部署

    Ollama 是一个开源的大语言模型服务工具,它的核心目的是简化大语言模型(LLMs)的本地部署和运行过程,请参考《Gemma 2+Ollama在算力魔方上帮你在LeetCode解题》,一条命令完成
    的头像 发表于 11-23 17:22 ?3841次阅读
    用Ollama轻松搞定<b class='flag-5'>Llama</b> 3.2 Vision模型本地<b class='flag-5'>部署</b>

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集扩展了 Meta Llama 开源模型集的模型阵容,包含视觉语言模型(VLM)、小语言模型(SLM)和支持视觉的更新版 Llama Guard 模型。与 NV
    的头像 发表于 11-20 09:59 ?850次阅读

    Llama 3 的未来发展趋势

    在科技迅猛发展的今天,人工智能和机器学习已经成为推动社会进步的重要力量。Llama 3,作为一个划时代的产品,正以其独特的设计理念和卓越的性能,预示着未来科技的新方向。 一、Llama 3
    的头像 发表于 10-27 14:44 ?834次阅读

    Llama 3 与开源AI模型的关系

    在人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新,还促进了全球开发者社区的合作。Llama 3,作为一个新兴的AI项目,与开源AI模型的关系密切,这种关系
    的头像 发表于 10-27 14:42 ?805次阅读

    深入理解 Llama 3 的架构设计

    在人工智能领域,对话系统的发展一直是研究的热点之一。随着技术的进步,我们见证了从简单的基于规则的系统到复杂的基于机器学习的模型的转变。Llama 3,作为一个假设的先进对话系统,其架构设计融合了
    的头像 发表于 10-27 14:41 ?1287次阅读

    Llama 3 模型与其他AI工具对比

    Llama 3模型与其他AI工具的对比可以从多个维度进行,包括但不限于技术架构、性能表现、应用场景、定制化能力、开源与成本等方面。以下是对Llama 3模型与其他一些主流AI工具的对比
    的头像 发表于 10-27 14:37 ?1127次阅读

    如何评估 Llama 3 的输出质量

    评估Llama 3(假设这是一个虚构的人工智能模型或系统)的输出质量,可以通过以下几个步骤来进行: 定义质量标准 : 在开始评估之前,需要明确什么是“高质量”的输出。这可能包括准确性、相关性、一致性
    的头像 发表于 10-27 14:32 ?741次阅读

    Llama 3 性能评测与分析

    1. 设计与构建质量 Llama 3的设计延续了其前代产品的简洁风格,同时在细节上进行了优化。机身采用了轻质材料,使得整体重量得到了有效控制,便于携带。此外,Llama 3的表面处理工
    的头像 发表于 10-27 14:30 ?889次阅读

    Llama 3 适合的行业应用

    在当今快速发展的技术时代,各行各业都在寻求通过人工智能(AI)来提高效率、降低成本并增强用户体验。Llama 3,作为一个先进的AI平台,以其强大的数据处理能力和用户友好的界面,成为了众多行业的新宠
    的头像 发表于 10-27 14:28 ?811次阅读

    Llama 3 在自然语言处理中的优势

    在自然语言处理(NLP)的快速发展中,我们见证了从基于规则的系统到基于机器学习的模型的转变。随着深度学习技术的兴起,NLP领域迎来了新的突破。Llama 3,作为一个假设的先进NLP模型,代表了这一
    的头像 发表于 10-27 14:22 ?777次阅读

    如何使用 Llama 3 进行文本生成

    使用LLaMA 3(Large Language Model Family of AI Alignment)进行文本生成,可以通过以下几种方式实现,取决于你是否愿意在本地运行模型或者使用现成的API
    的头像 发表于 10-27 14:21 ?1138次阅读

    Llama 3 与 GPT-4 比较

    随着人工智能技术的飞速发展,我们见证了一代又一代的AI模型不断突破界限,为各行各业带来革命性的变化。在这场技术竞赛中,Llama 3和GPT-4作为两个备受瞩目的模型,它们代表了当前AI领域的最前
    的头像 发表于 10-27 14:17 ?1217次阅读

    Llama 3 语言模型应用

    理解复杂的上下文信息,包括对话历史、用户偏好和文化差异。这使得它在对话系统和个性化推荐中表现出色。 情感分析 :通过深度学习技术,Llama 3 能够识别和理解文本中的情感倾向,无论是正面的、负面的还是中性的。 多语言支持
    的头像 发表于 10-27 14:15 ?779次阅读

    使用OpenVINO 2024.4在算力魔方上部署Llama-3.2-1B-Instruct模型

    前面我们分享了《三步完成Llama3在算力魔方的本地量化和部署》。2024年9月25日,Meta又发布了Llama3.2:一个多语言大型语言模型(LLMs)的集合。
    的头像 发表于 10-12 09:39 ?1512次阅读
    使用OpenVINO 2024.4在算力魔方上<b class='flag-5'>部署</b><b class='flag-5'>Llama</b>-3.2-1B-Instruct模型

    [技术] 【飞凌嵌入式OK3576-C开发板体验】llama2.c部署

    MCU 上部署。以下是 llama2.c 在 OK3576 开发板上的部署步骤。 工程克隆 首先我们将源码克隆下来:https://github.com/karpathy/llama
    发表于 09-18 23:58