0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开源与闭源之争:最新的开源模型到底还落后多少?

jf_23871869 ? 来源:jf_23871869 ? 作者:jf_23871869 ? 2024-11-15 11:16 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一,引言

随着人工智能AI)技术的迅猛发展,大模型已经成为推动科技进步的重要力量。然而,超大规模模型在带来高性能的同时,也面临着资源消耗大、部署困难等问题。本文将探讨AI大模型未来的发展方向。

开放性一直是人工智能研究领域的常态,促进了该领域的合作。然而,人工智能的快速发展引发了关于发布最强大模型可能带来的后果的担忧。此外,像ChatGPT这样的模型的销售企业有保持模型私有的商业动机。

行业AI实验室以多种方式回应了这些发展:

未发布模型:例如,谷歌DeepMind的Chinchilla模型尚未发布。

结构化访问控制:像GPT-4这样的模型有结构化的访问控制,控制用户如何与模型交互。

有限制的开源模型:Meta的Llama模型的权重可以下载,但使用条款有限制。

二,开源与闭源模型的对比

1,争议

发布模型、代码和数据集能够促进创新和外部审查,但这也是不可逆的,并且如果模型的安全措施被绕过,就有被滥用的风险。关于这种权衡是否可接受或可避免,存在持续的争论。开源AI的支持者认为,开放性通过开放社区开发的创新和工具,对社会以及模型开发者都有益。甚至有人认为,更多的闭源AI开发者已经被开源社区超越,保持封闭变得毫无意义。

wKgZomc2vO6AY1-9AAKqJNUwB60231.png

2,二者用户基数对比

ChatGPT(封闭模型):每月大约有3.5亿用户。

Meta AI助手(开放模型):每月有近5亿用户。

3,性能和训练计算方面的差距

为了系统地比较开放和封闭AI模型随时间的能力,我们收集了自2018年以来发布的数百个著名AI模型的权重和训练代码的可访问性数据。以下是主要发现:

基准性能:

最好的开源大型语言模型(LLMs)在多个基准测试上落后于最好的闭源LLMs5到22个月。Meta的Llama 3.1 405B是最新的一个在多个基准上缩小差距的开源模型。即使不考虑Meta的Llama模型,结果也类似。

训练计算:

在训练计算方面,最大的开源模型落后于最大的闭源模型大约15个月。

Llama 3.1 405B相对于GPT-4的发布,差距为16个月。由于我们尚未看到比GPT-4规模更大的闭源模型,Llama 3.1 405B已经在缩小训练计算的差距。

wKgaoWc2vM2ACnpVAAEfqJGsG8k232.png

训练效率:

尽管开源LLMs在达到与闭源LLMs相似的基准性能后,通常使用较少的训练计算,但新模型通常更高效。因此,我们缺乏同样高效的新闭源模型的数据。

训练数据污染和“为排行榜而学习”也可能导致更高的分数。

wKgZoWc2vNyAD19cAAEcuaFiRTg664.png

三,总结

开源与闭源AI模型之间的竞争和差距反映了AI领域的多样性和复杂性。尽管开源模型在某些方面落后于闭源模型,但它们在促进创新和安全性研究方面具有独特的优势。未来的发展将是结合两者的优点,开发能力优秀、规模适中、边缘友好的AI模型,以满足多样化的应用需求。当然也取决于技术进步、市场需求和政策监管的综合影响。

这两种模型你更看好哪一个呢?欢迎评论留言讨论。

更多精彩内容请关注“算力魔方?”!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3779

    浏览量

    44138
  • 模型
    +关注

    关注

    1

    文章

    3547

    浏览量

    50742
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025开放原子开源生态大会亮点抢先看

    2025年,从“开源VS”的激烈交锋到软件供应链安全危机,再到企业数字化转型浪潮中开源的挑战,“开源”始终占据C位,
    的头像 发表于 07-23 10:01 ?526次阅读

    2025开放原子开源生态大会前瞻

    2025年,开源模型迎来历史性突破——首次实现了模型能力的赶超,甚至赶超了领先模型。据麦肯
    的头像 发表于 07-21 17:47 ?607次阅读

    【VisionFive 2单板计算机试用体验】3、开源大语言模型部署

    , Gemma等开源模型。当然,一些的(类似chatgpt, gemini)是不支持部署的。如下图: 在端侧部署大模型,个人认为最大
    发表于 07-19 15:45

    AI开源模型库有什么用

    AI开源模型库作为推动AI技术发展的重要力量,正深刻改变着我们的生产生活方式。接下来,AI部落小编带您了解AI开源模型库有什么用。
    的头像 发表于 02-24 11:50 ?511次阅读

    模型训练:开源数据与算法的机遇与挑战分析

    最近,开源中国 OSCHINA、Gitee 与 Gitee AI 联合发布了《2024 中国开源开发者报告》。 报告聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及开源
    的头像 发表于 02-20 10:40 ?690次阅读
    大<b class='flag-5'>模型</b>训练:<b class='flag-5'>开源</b>数据与算法的机遇与挑战分析

    开源模型DeepSeek的开放内容详析

    代码、数据到模型的完全开源是人们渴求的方向。那么 DeepSeek 的开源究竟开放了什么?开放到了何种程度?本文作者——资深程序员+资深律师,一起为大家拆解 DeepSeek 的开源
    的头像 发表于 02-19 09:48 ?1641次阅读
    <b class='flag-5'>开源</b>大<b class='flag-5'>模型</b>DeepSeek的开放内容详析

    开源模型在多个业务场景的应用案例

    在人工智能发展浪潮中,大模型开源之争一直是业内的热点话题。随着技术的不断进步和应用场景的日益丰富,如何降低大
    的头像 发表于 12-30 10:16 ?1242次阅读

    云知声山海大模型多项评测名列前茅

    近日,智研究院发布并解读了国内外100余个开源和商业的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。
    的头像 发表于 12-24 10:29 ?564次阅读

    开源AI模型库是干嘛的

    开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练,能够执行特定的任务。以下,是对
    的头像 发表于 12-14 10:33 ?869次阅读

    Meta AI高管批评OpenAI模式

    Meta生成式AI工程副总裁Manohar Paluri近日对AI模式提出了尖锐批评,他认为要充分发挥AI的全部潜力,开源是唯一的出路。 Paluri的这一观点,直指当前生成式AI领域的先锋
    的头像 发表于 12-12 11:14 ?896次阅读

    阿里通义千问代码模型全系列开源

    近日,阿里云通义大模型团队宣布了一项重大决策:将通义千问代码模型全系列正式开源。此次开源模型系列共包含6款Qwen2.5-Coder
    的头像 发表于 11-14 15:26 ?1154次阅读

    科技云报到:假开源真噱头?开源模型和你想的不一样!

    查看、修改、分发。开源自此深刻影响了互联网行业的每一个角落。 在大模型和GenAI崛起的当下,开源再次成为业界关注焦点,对于开源
    的头像 发表于 11-03 10:46 ?653次阅读

    搭建开源大语言模型服务的方法

    本文我们将总结5种搭建开源大语言模型服务的方法,每种都附带详细的操作步骤,以及各自的优缺点。
    的头像 发表于 10-29 09:17 ?791次阅读

    Llama 3 与开源AI模型的关系

    在人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新,促进了全球开发者社区的合作。Llama 3,作为一个新兴的AI项目,与开源AI
    的头像 发表于 10-27 14:42 ?866次阅读

    人民邮电报:“开源到底是什么?为啥热度越来越高?

    ? ? ? 本文转载自人民邮电报 这些年,“开源”这个词越来越火,开源AI大模型开源数据库、开源框架、
    的头像 发表于 10-17 14:21 ?3948次阅读
    人民邮电报:“<b class='flag-5'>开源</b>”<b class='flag-5'>到底</b>是什么?为啥热度越来越高?