0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Mistral中杯代码能力完胜GPT-4,成本暴降2/3

深度学习自然语言处理 ? 来源:新智元 ? 2023-12-18 16:55 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。而网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4,而所花成本还不到三分之一。

最近,「小语言模型」忽然成为热点。

本周一,刚刚完成4.15亿美元融资的法国AI初创公司Mistral,发布了Mixtral 8x7B模型。

715336d2-9d7c-11ee-8b88-92fbcf53809c.png

这个开源模型尽管尺寸不大,小到足以在一台内存100GB以上的电脑上运行,然而在某些基准测试中却能和GPT-3.5打平,因此迅速在开发者中赢得了一片称赞。

之所以叫Mixtral 8x7B,是因为它结合了为处理特定任务而训练的各种较小模型,从而提高了运行效率。

这种「稀疏专家混合」模型并不容易实现,据说OpenAI在今年早些时候因为无法让MoE模型正常运行,而不得不放弃了模型的开发。

紧接着,就在第二天,微软又发布了全新版本的Phi-2小模型。

跟Mistral的70亿参数比,Phi-2小到可以在手机上跑,只有27亿参数。相比之下,GPT-4的参数达到了一万亿。

Phi-2在精心挑选的数据集上进行了训练,数据集的质量足够高,因此即使手机的计算能力有限,也能确保模型生成准确的结果。

虽然还不清楚微软或其他软件制造商将如何使用小型模型,但最明显的好处,就是降低了大规模运行AI应用的成本,并且极大地拓宽了生成式AI技术的应用范围。

这是一件大事。

Mistral-medium代码生成完胜GPT-4

最近,Mistral-medium已经开放内测。

有博主对比了开源的Mistral-medium和GPT-4的代码生成能力,结果显示,Mistral-medium比GPT-4的代码能力更强,然而成本却只需GPT-4的3成!

7163a274-9d7c-11ee-8b88-92fbcf53809c.png

总价来说就是:

1)Mistral会始终完成工作,完成度很高;

2)不会在冗长的解释性输出上浪费token;

3)提供的建议非常具体。

第一题,「编写用于生成斐波那契素数的PyTorch数据集的cuda优化代码」。

Mistral-Medium生成的代码严肃、完整。

716dbc64-9d7c-11ee-8b88-92fbcf53809c.png

7178e45e-9d7c-11ee-8b88-92fbcf53809c.png

71847daa-9d7c-11ee-8b88-92fbcf53809c.png

而GPT-4生成的代码,就差强人意了。

浪费了很多token,却没有输出有用的信息。

7189dd40-9d7c-11ee-8b88-92fbcf53809c.png

然后,GPT-4只给出了骨架代码,并没有具体的相关代码。

719013d6-9d7c-11ee-8b88-92fbcf53809c.png

第二道题:「编写高效的Python代码,将大约10亿个大型Apache HTTP访问文件摄取到 SqlLite数据库中,并使用它来生成对sales.html和product.html的访问直方图」。

Mistral的输出非常精彩,虽然log不是CSV格式的,但修改起来很容易。

719b463e-9d7c-11ee-8b88-92fbcf53809c.png

71a47db2-9d7c-11ee-8b88-92fbcf53809c.png

71af633a-9d7c-11ee-8b88-92fbcf53809c.png

GPT-4依旧拉跨。

71bb5f0a-9d7c-11ee-8b88-92fbcf53809c.png

71c60e28-9d7c-11ee-8b88-92fbcf53809c.png

71d27d48-9d7c-11ee-8b88-92fbcf53809c.png

此前,这位博主测试过多个代码生成模型,GPT-4一直稳居第一。

而现在,把它拉下宝座的强劲对手Mistral-medium终于出现了。

虽然只发布了两个例子,但博主测试了多个问题,结果都差不多。

他建议:鉴于Mistral-medium在代码生成质量上有更好的体验,应该把它整合到各地的代码copilot中。

71d73d7e-9d7c-11ee-8b88-92fbcf53809c.png

有人按照每1000token算出了输入和输出的成本,发现Mistral-medium比起GPT-4直接降低了70%!

71e45662-9d7c-11ee-8b88-92fbcf53809c.png

的确,节省了70%的token费用,可不是一件小事。甚至还可以通过不冗长的输出,来进一步节省成本。

71efad0a-9d7c-11ee-8b88-92fbcf53809c.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3547

    浏览量

    50728
  • 代码
    +关注

    关注

    30

    文章

    4907

    浏览量

    71232
  • 语言模型
    +关注

    关注

    0

    文章

    565

    浏览量

    10872

原文标题:Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPT-5即将面市 性能远超GPT-4

    行业芯事
    电子发烧友网官方
    发布于 :2025年06月04日 13:38:23

    【RA-Eco-RA4M2开发板评测】RA-Eco-RA4M2 PWM输出

    模块的结构框图 RA4M2系列共有共 8 个GPT定时器(即8个通道), 其中包括 4 个32位GPT定时器(GPT32n (n=0~
    发表于 04-28 22:57

    纳米铜烧结为何纳米银烧结?

    在半导体功率模块封装领域,互连技术一直是影响模块性能、可靠性和成本的关键因素。近年来,随着纳米技术的快速发展,纳米银烧结和纳米铜烧结技术作为两种新兴的互连技术,备受业界关注。然而,在众多应用场景
    的头像 发表于 02-24 11:17 ?1072次阅读
    纳米铜烧结为何<b class='flag-5'>完</b><b class='flag-5'>胜</b>纳米银烧结?

    马斯克发布Grok 3大模型,超越GPT-4o

    多项benchmark测试,Grok 3取得了比DeepSeek-v3GPT-4o以及Gemini-2 pro更优的效果。这一成绩无疑彰
    的头像 发表于 02-19 13:50 ?496次阅读

    OpenAI宣布GPT 4o升智计划

    透露,GPT 4o的智力水平将得到显著提升,目标直指o3 pro的水平。这一升级不仅意味着GPT 4o在理解和生成文本方面的
    的头像 发表于 02-17 14:24 ?657次阅读

    OpenAI即将发布GPT-4.5与GPT-5

    GPT-4.5将在未来几周内率先亮相,它将是OpenAI通用GPT-4模型的继承者。这款新的算法在技术上进行了诸多优化和升级,旨在为用户提供更加精准、高效的AI服务。 而在GPT-4.5发布后不久
    的头像 发表于 02-13 13:43 ?741次阅读

    如何在边缘端获得GPT4-V的能力:算力魔方+MiniCPM-V 2.6

    GPT4-V的能力:MiniCPM-V 2.6 。 MiniCPM-V 2.6是MiniCPM-V系列最新、性能最佳的模型,基于SigLip-400M和Qwen2-7B构建,共8B参数。在最新版
    的头像 发表于 01-20 13:40 ?696次阅读
    如何在边缘端获得<b class='flag-5'>GPT4</b>-V的<b class='flag-5'>能力</b>:算力魔方+MiniCPM-V 2.6

    OpenAI GPT-5开发滞后:训练成本高昂

    近日,据最新消息,OpenAI在推进其备受期待的下一代旗舰模型GPT-5的开发进程上遇到了困难。由于计算成本高昂且高质量训练数据稀缺,GPT-5的开发已经落后于原定计划半年之久。 据悉,OpenAI
    的头像 发表于 12-23 11:04 ?874次阅读

    讯飞星火大模型技术进展及落地

    讯飞星火4.0 Turbo重磅发布,七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集
    的头像 发表于 10-27 15:50 ?2411次阅读

    讯飞星火大模型4.0 Turbo正式发布

    近日,2024科大讯飞全球1024开发者节正式开幕。在数千名行业领袖、专家学者与开发者的共同见证下,讯飞星火大模型4.0 Turbo正式发布。七大核心能力全面超过GPT-4 Turbo,数学和代码
    的头像 发表于 10-27 15:47 ?1126次阅读

    Llama 3 模型与其他AI工具对比

    Llama 3模型与其他AI工具的对比可以从多个维度进行,包括但不限于技术架构、性能表现、应用场景、定制化能力、开源与成本等方面。以下是对Llama 3模型与其他一些主流AI工具的对比
    的头像 发表于 10-27 14:37 ?1204次阅读

    Llama 3GPT-4 比较

    随着人工智能技术的飞速发展,我们见证了一代又一代的AI模型不断突破界限,为各行各业带来革命性的变化。在这场技术竞赛,Llama 3GPT-4作为两个备受瞩目的模型,它们代表了当前AI领域的最前
    的头像 发表于 10-27 14:17 ?1307次阅读

    科大讯飞发布讯飞星火4.0 Turbo:七大能力GPT-4 Turbo

    超过GPT-4 Turbo,数学能力代码能力更是超过了Open AI最新一代GPT模型GPT-4
    的头像 发表于 10-24 11:39 ?1169次阅读

    讯飞星火内容运营大师新增三大功能

    一个月前,GPT-4o一出,打破了人们对于大模型的响应速度和多模态理解能力的想象边界。6月27日,科大讯飞马上也要发布全面对标GPT-4 Turbo当前能力水平的讯飞星火V4.0。
    的头像 发表于 10-14 10:08 ?1285次阅读

    真格基金宣布捐赠开源AI项目vLLM

    开源技术处于 AI 革命的中心。Llama 3Mistral 等开源大模型迅速追赶 GPT-4,TensorFlow、Pytorch 等开源深度学习框架提供了丰富的库和工具。GitHub 上有 6
    的头像 发表于 09-24 16:13 ?848次阅读