0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云发布通义千问2.0,性能超GPT-3.5

微云疏影 ? 来源:综合整理 ? 作者:综合整理 ? 2023-11-01 09:57 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

10月31日阿里云正式发布了1000亿级参数大模型“通义千问2.0”。这2.0在10个权威评价中超过了gpt-3.5,正在快速追赶gpt-4。当天,通义千问app在各种手机应用市场正式上市,任何人都可以通过app直接体验最新模特能力。

在过去的6个月里,通义千问2.0与4月份推出的1.0版本相比,在复杂的命令理解、文学创作、通用数学、知识记忆、幻觉抵抗力等方面有了很大的提高。目前,通义千问的千托综合性能已经超过gpt-3.5,正在快速赶上gpt-4。

在mmlu、c-eval、gsm8k、humaneval、math等10个主要标准评价集中,通义千问2.0整体上领先meta的rama -2-70b,与openai的chat 3.5相比,是9胜1负。与gpt-4的战绩为4胜6负,差距进一步缩小。

汉语和英语的理解能力是大语言模型的基本技能。在英语作业中,mmlu的标准分数为82.5分,仅次于gpt-4,可以更好地理解和处理复杂的语言结构和概念。在汉语任务方面,通义千问2.0以明显优势在c-eval标准中获得最高分,这是因为模型在训练中学习了更多的汉语语言资料,进一步强化了对汉语的理解和表达能力。

在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。

通义千问2.0在技术上优化了命令遵守、工具使用和精细化,以便更好地整合到下游应用程序脚本中。通义大模型官方网站提供多模态和插件功能,支持图片输入、文件解释等细分化工作。

与此同时,基于通义大学模型训练的8大行业模型队启动。他们分别通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。8个产业模型以目前最受欢迎的多个垂直剧本为对象,训练各领域的数据。用户可以在官方网站直接体验模型功能,开发者可以通过网页嵌入式、api/sdk调用等将模型功能整合到自己的大规模模型应用和服务中。

截至10月,阿里云已与60多个行业合作伙伴进行深度合作,推进通义钱文办公、文化旅游、电力、政务、医疗保险、交通、制造、金融、软件开发等领域的出台。

周靖人表示,阿里云近期将开放72b版本,此前阿里云先后开放了7b版本和14b版本,累计下载次数超过100万次。ali cloud持续支持各领域开发者在通义千问的开源模型基础上进行模型和应用创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPT
    GPT
    +关注

    关注

    0

    文章

    368

    浏览量

    16336
  • 阿里云
    +关注

    关注

    3

    文章

    1017

    浏览量

    44401
  • 通义千问
    +关注

    关注

    1

    文章

    37

    浏览量

    454
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里通义发布小尺寸模型Qwen3-4B,手机也能跑

    电子发烧友网综合报道 8月7日,阿里通义宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thi
    的头像 发表于 08-12 17:15 ?5180次阅读
    <b class='flag-5'>阿里</b><b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>发布</b>小尺寸模型Qwen3-4B,手机也能跑

    AI大模型加速上车,联手高通,阿里有哪些策略?

    系列模型衍生数量Llama,三大方向形成 阿里巴巴的“AI大模型” 通义大模型最初于2023年4月7日开始邀请测试,并在2023年4月
    的头像 发表于 07-03 01:10 ?8159次阅读
    AI大模型加速上车,联手高通,<b class='flag-5'>阿里</b>有哪些策略?

    壁仞科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen3
    的头像 发表于 04-30 15:19 ?892次阅读

    低至?2.27/h!就能使用全球最强开元模型—— QwQ-32B

    ABSTRACT摘要捷智算平台上新全球最强开元模型——QwQ-32B。JAEALOT2025年3月18日3月17日,阿里通义
    的头像 发表于 03-19 12:34 ?637次阅读
    低至?2.27/h!就能使用全球最强开元模型——<b class='flag-5'>千</b><b class='flag-5'>问</b> QwQ-32B

    阿里最新消息:国家算互联网平台、广州算力中心、多所高校接入通义大模型

    ? 国家算互联网平台 接入阿里通义大模型 ? 3月10日,国家算互联网平台接入
    的头像 发表于 03-14 11:54 ?866次阅读

    Manus与阿里通义达成合作

    据媒体报道,火爆异常的AI Agent新秀Manus和阿里旗下大语言模型通义达成合作。双方将基于
    的头像 发表于 03-12 15:47 ?947次阅读

    摩尔线程支持阿里通义QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义QwQ-32B。摩尔线程在该模型发布后2小时内,迅速且高效完成了对
    的头像 发表于 03-07 17:48 ?834次阅读
    摩尔线程支持<b class='flag-5'>阿里</b><b class='flag-5'>云</b><b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>QwQ-32B开源模型

    广和通基于阿里通义大模型推出随身智能解决方案,赋能消费电子终端行业

    2月,广和通与全球领先的解决方案提供商阿里达成合作:广和通AI模组及解决方案,基于阿里通义
    的头像 发表于 03-03 17:55 ?782次阅读
    广和通基于<b class='flag-5'>阿里</b><b class='flag-5'>云</b><b class='flag-5'>通义</b>大模型推出随身智能解决方案,赋能消费电子终端行业

    广和通携手阿里推出随身智能解决方案

    2月,广和通与全球领先的解决方案提供商阿里达成合作:广和通AI模组及解决方案,基于阿里通义
    的头像 发表于 02-25 16:04 ?623次阅读

    阿里通义Qwen2.5-Max模型全新升级

    近期,阿里通义团队为用户带来了一个振奋人心的好消息:其旗舰版模型Qwen2.5-Max迎来了全新升级发布。 Qwen2.5-Max模型是阿里
    的头像 发表于 02-05 14:07 ?893次阅读

    阿里通义发布Qwen2.5-Turbo开源AI模型

    近日,阿里通义官方宣布,经过数月的精心优化与改进,正式推出了Qwen2.5-Turbo开源AI模型。这款新模型旨在满足社区对更长上下文长度的迫切需求,为用户带来更加便捷、高效的AI
    的头像 发表于 11-19 18:07 ?1547次阅读

    阿里通义代码模型全系列开源

    近日,阿里通义大模型团队宣布了一项重大决策:将通义代码模型全系列正式开源。此次开源的模型系
    的头像 发表于 11-14 15:26 ?1147次阅读

    通义三款主力模型再降价

    阿里百炼平台再次掀起降价风暴,三款通义主力模型——Qwen-Turbo、Qwen-Plus及Qwen-Max,继5月首次大幅度降价后,
    的头像 发表于 09-20 16:46 ?1649次阅读

    阿里通义发布视频生成大模型

    在即将召开的云栖大会上,阿里通义将震撼发布其自主研发的视频生成大模型。目前,用户已可通过通义App频道及通义万相PC端预约体验这一创新功能,
    的头像 发表于 09-19 17:01 ?659次阅读

    通义发布第二代视觉语言模型Qwen2-VL

    阿里巴巴旗下的通义近日宣布,其第二代视觉语言模型Qwen2-VL正式问世,并宣布旗舰模型Qwen2-VL-72B的API已顺利接入阿里
    的头像 发表于 09-03 16:31 ?938次阅读