0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“千帆杯”第二期十万大奖花落谁家?TOP10名单出炉!

百度 ? 来源:百度 ? 2024-03-08 10:21 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

千帆杯AI原生应用开发挑战赛第二期赛题“贺岁灵感模型”已于2月28日圆满结束。经过严格的自动评估和人工复审后,现已决出TOP10选手!

第二期赛题,结合新春佳节的背景以“贺岁灵感模型”为主题,鼓励开发者使用千帆ModelBuilder,基于ERNIE Speed模型打造一个春节文案创作的精调模型,在通过对模型精调使其保持原有能力的同时,还能准确理解和执行文案创作,帮助用户成为春节档“最强贺岁文案专家”。

本期赛题主要通过千帆ModelBuilder工具链中“模型评估”的部分能力以及人工评估做整体评审,全方位保证评审结果的公平、公正、公开。

第一轮:自动评估(满分1分)

以“内容分”和“字数控制分”为主要考核指标,两项标准分别占据0.6、0.4的权重,通过加权平均后,得出“选手模型”的作品分数。

内容分(占据0.6权重):官方输入包含内容及字数要求的评测数据集,以ERNIE Bot 4.0作为裁判,如果“选手模型”答案比数据集答案更好则得分,反之则不得分。如果ERNIE Bot 4.0没有明确返回评测数据集答案更好,均算作“选手模型”得分。

字数控制分(占据0.4权重):基于官方评测数据集的字数要求,根据“选手模型”的全量回答综合得出最终字数控制评分。

具体规则:根据“选手模型”答案字数与评测数据集中字数要求的diff进行分段打分,具体分段分数如下:

diff ≤ 0.05,得1分

0.05 < diff ≤ 0.1,得0.9分

0.1 < diff ≤ 0.15,得0.8分

0.15 < diff ≤ 0.2,等0.7分

0.2 < diff ≤ 0.25,得0.6分

其余则不得分

举例:如评测数据要求为300字,选手模型返回290字,则diff为:(300-290)/300=0.033,最终得分因0.033 ≤ 0.05,因此在该评测数据下字数控制得1分。

第二轮:人工评估(满分1分)

为了保证自动评估的结果,官方针对自动评估得出的TOP 12“选手模型”安排了第二轮人工评估。(由于选手比分较为接近,因此官方对TOP 12“选手模型”进行人工评估)

人工评估由三位百度专家通过人工查验的方式进行,专家通过对参赛选手所提供的模型微调方案进行投票(一位专家最多可投3票),如选手获得三票,即获得满分。

“千帆杯”第二期

「最强挑战者」出炉

第二期最强挑战者张辉,带来作品“贺岁灵感模型”,张辉使用ModelBuilder的模型SFT精调工具链,基于ERNIE Speed基座模型,精调训练出了一个能准确控制创作字数的春节贺岁文案模型。

ERNIE Speed模型作为百度在2024年最新发布的自研高性能大语言模型,凭借其轻量级、高效的自然语言处理等特点,可以快速地响应用户需求。同时,其在微调场景下优势显著,模型的训练时间更短,成本更低,特定场景下的效果可媲美ERNIE Bot 4.0。

自2月发布上线以来,目前已有超过150家企业采用了ERNIE Speed模型,它除了能做到快速响应外,作为基础通用大模型,在阅读理解、close-book问答、创作与续写等复杂任务上,也能达到甚至超越千亿大模型的效果。每一位开发者,都可以在ERNIE Speed的助力下,快速实现企业级的专属模型训练,探索AI大模型的无限可能。

wKgZomXqdnSACVt3AAUH5O6B5kw425.jpg

更多AI的想象

值得期待

3月21日,百度智能云将在北京举行AI Cloud Day:百度智能云千帆产品发布会。作为2024年AI领域最值得期待的系列产品发布会,诚挚邀请所有技术爱好者共襄盛举。届时,百度智能云千帆ModelBuilder和AppBuilder也将公布最新产品进展,发布系列新模型以及应用开发工具组件等,分享如何助力企业、用户释放模型创新潜能,简单高效打造AI原生应用,推动中国AI原生应用的发展,共同迈入崭新的AI生产力的最新纪元。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度智能云
    +关注

    关注

    0

    文章

    47

    浏览量

    2135
  • AI大模型
    +关注

    关注

    0

    文章

    382

    浏览量

    710

原文标题:“千帆杯”第二期十万大奖花落谁家?TOP10名单出炉!

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OpenHarmony论文解读系列直播第二期

    ?
    的头像 发表于 08-07 11:05 ?205次阅读
    OpenHarmony论文解读系列直播<b class='flag-5'>第二期</b>

    2025最新前瞻技术方案揭秘(第二期):逆变器、软件与控制算法、仿真与人工智能

    -关于2025最新前瞻技术方案揭秘·第二期-文字原创,素材来源:解决方案供应商-本篇为知识星球节选,完整版报告与解读在知识星球发布-1500+最新电动汽车前瞻技术报告与解析已上传知识星球目录
    的头像 发表于 08-02 07:02 ?1083次阅读
    2025最新前瞻技术方案揭秘(<b class='flag-5'>第二期</b>):逆变器、软件与控制算法、仿真与人工智能

    广汽集团启动IPD及数字化变革二期项目

    近日,广汽集团召开IPD及数字化变革二期项目启动会。在一项目“松土育苗”基础上,二期项目将直击核心痛点,贯通IPD主流程,从流程、组织和体制机制三大维度实现转型。
    的头像 发表于 07-31 15:52 ?353次阅读

    赣锋锂电荣登全球新能源品牌榜TOP10

    近日,由全球绿色能源理事会(GGIEC)、亚太新能源行业协会(NEIAAP)、亚洲光伏产业协会(APVIA)联合主办的 “全球新能源品牌榜 TOP10” 颁奖典礼在国家会展中心(上海)举行。
    的头像 发表于 07-18 17:56 ?713次阅读

    京东方越南智慧终端二期项目提前量产

    近日,BOE(京东方)越南智慧终端二期项目量产暨客户交付仪式在越南巴地头顿省富美市成功举办。作为京东方首个海外自主投建的智慧工厂,越南二期项目比原计划提前两个半月量产,以先进的运营管理经验再次彰显“BOE速度”。
    的头像 发表于 06-17 09:06 ?576次阅读

    玻色量子完成数千万元A+轮第二期融资 光电融合产业基金领投

    近日,北京玻色量子科技有限公司(以下简称“玻色量子”)完成数千万元A+轮第二期融资,由北京光电融合产业投资基金(有限合伙)(以下简称“光电融合产业基金”)等机构投资。这是玻色量子成立四年多以来完成
    的头像 发表于 05-15 09:23 ?481次阅读

    AspenCore评选中国Top10传感器公司出炉 豪威科技、格科微、思特威、汇顶科技等上榜(附全名单

    模拟,每个类别挑选出Top ?10,外加上市公司和EDA、IP公司这三个类别各自的Top 10,共同组成Fabless100 3+10
    的头像 发表于 04-02 18:54 ?1921次阅读
    AspenCore评选中国<b class='flag-5'>Top10</b>传感器公司<b class='flag-5'>出炉</b> 豪威科技、格科微、思特威、汇顶科技等上榜(附全<b class='flag-5'>名单</b>)

    渝您共享|第二期2024年重庆市物联网赋能行业发展典型案例专题活动《5G+生物多样性保护物联网集成创新应用

    为加强典型经验总结与优秀案例推广,以典型案例示范应用带动产业发展。3月28日,由重庆市经济和信息化委员会指导,重庆市物联网产业协会/重庆市物联网技术创新战略联盟主办的“渝您共享”——第二期2024年
    的头像 发表于 04-02 16:58 ?718次阅读
    渝您共享|<b class='flag-5'>第二期</b>2024年重庆市物联网赋能行业发展典型案例专题活动《5G+生物多样性保护物联网集成创新应用

    燧原技术伙伴培育计划第二期开启

    新的里程碑,第二期ETP培训于昨日在上海正式开课,来自中电金信、恒生电子、清昴智能、超聚变、卡姆派乐、思迹信息、先进编译实验室、亿芯智算、燧弘华创等10家企业的近30位技术专家和工程师参与其中。
    的头像 发表于 01-10 15:25 ?752次阅读

    东风奕派eπ008登顶CCRT细分市场榜首

    日前,中汽中心汽车测评管理中心揭晓第二期《CCRT选车指南》中型及中大型新能源SUV推荐名单,东风奕派旗下家庭智能大型SUV eπ008,以综合得分90.1分的优异成绩获15-20万级城市SUV第一
    的头像 发表于 12-17 09:52 ?665次阅读

    今晚直播!OpenHarmony应用开发精品课程第二期来啦~

    原文标题:今晚直播!OpenHarmony应用开发精品课程第二期来啦
    的头像 发表于 11-20 15:24 ?570次阅读

    中科创达入选车载操作系统TOP10企业

    TOP10分析报告》,中科创达凭借多年在操作系统领域的深厚技术积累以及在智能汽车整车操作系统方面的卓越创新成功入选“车载操作系统TOP10企业”之列。
    的头像 发表于 11-14 11:47 ?1184次阅读

    第三季度全国5G新基建智慧灯杆建设案例TOP10

    第三季度全国5G新基建智慧灯杆建设案例TOP10
    的头像 发表于 11-07 13:01 ?1407次阅读
    第三季度全国5G新基建智慧灯杆建设案例<b class='flag-5'>TOP10</b>

    2024年汽车操作系统趋势及TOP10分析报告

    2024年汽车操作系统趋势及TOP10分析报告
    的头像 发表于 09-30 08:07 ?761次阅读
    2024年汽车操作系统趋势及<b class='flag-5'>TOP10</b>分析报告

    必易微受邀参加美的集团第二期电控硬件专项训练营

    必易微系统应用总监文鹏先生受邀参加美的集团第二期电控硬件专项训练营,面向训练营全体学员深入讲授《SSR 反激拓扑及 PWM IC 工作原理》的专题课程,分享其丰富的专业知识与经验。
    的头像 发表于 09-25 11:06 ?820次阅读