0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌大脑CMU联手推出XLNet,20项任务全面超越BERT

gckX_aicapital ? 来源:YXQ ? 2019-06-22 11:19 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌大脑和CMU联合团队提出面向NLP预训练新方法XLNet,性能全面超越此前NLP领域的黄金标杆BERT,在20个任务上实现了性能的大幅提升,刷新了18个任务上的SOTA结果,可谓全面屠榜!

近日,谷歌大脑主任科学家Quoc V. Le在Twitter上放出一篇重磅论文,立即引发热议:

这篇论文提出一种新的NLP模型预训练方法XLNet,在20项任务上(如SQuAD、GLUE、RACE) 的性能大幅超越了此前NLP黄金标杆BERT。

XLNet:克服BERT固有局限,20项任务性能强于BERT

本文提出的XLNet是一种广义自回归预训练方法,具有两大特点:(1)通过最大化分解阶的所有排列的预期可能性来学习双向语境,(2)由于其自回归的性质,克服了BERT的局限性。

此外,XLNet将最先进的自回归模型Transformer-XL的创意整合到预训练过程中。实验显示,XLNet在20个任务上的表现优于BERT,而且大都实现了大幅度性能提升,并在18个任务上达到了SOTA结果,这些任务包括问答、自然语言推理、情感分析和文档排名等。

与现有语言预训练目标相比,本文提出了一种广义的自回归方法,同时利用了AR语言建模和AE的优点,同时避免了二者的局限性。首先是不再像传统的AR模型那样,使用固定的前向或后向分解顺序,而是最大化序列的预期对数似然性分解顺序的所有可能排列。每个位置的上下文可以包含来自该位置前后的令牌,实现捕获双向语境的目标。

作为通用AR语言模型,XLNet不依赖于数据损坏。因此,XLNet不会受到BERT受到的预训练和微调后的模型之间差异的影响。同时以自然的方式使用乘积规则,分解预测的令牌的联合概率,从而消除了在BERT中做出的独立性假设。

除了新的预训练目标外,XLNet还改进了预训练的架构设计。 XLNet将Transformer-XL的分段重复机制和相对编码方案集成到预训练中,从而凭经验改进了性能,对于涉及较长文本序列的任务效果尤其明显。

图1:在给定相同输入序列x,但分解顺序不同的情况下,对置换语言建模目标的预测结果

图2:(a):内容流注意力机制,与标准的自注意力机制相同。(b)查询流注意力,其中不含关于内容xzt的访问信息。(c):使用双信息流注意力机制的置换语言建模训练示意图。

全面屠榜:大幅刷新18项任务数据集SOTA性能

表1:与阅读理解任务RACE测试集的最新结果的比较。 *表示使用聚集模型。 RACE中的“Middle”和“High”是代表初中和高中难度水平的两个子集。所有BERT和XLNet结果均采用大小相似的模型(又称BERT-Large),模型为24层架构。我们的XLNet单一模型在精确度方面高出了7.6分

表2:单XLNet模型在SQuAD1.1数据集上的性能优于分别优于真人表现和最佳聚集模型性能达7.6 EM和2.5 EM。

表3:与几个文本分类数据集的测试集上错误率SOTA结果的比较。所有BERT和XLNet结果均采用具有相似大小的24层模型架构(BERT-Large)

表4:GLUE数据集上的结果。所有结果都基于具有相似模型尺寸的24层架构(也称BERT-Large)。可以将最上行与BERT和最下行中的结果直接比较。

表5:与文档排名任务ClueWeb09-B的测试集上的最新结果的比较。 ?表示XLNet的结果。

表6:我们使用BERT官方实现方案和XLNet超参数搜索空间在其他数据集上运行BERT,结果如图所示,其中K是控制优化难度的超参数。所有模型都在相同的数据上进行预训练。

从实验结果可以看出,说XLNet全面超越BERT其实一点都不夸张。

知乎热议:512TPU训练,家里没矿真搞不起

有热心网友一早将这篇“屠榜”论文发在了知乎上,从网友的评论上看,一方面承认谷歌和CMU此项成果的突破,同时也有人指出,这样性能强劲的XLNet,还是要背靠谷歌TPU平台的巨额算力资源,“大力出奇迹”果然还是深度学习界的第一真理吗?

比如,网友“Towser”在对论文核心部分内容的简要回顾中,提到了XLNet的优化方法,其中引人注目的一点是其背后的谷歌爸爸的海量算力资源的支持:

512个TPU训练了2.5天,训练总计算量是BERT的5倍!要知道作为谷歌的亲儿子,BERT的训练计算量已经让多数人望尘莫及了。没钱,搞什么深度学习?

难怪NLP领域的专家、清华大学刘知远副教授对XLNet一句评价被毫无悬念地顶到了知乎最高赞:

目前,XLNet的代码和预训练模型也已经在GitHub上放出。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6233

    浏览量

    108592
  • nlp
    nlp
    +关注

    关注

    1

    文章

    490

    浏览量

    22711

原文标题:NLP新标杆!谷歌大脑CMU联手推出XLNet,20项任务全面超越BERT

文章出处:【微信号:aicapital,微信公众号:全球人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    将HFREFR和LFREFR寄存器值设置为错误的值来将故障注入CMU,但CMU_ISR值始终为零,为什么?

    我试图通过将 HFREFR 和 LFREFR 寄存器值设置为错误的值来将故障注入 CMU,但 CMU_ISR值始终为零。
    发表于 03-28 07:41

    谷歌AI智能体执行复杂任务能力大幅提升

    自然语言描述任务,随后由AI智能体代替用户执行并最终完成任务,极大地提升工作效率和便捷性。 为了推进这一技术的实现,谷歌正在积极开发两个相关项目。其中备受瞩目的是名为“Mariner”的浏览器扩展程序。通过该程序,AI智能体能够
    的头像 发表于 02-17 14:39 ?703次阅读

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗舰大模型 Gemini 2.0 Pro 实验
    的头像 发表于 02-07 15:07 ?802次阅读

    DeepSeek用户量超越谷歌Gemini

    在聊天AI领域的竞争中,中国AI产品DeepSeek展现出了强劲的增长势头。据最新数据显示,1月底,DeepSeek的用户量已经成功超越谷歌的Gemini。 具体来看,1月31日这一天
    的头像 发表于 02-07 14:59 ?605次阅读

    科技为用户而生!海尔智家大脑HomeGPT连获三大奖

    用户体验的全面提升。 连获三大奖,让家更懂用户所需 用户的好评与行业认可是科技实力的最佳证明。短短两个月内,海尔智家大脑HomeGPT入选“2024年工信部‘数字三品’应用场景典型案例”,荣获“2024年度山东省信息产业协会科
    的头像 发表于 01-24 11:36 ?536次阅读

    三星电子与谷歌联手研发AR眼镜

    近日,三星电子在美国加州圣何塞成功举办了其一年一度的“Galaxy Unpacked”发布会。会上,三星电子不仅推出了备受期待的新旗舰“Galaxy S25”系列手机,还展示了与谷歌共同研发
    的头像 发表于 01-24 10:22 ?1016次阅读

    机器人“大脑+小脑”范式:算力魔方赋能智能自主导航

    ?在机器人技术的发展中,“大脑+小脑”的架构模式逐渐成为推动机器人智能化的关键。其中, “大脑”作为机器人的核心决策单元,承担着复杂任务规划、环境感知和决策制定的重要角色,而“小脑”则专注于运动控制
    的头像 发表于 01-20 13:35 ?632次阅读

    谷歌CEO:Gemini AI技术超越竞品,目标年底5亿用户

    近日,谷歌CEO皮查伊近期向员工传达了他对公司Gemini AI技术的信心。据悉,皮查伊认为Gemini的能力已经超越了当前的竞争对手。 皮查伊表示,他期望到今年年底,全球能有5亿人
    的头像 发表于 01-17 10:37 ?941次阅读

    马斯克预言:AI将全面超越人类智力

    近日,科技巨头马斯克作出了一个关于人工智能(AI)的大胆预测。他断言,AI的发展速度将超乎人类的想象,并将在不久的将来全面超越人类的智力。 马斯克在X平台上明确表示,AI的迅猛进步不容忽视。他预测
    的头像 发表于 12-28 14:23 ?831次阅读

    谷歌量子芯片Willow发布 速度超最快超算

    谷歌最新推出的量子芯片Willow引发了业界的广泛关注。这款芯片具备105个物理量子比特,并在多个性能指标上处于领先地位,同时实现了两重要突破。 首先,Willow成功解决了近30年来困扰研究者
    的头像 发表于 12-13 16:36 ?668次阅读

    谷歌发布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性,旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高级推理和长上
    的头像 发表于 12-12 10:13 ?734次阅读

    英伟达与谷歌联手加速量子计算设备设计

    近日,据外媒最新报道,英伟达与谷歌两大科技巨头宣布携手合作,共同加速下一代量子计算设备的设计进程。 双方在一份联合声明中透露,谷歌的量子人工智能部门将充分利用英伟达强大的Eos超级计算机资源,模拟量
    的头像 发表于 11-21 11:08 ?834次阅读

    英国CMA批准谷歌与Anthropic合作关系

    近日,英国竞争与市场管理局(CMA)宣布了一重要决定,批准了谷歌与人工智能公司Anthropic之间的合作关系。CMA在周二表示,根据合并规则,这笔交易并未达到需要进行全面调查的标准,因此将避免
    的头像 发表于 11-20 10:55 ?914次阅读

    谷歌云宣布一重要人事任命

    近日,谷歌云(Google Cloud)正式宣布了一重要人事任命,尹世明将加入谷歌云,担任大中华区总裁一职。这一任命无疑将为谷歌云在大中华区的业务发展和市场拓展注入新的活力和动力。
    的头像 发表于 11-18 15:07 ?664次阅读

    谷歌推出Gemini大型语言模型

    够协助用户完成诸如收集研究资料、购买产品或预订航班等各种日常任务,从而极大地提升用户的生活便捷性和效率。通过智能分析用户的浏览行为和需求,该项目将为用户提供个性化的建议和服务,使用户能够更加轻松地完成各种任务。 此外,知情人士还透露,
    的头像 发表于 10-29 15:11 ?723次阅读