0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

怎样去增强PLM对于实体和实体间关系的理解?

深度学习自然语言处理 ? 来源:TsinghuaNLP ? 作者:秦禹嘉 ? 2021-06-23 15:32 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近年来,预训练语言模型(PLM)在各种下游自然语言处理任务中表现出卓越的性能,受益于预训练阶段的自监督学习目标,PLM 可以有效地捕获文本中的语法和语义,并为下游 NLP 任务提供蕴含丰富信息的语言表示。然而,传统的预训练目标并没有对文本中的关系事实进行建模,而这些关系事实对于文本理解至关重要。

在这篇被ACL 2021主会录用的文章中,清华大学联合腾讯微信模式识别中心与伊利诺伊大学厄巴纳香槟分校(UIUC),提出了一种新颖的对比学习框架ERICA,帮助PLM深入了解文本中的实体及实体间关系。具体来说,作者提出了两个辅助性预训练任务来帮助PLM更好地理解实体和实体间关系:(1)实体区分任务,给定头实体和关系,推断出文本中正确的尾实体;(2)关系判别任务,区分两个关系在语义上是否接近,这在长文本情景下涉及复杂的关系推理。实验结果表明,ERICA在不引入额外神经网络参数的前提下,仅仅对PLM进行少量的额外训练,就可以提升典型PLM(例如BERT 和 RoBERTa)在多种自然语言理解任务上(包括关系抽取、实体类别区分、问题回答等)的性能。尤其是在低资源(low-resource)的设定下,性能的提升更加明显。

一、问题背景

传统的预训练目标没有对文本中的关系事实进行显式建模,而这些关系事实对于理解文本至关重要。为了解决这个问题,一些研究人员试图改进 PLM 的架构、预训练任务等,以更好地理解实体之间的关系。但是它们通常只对文本中的句子级别的单个关系进行建模,不仅忽略了长文本场景下多个实体之间的复杂关系,也忽略了对实体本身的理解,例如图1中所展现的,对于长文本来说,为了让PLM更加充分理解地单个实体,我们需要考虑该实体和其他实体之间的复杂关系;而这些复杂的关系的理解通常涉及复杂的推理链,往往需要综合多个句子的信息得出结论。针对这两个痛点,本文提出了实体区分任务和关系区分任务来增强PLM对于实体和实体间关系的理解。

二 、文档级预训练数据收集

ERICA的训练依赖于大规模文档级远程监督数据,该数据的构造有三个阶段:首先从wikipedia中爬取文本段落,然后用命名实体识别工具(例如spacy)进行实体标注,将所有获得的实体和wikidata中标注的实体对应上,并利用远程监督(distant supervision)信号获得实体之间可能存在的关系,最终保留长度在128到512之间,含有多于4个实体,实体间多于4个远程监督关系的段落。注意这些远程监督的关系中存在大量的噪声,而大规模的预训练可以一定程度上实现降噪。作者也开源了由100万个文档组成的大规模远程监督预训练数据。

三 、实体与实体间关系的表示

鉴于每个实体可能在段落中出现多次,并且每次出现时对应的描述(mention)可能也不一样,作者在使用PLM对tokenize后的段落进行编码后,取每个描述的所有token均匀池化后的结果作为该描述的表示,接着对于全文中该实体所有的描述进行第二次均匀池化,得到该实体在该文档中的表示;对于两个实体,它们之间的关系表示为两个实体表示的简单拼接。以上是最简单的实体/实体间关系的表示方法,不需要引入额外的神经网络参数。作者在文中还探索了其它的表示方法,并验证了所有方法相比baseline都有一致的提升。

四 、实体区分任务

实体区分任务旨在给定头实体和关系,从当前文档中寻找正确的尾实体。例如在上图中,Sinaloa和Mexico具有country的远程关系,于是作者将关系country和头实体Sinaloa拼接在原文档的前面作为提示(prompt),在此条件下区分正确的尾实体的任务可以在对比学习的框架下转换成拉近头实体和正确尾实体的实体表示的距离,推远头实体和文档中其它实体(负样本)的实体表示的距离,具体的公式如下所示:

aa6771d0-d061-11eb-9e57-12bb97331649.png

五、关系区分任务

关系区分任务旨在区分两个关系的表示在语义空间上的相近程度。由于作者采用文档级而非句子级的远程监督,文档中的关系区分涉及复杂的推理链。具体而言,作者随机采样多个文档,并从每个文档中得到多个关系表示,这些关系可能只涉及句子级别的推理,也可能涉及跨句子的复杂推理。之后基于对比学习框架,根据远程监督的标签在关系空间中对不同的关系表示进行训练,如前文所述,每个关系表示均由文档中的两个实体表示构成。正样本即具有相同远程监督标签的关系表示,负样本与此相反。作者在实验中还发现进一步引入不具有远程监督关系的实体对作为负样本可以进一步提升模型效果。由于进行对比训练的两个关系表示可能来自于多个文档,也可能来自于单个文档,因此文档间/跨文档的关系表示交互都得到了实现。巧妙的是,对于涉及复杂推理的关系,该方法不需要显示地构建推理链,而是“强迫”模型理解这些关系并在顶层的关系语义空间中区分这些关系。具体的公式如下所示:

aaa2d9dc-d061-11eb-9e57-12bb97331649.png

为了避免灾难性遗忘,作者将上述两个任务同masked language modeling (MLM)任务一起训练,总的训练目标如下所示:

aaaeafe6-d061-11eb-9e57-12bb97331649.png

六、实验结果

ERICA的训练不需要引入除了PLM之外的任何参数,并且对于任意模型均能够适配,具体的,作者采用了两个经典的PLM:BERT和RoBERTa,并对其进行一定时间的post-training,最后在文档级关系抽取、实体类别区分、问题回答等任务上进行了测试,并对比了例如CorefBERT, SpanBERT, ERNIE, MTB,CP等基线模型,验证了ERICA框架的有效性。具体结果如下:

a) 文档级关系抽取,模型需要区分文档中的多个实体之间的关系,这需要PLM对实体间关系有较好的理解。

b) 实体类别区分,模型需要区分文本中的实体的具体类别,这需要PLM对实体本身有较好的理解。

c) 问题回答,作者测试了两种常见的问题回答任务:多选问答(multi-choice QA)和抽取式问答(extractive QA)。这需要PLM对实体和实体间关系有较好的理解。

七、分析

a) 消融分析(ablation study)。作者对ERICA框架中的所有组成成分进行了细致的分析,并证明了这些组成成分对于模型整体效果的提升是缺一不可的。

b) 可视化分析。作者对经过ERICA训练前后的PLM对实体和实体间关系的表示进行了可视化,结果如下图所示。通过ERICA的对比学习训练,PLM对于同类别的实体/实体关系的表示有明显的聚类现象,这充分验证了ERICA能够显著增强PLM对实体和实体间关系的理解。

c) 此外,作者分析了远程监督关系的多样性/预训练文档数量对于模型效果的提升。实验结果发现,更加多样的远程监督关系与更大的预训练数据集对于性能的提升有积极的作用。

d) 除了使用均匀池化的方式来获得实体/关系表示,作者也尝试使用entity marker的表示方法来测试模型的性能。实验结果证明,ERICA对各种实体/关系表示方法均适用,进一步验证了该架构的通用性。

八、总结

在本文中,作者提出了ERICA框架,通过对比学习帮助PLM提高实体和实体间关系的理解。作者在多个自然语言理解任务上验证了该框架的有效性,包括关系提取、实体类别区分和问题问答。实验结果表明ERICA显著优于所有基线模型,尤其是在低资源的设定下,这意味着 ERICA 可以更好地帮助 PLM捕获文本中的相关事实并综合有关实体及其关系的信息。

责任编辑:lq6

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • PLM
    PLM
    +关注

    关注

    2

    文章

    140

    浏览量

    21518
  • 实体
    +关注

    关注

    0

    文章

    8

    浏览量

    7383

原文标题:ERICA: 提升预训练语言模型实体与关系理解的统一框架

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PLM - 基础知识、优势和差异化

    工业4.0、制造业数字化和工业流程网络化为PLM的运行提供了框架。它结合了不同的系统和技术,共同优化了产品整个生命周期的信息流。 什么是PLM? 产品生命周期管理(Product
    发表于 07-30 14:26

    PDM是什么?2025制造PDM/PLM系统盘点

    合适PDM/PLM(How)五个方面,用最简练的语言帮助读者理解PDM。 文末附有10款主流PDM产品、
    的头像 发表于 06-19 17:46 ?587次阅读
    PDM是什么?2025制造PDM/<b class='flag-5'>PLM</b>系统盘点

    如何在MQTT中发布和订阅实体

    在MQTT中发布和订阅实体(主题)是MQTT通信的核心操作,下面将详细介绍其原理、步骤以及示例代码,帮助你全面理解这一过程。 一、MQTT发布与订阅的基本概念 发布(Publish):客户端将
    的头像 发表于 05-20 17:21 ?426次阅读

    蓝牙技术联盟正式成立中国实体,扩展全球市场布局

    中国北京, 2025 年 3 月 13 日 ——负责发展蓝牙技术的行业协会蓝牙技术联盟(Bluetooth SIG)今日宣布正式成立蓝牙技术(北京)有限公司。中国实体的总部设在北京,并在上海和深圳
    发表于 03-13 10:53 ?275次阅读
    蓝牙技术联盟正式成立中国<b class='flag-5'>实体</b>,扩展全球市场布局

    ADS7864输入模拟量与输出数字量关系怎样的?

    可以看到芯片busy口是有变化的,说明芯片在工作,麻烦问一下输入模拟量与输出数字量关系怎样的,是需要我定义的吗,有没有详细的时序图或程序流程,给我一点技术资料,我所看的ADS7864芯片介绍资料时序图说的不清楚,尤其是循环模
    发表于 02-10 07:23

    鲲云科技入选工信部2024年实体经济和数字经济深度融合典型案例

      近日,工业和信息化部公布了 2024 年实体经济和数字经济深度融合典型案例名单,鲲云科技凭借基于可重构数据流 AI 芯片的智慧城市管理系统成功入选。
    的头像 发表于 01-16 15:54 ?667次阅读

    探秘定制锂电池实体店:开启专属电力新体验

    定制锂电池实体店为我们提供了一种全新的电池选择方式,让我们能够摆脱传统锂电池的束缚,拥有一款真正符合自己需求的专属电力解决方案。如果你正在为电池的适配性、性能等问题烦恼,不妨走进身边的定制锂电池实体店,开启属于你的专属电力新体验。
    的头像 发表于 01-15 17:06 ?534次阅读
    探秘定制锂电池<b class='flag-5'>实体</b>店:开启专属电力新体验

    研发数据管理:从前PLM时代的Excel到PLM3.0、PLM 4.0

    SAP、Oracle、西门子都在裁员,国产PLM厂商是该亦步亦趋,还是实现PLM的国产替代?
    的头像 发表于 01-10 16:23 ?529次阅读

    半导体企业回应美国出口管制 多家A股公司谈实体清单影响

    日前,美国又一次以国家安全为借口,进一步加大了对我国半导体出口的限制措施。将136家中国实体列入“实体清单”,并对24种半导体制造设备、3种软件工具和HBM芯片出口增加限制。比如北方华创、拓荆
    的头像 发表于 12-04 16:39 ?1572次阅读

    如何使用ar增强实体

    增强现实(AR)技术近年来得到了迅速发展,它通过在用户的现实世界视野中叠加计算机生成的图像、视频或信息,为用户提供了一种全新的交互方式。这种技术已经被广泛应用于游戏、教育、零售、医疗等多个领域
    的头像 发表于 11-11 10:03 ?1728次阅读

    南方智能推出三维地理实体生产软件

    新型基础测绘与实景三维中国建设持续推进,南方智能深度聚焦,基于自主研发的SmartGIS平台,打造以地理实体数据为核心的“生产、处理、质检、管理、可视化分析”实景三维系列软件,提供全流程、按需定制的服务方案。
    的头像 发表于 11-06 10:26 ?1031次阅读

    PLM系统 PLM软件 PLM项目管理系统软件 PLM产品生命周期管理系统哪个好?

    随着产品设计和制造日益复杂,市场竞争日益激烈,产品生命周期管理(PLM)系统已经成为许多企业提高竞争力和创新能力的重要工具。PLM系统是一种端到端的产品开发管理解决方案,旨在整合产品开发的所有阶段
    的头像 发表于 10-23 15:18 ?820次阅读

    传音控股入选2023新型实体企业TOP100

    2023“新型实体企业TOP100”成果发布暨典型企业分享交流会在北京举办。大会上,中国企业评价协会发布了《2023新型实体企业TOP100发展报告》及榜单。传音控股长期深耕智能终端制造和移动互联领域,凭借领先的技术创新实力入选“2023新型
    的头像 发表于 09-29 16:21 ?933次阅读

    立讯精密上榜《2023新型实体企业TOP100》

    中国企业评价协会主办的2023“新型实体企业TOP100”成果发布暨典型企业分享交流会上,发布了《2023年度新型实体企业TOP100发展报告》及“2023新型实体企业TOP100”榜单,集中呈现
    的头像 发表于 09-29 09:51 ?694次阅读

    一站式解决企业难题:彩虹PLM系统引领企业管理革新

    企业面临市场挑战,需PLM系统提升管理、研发、设计、生产等效率。彩虹PLM系统助企业实时监控产品全生命周期,优化各部门工作,增强核心竞争力...
    的头像 发表于 09-10 16:43 ?728次阅读
    一站式解决企业难题:彩虹<b class='flag-5'>PLM</b>系统引领企业管理革新