0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

介绍两个few-shot NER中的challenge

深度学习自然语言处理 ? 来源:AI Station ? 作者:QI ? 2022-08-24 10:01 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

01

Introduction-现有什么问题、怎么解决

此部分着重介绍了两个few-shot NER中的challenge:limited information challenge和knowledge mismatch challenge。前者主要是指样本数少,后者是指不同的数据集中同一个实体可能被分成了不同的类别标签。(比如“America”在Wikipedia被分为geographic , 在 OntoNotes中被分为GPE, 在WNUT17被分为location )

本文最重要的思想基于这样一个假设:不论是否是未知的实体类别,都可以用一个概念集中的若干概念来描述(all entity types can be described using the same set of concepts)。这样可以解决knowledge mismatch challenge,而且在给了几个少样本后,可以根据这几个少样本构建新实体类别到概念集的映射,这样可以直接用映射后的若干概念识别实体,进而解决limited information challenge。下图是实体类别到概念集的映射举例。

93bd0394-22ce-11ed-ba43-dac502259ad0.jpg

02

SDNet: Self-describing Networks for FS-NER

2.1 SDNet核心部分: Mention describing、Entity generation

这部分将主要介绍SDNet怎么进行命名实体识别的,主要包括:Mention describing(从给的sentence构建该实体的concept description)和Entity generation(根据给的实体类型逐个生成句子中的实体词)。

以下图为例,输入一个sentence(以[MD]作为起始符),SDNet将输出novel series这样的concept description。输入一个以[EG]作为起始符、实体类别名+相关的concept description以及待识别的sentence作为内容的文本,SDNet将输出Harry Potter is creative work.这样的回答。这两个过程分别对应Mention describing和Entity generation。

93d176ee-22ce-11ed-ba43-dac502259ad0.png

2.2 模型工作流程

93dc6414-22ce-11ed-ba43-dac502259ad0.jpg

a、预训练阶段

左上角的维基百科上有大量的句子,句子中的人物、地点、公司等都有相应的维基百科给的标签和描述。预训练阶段根据2.1部分介绍的模板,进行[MD]和[EG]两个任务的Seq2Seq任务的训练。

b、微调与解码阶段

这部分对应于Few-shot NER的少样本阶段。给了一些带标注的少量样本句子,我们知道了这些句子中那些单词是实体部分,把这些实体部分添加到以[MD]开头的模板并输入到SDNet中,模型会生成这些实体部分描述,并将生成的描述加入到新类别的概念描述集中,并在预测阶段输入添加了新类别的[EG]开头的模板,根据生成的结果判断待预测的句子中哪些单词部分是该类别的实体。

以上图中为例,给的少样本中Iran是GPE类别的实体,SDNet先用[MD]开头的模板生成了Iran是country的描述,将country加入到属于GPE这个新类别的概念描述集合中,在预测阶段用[EG]开头的模板输入GPE这个类别名、其包含的概念描述以及待识别的句子,生成属于GPE的实体词,完成实体识别。

c、Filtering Strategy

在众多下游任务中,SDNet可能会遇到难以生成新实体类别描述的情况(或者或生成不准确的描述),因此SDNet在训练阶段可以对于那些不去确定的instance生成other的描述词。如果给少量样本生成的描述词中有0.5以上的other,将在最后的decode阶段直接使用新实体类别名(如GPE)。(实验部分可以看到这个策略带来了一定的提升)

具体实现过程将不再赘述,可以看原文的第4部分,有对预训练和fintune阶段的详细介绍。

03

实验部分

93f542f4-22ce-11ed-ba43-dac502259ad0.jpg

这种借助先验知识的方式,在6个数据集上都取得了很好的效果,尤其是对一些之前的识别效果一直很差的(比如I2B2),这说明这种通用的实体概念集合在各种类别间是通用的。

04

评价

优点

为少样本NER引用外部知识提供了新思路,且提供了可直接使用的,通用的预训练模型,可以为后来的研究工作提供参考。

可能的缺陷

在很多新领域下(尤其涉及到domain transfer)的,可能会出现很多无法描述成概念集合的实体类别,出现大量的other,这时只能用实体类别名了,在完全不重叠的领域之间可能效果会不佳。

另外,预训练阶段使用的维基百科,大量的是事件人物地点等这些广泛且常用的,面对实际应用中的非常见实体类别时,可能做不到很好的描述。

在大量的语料中进行训练,可能出现了“泄露”,当然这只是一个猜测。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SDNet
    +关注

    关注

    0

    文章

    4

    浏览量

    5727

原文标题:ACL2022 | 基于自描述网络的小样本命名实体识别

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    看到STM8L152用两个IO用两个或非门检测两个通断,是什么原理呢?

    图中两个按键开关是两个干簧管,为什么不直接对GND设计来检测这个干簧管通断呢? 这样设计的原理是什么?
    发表于 06-12 06:25

    在ADS828两个输入管脚IN+和IN-,当两个管脚的都接不同的输入的时候,输入值是如何计算的啊?

    在ADS828两个输入管脚IN+和IN-,当两个管脚的都接不同的输入的时候,输入值是如何计算的啊?是等于IN+的输入电压减去IN-的电压吗?
    发表于 02-06 06:25

    ADS1191的ADC是和两个通道的哪个通道相连呢?

    ADS 1191的ADC是和两个通道的哪个通道相连呢?数据手册并未说明情况,还请说的清楚一点。
    发表于 01-23 07:40

    两个不同频率晶振靠的近会怎样

    晶振的振荡本质上是一种机械振动(在压电晶体层面)。当两个晶振靠得很近时,它们的机械振动可能会相互影响。一晶振的振动可能会通过电路板或者外壳等介质传递给另一晶振,从而改变另一晶振的
    的头像 发表于 01-20 13:55 ?1718次阅读
    <b class='flag-5'>两个</b>不同频率晶振靠的近会怎样

    如何把两个数据返回给调用函数

    函数的处理结果包含两个数据,如何把两个数据返回给调用函数? 第一种,把两个数据封装成一结构体,函数返回结构体。 调用函数的地方同样用结构体去接收函数的返回值。 第二种,把返回值保存在
    的头像 发表于 01-08 10:15 ?470次阅读

    两个晶体管能如何实现高效正弦波振荡?

    在电子设计,振荡器是一重要的组件,广泛应用于信号发生、无线通信和音频设备。一般来说,设计一稳定的正弦波振荡器往往需要运算放大器或复杂的电路结构。然而,是否可以仅用
    的头像 发表于 01-07 12:00 ?630次阅读
    <b class='flag-5'>两个</b>晶体管能如何实现高效正弦波振荡?

    EE-98:使用外部总线仲裁将两个以上的ADSP-21065L组合到一多处理集群

    电子发烧友网站提供《EE-98:使用外部总线仲裁将两个以上的ADSP-21065L组合到一多处理集群.pdf》资料免费下载
    发表于 01-05 09:38 ?0次下载
    EE-98:使用外部总线仲裁将<b class='flag-5'>两个</b>以上的ADSP-21065L组合到一<b class='flag-5'>个</b>多处理集群<b class='flag-5'>中</b>

    ads1013有两个模拟输入,可以接不同的两个模拟输入吗?

    ads1013有两个模拟输入,可以接不同的两个模拟输入吗,驱动程序怎么分别读两个模拟输入的转换结果?
    发表于 12-02 08:02

    德州仪器推出两个全新系列实时微控制器

    德州仪器 (TI) 近日推出了两个全新系列的实时微控制器,这些产品的技术进步可帮助工程师在汽车和工业应用实现更智能、更安全的处理。
    的头像 发表于 11-28 13:45 ?934次阅读

    两个开关电源可以并联使用吗

    两个开关电源并联使用是一相对复杂的话题,涉及到电子电路设计、电源管理、安全规范等多个方面。 1. 开关电源的基本原理 开关电源是一种通过电子开关元件(如晶体管、MOSFET等)快速切换来控制电流
    的头像 发表于 10-09 16:04 ?5368次阅读

    单相电机两个绕组都在定子上吗

    单相电机的两个绕组,即起动线圈(或称为辅助绕组、副绕组)和运行线圈(或称为主绕组),都位于定子上 。这两个绕组在电机起着关键作用,共同协作以产生旋转磁场,从而使电机能够运转。 单相电机通常由一
    的头像 发表于 09-03 15:10 ?2402次阅读

    ad如何设置两个元器件的距离

    在Altium Designer(简称AD)设置两个元器件之间的距离,主要是通过设置元器件间的安全间距(Clearance)规则来实现的。这个规则定义了元器件之间、元器件与走线之间以及其他设计元素
    的头像 发表于 09-02 15:31 ?1.8w次阅读

    sr锁存器特性表q为什么有两个

    SR锁存器特性表Q之所以有两个值,是因为这些值分别代表了锁存器在不同输入条件下的状态。具体来说,Q的两个值分别对应了锁存器的“当前状态”(也称为“初态”或“现态”)和“新状态”(也称为“次态”或
    的头像 发表于 08-28 09:28 ?1542次阅读

    功放机AB两个声道输出怎么接

    功放机AB两个声道输出的接线方式,主要取决于您想要实现的音频效果以及音箱的配置。以下将详细介绍几种常见的接线方式,以及它们各自的特点和适用场景。 一、基础接线方式 在大多数情况下,功放机的AB两个
    的头像 发表于 08-23 10:40 ?1w次阅读

    单稳态触发器的两个工作状态是什么

    单稳态触发器是一种数字逻辑电路,广泛应用于各种电子设备和系统。它具有两个工作状态:稳定状态和暂态状态。 单稳态触发器的工作原理 单稳态触发器是一种具有两个稳定状态的触发器,其中一
    的头像 发表于 08-22 10:11 ?1238次阅读