论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution

摘要:
对于循环单元,它的灵感来自于特定于核心的GRU。更新方法如下:Ct是衡量当前令牌在内存网络中重要性的门。对于内存单元,它是一个标量集合,这意味着在标记处更新或重新创建实体。从结果来看,实验效果相当好。从实验结果来看,改进比较明显。但它也提醒我们,未来的工作可以与大规模预训练的一些模型和方法相结合。

论文地址:https://arxiv.org/abs/1902.01541

 

已有的研究工作:

本文关注的是文献的实体解析问题,当前的state-of-art是mention-pair模型,但是该方法在计算和标记数据方面的成本都比较高。

 

本文的工作和创新点

本文提出了一种以增量方式处理文本、动态解析引用的模型,是一种在线学习方法。

 

研究方法:

工作原理:

自左向右地读取文本,在一个固定大小的工作内存中存储实体,当遇到每个token时,有三种选择:将该token链接到现有的内存中,从而创建一个共同的指代链接;存储一个新的实体,覆盖到现有的内存中;忽视这个token并且继续向前阅读。下图显示的是具有两个内存单元的模型的工作示意。

 论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution第1张

模型简介:

对于一个给定的文档,在两个层级上表示文本,分别是token级别和entity级别。模型包括两个组件,分别是存储单元,用于存储和跟踪文本中实体的状态;循环单元,通过一组门来控制记忆。下图是模型的概述。

 论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution第2张

对于循环单元,它的灵感来源于Coreferential-GRU。使用外部存储单元来跟踪实体,让模型学习在每个单元中存储什么,而不是依赖于参照结构来构建动态计算图。其更新方式如下:

 论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution第3张

 论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution第4张

Ct也就是衡量当前token在记忆网络中重要性的一个门。

对于内存单元,它是一个标量的集合,表示的是在某个token处更新或重新某个实体。

实验部分:

实验在GAP数据集上进行,任务是在文本中正确跟踪实体引用的能力。从结果来看,实验所取得的效果相当好。

论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution第5张

 

评价:

本文做的是文档中实体解析的问题,也就是在本文中正确地跟踪引用的实体。从实验结果来看,提升还是比较明显的。尤其在使用BERT建模的方法取得的提升相当明显,然而BERT的建模是双向的,利用了未来的信息,因此并不能说是纯粹的以增量的方式来更新。但也提醒,未来的工作可以与大规模预训练的一些模型和方法相结合。

免责声明:文章转载自《论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇vue中选择图片,预览图片,返回base64网易云课堂js学习笔记下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

随便看看

react 中echarts-for-react使用 自适应div

import*asReactfrom'react'importReactEchartsfrom'charts-for-ract'导出接口IProps{}接口IState{}classCapitalBudgetsextendsReact.Component<IProps,IState>{constructor(props:IProps){super(props...

选包

安装系统后,将不会安装一些基本工具。此时,您可以根据yum的要求安装它们。你也可以使用任何你想要的时尚。...

FoxMail 7.2的邮件存储目录修改

在FoxMail升级到7.x之后,邮件的存储路径和策略也发生了变化。许多朋友想更改FoxMail 7.2邮件的位置,因为他们担心重新安装系统时会占用磁盘C上的空间或丢失邮件。但是,FoxMail设置界面中没有提供相应的功能。我们该怎么办?同样,如果您想将邮件存储在磁盘D上,则需要执行以下操作:1.退出运行FoxMail,而不重新安装它。...

DNSmasq架设简单DNS服务器

DNSmasq是一个轻量级且易于使用的DNS服务工具。当连接到内联网和互联网时,它可以用于IP地址的NAT转换,或者用作小型网络的DNS服务。默认值为5,最大值为100。...

Linux下如何确认磁盘是否为SSD

方法1:通过cat/sys/block/sda/queue/rotative查看/sys/block/sda/queet/rotative,返回值0为SSD;返回1表示HDD。方法2:通过lsscsi[root@ssd-testthatsit]#cat/sys/bl...

通过 java的 esl 连接 freeswitch

--所有ip都能通过esl连接到freeswitch--˃4.reloadmod_event_socket5.通过java的esl连接fs服务器三、报错[WARNING]mod_event_socket.c:2641IPx.x.x.xRejectedbyacl"loopback.auto"四、以前版本按照步骤二操作完就可以了,现在报错了。世界变化的太快。--...