「论文笔记」Named Entity Recognition as Dependency Parsing

用仿射模型识别嵌套实体

ZingLix July 29, 2020 ACL 2020

文章主要想要解决的是存在嵌套实体的情况,提出了使用依存分析中经常使用的仿射模型进行识别。在嵌套和非嵌套的识别任务中都能取得了 SoTA 的表现。

文中将每个 token 用 BERT 和 fastText 进行 embedding,拼接上用 CNN 编码的字符级别向量,送入一个双向 LSTM 编码上下文信息,获得每个词的表达。之后采用两个独立的 FFNN 来得到作为实体开始和结束的位置的表达。

最后用一个仿射模型得到一个 \(l \times l \times c\) 的 tensor,其中 l 是句子长度,c 是实体类别数量加一(表示无实体)。运用该矩阵,文中对于嵌套和非嵌套采用了两种不同的策略,从而得到了实体的起止位置。

文中出现任何错误或者对于论文内容想要进行探讨,可以在网页最下方找到联系方式邮件联系我,共同学习进步 :smirk:

论文来源:Yu J, Bohnet B, Poesio M. Named Entity Recognition as Dependency Parsing[J]. arXiv preprint arXiv:2005.07150, 2020.