A Dependency-Based Neural Network for Relation Classification（DepNN，2015）论文阅读笔记 - 为之网

C/C++教程

A Dependency-Based Neural Network for Relation Classification（DepNN，2015）论文阅读笔记

本文主要是介绍A Dependency-Based Neural Network for Relation Classification（DepNN，2015）论文阅读笔记，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

一、背景

SVM（2010）
MV-RNN（2012）
CNN（2014）
FCM（2014）
DT-RNN（2014）
DT-RNN使用RNN建模依赖树后，通过线性组合的方式将节点的词嵌入与其子节点的词嵌入结合起来。而本文则是利用子树结合词嵌入，再使用CNN捕捉特征，F1值大幅提高。

以往的关系分类研究已经验证了使用依赖最短路径或子树进行关系分类的有效性。二者具有不同的功能。本文提出了一种新的结构：Augmented Dependency Path（ADP，增强依赖路径），将两个实体间的最短依赖路径和与最短依赖路径相连的子树结合起来：使用递归神经网络建模子树，将生成的依赖子树的表示附加到最短依赖路径上的单词上，从而使最短依赖路径上的单词获得新的词嵌入，然后使用卷积神经网络捕捉最短依赖路径上的关键特征。

传统的依赖解析树：

本文提出的ADP结构：

加粗部分为句子的最短依赖路径。从图二中可以看出，具有相似最短依赖路径的两个句子却具有不同的relation，表明只使用最短依赖路径具有局限性，同时使用子树后则可以辨别两者的区别。

二、模型

在这里插入图片描述

1.词嵌入

首先，句子中的每个word和最短依赖路径中的每个dependency relation都被映射成向量x_w，x_r，二者维度相同

在这里插入图片描述
2.使用RNN对依赖子树进行建模

对于最短依赖路径中的每个word，使用一个递归神经网络，从其叶节点到根节点（即这个word本身），自上而下地生成一个subtree embedding： c_w

在这里插入图片描述
如果一个词是根节点，将其subtree embedding表示为c_LEAF。

每对父节点与子节点之间都存在一个依赖关系r，设置一个变换矩阵W_r，在训练过程中学习

在这里插入图片描述

从而得到 **c_w**的计算公式：

在这里插入图片描述
其中R_（w,q）表示词w和其子节点词q之间的依赖关系。

计算过程举例可以参考帖子：https://blog.csdn.net/appleml/article/details/78778555

3.使用CNN对最短依赖路径进行建模

经上述步骤后，我们得到了最短依赖路径上的word的表示p_q（维度为dim+dim_c）和dependency relation的表示x_r（维度为dim）

在这里插入图片描述
应用window processing，当窗口大小k=3时，得到的n个窗口表示为（n为句子长度）：

在这里插入图片描述
s表示start，e表示end

将每个窗口内的k个向量拼接，得到

在这里插入图片描述
n_w是窗口内word的个数，X_i 表示第i个窗口的拼接向量

随后设置一个含有l个卷积核的filter：
在这里插入图片描述
将filter应用于每一个窗口X_i ，得到

在这里插入图片描述

最后应用一个最大池化操作：

在这里插入图片描述
L是一个l维向量，与句子长度n无关

4.分类

可以对L添加一些外部特征（如NER和WordNet上义词）：

在这里插入图片描述

经过一个全连接层后，送入softmax分类器分类：

在这里插入图片描述

采用交叉熵损失，反向传播训练。

依赖树生成采用：Stanford Parser (Klein and Manning, 2003) with the collapsed option.

三、实验结果

在这里插入图片描述

待解决的疑问：

1.dependency relation的嵌入**x_r**是预先训练好的还是随机初始化的？
2.本文中的最短依赖路径相当短（甚至只有3个词），而SDP-LSTM（2015）中的最短依赖路径却比较长（也许是使用了不同版本的Stanford parser？？？）

这篇关于A Dependency-Based Neural Network for Relation Classification（DepNN，2015）论文阅读笔记的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

您可能喜欢

栏目导航

前端开发

HTML5教程

CSS教程

Javascript

jQuery教程

AJAX教程

Node.js教程

XML教程

正则表达式

后端开发

Go教程

C/C++教程

消息队列MQ

Net Core教程

Asp.net教程

Java教程

PHP教程

移动端开发

微信公众号开发

小程序开发

Swift教程

IOS教程

Kotlin教程

Android开发

数据库

Redis教程

MongoDB教程

PostgreSQL教程

Oracle教程

MariaDB教程

SqLite教程

MySql教程

SqlServer教程

服务器运维

Kubernetes

Docker容器

linux shell

Nginx教程

网站安全

PowerShell教程

Linux教程

人工智能

TensorFlow教程

Python教程

机器学习

人工智能学习

区块链

区块链技术

游戏开发

游戏编程

Unity3D教程

网站运营

网站策划

网站优化

建站知识

大数据/云计算

云计算

Hadoop教程

软件工程

软件/开发工具使用

Git教程

资讯