Deep Multitask Learning for Semantic Dependency Parsing

Hao Peng, Sam Thomson, Noah A. Smith

Intro

带上标记的有向图能够自然地表达语法。但是full semantic graphs要标记的话会非常贵，从而使得学习困难。

这里第一次将Semantic Dependency Parsing(SDP)作为试验台，并考虑multi-task训练。

这篇paper引入了一个新的系统，能够分别独立的将每一个formalism进行解析。使用bidirectional-LSTM加上multi-layer perceptron来对边（arc）进行评分，并进行预测。

然后展示两种multitask变形，能够隐含地将不同formalism之间进行建模。

Broad-Coverage Semantic Dependency Parsing(SDP)

大致集中在三种semantic formalisms，每一个formalism的标记都是双方向的词汇关系（比如及物动词的主宾）。这三种formalism从不同的语言习惯中来，但是都为了抓住单词间predicate-argument关系。

semantic dependency更像是semantic role labeling或者是abstract meaning representation。形式上，就如图一，将每一个句子当作有向图，句子中的单词就好比是token。将semantic dependency表示成有向图有这么几个好处：

更容易parsing
表示更加自然，每一个单词/token可以是不知一个谓词的参数
提供了一中whole-sentence analysis
与syntactic tree相比，有更高level的nonprojectivity

预处理，将有环的图去掉，保证剩余的都是DAG。

formalism（形式化）：考虑三种形式化

DM(Delph-in MRS) 表达方式来自于DeepBank，是人工纠正的parse。来自于LinGO English Resource Grammar。
PAS(Predicate-Argument Structures) 表达方式来自于Enju Treebank，包含了来自于Enju HPSG parsser的自动parse。
PSD(Prague Semantic Dependencies) 表达方式来自于Prague Czech-English Dependency Treebank。

三个里面，PAS最贴近语法，而且最容易预测。PSD的标签最多，相应parser在上面的性能偏差。

Single-Task SDP

basic model，每一个形式化的training和prediction都是独立的。

问题定义：每一个arc的标签都来自于一个已经定义好的集合$$\mathcal{L}$$，表示两个点之间的语法关系。给定一个句子$$x$$，$$\mathcal{Y}(x)$$是可能的semantic graphs集合。优化一个score function：

$$\hat y = arg\,max S(x,y), \,y \in \mathcal{Y}$$

将score function进行分解成每一个local structures/parts $$p$$：

$$S(x,y) = \sum s(p)$$

因为会搜索所有可能的图像，所以这个方法叫做graph-based（或者all-pairs） method。

Multi-Task SDP

用$$t\in \mathcal{T}$$来分别不同的formalism tasks，$$\mathcal{T} = { DM, PAS, PSD }$$。现在的任务就是已知输入的句子，分辨出三个图。

Appendix

使用BiLSTM对图进行分解。

Deep Multitask Learning for Semantic Dependency Parsing

Deep Multitask Learning for Semantic Dependency Parsing