Document-level Sentiment Inference with Social, Faction, and Discourse Context
Eunsol Choi, Hannah Rashkin, Luke Zettlemoyer, Yejin Choi
UW-Seattle
Introduction
文档级别的感情推导。
Document-level Sentiment Model
给定一个文档$$d$$,和一系列已知的实体$$e_1,...,e_n$$。
使用了两个基本的模型:一个是pairwise sentiment classifier,一个是pattern-based faction extractor。ILP解决的目标是最大化:
$$F=\psi{social} + \psi{fact} + \sumi \sum_j \psi{ij}$$。
其中$$\psi{ij}$$是pairwise potentials。$$\psi{ij} = \phi{pos{ij}} \cdot pos{ij} + \phi{neg{ij}} \cdot neg{ij} + \phi{neu{ij}} \cdot neu_{ij}$$。
包含了情感分类器的结果$$(\phi{pos}, \phi{neg}, \phi{neu})$$,和binary变量$$pos{ij}, neu{ij}, neg{ij}$$。比如,$$neg_{ij}=1$$就表示i对j有负面态度。
Inference with factions
soft ILP限制$$\psi_{fact}$$是模拟一般互相支持的实体会对其他实体有类似的情感。公式定义:
$$\psi{fact} = \sum_i \sum_j ( \alpha{iteself} \cdot itself{ij} + \sum_k (\alpha{fact} \cdot ( tie_same{ijk} - tie_diff{ijk}) ) )$$
这个公式可以预测不明显的情感分析,通过联合考虑了事实和情感关系。
Inference with sentiment relations
根据Social balance theory,动态的情感分析是一个人际之间的网络。尤其是在平衡的状态下,在一个positive term中的实体会对其他实体有类似的观点,而在negative term中的实体就会有相反的观点。引入一系列变量来获取这类关系:
假设$$e_i$$对$$e_j$$是pos的:
- $$pos_same{ijk} = pos{ij} \bigwedge pos{ik} \bigwedge pos{jk} + neg{ij} \bigwedge neg{ik} \bigwedge neg_{jk}$$
- $$pos_diff{ijk} = pos{ij} \bigwedge neg{ik} \bigwedge pos{jk} + neg{ij} \bigwedge pos{ik} \bigwedge neg_{jk}$$
那么就有:
$$\psi{bl} = \sum_i \sum_j \sum_k ( \alpha{bl} \cdot (pos_same{ijk} + neg_diff{ijk} ) + \alpha{bad{bl}} \cdot (pos_diff{ijk} + neg_same{ijk}) )$$
最后将$$\psi{bl}$$加到$$\psi{social}$$上。
再考虑一个相互作用的限制:
$$ r_same{ij} = pos{ij} \bigwedge pos{ji} + neg{ij} \bigwedge neg{ji}\ r_diff{ij} = pos{ij} \bigwedge neg{ji} + neg{ij} \bigwedge pos{ji}\ \psir = \sum_i \sum_j \alpha_r(r_same{ij}) + \alpha{bad_r}(r_diff{ij})
$$
再把$$\psi{r}$$加到$$\psi{social}$$上。
Appendix
有一个很有意思的展示。