Modeling polypharmacy side effects with graph convolutional networks

Marinka Zitnik, etc.

Stanford

Intro

这篇work是测试polypharmacy, i.e., drug combinations；药物组合的反应。

提出了解决方案，Decagon，multimodal graph

protein-protein interaction
drug-protein target interaction
drug-drug interaction，也就是polypharmacy side effect
- 注意这里和DDI的表现形式类似，但是和DDI的区别是放在了link prediction的角度来讨论，每一个side effect是一个edge type

Decagon用了两层multimodal graph，每个drug－drug interaction有不同的edge type，表示side effect type。之后又multirelational edge prediction model会用到这个multimodal graph。

有两个发现

co－prescribed drugs更倾向于share target protein
protein－protein interaction map可以帮助model drug characteristics （with common side effects）

以前的work，link prediction model，都通常有两个步骤

graph feature extraction
link prediction

并且两个是分开训练。而Decagon是基于graph auto-encoder的end－to－end model。

Graph convolutional Decagon approach

encoder 是 GCN，embedding for node feature
decode 是tensor factorization model，用encoder的embedding来给polypharmacy side effects建模

Graph convolutional encoder

每一个relational type是一个channel。当将relation／type考虑的时候

$$ hi^{(k+1)} = \phi \big( \sum_r \sum{j \in \mathcal{N}_r^i } c_r^{ij} W_r^{(k)} h_j^{(k)} + c_r^i h_i^{(k)} \big)

$$h_i \in \mathbb{R}^{d(k)}$$是node i在第k层hidden state，而$$d(k)$$是该层的dimension。r是一个relation type，而$$W_r^{(k)}$$是根据每一个relation确定的parameter matrix。$$c_r^{ij}, c_r^i$$是normalization constant，这里我们选择$$c_r^{ij} = \frac{1}{\sqrt{|\mathcal{N}_i| |\mathcal{N}_j|}}, c_r^i = \frac{1}{\sqrt{|\mathcal{N}_i|}}$$。

$$z_i = h_i^{(k)}$$是最终的embedding。

注1：看图1，似乎他们没有区分drug－protein target interaction和drug－drug interaction的类别，仅仅区分了drug－drug interaction类别。

注2：每一个channel／interaction type／relation type对应于一个GCN。

Tensor factorization decoder

给一个triplet $$(v_i, r, v_j)$$ 进行评分。

$$ g(v_i, r, v_j) = \begin{cases} z_i^T D_r R D_r z_j & \text{both are drugs}\ z_i^T M_r z_j & \text{otherwise} \end{cases}

紧跟着是一个sigmoid函数 $$p_r^{ij} = \sigma (g(v_i, r, v_j))$$

综上，Decagon模型有这么几个trainable parameters

relation-type-specific neural network parameter $$W_r$$
relation-type-specific parameter matrices $$M_r$$
a global side-effect parameter matrix $$R$$
side-effect-specific diagonal parameter matrices $$D_r$$ （这个只针对drug-drug interaction／polypharmacy side-effect）。

这里虽说实现了end-to-end model，但是会随着link种类的增多而线性增加复杂度。

注1：通过公式2，decoder部分的order invariant（即交换两个embedding）就解决了。

注2：但这里有一个问题，很多drug interaction实际上是missing，而非negative。这个在训练的时候要标记出来。（也算是semi-supervised learning)

Modeling polypharmacy side effects with graph convolutional networks

Modeling polypharmacy side effects with graph convolutional networks