Modeling polypharmacy side effects with graph convolutional networks

Modeling polypharmacy side effects with graph convolutional networks

Marinka Zitnik, etc.

Stanford

Intro

这篇work是测试polypharmacy, i.e., drug combinations;药物组合的反应。

提出了解决方案,Decagon,multimodal graph

  1. protein-protein interaction
  2. drug-protein target interaction
  3. drug-drug interaction,也就是polypharmacy side effect
    • 注意这里和DDI的表现形式类似,但是和DDI的区别是放在了link prediction的角度来讨论,每一个side effect是一个edge type

Decagon用了两层multimodal graph,每个drug-drug interaction有不同的edge type,表示side effect type。之后又multirelational edge prediction model会用到这个multimodal graph。

有两个发现

  1. co-prescribed drugs更倾向于share target protein
  2. protein-protein interaction map可以帮助model drug characteristics (with common side effects)

以前的work,link prediction model,都通常有两个步骤

  1. graph feature extraction
  2. link prediction

并且两个是分开训练。而Decagon是基于graph auto-encoder的end-to-end model。

Graph convolutional Decagon approach

  • encoder 是 GCN,embedding for node feature
  • decode 是tensor factorization model,用encoder的embedding来给polypharmacy side effects建模

Graph convolutional encoder

每一个relational type是一个channel。当将relation/type考虑的时候

$$ hi^{(k+1)} = \phi \big( \sum_r \sum{j \in \mathcal{N}_r^i } c_r^{ij} W_r^{(k)} h_j^{(k)} + c_r^i h_i^{(k)} \big)

$$

$$h_i \in \mathbb{R}^{d(k)}$$是node i在第k层hidden state,而$$d(k)$$是该层的dimension。r是一个relation type,而$$W_r^{(k)}$$是根据每一个relation确定的parameter matrix。$$c_r^{ij}, c_r^i$$是normalization constant,这里我们选择$$c_r^{ij} = \frac{1}{\sqrt{|\mathcal{N}_i| |\mathcal{N}_j|}}, c_r^i = \frac{1}{\sqrt{|\mathcal{N}_i|}}$$。

$$z_i = h_i^{(k)}$$是最终的embedding。

注1:看图1,似乎他们没有区分drug-protein target interaction和drug-drug interaction的类别,仅仅区分了drug-drug interaction类别。

注2:每一个channel/interaction type/relation type对应于一个GCN。

Tensor factorization decoder

给一个triplet $$(v_i, r, v_j)$$ 进行评分。

$$ g(v_i, r, v_j) = \begin{cases} z_i^T D_r R D_r z_j & \text{both are drugs}\ z_i^T M_r z_j & \text{otherwise} \end{cases}

$$

紧跟着是一个sigmoid函数 $$p_r^{ij} = \sigma (g(v_i, r, v_j))$$

综上,Decagon模型有这么几个trainable parameters

  1. relation-type-specific neural network parameter $$W_r$$
  2. relation-type-specific parameter matrices $$M_r$$
  3. a global side-effect parameter matrix $$R$$
  4. side-effect-specific diagonal parameter matrices $$D_r$$ (这个只针对drug-drug interaction/polypharmacy side-effect)。

这里虽说实现了end-to-end model,但是会随着link种类的增多而线性增加复杂度。

注1:通过公式2,decoder部分的order invariant(即交换两个embedding)就解决了。

注2:但这里有一个问题,很多drug interaction实际上是missing,而非negative。这个在训练的时候要标记出来。(也算是semi-supervised learning)

Appendix

results matching ""

    No results matching ""