Hierarchical Generation of Molecular Graphs using Structural Motifs

Hierarchical Generation of Molecular Graphs using Structural Motifs

Intro

提出了motif-based hierarchical encoder-decoder,能够针对大型的graph generation。在graph generation中,molecules是一步步将motifs attach起来。

Background and Motivation

前面的autoregressive model可以分作两类:

  • atom-based methods:atom by atom生成molecule
  • structure-based methods:通过生成substructure(符合ring和bond的限制),来生成molecule
  • 找到bridge bond,这个bond的两个node的度都大于等于2,且都属于ring。将bridge解开。
  • 将剩下的subgraph。若其出现的次数超过100,则作为graph motif。
  • 如果subgraph没有作为graph motif,那么就将其继续降解为ring和bond。

Hierarchical Graph Generation

有一个hierarchical decoder和一个matching encoder。

attachment定义为 $$A_i = { v_j | v_j \in \bigcup_k Si \cap Sk }$$,表示为每一个atom是如何与其neighbor motifs连接。

我们提出了一个auto-regressive factorization。

$$P(G) = \intz P(z) \prod_k P(S_k, A_k | S{1,2,...k-1}, A_{1,2,...k-1}, z) dz$$

  1. Motif layer: motif在图中是如何松散地链接。
  2. Attachment layer: motif之间的连接,通过引入了attachment。
  3. Atom layer: atom是如何连接的。

Appendix

根据motif,就是一个个小的substructure

results matching ""

    No results matching ""