Hierarchical Generation of Molecular Graphs using Structural Motifs
Hierarchical Generation of Molecular Graphs using Structural Motifs
Intro
提出了motif-based hierarchical encoder-decoder,能够针对大型的graph generation。在graph generation中,molecules是一步步将motifs attach起来。
Background and Motivation
前面的autoregressive model可以分作两类:
- atom-based methods:atom by atom生成molecule
- structure-based methods:通过生成substructure(符合ring和bond的限制),来生成molecule
- 找到bridge bond,这个bond的两个node的度都大于等于2,且都属于ring。将bridge解开。
- 将剩下的subgraph。若其出现的次数超过100,则作为graph motif。
- 如果subgraph没有作为graph motif,那么就将其继续降解为ring和bond。
Hierarchical Graph Generation
有一个hierarchical decoder和一个matching encoder。
attachment定义为 $$A_i = { v_j | v_j \in \bigcup_k Si \cap Sk }$$,表示为每一个atom是如何与其neighbor motifs连接。
我们提出了一个auto-regressive factorization。
$$P(G) = \intz P(z) \prod_k P(S_k, A_k | S{1,2,...k-1}, A_{1,2,...k-1}, z) dz$$
- Motif layer: motif在图中是如何松散地链接。
- Attachment layer: motif之间的连接,通过引入了attachment。
- Atom layer: atom是如何连接的。
Appendix
根据motif,就是一个个小的substructure