Convolutional Networks on Graphs for Learning Molecular Fingerprints

Convolutional Networks on Graphs for Learning Molecular Fingerprints

David Duvenaud, Dougal Maclaurin, etc.

Harvard

Intro

提出了一种新的特征方式 Neural FPs

Creating a differentiable fingerprint

  1. 将hashing操作改为single layer of network。
  2. circular fingerprint使用index方法,将所有node的feature vector变成一个fingerprint。每一个node根据哈希之后的index,将对应位置的fingerprint bit设置为1。我们使用softmax来模拟这一步操作。这类似CNN中的pooling操作。从而给了我们fingerprint。
  3. Canonicalization指的是,在circular fingerprint中,不论我们如何传递进去atom和neighborhood,产生的fingerprint是固定不变的。我们这里就用了一个固定的sorting规则,对于任意一种permutation都会给出固定顺序规则之后的结果。另外替代方案就是求和。

Experiments

跑实验,奇特的是用了tanimoto作为similarity,并且仅仅使用了MSE作为衡量的标准。

Appendix

代码

有一些疑问。比如简单的直接看第二层layer,是否真的能够成功表示这些bond?这是非常直观的结果,觉得可以尝试一下。

还有一个缺点是基于SMILES,并非基于纯正的molecular graph。

results matching ""

    No results matching ""