• 使用RDkit可视化分子指纹


    我们可以假想有一个圆形的切割刀,随着半径的不同,我们可以得到许多分子的部分框架,然后按照这些框架的有无,对应的生成样子诸如0011011。。。的表达形式,这个东西就是该分子的分子指纹,如图所示。

    在Rdkit的2018.09版本的更新中,导入了新的工具rdkit.Chem.Draw。我们可以使用它来可视化morgan fingerprint等等除了Maccskey以外的分子指纹。

    首先导入我们这次使用的library(请记得把rdkit更新到最新的版本):

    import sys
    from IPython.display import SVG
    from rdkit import rdBase
    from rdkit import Chem
    from rdkit.Chem import AllChem, DataStructs
    from rdkit.Chem.Draw import DrawMorganBit, DrawMorganBits,DrawMorganEnv, IPythonConsole
    

    导入目标分子&分子指纹化

    这次选择的目标分子是多巴胺。在pubchem里查到了它的Smiles之后,让我们将它的分子式可视化:

    dopamine='C1=CC(=C(C=C1CCN)O)O'
    mol = Chem.MolFromSmiles(dopamine)
    mol
    

    可以得到多巴胺的分子式:

    给多巴胺分子式添加原子序号

    def add_atom_index(mol):
        atoms = mol.GetNumAtoms()
        for i in range( atoms ):
            mol.GetAtomWithIdx(i).SetProp(
                'molAtomMapNumber', str(mol.GetAtomWithIdx(i).GetIdx()))
        return mol
    
    # SetProp:给MOL添加新的物性信息
    # mol.SetProp('prop_name',prop_val)           str格式
    # mol.SetIntProp('prop_name',prop_val)        int格式
    # mol.SetUnsignedProp('prop_name',prop_val)   int格式 (正数)
    # mol.SetDoubleProp('prop_name',prop_val)	    # float格式
    # mol.SetBoolProp('prop_name',prop_val)	    # bool格式
    
    add_atom_index(mol)
    

    可以得到标记了原子序号的分子式:

     

    在最新的Rdkit的2018.09版本里,我们可以将Morgan fingerprint和Rdkit fingerprint两种分子指纹可视化。先将选项bitInfo设定为一个空的dict型的变数之后执行可视化。

    ECFP_bitinfo = {}
    ECFP = AllChem.GetMorganFingerprint(mol, radius=2, bitInfo=ECFP_bitinfo, useFeatures=False)
    ECFP_tuples = [(mol, bit, ECFP_bitinfo) for bit in list(ECFP_bitinfo.keys())]
    DrawMorganBits(ECFP2_tuples, molsPerRow=5, legends=list(map(str, list(ECFP2_bit_info.keys()))))
    

    结果如下:

    转自https://zhuanlan.zhihu.com/p/60796265

    欢迎各位同学学习

    python机器学习生物信息学,博主录制,2k超清
    腾讯课堂报名入口

    网易云课堂报名入口

    (腾讯课堂新营业,报名可领取20元优惠券)

    (原创课程,版权所有,项目合作QQ:231469242,微信公众号:pythonEducation)

    作者Toby:持牌照消费金融模型专家,曾任职国内最大医药数据中心数据,和重庆儿科医院,中科院教授保持慢病数据挖掘项目合作!管理过欧美日中印巴西等国外药典数据库,马丁代尔数据库,FDA溶解度数据库,临床试验数据库,WHO药物预警等数据库。

  • 相关阅读:
    【转】ArcEngine 打开AutoCAD文件的几种方法与读取CAD数据的方法
    汉字转拼音(VB版)
    ArcIMS9.2 + Web ADF for the Microsoft .NET Framework 安装配置
    【转载】有关web效率
    解决点击空链接返回页面顶部的方法
    j2se安装配置测试
    汉字转拼音(C#版)
    【转】Google 排名中的 10 个最著名的 JavaScript 库
    【转】并发危险:解决多线程代码中的 11 个常见的问题
    【转】ArcGIS 9.2中时态GIS的应用
  • 原文地址:https://www.cnblogs.com/webRobot/p/14154880.html
Copyright © 2020-2023  润新知