摘要:
本文讨论了计算机辅助药物设计中的若干问题,仅为一家之言,供参考。
1.LBDD和SB DD方法的对应
2.LBDD和SBDD方法的整合
3.药物设计方法的层次
4.关于虚拟筛选
5.关于药物设计软件
6.CADD研究的困难
关键词:计算机辅助药物设计;讨论;CADD;LBDD;SBDD;
计算机辅助药物设计(computer-aided drugdesign,CADD)大大加快了药物发现的速度。广义的CADD泛指在信息技术在药物分子设计与开发过程中的所有应用,包含信息分析技术、数据处理过程等;而通常意义上的CADD仅指基于分子模拟(计算化学)的分子设计技术,又可分为基于受体结构的药物设计(receptor-based orstructure-based drug design, SBDD)和基于配体的药物设计(ligand-based drugdesign, LBDD)。SBDD从受体的结构和性质出发寻找可以与其特异结合的配体分子,所以也称为直接药物设计,包括基于受体结构的分子对接、活性位点分析、从头药物设计(生长或连接算法)等具体方法;LBDD根据已知活性的先导分子,构建结构-活性关系或药效基团模型,称为间接药物设计,包括定量构效关系(QSAR)、药效基团模型、受体映射、基于分子形状的叠合等具体的方法。在实际工作中,根据已知信息的多少可以选择相应的研究方法,当然已知信息越多越准确的时候,结果就越可靠。
本文结合作者从事相关工作的实践,谈一下对CADD的几点思考。
当然关于CADD本身的“有用”与“无用”的争辩,这里也就免了。(假舆马者,非利足也,而致千里;假舟楫者,非能水也,而绝江河。君子生非异也,善假於物也。(《荀子·劝学》))
1.LBDD和SBDD方法的对应
虽然SBDD和LBDD两种方法有完全不同的出发点,但是二者在方法学或设计思想上存在细微而有趣的对应关系。任伟同学将我在《药物设计概论》课程中的这个观点整理成了一篇论文——《基于配体和受体的药物设计方法的对应性》,发表在《生命科学仪器》(2009,7:19)上。在这里将这一对应简单整理如下表,供感兴趣的朋友参考:
Table1 Corresponding of receptor andligand based drug design methods
表1 基于受体和配体药物设计方法的对应
SBDDexample | LBDDexample | ||
Gridbased Step sized orrandom placed | Atomicprobe | Grid | CoMFA,COMSIA, SOMFA, MFA |
Fragment probe | MCSS,MFS | TopomaCoMFA | |
Docking | Traditional docking DOCK,FlexX, GOLD,AutoDock,FRED, SurflexDock,Glide | Reversed docking RT-Dock | |
FeatureBased | Pharmacophore based on protein Or Feature based protein sitesimilarity/classfication | Pharmacophore DISCO,Catalyst | |
Fragment based | Fragment searching Ludi,MFS, MCSS | Legend,HQSAR, TopmaCoMFA, Scafflod hopping, Fragment basedsimilarity, | |
Alignment or superimpose | Structure or sequence based proteinalignment | Corestructure, pharmacophore or field based alignment | |
Knowledge based | Target like Active site like Protein diversity universe | Drug like Lead Like Diversity | |
Similarity ordrug-target network | Protein similaritylandscape | SAR-MAP and Chemical spaceanalysis | |
Hypothetical model | Initial design | Hypothetical receptor model HASL |
下面的思维导图也供参考:
药物设计中SBDD和LBDD的对应甚至可以体现在整体水平上——蛋白质设计与改造vs. 配基设计。药物设计是根据蛋白质的结构设计小分子配体,蛋白质设计是设计或改造基因序列,使表达后的蛋白具有特定的功能(如结合或催化底物),二者都是基于分子之间的相互作用。蛋白质改性、设计是一个十分重要并充满挑战的领域,并有可能藉此推动生命起源研究的发展。在蛋白设计发展到一定阶段说不定会出现潜在活性的蛋白库(虚拟的或者实体商品库)。到那时,将会出现与现在配体库的分析相对应的蛋白质的定量结构功能关系、蛋白商品库的多样性分析、生物相关性、稳定性研究等等研究方向。
可见,SBDD、LBDD这两种出发点完全不同的药物设计方法确实存在着微妙的对应关系。认识到这种对应关系不仅为药物设计方法的发展研究提供了素材,而且更为重要的是为今后药物设计方法的创新提供了重要的提示。例如,可以根据某种SDBB方法设计对应的LBDD方法,反之亦然。这为今后的药物设计方法的开发指出了一个捷径。
2.LBDD和SBDD方法的整合
SBDD以锁匙模型为基础,寻找可以与靶标结合的配体分子;而SBDD以相似性原理为基础,寻找与已知抑制剂具有潜在相同作用方式的配体分子。SBDD结果准确,可直接预测结合能,缺点是需要受体结构,速度慢;LBDD速度快,无需蛋白结构,但是有时由于缺乏具体结合方式的指导,结果外推时常常误差很大。这两种方法、理论是独立发展,各有其适用条件和利弊的。同时,这两类方法也是紧密联系的,将两种方法结合使用,特别是基于分子对接的三维定量构效关系研究(CoMFA based onDocking)常见于报道。以下是部分相关的文献:
lAn Integrated Approach toLigand- and Structure-Based Drug Design: Development andApplication to a Series of Serine Protease Inhibitors. J. Chem. Inf. Model.2008, 48, 1211–1226
lCombining Structure-Based DrugDesign and Pharmacophores. Journal of MolecularGraphics and Modelling 23 (2005) 439–446
lPseudoreceptor models in drugdesign: bridging ligand- and receptor-based virtual screening.NRDD, 2008,7:667
lCombined Target-Based andLigand-Based Drug Design Approach as a Tool To Define a Novel3D-Pharmacophore Model of Human A3 Adenosine Receptor Antagonists:Pyrazolo[4,3-e]1,2,4-triazolo[1,5-c]pyrimidine Derivatives as a KeyStudyJ. Med. Chem. 2005, 48, 152-162
lComparison of Ligand-Based andReceptor-Based Virtual Screening of HIV Entry Inhibitors for theCXCR4 and CCR5 Receptors Using 3D Ligand Shape Matching andLigand-Receptor Docking. J. Chem. Inf. Model., 48 (3), 509 -533,2008.
lA combined ligand-based andtarget-based drug design approach for G-protein coupled receptors:application to salvinorin A, a selective kappa opioid receptoragonist. J Comput Aided Mol Des (2006) 20:471–493
lCombining ligand-based andstructure-based drug design in the virtual screening arena. EODDJanuary 2007, Vol. 2, No. 1, Pages 37-49
LBDD和SBDD方法整合的趋势也体现在数据库的设计上,不仅大分子数据库加入了抑制剂等配基的信息,将小分子数据库中加入活性数据(PubChem,ChemBL,DrugBank)上,而且在系统生物学的高度上,将大小分子信息整合为一个生物代谢调控的网络,并用于药物设计和生物基础研究。
此外,不同的LBDD或SBDD方法之间还可以相互整合,如多拷贝子结构搜寻(MCSS,in Insight II orDiscovery Studio)、多片段搜寻(MFS,inMOE)是基于片段的药物设计方法和基于格点的药物设计方法的整合。基于药效团的QSAR是LBDD中内部结合使用的例子。现在将两种方法结合使用的趋势越来越受到重视。
下图仅供参考:
3.药物设计方法的层次
Grid是一个很有特色的方法,DDT上有一篇论文对此进行了讨论,S. Cross, G. Cruciani,Drug Discov Today 2010, 15(1-2), 23-32。我们都知道ComFA是用探针对小分子进行格点扫描。Grid软件是用格点方法扫描大分子。不过,用于蛋白质活性口袋的表征时,GRID软件不仅使用原子探针(如碳正离子),还使用分子片段探针(羟基、氨基、羧基、苯环等),甚至允许使用整个分子作为探针(类似于分子对接)。(多原子探针的方法还应用在Accelrys公司的Ludi、MCSS、CGC公司的MOE中MultiFragmentSearch(MFS)等模块上,但是它们都允许这些小分子片段运动/优化其位置。)
可见,药物设计分析方法存在着层次差异:
l电子:量化计算得到的静电势、电子云密度,轨道信息
l亚原子:Grid探针的点阵扫描
l原子:原子生长法,基于原子类型的LogP、MR计算;
l片段:片段连接法、HQSAR、骨架迁越、TopomaCoMFA、Hansch、FreeWilson
l分子:分子对接、分子描述符
相应地,我们都知道分子描述符可以分为:一维、二维、三维甚至多维;大分子的研究水平也可以分为一级序列(AA)、motif、二级结构和Fold、三级结构、结构域等水平。
//本来想花点时间,基于SBDD、LBDD的对应、整合以及药物设计层次的分类,整理出计算机辅助药物设计中QSAR、SBDD等方法的理论策略和技术发展的路线图,给出各种药物设计方法之间的联系(横向)及其发展脉络(纵向)。可是实在事情太多,而且能力有限,只好留爪在此,以后再说。
4.关于虚拟筛选
在药物设计中,大家常常会用到”虚拟筛选”这一名词,通常是指分子对接和基于药效基团的数据库搜寻。由于PDB数据库中蛋白质结构数量的快速增加,以及分子对接方法的进展,分子对接得到了全面的发展和广泛的应用,几乎成了虚拟筛选(VS)的代名词。其实,所有的CADD工作都可以看作虚拟筛选,即从众多的化合物(也包括虚拟的化合物)中得到活性的化合物。无论是分子对接、QSAR、药效基团、分子相似性筛选、三维结构叠合、分子骨架拆分等等都是虚拟筛选的途径。VS是目的,不是方法,CADD =VS。所有的SBDD都是基于互补的筛选,而所有的LBDD方法是基于相似性的筛选。各种筛选方法有不同的条件限制和速度,应采用先粗筛、再精筛的策略,在有限的时间内完成先导化合物的发现。
5.关于药物设计软件
药物设计中最重要的是人的经验,特别是药物化学、药理学基础知识的经验,而不全是软件的优劣。相同的软件在不同的学者手中发挥的作用是不同的。CADD离不开软件,一个软件就是一种思维方式、问题求解思路的体现。从这个意义上讲,尽管各种对接软件采用不同的搜索算法、结合能力评价方式,但是所有的分子对接的软件都具有相同的思想,即配体和蛋白质之间的互补。可能一个新的对接软件采用了更高效的算法、更准确的打分,解决的还是同一个问题。虽然筛选策略的创新需要技术方法的支持,但是,研究策略的创新显然比纯粹方法上的改进更有意义。
软件的学习要熟悉该软件的理论方法和应用条件,特别是软件的新思想,而不是软件的用法。随着时间的推移,软件的界面、选项、平台都有可能发生变化,仅仅是学习软件的使用方法意义不大。每个软件的力场和理论虽然有所差别,可是基本理论还是一样的,大同小异而已,只有学会软件的基本理论才能以不变应万变。因此,要注意软件背后的原理,熟悉软件的适用条件和体系。
药物设计软件正两个方向发展,一个是综合平台越来越多,所以专业综合软件的价格越来越低,从这个方面说,药物设计软件已经不是从事药物理论研究的瓶颈,几乎每一个研究所,每一个公司都可以支撑一个CADD项目组。另外一方面,单功能的药物设计软件的力量也在加强,有些甚至强大到和综合软件相抗衡的地步,如MolecularDiscovery的GRID历经多年依然年轻活力,而且衍生出一系列的应用(Volsurf等);此外,SARNavigator,Recore,Gold等软件,都是依靠其独特的算法、思路,专利的力量维持自己的发展,占据CADD软件市场一角。
药物设计软件中有免费和商业两种,对于制药公司,由于追求速度和效率,往往选择昂贵的商业软件,而对于科研用户,往往在二者之间徘徊,由于囊中羞涩,即向往于免费软件的自由,同时又觊觎商业软件操作的简便;虽然自由软件(特别是科研部门开发的软件)存在界面和操作上各种不足,但是其在应用领域的创新上,甚至是方法的创新上一直走在前列。以下是几个讨论文章:
lDrug Discov Today. 2005 Feb 1;10(3):219-22. Open-source software:not quite endsville.
lDrug Discov Today.2005 Feb 1;10(3):213-7. The case for open-source software in drugdiscovery.
lDrug Discov Today.2006 Feb;11(3-4):127-32. Optimizing the use of open-source softwareapplications in drug discovery.
lNat Rev DrugDiscov. 2006 Sep;5(9):723-9. Epub 2006 Aug 18. Can open-sourceR&D reinvigorate drug research?
关于生物信