在分子靶向药物设计中,打分函数(scoring function)可以定量计算药物-靶标之间的相互作用,具有适用性好,计算速度快、精度良好等优点,广泛地应用于分子对接、虚拟筛选、从头设计等各种用途。因此,发展性能更加优良的打分函数一直是该领域中一个竞争激烈的课题。发展打分函数需要大量已知亲合性实验数据的蛋白-配体复合物样本作为知识基础。但是这样的知识散布在海量的文献中,无法被研究者有效地利用。另外,人们往往更关注研究理论方法本身,而对收集支持理论研究的相关数据缺乏热情。“巧妇难为无米之炊”,这种局面在很大程度上制约了理论方法的进一步发展。
我室王任小研究员课题组多年来对蛋白-配体相互作用打分函数有系统的研究。他们敏锐地抓住了这一瓶颈问题,投入极大的精力构建了PDBbind-CN数据库,致力于系统地收集Protein Data Bank数据库中各类生物大分子复合物的亲合性实验数据(Bioinformatics,2015; 31(3), 405-412)。他们逐步发展了一套程序流程,能够以比较高的准确率从整个PDB数据库中辨别出各种类型复合物,并人工查阅了大量的原始文献,收集实验测定的亲合性数据,并将这些复合物的三维结构信息和它们的亲合性数据整合在一个可以通过Web界面访问的数据库中(http://www.pdbbind-cn.org/)。自2007年公开发布以来,该课题组每年定期对PDBbind-CN数据库进行更新,数据量每年增长幅度超过10%(见下表)。迄今累计已经查阅了近30000篇原始文献,最新的2016版本中收录了16179种复合物的亲合性实验数据和三维结构信息。
表1、PDBbind-CN数据库历年版本的简要情况
PDBbind-CN数据库是国际上首例系统地归纳PDB数据库中复合物结构信息和亲合性实验数据的数据库,为打分函数研究提供了丰富的素材,一举打破了该领域中曾经存在的瓶颈。就数据库的规模、数据的质量以及更新的及时性而言,PDBbind-CN数据库均明显优于竞争对手,是我国科学家在药物分子设计领域中取得的一项标志性成果。该数据库提供的高质量信息在国际上得到了大量的应用,不仅服务于打分函数研究,也被广泛地应用于药物构效关系分析、药物-靶标作用网络等研究。该数据库目前拥有来自60多个国家的3600余名注册用户,其中许多来自国际一流大学、研究机构以及医药公司。网站访问总量已超过470万次,而且在持续快速增长中。根据我们的文献调研,国内外已有190余项应用PDBbind-CN数据库进行的各种研究得以公开发表。
近日,王任小研究员受美国化学会Accounts of Chemical Research杂志邀请,撰写文章介绍了这部分工作。该文章已经在线发表:Liu, Zhihai; Su, Minyi; Han, Li; Liu, Jie; Yang, Qifan; Li, Yan; Wang, Renxiao *, "Forging the Basis of Scoring Function Development", Accounts of Chemical Research, 2017, DOI: 10.1021/acs.accounts.6b00491
上述研究工作得到国家重大科学研究计划、中国科学院战略性先导科技专项、国家自然科学基金委、生命有机化学国家重点实验室及中国科学院上海有机化学研究所的大力支持与资助。
附件下载: