清华大学智能产业研究院(air)兰艳艳教授携手生命科学学院与化学系科研团队,成功构建了ai赋能的超高通量药物虚拟筛选平台——drugclip。该成果以《深度对比学习赋能基因组尺度药物虚拟筛选》(deep contrastive learning enables genome-wide virtual screening)为题,于国际顶级期刊《科学》(science)在线发表。
当前药物研发中,靶向治疗药物仅作用于人类可成药靶点中约10%的范围。面对数以万计尚未被充分探索的潜在靶标,如何在浩瀚的化学空间中高效识别具有潜力的苗头化合物,已成为制约新药开发的核心瓶颈。
据研究介绍,DrugCLIP相较传统虚拟筛选方法,计算速度提升达百万倍级,同时在预测精度方面亦实现跨越式进步。依托该平台,团队首次实现了覆盖全人类基因组范围的系统性药物虚拟筛选,为原创性药物发现开辟了全新路径。
DrugCLIP首次实现了从蛋白质三维结构预测到候选药物识别的端到端贯通,真正达成基因组尺度的全景式虚拟筛选。
硬件部署层面,仅需配备128核中央处理器(CPU)与8张图形处理器(GPU)的单计算节点,DrugCLIP即可完成每日万亿量级蛋白口袋-小分子对的打分任务。其核心技术突破在于:将传统依赖物理力场的分子对接过程,重构为蛋白口袋表征与小分子表征在统一向量空间中的高效语义匹配,从而在保持高精度的同时,将运算效率提升百万倍。

借助DrugCLIP平台,研究团队首次完成了面向人类全基因组的规模化药物虚拟筛选。整个流程涵盖约1万个蛋白质靶标、2万个蛋白结合口袋,并对超过5亿个类药性小分子展开系统评估,最终成功富集出逾200万个具备潜在生物活性的候选分子。由此构建的蛋白-配体互作筛选数据库,是目前全球已公开的最大规模同类资源库,现已向全球科研界免费开放共享。
源码地址:点击下载










