0

0

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

WBOY

WBOY

发布时间:2023-12-14 20:04:20

|

608人浏览过

|

来源于51CTO.COM

转载

化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。

近日,来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。

受到有机化学机制的启发,研究人员开发了一种新的预训练框架,使其能够将归纳偏差纳入模型中。这个提出的框架在执行具有挑战性的下游任务时取得了最先进的结果。通过掌握化学知识,该框架克服了目前依赖少量反应模板的分子生成模型的局限性。在大量的实验中,该模型生成了高质量的可合成药物样结构

总的来说,该研究向各种基于反应的应用程序的大规模深度学习框架迈出了重要一步。

该研究以《Bridging the gap between chemical reaction pretraining and conditional molecule generation with a unified model》为题,于 2023 年 12 月 5 日发布在《Nature Machine Intelligence》上。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

论文链接:https://www.nature.com/articles/s42256-023-00764-9

深度学习模型已经在许多科学研究领域得到广泛应用。预训练框架对于新任务的无缝集成起到了积极作用,可以加快建模过程,特别是在标记数据有限的情况下

药物设计和有机化学研究的基础是化学反应。目前,数据挖掘的研究和应用已经使得深度学习模型可以用于化学反应。基于这些数据,已经有许多数据驱动的研究深入研究化学反应的表征学习

表征学习是指从数据中自动学习有用的特征,然后将其用于各种下游任务。现有方法忽略了有机化学的基本理论,限制了其性能。

基于化学反应的分子生成

除了反应分类任务外,基于化学反应的分子生成也是一个重要的应用。在早期的研究中,通常采用基于模板的逐步分子生成策略

这些基于模板的方法在很大程度上依赖于预定义的构建模块和反应,这缩小了可访问的化学空间。在反应产物预测领域也发现了类似的趋势,其中基于模板的方法不能外推到复杂的反应;这个问题可以通过使用无模板方法来解决。

在基于反应的分子生成任务中,无模板方法也表现出了优于基于模板方法的泛化优势。然而,现有的无模板分子生成方法只能基于预定义的反应物库生成分子。除此之外,对于药物设计中的先导化合物或先导化合物优化阶段,利用化学反应作为编辑工具来修改给定的结构是更有利的。生成的化学库将重点关注可以用更少的反应步骤合成的化学空间的子集。

一个新、全面的化学反应深度学习框架

在此,研究人员提出了一个新的、全面的化学反应深度学习框架,称为 Uni-RXN。旨在解决两个基本任务:自监督表征学习和条件生成建模。

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

展示:Uni-RXN的组成和方法。(引自:论文)

与现有方法不同,研究人员提出了一套专门针对化学反应精心设计的自监督任务。这些任务包括反应中心预测、主反应物与子反应物配对以及反应物-产物配对。在对具有挑战性的反应任务的广泛评估中,Uni-RXN 方法超越了最先进的水平,证明了其有效捕获化学反应领域知识的能力。所获得的有希望的结果为广泛的下游应用铺平了道路

通过有效捕获化学规则,Uni-RXN 非常适合生成任务。与依赖于从预定义反应物库中选择片段的传统方法不同,Uni-RXN 将分子结构作为输入条件并生成相应反应物的表示,同时保持反应内的排列不变性。利用密集向量相似性搜索包的强大功能,Uni-RXN 能够从大型反应物和试剂库中高效检索反应物。随后,采用反应预测模型来生成产物输出。

与仅探索化学空间的有限子集的基于模板的方法相比,Uni-RXN 在生成更广泛的可合成药物样结构方面表现出卓越的性能。这一特点使其特别适合虚拟 library 枚举,并得到全面统计分析和案例研究的支持。

Uni-RXN 方法有许多优势,可以为具有挑战性的化学反应分类任务生成丰富的表达。相对于其他基线模型,Uni-RXN 在每类仅提供 4 个数据点的情况下,准确率达到了 58.7%

重写后的内容:化学反应分类的准确度见表1。(来源:论文)

TapNow
TapNow

新一代AI视觉创作引擎

下载

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

Transformer 模型可以被用来区分优化和未优化的化学反应数据。此外,编码器也可以轻松应用于结构条件的生成

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

需要重新改写的内容是:图表展示了Uni-RXN的检索性能和注意力权重。(来源:论文)

研究结果强调了所提出的模型所生成的分子具有有利的特性,这使得它们非常适合于药物发现任务。该模型可以生成更多具有类似药物特性和可合成性的分子

北大&望石智慧提出全新模型:弥合化学反应预训练与条件分子生成之间的鸿沟!

图示:Uni-RXNGen 流程与性能。(来源:论文)

与分子对接等虚拟筛选方法相结合,该生成模型可以实现高效的构效关系研究。该模型生成的巨大的可合成类药物化学空间可以提高药物再利用或命中分子搜索的真阳性率。

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1932

2024.08.16

Java 项目构建与依赖管理(Maven / Gradle)
Java 项目构建与依赖管理(Maven / Gradle)

本专题系统讲解 Java 项目构建与依赖管理的完整体系,重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例,帮助学习者掌握 从零搭建、维护到发布 Java 工程的标准化流程,提升在实际团队开发中的工程能力与协作效率。

4

2026.01.12

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

99

2026.01.09

c++框架学习教程汇总
c++框架学习教程汇总

本专题整合了c++框架学习教程汇总,阅读专题下面的文章了解更多详细内容。

55

2026.01.09

学python好用的网站推荐
学python好用的网站推荐

本专题整合了python学习教程汇总,阅读专题下面的文章了解更多详细内容。

139

2026.01.09

学python网站汇总
学python网站汇总

本专题整合了学python网站汇总,阅读专题下面的文章了解更多详细内容。

12

2026.01.09

python学习网站
python学习网站

本专题整合了python学习相关推荐汇总,阅读专题下面的文章了解更多详细内容。

19

2026.01.09

俄罗斯手机浏览器地址汇总
俄罗斯手机浏览器地址汇总

汇总俄罗斯Yandex手机浏览器官方网址入口,涵盖国际版与俄语版,适配移动端访问,一键直达搜索、地图、新闻等核心服务。

85

2026.01.09

漫蛙稳定版地址大全
漫蛙稳定版地址大全

漫蛙稳定版地址大全汇总最新可用入口,包含漫蛙manwa漫画防走失官网链接,确保用户随时畅读海量正版漫画资源,建议收藏备用,避免因域名变动无法访问。

444

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Django 教程
Django 教程

共28课时 | 3万人学习

Go 教程
Go 教程

共32课时 | 3.6万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 2.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号