0

0

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

WBOY

WBOY

发布时间:2024-07-11 20:04:01

|

1018人浏览过

|

来源于机器之心

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

精度媲美alphafold,epfl的ai方法从序列中匹配蛋白质互作

1. 蛋白质相互作用的重要性

蛋白质是生命的基石,参与几乎所有生物过程。了解蛋白质如何相互作用对于解释细胞功能的复杂性至关重要。

2. 新方法:配对相互作用的蛋白质序列

洛桑联邦理工学院(EPFL)的 Anne-Florence Bitbol 团队提出了一种配对相互作用的蛋白质序列的方法。该方法利用了在多个序列比对上训练的蛋白质语言模型的强大功能。

3. 方法优点

该方法对于小型数据集表现良好,并且可以通过监督方法改进蛋白质复合物的结构预测。

4. 研究成果发表

该研究以「Pairing interacting protein sequences using masked language modeling」为题,于 2024 年 6 月 24 日发布在《PNAS》。

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

蛋白质间相互作用的预测

蛋白质间的相互作用对细胞功能至关重要,它们确保了信号传导的特定性和多蛋白复合体(如分子马达或受体)的形成。预测蛋白质-蛋白质相互作用及其复合体结构是计算生物学和生物物理学中的重要课题。

尽管 AlphaFold 等深度学习方法在蛋白质单体结构预测上取得重大进展,但对于复合体结构的预测性能仍不如同单体预测,且存在异质性。AlphaFold 首先构建查询蛋白序列的同源多序列比对(MSA),而 MSA 的质量对预测准确性极为关键。

异源多聚体的配对 MSA

对于涉及多种链的蛋白质复合体(异源多聚体),配对 MSA 能提供交互伙伴间的协同进化信息,有助于推断链间接触,但构建正确配对的 MSA 是一大挑战;尤其是在真核生物中,因存在众多同源蛋白且非依赖于基因组邻近性。

协同进化方法

目前,结合基因组邻近性、近似同源性、基于系统发生的方法及协同进化策略等手段来应对这一挑战,其中协同进化方法虽数据需求大,但在优化配对和预测复合体结构方面展现出潜力,特别是通过最大化协同进化信号来匹配同源蛋白。

DiffPALM:一种可微分配对方法

火山写作
火山写作

字节跳动推出的中英文AI写作、语法纠错、智能润色工具,是一款集成创作、润色、纠错、改写、翻译等能力的中英文 AI 写作助手。

下载

EPFL 的 Anne-Florence Bitbol 团队开发了一种配对相互作用蛋白质序列的方法,该方法利用了在多序列比对 (MSA) 上训练的蛋白质语言模型的强大功能,例如 MSA Transformer 和 AlphaFold 的 EvoFormer 模块。这使它能够高度准确地理解和预测蛋白质之间的复杂相互作用。

基于这些,研究人员提出了使用基于对齐的语言模型(DiffPALM)的可微分配对,这是一种使用 MLM 预测同源词匹配的可微分方法。

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

图示:DiffPALM 在小型 HK-RR MSA 上的性能。(来源:论文)

DiffPALM 在从普遍存在的原核生物蛋白质数据集中提取的浅层 MSA 的困难基准测试中,它的表现远胜于现有的协同进化方法。当提供已知的相互作用对作为示例时,DiffPALM 性能会进一步快速提高。

基于协同进化的配对方法,主要研究蛋白质序列在紧密相互作用时如何随着时间的推移一起进化——一种蛋白质的变化可能导致其相互作用分子的变化。这是分子和细胞生物学中一个极其重要的课题,在 MSA 上训练的蛋白质语言模型可以很好地捕捉到这一点。

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

图示:使用不同配对方法的 AFM 性能。(来源:论文)

之后,该团队将 DiffPALM 应用于真核蛋白质复合物的同源物匹配难题。为此,研究人员将 DiffPALM 配对的序列作为 AFM 的输入。在测试的复合物中,使用 DiffPALM 在某些情况下可以显著改善 AFM 的结构预测。它还实现了与使用基于直系同源物的配对相媲美的性能。

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

图示:正例的影响、MSA 深度以及对另一对蛋白质家族的扩展。(来源:论文)

DiffPALM 的应用在基础蛋白质生物学领域显而易见,但它的应用范围不止于此,因为它有可能成为医学研究和药物开发的有力工具。例如,准确预测蛋白质相互作用有助于了解疾病机制和开发有针对性的治疗方法。

研究人员已免费提供 DiffPALM,希望科学界广泛采用它以进一步推动计算生物学的发展,并使研究人员能够探索蛋白质相互作用的复杂性。

DiffPALM 结合先进的机器学习技术和对复杂生物数据的有效处理,标志着计算生物学向前迈出了重大一步。

它不仅增强了科学家对蛋白质相互作用的理解,而且开辟了医学研究的新途径,有可能带来疾病治疗和药物开发的突破。

论文链接:
https://www.pnas.org/doi/10.1073/pnas.2311887121

相关报道:
https://phys.org/news/2024-06-ai-based-approach-protein-interaction.html

相关专题

更多
html版权符号
html版权符号

html版权符号是“©”,可以在html源文件中直接输入或者从word中复制粘贴过来,php中文网还为大家带来html的相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

582

2023.06.14

html在线编辑器
html在线编辑器

html在线编辑器是用于在线编辑的工具,编辑的内容是基于HTML的文档。它经常被应用于留言板留言、论坛发贴、Blog编写日志或等需要用户输入普通HTML的地方,是Web应用的常用模块之一。php中文网为大家带来了html在线编辑器的相关教程、以及相关文章等内容,供大家免费下载使用。

637

2023.06.21

html网页制作
html网页制作

html网页制作是指使用超文本标记语言来设计和创建网页的过程,html是一种标记语言,它使用标记来描述文档结构和语义,并定义了网页中的各种元素和内容的呈现方式。本专题为大家提供html网页制作的相关的文章、下载、课程内容,供大家免费下载体验。

456

2023.07.31

html空格
html空格

html空格是一种用于在网页中添加间隔和对齐文本的特殊字符,被用于在网页中插入额外的空间,以改变元素之间的排列和对齐方式。本专题为大家提供html空格的相关的文章、下载、课程内容,供大家免费下载体验。

240

2023.08.01

html是什么
html是什么

HTML是一种标准标记语言,用于创建和呈现网页的结构和内容,是互联网发展的基石,为网页开发提供了丰富的功能和灵活性。本专题为大家提供html相关的各种文章、以及下载和课程。

2844

2023.08.11

html字体大小怎么设置
html字体大小怎么设置

在网页设计中,字体大小的选择是至关重要的。合理的字体大小不仅可以提升网页的可读性,还能够影响用户对网页整体布局的感知。php中文网将介绍一些常用的方法和技巧,帮助您在HTML中设置合适的字体大小。

500

2023.08.11

html转txt
html转txt

html转txt的方法有使用文本编辑器、使用在线转换工具和使用Python编程。本专题为大家提供html转txt相关的文章、下载、课程内容,供大家免费下载体验。

306

2023.08.31

html文本框代码怎么写
html文本框代码怎么写

html文本框代码:1、单行文本框【<input type="text" style="height:..;width:..;" />】;2、多行文本框【textarea style=";height:;"></textare】。

417

2023.09.01

苹果官网入口直接访问
苹果官网入口直接访问

苹果官网直接访问入口是https://www.apple.com/cn/,该页面具备0.8秒首屏渲染、HTTP/3与Brotli加速、WebP+AVIF双格式图片、免登录浏览全参数等特性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

10

2025.12.24

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 4.8万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号