• 背靠背 Nature 新方向 - 蛋白质结构家族图谱的“潘多拉魔盒”


    NBT - Foldseek快速准确搜索结构相似的蛋白,AlphaFold蛋白质数据库提供了一个快速的搜索工具

    AlphaFold的极限:高中生揭示人工智能在生物信息学挑战中的缺陷

    AlphaFold2开源了,不是土豪也不会编程的你怎么蹭一波?


    164e39ec9e7c7694802f6d7cc781b506.png

    对蛋白结构的大规模分析揭示了蛋白质中前所未见的结构单元和蛋白蛋白之间出乎意料的关联关系。

    Google DeepMind利用AlphaFold神经网络预测了几乎所有已知蛋白的结构(超过2亿条记录),并存储于数据库AlphaFoldDB (https://alphafold.ebi.ac.uk/)。两篇Nature工作对该数据库进行了深度挖掘,揭示了全新的蛋白质结构、蛋白质在生命机器中惊奇的连接关系以及其他在几年前难以想象的洞见。

    “多亏了AlphaFold,我们现在可以探索之前一无所知的整个蛋白质家族。” 西班牙巴塞罗那Josep Carreras白血病研究所(IJC)的计算生物学家Eduard Porta Pardo说,他并未参与2023年9月13日在《Nature》(IF2022=64.8)杂志发表的两项研究[1,2]。

    8c5477f04d427bef367556c9559ac3ab.png

    去年Google DeepMind利用AlphaFold从具有基因组序列的物种中预测了几乎所有已知蛋白的结构,在AlphaFold数据库(AlphaFold Protein Structure Database)中积累了近2.14亿条结构信息。该数据库由位于英国欣克斯顿的欧洲分子生物学实验室欧洲生物信息学研究所(EMBL-EBI)托管。

    结构簇(Sructure cluster)

    首尔国立大学的计算生物学家Martin Steinegger表示,很快科学家们发现AlphaFold数据库资源的使用非常方便,但其中很多科学家仅关注单一的蛋白质结构或某一家族的蛋白结构。而Martin Steinegger则对绘制整个数据库中的蛋白质的关联关系非常感兴趣,他说:“我认为探索蛋白质的结构宇宙到底有多大将非常有趣。”

    为此,由Steinegger和瑞士苏黎世联邦理工学院(ETH Zurich)的计算生物学家Pedro Beltrao领导的团队开发了基于结构相似性的蛋白质快速比对工具,实现了对AlphaFold数据库中的蛋白结构比对,并鉴定了超过2百万个结构相似的蛋白“簇”[1]。

    研究人员通常利用蛋白的氨基酸序列进行结构的比对。但与结构相比,在进化过程中,氨基酸序列更易于改变,这就限制了寻找远源蛋白的能力。Steinegger等分析发现通过比对蛋白质的结构识别出的蛋白“簇”的数量是利用序列比对所得“簇”的数量的10倍。

    尽管研究人员才刚刚开始探索蛋白“宇宙”中这些新发现的“星系”(galaxies),但他们已经发现了惊人的蛋白质连接关系。例如,他们发现,用于检测人类和其他复杂生物体内的病毒DNA且可引发快速免疫反应的蛋白质与来自单细胞的细菌和古菌的蛋白质属于同一个蛋白簇,这种蛋白关系以前从未被揭示,Steinegger说。

    对于超过三分之一的蛋白质簇,目前几乎一无所知。“我真的希望生物学家能为这个未知领域的研究贡献一份力量,”斯坦格尔说道。

    未知的结构(Never-before-seen shape)

    另一个团队采用了略有不同的方法来揭示蛋白质宇宙中的“暗物质”。瑞士巴塞尔大学的计算生物学家Joana Pereira,Janani Durairaj,Torsten Schwede和SIB瑞士生物信息学研究所及其同事为AlphaFold数据库中超过5000万最准确预测的蛋白结构创建了一个关系网络。他们利用这些分组来鉴定蛋白宇宙中的神秘角落[2]。

    52d3f711684a582b371c95d2df998dfe.png

    蛋白质的β桶结构。来源:Laguna Design/Science Photo Library

    令人惊喜的是,他们发现了一种新型蛋白结构。由于该结构包含了一系列的发卡翻转(这种发卡翻转结构在β桶(Beta-barrel)结构中也存在)类似于一朵花的花瓣,因此研究人员将其称为“β花”(Beta-flower)。具有“β花”结构的蛋白质之间亲缘关系疏远,目前对他们的功能尚不清楚,研究该结构的Pereira表示。

    8707aaa0448acf878db3d1f0cfecb45c.png

    蛋白质的β花结构。来源:Durairaj, J. et al.

    “这项工作实际上打开了蛋白质研究的潘多拉魔盒,我们必须决定优先考虑哪些项目。” Pereira 补充道。她和她的同事期望其他研究人员能够利用他们创建的网络来分析他们最感兴趣的蛋白如何适应更广泛的分子宇宙。

    伦敦大学学院的计算生物学家Christine Orengo很高兴有新的方法来探索蛋白质宇宙。但她提醒道,有些高度准确的AlphaFold预测结构不一定是研究人员感兴趣的功能蛋白或功能域。Orengo表示,抛开这些异常,该方法仍然为研究者提供了探索新的蛋白质家族的宝库,“这一点非常令人兴奋。”

    Google DeepMindAlphaFold团队的负责人John Jumper尽管没有参与这两项研究,但他很高兴看到研究人员开发出新的方法来探索他和他的同事们所释放的宇宙。他认为这些研究标志着一个新的、前所未有的蛋白质结构领域的开始,“我希望我们将看到更深入的研究成果。”

    参考文献

    [1]. Barrio-Hernandez, I. et al. Nature(2023)

    [2].  Durairaj, J. et al. Nature(2023).

    阅读原文内容

    https://doi.org/10.1038/d41586-023-02892-z

    往期精品(点击图片直达文字对应教程)

    0140260e6b20de9a89a37b8215743260.jpeg

    19a5eee01eaa67817f412caed38a4f97.jpeg

    fcdfd562d233cbf7d992c168405618a9.jpeg

    54467fb9e983ccb93f42d051e921a3fb.jpeg

    4a577377bfe00e1f37cad8a26d603dc2.jpeg

    e5bb9d1e623a662c54343dfebedbac3d.jpeg

    867656cc0475202f688decfd74e0a695.jpeg

    4b7b091f63086419ce8793a0effdfb2b.jpeg

    1cd26ee3e0d4ce9a47160b0650ce5ac8.jpeg

    e85b4424bdab467a2692b254494f312f.jpeg

    095f36891710caccf977e1a26efbd27a.jpeg

    95970de2975ace76a82394b45e3d77c5.jpeg

    459bbbddb6d6130bd73a76b1a9bbbcbc.png

    e066707458b8e44c24c509d097662a64.png

    8bc41592dbc88c8abb192e83dbc71ec3.png

    2c351dd162f99752cdccfb60c8bedcc8.png

    8e7090cb3799df445619f89bcaa53335.jpeg

    6c88ec079ecc4a7cb1cf889aea8a86ad.jpeg

    aa6568945243e43cd420da5a619794d9.jpeg

    f2ff0a8d3c8b902656cf777c9ffe0a21.jpeg

    948c92579edbb8fd5cdba285fb605595.png

    fc87d8a6a769e2e3560824d94ce562d6.png

    e74bf297b91de8a214eee9e3183237ca.jpeg

    bf98f747b87948c7dbd9f9401f57e420.png

    57d5cb252febd05d2bd178b84822cefa.png

    41fec898fc4cc952700e6056c504ced7.jpeg

    8f3cfd0aced3325805d3e7a35ec9fd50.png

    146865dd00b13d1afb188cdc01194c52.png

    机器学习

    b23fa4c1bc4d4dcdf79772df33ff74e4.png

    970c177e9fc29cc76a7024c5b8f84b95.jpeg

    57553ae390ecd68c991291f2a7f56920.jpeg

    f702cdac43507df706693bd74b292db4.png

  • 相关阅读:
    Pytorch中张量的维度扩张与广播操作示例
    递归,动态规划实现
    《中国垒球》:四强巡礼·再创辉煌
    Pytorch:张量的索引操作
    【记录】java打印控制台特殊字符被转义,再转回正常字符(<<&gt>d等等特殊字符)
    前端 JS 经典:Math 常用方法汇总
    C语言第十一课(下):优化扫雷游戏
    混沌系统在图像加密中的应用(基于哈密顿能量函数的混沌系统构造1.1)
    300元开放式耳机哪款好一点、百元开放式耳机性价比挂耳式推荐
    大数据培训CombineTextInputFormat案例实操
  • 原文地址:https://blog.csdn.net/qazplm12_3/article/details/133004080