华体会-清华大学团队提出蛋白质序列

卵白质作为最主要的生命构建单位之一,其序列和功能之间的映照(顺应性景不雅,Fitness landscape)的针对性研究对卵白质理性设计和工程利用都有极年夜的意义。今朝人们只能对卵白质序列-功能关系进行少许低纬度的点采样,例如深度突变搜刮(DMS)、单元点饱和突变等,或是操纵随机建库等体例以极低几率捕捉序列与功能耦连的要害信息。一些更高效的定向进化东西如PACE、OrthoRep等会使得卵白质空间的搜刮深度加深,但因为其专注在发生高顺应性突变体的特点使得其对卵白功能的全局认知不足。一些计较方式成功构建起序列-布局之间的切确联系关系,例如2024年诺贝尔化学奖获奖者开辟的AlphaFold, RoseTTAFold等布局猜测或设计较法,并进一步试牟利用深度进修构建序列和功能的映照关系,但因为缺少高质量年夜范围的序列-功能映照数据,计较方式的可延展性始终有所限制。总之,受限在卵白质序列空间的高维度与复杂性(例如,100个氨基酸的卵白质设计空间到达10130,远超宇宙中的原子数量~1080),研究人员对这一空间和其映照纪律的理解尚浅,亟待丰硕与完美。

近日,清华年夜学药学院张数一团队提出了对卵白质序列-功能空间进行紧缩的概念,开辟了进化扫描系统,可以高效获得空间紧缩后的锚点(Anchor),并开辟了响应的EvoAI系统,实现了对卵白质序列-功能空间的进化紧缩和AI重构,紧缩比可以到达1048,对理解卵白质序列-功能空间映照关系引入了新的视角。

研究人员起首构建了进化搜刮系统(Evolutionary Scanning, EvoScan)用以对卵白进行分区域定向进化。该系统革新了噬菌体辅助的持续定向进化系统(PACE)。此中,突变系统来历EvolvR系统中enCas9-PolIM5复合卵白,经由过程构建其引诱表达系统来建立靶向分区域突变质粒(TP)。为了测试系统的可行性,研究人员前后操纵了绿色荧光卵白EGFP的纳米抗体突变体的答复突变尝试测试卵白-卵白彼此感化的靶向进化,和操纵SARS-CoV-2主卵白酶Mpro卵白对其按捺剂的逃逸效应的进化测试卵白-配体彼此感化的靶向进化,证实该系统可以对gRNA笼盖的上下流约30bp的区域进行靶向进化并获得功能晋升的突变体。随后,研究人员操纵EvoScan进化了转录因子AmeR对特定DNA序列的按捺能力,设计了13条gRNA对卵白进行区域朋分,终究在8个区域中找到氨基酸突变。研究人员对这些区域进行随机排序,构建了8个分歧的进化路径,使进化进程可以遍历以上8个区域,终究发生了82个功能晋升、维度各不不异的锚点,并对上述锚点进行基在流式荧光的功能测试,系统生物学阐发和上位效应(Epistasis)的阐发与计较等。成果显示,虽然绝年夜大都突变对卵白功能都有分歧水平的晋升,但分歧的单点突变对分歧的突变组合而言,发生的功能效应并不是都是晋升,一些突变位点可以或许晋升卵白功能,但会干扰其他的突变位点的效应,这反应了卵白质序列空间的高复杂度。

图1.EvoScan系统组成和卵白质序列-功能空间紧缩

?

为了理解和重构这个高纬度复杂空间,研究人员设计了与EvoScan配套的深度进修算法,并定名为EvoAI。该方式连系了预练习的GeoFitness模子和卵白质说话模子(ESM-2),加上多层感知器(MLP),以提高猜测卵白质突变效应的正确性。在本研究中EvoAI操纵AmeR卵白82个突变体的序列-功能映照信息对模子加以练习,并生成了分歧在上述突变体的共1093个新卵白,经由过程对猜测强度的排序,研究人员测试了猜测强度最高的10个突变体,并将其与仅操纵传统DMS方式猜测获得的10个具有不异突变数目的,强度最高的10个突变体进行强度对照,成果显示,经由过程EvoAI猜测获得的突变体均有显著的功能晋升,而DMS方式获得的突变体大都均无显著功能晋升,乃至某些突变体不再具有较着的按捺功能。这注解EvoAI系统辨认到了经由过程信息紧缩获得的高维度卵白信息,并有用地生成了具有功能的突变体。

图2.EvoAI道理示意图和卵白质序列-功能空间重构

?

与现有方式比拟,该方式有几个主要优势。起首,它实现了序列空间普遍、平均且切确的采样,可以快速摸索高维并生成更多样化和功能性的突变体,并供给有关序列-功能映照的更丰硕信息。其次,它整合了基在经验的进化扫描和深度进修模子,充实操纵了这两种分歧方式的优势。研究人员可使用深度进修获得的要害特点来动态地指点扫描进程。可注释性深度进修在将来的进一步成长可能会揭露潜伏的进化法则,并为卵白质若何顺应和降服进化限制供给看法。第三,它可以进化和研究缺少布局信息或触及具有挑战性的彼此感化的卵白质。EvoScan可以针对分歧的卵白质彼此感化捕捉卵白质锚点,如卵白质-卵白质、卵白质-配体和卵白质-核酸彼此感化。文章中提出的卵白质序列-功能空间紧缩的概念也有望利用在分歧种类的卵白质,并对天然界若何在有限时候内完成卵白质空间的搜刮和物种的高效进化发生必然的开导感化。

相干研究功效以“EvoAI 实现卵白质序列空间的极端紧缩和重构”(EvoAI enables extreme compression and reconstruction of the protein sequence space)为题,在11月11日颁发在《天然 方式》(Nature Methods)。

清华年夜学药学院2020级博士生马梓源,2019级博士生李文杰、沈运浩和生命学院2019级博士生徐运昕为论文配合第一作者,药学院助理传授张数一为论文通信作者。生命学院副传授龚海鹏与药学院研究员田博学为研究供给了主要帮忙。研究获得国度科技部重点研发打算、国度天然科学基金、清华年夜学笃实专项基金和北京生物布局前沿研究中间的帮助。

论文链接:

https://www.nature.com/articles/s41592-024-02504-2

特殊声明:本文转载仅仅是出在传布信息的需要,其实不意味着代表本网站不雅点或证实其内容的真实性;如其他媒体、网站或小我从本网站转载利用,须保存本网站注明的“来历”,并自大版权等法令责任;作者假如不但愿被转载或联系转载稿费等事宜,请与我们联系。

上一篇:华体会-全新大模型可预测和设计基因序列—新闻—科学网 下一篇:华体会-潘晓东已任科技部党组成员—新闻—科学网