Nature | 抛弃物理“最低能量点”:概率生成大模型如何颠覆长达30年的蛋白质设计铁律?
引言自然界的蛋白质经过数亿年的漫长进化才打磨出支撑生命的复杂功能。然而面对癌症、新发传染病以及日益严峻的气候危机我们已无法再等待下一个百万年的自然选择。4月30日《Nature》的重磅综述“The past, present and future of de novo protein design”系统总结了基于深度学习Deep Learning的计算方法如何引发蛋白质工程领域的范式转变。从头设计蛋白质De novo protein design正从随机筛选走向理性的定制化构建。告别盲人摸象生成式大模型重构分子设计法则设计一个全新蛋白质的难点究竟在哪里从上世纪90年代到几年前计算蛋白质设计的底层逻辑一直深植于物理化学模型。研究人员的出发点是著名的安芬森假说Anfinsens hypothesis即蛋白质的折叠状态处于其氨基酸序列的全局自由能最低点。为了找到这个“最低点”像 Rosetta 这样的软件试图通过计算范德华力、氢键、静电相互作用等物理量来评估数以亿计的可能结构。这种方法虽然极其严谨但也极度耗时且极易陷入局部最优解的陷阱。如今这场革命性的突破得益于深度学习模型的引入。AlphaFold 和 RoseTTAFold 等结构预测工具的成熟提供了一种从序列空间到结构空间的全新映射方式。研究人员不再单纯追求“能量最低”而是转向寻找“概率最高”的序列-结构对。这种概率计算的底气源于全球结构生物学领域历经 60 年、耗资数十亿美元、由成千上万名研究人员共同构建的蛋白质数据库PDB。大模型通过学习这些已知结构的底层概率分布掌握了生命的“语法”。随后基于扩散模型Diffusion models的生成式人工智能AI工具如RFdiffusion 彻底颠覆了设计流程。在设计之初模型面对的只是一团完全随机的氨基酸残基“噪声”通过逐步去噪这些残基最终组织成具有高度互补性和特定功能的蛋白质结构。一旦骨架确定ProteinMPNN 等序列设计工具就能迅速填补合适的氨基酸序列。这种骨架生成与序列设计的解耦与协同让蛋白质设计摆脱了天然序列的束缚真正实现了从功能需求出发的“逆向工程”。突破天然界限定制多维空间结构的组装模块掌握了底层规律后研究人员首先挑战的是设计全新的蛋白质折叠和组装形式。早在2003年世界上第一个具有原子级精度的全新折叠蛋白质 Top7 问世证明了计算方法能够无中生有地创造出稳定结构。而如今这种能力已经扩展到了极具挑战性的跨膜蛋白领域。研究人员成功设计了包含α-螺旋和 β-折叠的跨膜孔道和通道。例如定制尺寸和内衬属性的 β-桶状孔道为基于纳米孔的单分子 DNA 测序技术及广谱生物传感技术提供了更为理想的物理通道。在微观尺度上设计技术已经能够突破传统20种天然氨基酸的限制。通过引入非天然氨基酸研究人员设计出了长度在 7 到 14 个残基之间的主链环化肽Macrocyclic peptides不仅在溶液中具有明确的结构还展现出跨膜穿透和口服生物利用的潜力。甚至更小巧的 4 到 5 个残基组成的寡酰胺Oligoamides大环化合物也被成功合成将蛋白质设计的边界直接拓展到了小分子药物的范畴。在宏观组装层面计算设计赋予了材料前所未有的对称性和规模。从最初的简单二聚体到如今利用四个相互正交的组分研究人员能够设计出直径高达 100 nm 的伪对称Pseudosymmetric纳米笼结构。这种模块化的设计思路让蛋白质像乐高积木一样可以无缝拼接。以此技术为基础研发的二十面体纳米颗粒已经促成了全球首个从头设计并获批临床使用的 COVID-19 疫苗SKYCovione。可以预见通过设计对 pH 敏感的解离组分或整合具有靶向信号的亚基未来的纳米疫苗和药物递送系统将具备极高的组织特异性。靶向深水区高亲和力结合蛋白的降维打击自然界中抗体是执行识别和结合任务的主力军。但在临床应用中抗体体积庞大、稳定性差且生产成本高昂。那么能否用更小、更稳定的从头设计蛋白质来替代甚至超越抗体呢答案是肯定的。如今结合蛋白Protein binders的设计已经接近被彻底解决的边缘。研究人员通过 RFdiffusion 和 Bindcraft 等工具已成功设计出针对 200 多个不同蛋白质靶点的高亲和力结合蛋白。在抗病毒领域设计的微型蛋白质能够精准结合 SARS-CoV-2、流感病毒的刺突蛋白甚至能中和致命的肉毒杆菌毒素和蛇毒。这些结合蛋白在经过部分扩散优化后达到了皮摩尔Picomolar级别的结合亲和力。更为关键的是由于其结构高度紧凑且具有极高的热稳定性这类蛋白药物无需冷链运输甚至可以制成鼻喷雾剂供大众日常预防使用。不仅如此计算设计还攻克了传统制药领域公认的“不可成药”靶点——内部无序区Intrinsically disordered regions, IDRs。这些区域缺乏固定的三维结构传统的锁钥模型在此完全失效。研究人员利用诱导契合Induced fit的概念让设计的蛋白质在结合过程中迫使 IDRs 采取特定的稳定构象。利用这一策略针对致癌基因产物如 β-连环蛋白以及引发神经退行性疾病的 β-淀粉样蛋白的结合蛋白已被成功开发出来。在免疫调控方面通过设计针对细胞因子受体的高亲和力激动剂或拮抗剂如 IL-2 和 IL-21 的模拟物研究人员在动物模型中观察到了极其强效的抗肿瘤活性。不仅如此通过构建 EndoTags 等靶向溶酶体降解的标签系统结合蛋白可以精准招募 E3 泛素连接酶实现对致病膜蛋白或胞外蛋白的靶向清除。跨越能垒的炼金术打造极高活性的定制酶引擎如果说结合蛋白质是在玩“拼图”那么设计具备催化活性的酶Enzymes则是在挑战化学反应的能量极限。传统的酶工程主要依赖对天然酶的定向进化但这往往受限于天然骨架的原始属性。从头计算设计的最终目标是为一个全新的化学反应从零开始定制完美的催化位点。这就要求设计的蛋白质结构必须能够在原子级别精确排列催化基团以极致的精度稳定化学反应的过渡态。随着大模型技术引入我们看到了令人振奋的突破。研究人员不仅能够设计针对特定小分子如心脏病药物地高辛 Digoxigenin 或抗癌药物甲氨蝶呤 Methotrexate的高亲和力传感器还能直接针对酶的过渡态几何形态进行骨架生成。具体的数据令人惊叹以往针对模型化学反应如 retro-aldol 反应设计的酶其催化效率kcat/KM仅为 180 M-1s-1。而借助新型生成工具如 PLACER 深度学习方法对催化位点预组织的筛选新设计的荧光素酶Luciferase达到了 1400 M-1s-1丝氨酸水解酶达到了 3800 M-1s-1。更引人瞩目的是一款从头设计的锌水解酶催化效率飙升至53000 M-1s-1而在一些高度优化的丝氨酸水解酶设计中这一数值甚至突破了 2.2 × 105M-1s-1。不仅如此结合血红素Haem等多核金属簇辅助因子的酶也被成功设计。对于那些需要克服极高能垒的非自然化学反应比如降解难降解塑料基于全新骨架的金属水解酶已经展现出了强大的应用潜力。逻辑门与动态齿轮唤醒未来的智能分子纳米机器掌握了静态结构设计、分子结合以及化学催化之后从头蛋白质设计正在迈向它的终极形态构建能够对外界刺激做出动态响应、具备多稳态和逻辑运算能力的分子纳米机器。生命的底层逻辑往往伴随着信息处理和能量转换。研究人员设计出了名为LOCKR 的智能系统。这是一种能够执行布尔逻辑Boolean logic运算的蛋白质开关。在嵌合抗原受体 T 细胞CAR-T疗法中它可以被设计成只有当靶细胞表面同时存在两种特定的标志物即执行“与”逻辑AND logic时才会解除一段多肽的隐藏状态进而招募效应蛋白杀伤癌细胞从而最大限度地减少对健康组织的误伤。在动态调控层面研究人员开发出了由效应物如特定肽段或钙离子驱动的变构组件。通过在一个远离作用中心的位置结合效应肽可以诱导整个蛋白质复合体解离或改变其寡聚状态。动力学数据显示在这种变构肽的控制下细胞因子信号的持续时间可以从原来的 1 小时精准缩短至 40 分钟。更具科幻色彩的是这种定制能力正延伸向材料科学与可持续发展领域。研究人员设计出了能够精确引导无机晶体成核的蛋白质模板例如控制碳酸钙CaCO3的多晶型结晶过程以探索一种全新的二氧化碳CO2固定方案。在人工光合作用方向成功设计出能够容纳且维持叶绿素特殊对Chlorophyll special pairs激子耦合的同源二聚体蛋白质这为未来利用太阳能驱动的高效多电子化学反应奠定了物理基础。在这个领域当前的核心挑战已经不再是“如何设计”而是“应该设计什么”。虽然在免疫原性验证、大规模生物制造等方面仍有现实问题需要克服但从头蛋白质设计已经不可逆转地重构了我们与分子世界的交互方式。可以预见在接下来的十年中整合了结合、催化和动态构象变化的智能生物材料将带领我们走向一个全面定制分子的新纪元。参考文献Yang W, Wang S, Lee GR, Zhang JZ, Courbet A, Juergens D, Wang X, Schlichthaerle T, Abedi M, Ragotte R, An L, Kalvet I, Pellock S, Mihaljevic L, Glasscock C, Pillai A, Broerman A, Ennist N, Haefner E, McNamara-Bordewick N, Haydon I, Stewart L, Bhardwaj G, Baker D. The past, present and future of de novo protein design. Nature. 2026 Apr;652(8112):1139-1152. doi: 10.1038/s41586-026-10328-7. Epub 2026 Apr 29. PMID: 42056544.转载请注明来源于【游离的DNA】声明本文仅用于分享不代表平台立场如涉及版权等问题请尽快联系我们我们第一时间更正谢谢往期热文Science | 进化史上的“借壳上市”质粒分配马达如何演化为决定形态的细胞骨架Science | 重定义传染病防治逻辑体内构建自我扩增的“超级抗体工厂”Nature | 从序列识别到表观感知的跨越新型ThermoCas9重塑基因编辑精度边界Cell | 从光遗传到“磁遗传”非侵入式“电磁场基因开关”问世实现体内深层组织的高分辨时空遥控Nature Medicine | 筛查范式亟待重塑当50%的食管癌找不到癌前病变我们的防线该如何前移Cell | 从“基因突变”到“微生态演替”重塑我们对癌症起源的底层认知Nature Biotechnology | 体内基因编辑新纪元打破毒性枷锁重塑肿瘤靶点发现的精准导航Nature Medicine | 一半是奇迹一半是深渊研究披露靶向KCNT1 ASO疗法的“双刃剑”效应Nature Genetics | 颠覆传统认知没有染色质环挤压基因调控网络也能“从零”重建Nature Medicine | 从局部响应到系统广播198个外周血标志物改写女性生殖健康研究的底层逻辑