抗体药物研发里序列只是故事的开头结构才是真正进入机制理解的入口。一条抗体序列能否识别抗原不只取决于氨基酸排列本身更取决于它折叠后形成的三维结构VH/VL 如何配对CDR loops 如何摆放CDR-H3 是否形成合理构象paratope 是否能和抗原表位形成稳定接触。如果进一步进入抗原-抗体复合物层面问题会更加复杂抗体和抗原是否真的结合结合在哪个表位界面是否合理是否存在诱导契合模型预测构象能否解释亲和力、特异性和功能阻断这就是抗体结构预测与抗原-抗体复合物预测的核心价值。传统实验方法如 X-ray、cryo-EM 和 NMR可以给出高可信结构但周期长、成本高也难以覆盖海量抗体序列空间。随着抗体发现逐渐进入高通量筛选、单 B 细胞测序、AI 设计和亲和力成熟阶段计算模型的重要性越来越高。研究者希望模型不仅能回答“这条抗体长什么样”还希望进一步回答“它可能识别哪个表位”“它与抗原如何结合”“哪些突变可能提高亲和力”“哪些结构风险会影响可开发性”。不过这个问题远比普通蛋白结构预测更难。抗体 framework 相对保守但 CDR loops 高度多样其中 CDR-H3 最灵活、最难预测也最常参与抗原识别。抗原-抗体复合物预测更困难因为抗体与抗原之间通常缺少 AlphaFold 类模型非常依赖的共进化信号表位往往未知界面柔性强bound/unbound 构象可能不同预测模型的排序能力也仍然有限。因此抗体结构预测模型的发展大致可以分成三条线索第一抗体单体结构预测。主要任务是输入重链、轻链序列预测 Fv 或 Fab 结构重点关注 CDR loop尤其 CDR-H3。第二纳米抗体 / VHH / TCR 等免疫受体结构预测。这类模型关注单域抗体、TCR 等结构和常规抗体类似但又存在分布差异。第三抗原-抗体复合物预测。这类模型尝试预测 paratope-epitope 接触和复合物构象是当前最困难、也最接近功能机制的任务。本文围绕这三条线系统梳理代表模型、设计思路、优劣比较和未来方向。一、抗体结构预测为什么不同于普通蛋白结构预测普通蛋白结构预测通常关心一条序列如何折叠成整体结构。但抗体结构预测有非常特殊的结构规律。抗体可变区由重链可变区 VH 和轻链可变区 VL 组成。VH 和 VL 的 framework 区域相对保守支撑整体结构而真正决定抗原识别特征的主要是 6 条 CDR loopsH1、H2、H3、L1、L2、L3。其中CDR-H3 是最关键、也最难的部分。一方面CDR-H3 位于重链 V-D-J 重排区域长度和序列多样性极高另一方面它经常位于抗体结合面的中央直接参与抗原识别。很多 CDR-H1、H2、L1、L2、L3 可以在一定程度上归入 canonical conformations但 CDR-H3 的构象空间更加开放模板依赖方法和通用结构预测方法都容易在这里出现偏差。除了 CDR-H3VH/VL 相对取向也很重要。VH/VL 的微小旋转和位移可能改变 CDR loops 的整体空间排列从而影响 paratope 的形状和电荷分布。进入抗原-抗体复合物预测后问题更复杂。模型不仅要预测抗体本身结构还要预测抗原表位、抗体结合姿势、界面侧链、CDR loop 的 bound 构象以及可能的诱导契合。更困难的是抗体和抗原之间通常没有共同进化历史这使得基于 MSA 共进化信号的通用复合物预测模型在这一任务上面临天然短板 [1,2]。因此抗体建模不能简单等同于普通蛋白建模。它既需要抗体家族知识也需要几何建模、物理约束、语言模型表征和复合物 docking 能力。二、传统路线模板建模、物理建模与 Rosetta 系列早期抗体结构预测主要依赖模板和物理建模。典型思路是先根据抗体序列进行编号和分区识别 framework 与 CDR然后在结构数据库中寻找相似抗体模板再用模板构建 framework 和部分 CDR最后对 CDR loops尤其 CDR-H3进行 loop modeling 和能量优化。SAbDab 是抗体结构建模的重要基础资源。它将公开抗体结构进行统一整理并标注 heavy/light chain 配对、抗原信息、实验信息和部分亲和力信息为后续 ABodyBuilder、SAbPred、Thera-SAbDab 等工具提供了基础数据支撑 [3]。ABodyBuilder 是较早广泛使用的自动抗体结构建模工具。它通过模板搜索、VH/VL orientation 建模和 CDR loop 建模来生成 Fv 模型对 canonical CDR loops 可达到较好精度并且速度较快 [4]。RosettaAntibody 则代表了物理建模路线它利用 canonical loop 知识、片段组装和 Rosetta 能量函数来构建抗体结构 [5]。如果进一步进入抗原-抗体 dockingRosetta SnugDock 是经典代表。SnugDock 扩展了 RosettaDock在抗体-抗原 docking 中同时优化抗体-抗原相对取向、VH/VL orientation并对 CDR loops尤其 H2/H3进行柔性 refinement [6,7]。这类传统方法的优点是可解释性较强。研究者可以清楚知道模型用了什么模板、优化了哪些自由度、能量函数如何评价界面也可以引入实验约束如突变实验、表位 mapping、HDX-MS、交联质谱等。但它们也有明显限制。第一对模板依赖较强。非典型 CDR-H3、新型抗体、低同源结构和特殊构象往往更难建模。第二scoring function 排序能力有限。生成多个候选结构后如何选出最接近真实结构的模型仍然困难。第三处理大规模抗体库时效率不如现代深度学习模型。第四对结构不确定性的表达不足尤其是对柔性 CDR 和 bound/unbound 变化的刻画有限。因此传统物理建模方法并未消失但正在从“主流程”逐渐变成深度学习结构预测后的 refinement、约束 docking 和机制解释工具。三、深度学习抗体单体结构预测从 DeepAb 到 IgFold、ImmuneBuilder 和 ABodyBuilder31. DeepAb从序列直接学习抗体结构约束DeepAb 是抗体结构预测进入深度学习阶段的重要模型之一。它从抗体序列出发预测结构相关信息并结合后续建模得到 Fv 结构 [8]。DeepAb 的价值在于它证明抗体结构中的很多规律可以通过深度学习从序列中学习而不必完全依赖模板。DeepAb 的优势是较早系统地将深度学习用于抗体 Fv 结构建模并在多个测试集上表现优于当时的若干替代方法。但它仍然不是完全端到端的一步式结构生成模型对后处理和物理建模仍有依赖。2. ABlooper专注 CDR loop特别是快速 loop 建模ABlooper 是专门用于 CDR loop 结构预测的深度学习模型。它强调速度和 CDR loop 精度并提供预测置信度估计 [9]。对抗体建模来说这种“局部关键区域精修”的思路非常实用因为 framework 区域通常相对容易真正决定结构误差的常常是 CDR loops。ABlooper 适合用于 CDR loop 快速建模、ABodyBuilder 系列工具的 loop 组件也适合作为大规模抗体结构预测中的局部模块。但它本身并不解决完整抗原-抗体复合物 docking 问题。3. IgFold抗体语言模型驱动的快速结构预测IgFold 是近年来非常有代表性的抗体结构预测模型。它使用在大规模天然抗体序列上训练的抗体语言模型 AntiBERTy 提取 embedding再结合图神经网络直接预测抗体 backbone 原子坐标 [10]。IgFold 的核心优势是速度快不依赖 MSA适合大规模抗体库建模。论文中还展示了用 IgFold 预测 140 万条 paired antibody sequences 的能力这说明它非常适合高通量抗体序列结构化分析 [10]。IgFold 的思路很有启发性抗体序列本身携带大量进化和结构信息语言模型可以从海量抗体序列中学习 framework、CDR、VH/VL 配对和结构规律。这使抗体建模从“找模板”逐步走向“学习抗体序列空间”。但 IgFold 也不是万能的。它对 CDR-H3、特殊构象、侧链精度和 bound 构象仍有局限。更重要的是IgFold 主要解决抗体单体结构问题并不能直接预测抗原表位或复合物结合姿势。4. ImmuneBuilder / ABodyBuilder2面向抗体、纳米抗体和 TCR 的统一框架ImmuneBuilder 是 OPIG 团队提出的一组免疫受体结构预测模型包括 ABodyBuilder2、NanoBodyBuilder2 和 TCRBuilder2用于预测抗体、纳米抗体和 TCR 结构 [11]。ImmuneBuilder 的意义在于它不只面向普通抗体 Fv也扩展到 VHH 和 TCR。这一点很重要因为 VHH 和 TCR 虽然都属于免疫识别分子但结构分布、loop 特征和训练数据分布与常规抗体不同。将它们纳入统一但分任务训练的框架有助于提高不同免疫受体类型的建模效率。ImmuneBuilder 相比传统模板方法更加自动化也比通用蛋白结构预测模型更理解免疫受体结构分布。不过它仍然主要关注单体结构预测不直接解决复杂的抗原-抗体 docking。5. ABodyBuilder3语言模型增强与不确定性估计ABodyBuilder3 是 ABodyBuilder 系列的新版本在 ABodyBuilder2 基础上引入语言模型 embedding并报告了更好的 CDR loop 建模效果和 pLDDT 式不确定性估计 [12]。这一变化非常值得关注。抗体结构预测未来不会只是“端到端预测坐标”还需要告诉使用者模型对哪些区域有信心哪些 CDR loop 可能不可靠哪些结构需要进一步 refinement 或实验验证。ABodyBuilder3 将语言模型表征和不确定性估计结合起来代表了抗体结构预测从“给出一个结构”走向“给出结构加可信度”的趋势。对抗体药物研发而言这比单纯提高平均 RMSD 更重要。因为项目中真正需要的是知道哪些候选值得信、哪些区域不该过度解释、哪些突变设计需要谨慎。四、纳米抗体和 TCR相似但不能简单套用抗体模型纳米抗体又称 VHH 或 single-domain antibody只有一个可变域不存在传统 VH/VL 配对问题。但它的 CDR3 往往更长、更凸出也更常深入抗原沟槽或口袋因此结构建模仍然很有挑战。NanoBodyBuilder2 是 ImmuneBuilder 框架中面向纳米抗体的模型 [11]。相比普通抗体模型纳米抗体模型需要更好处理单域结构、长 CDR3 和特殊 framework 适配。用普通抗体模型直接预测 VHH可能在 CDR3 和表面结构上出现偏差。TCR 结构预测同样不能简单套用抗体模型。TCR 与抗体在整体免疫球蛋白折叠上有相似之处但训练数据分布、CDR 结构和配体识别机制不同。2025 年关于 TCR 结构预测的研究也提示模型在训练分布内表现更好跨免疫受体类型泛化并不理所当然 [13]。这说明一个重要原则免疫受体结构预测需要尊重家族特异性。通用蛋白模型可以提供基础能力但抗体、VHH、TCR 往往需要专门数据和专门架构。五、抗原-抗体复合物预测真正困难的问题才刚开始抗体单体结构预测已经取得明显进展但抗原-抗体复合物预测仍然困难。原因很直接抗体结构预测只需要回答“这条抗体怎么折叠”而复合物预测要回答“它和抗原在哪里、以什么姿势、通过哪些残基结合”。这会引入几个额外难点。第一表位未知。如果不知道抗原上哪个区域被识别搜索空间会很大。第二共进化信号缺失。很多通用复合物预测模型依赖链间共进化信号但抗体和抗原并没有长期共同进化历史。第三CDR 柔性强。抗体结合抗原时CDR loops 可能发生 bound/unbound 构象变化。第四界面 scoring 困难。即使生成多个候选复合物如何排序、如何判断哪个接近真实结构仍然是瓶颈。第五结合构象不等于亲和力。结构预测合理不代表亲和力高界面接触多也不代表功能有效。因此抗原-抗体复合物预测不能简单套用普通蛋白复合物预测逻辑。六、物理 docking 与信息驱动 dockingSnugDock、HADDOCK、ClusPro 等抗原-抗体复合物预测最传统的路线是 docking。一般流程是先获得抗体和抗原结构再进行 rigid-body docking生成多个可能结合姿势然后根据能量、形状互补、界面接触和实验约束进行筛选。对于抗体体系还常常需要对 CDR loops 和 VH/VL orientation 进行柔性 refinement。HADDOCK 是信息驱动 docking 的代表。它可以引入实验约束如已知表位、突变实验和交联信息并结合 rigid-body search、torsion-space simulated annealing 和 Cartesian minimization 等步骤完成复合物建模 [7]。Rosetta SnugDock 则是抗体-抗原 docking 的经典专用工具。它在 docking 过程中显式优化抗体相关自由度包括 CDR loop 和 VH/VL orientation [6,7]。ClusPro、ZDOCK、HDOCK、GalaxyTongDock 等工具也常用于抗体-抗原 docking。GalaxyTongDock 的在线说明中特别提到AlphaFold-Multimer 在抗体-抗原复合物预测中存在局限而 docking 方法在某些场景下仍有价值 [14]。这类方法的优势是可解释、可引入实验约束、可生成多个候选构象适合已知或部分已知表位的局部 docking。局限也很明显如果抗原表位未知搜索空间大如果抗体或抗原存在明显构象变化rigid docking 难以处理如果候选很多scoring function 很难准确排序。因此物理 docking 更适合作为“已知信息约束下的局部复合物建模”而不是万能的一步式抗原-抗体结构预测工具。七、通用复合物预测模型AlphaFold-Multimer、AlphaFold3、Boltz、Chai 与 HelixFold-Multimer1. AlphaFold-Multimer对抗体-抗原复合物有限但仍有价值AlphaFold-Multimer 将 AlphaFold2 扩展到多链蛋白复合物预测。对于许多蛋白复合物它可以提供有价值的结构假设。但在抗体-抗原任务中它的表现明显受限。Yin 和 Pierce 对 427 个非冗余抗体-抗原复合物进行系统评估指出 AlphaFold / AlphaFold-Multimer 对抗体-抗原建模的成功率有限并分析了置信度指标与模型质量之间的关系 [1]。这一结果并不令人意外。抗体和抗原之间缺少链间共进化信号抗体 CDR loop 灵活表位未知这些都让 AlphaFold-Multimer 难以稳定预测正确界面。不过AlphaFold-Multimer 仍有实用价值。它可以作为候选构象生成工具也可以与多 seed、多采样、已知表位约束、docking refinement 和实验数据结合使用。2. AlphaFold3多分子复合物预测的新阶段但抗体任务仍需谨慎AlphaFold3 将预测范围扩展到蛋白、核酸、小分子、离子和修饰残基等多分子体系并使用更新的扩散式架构预测复合物联合结构 [15]。对于抗原-抗体复合物预测AlphaFold3 的确带来了新能力。它不再只是蛋白-蛋白复合物预测工具而是更广义的生物分子相互作用建模平台。但是AlphaFold3 仍然不能被理解成“抗体-抗原复合物问题已经解决”。2025 年以来一些 benchmark 开始比较 AlphaFold3、Boltz-1、Chai-1 等模型在抗体和纳米抗体复合物上的表现结论通常是新模型相对旧模型有进步但成功率、排序能力和特殊体系泛化仍有限 [16,17]。尤其要注意AlphaFold3 预测复合物结构不等于真实结合预测结合姿势不等于亲和力模型置信度高不代表功能有效。3. Boltz 与 Chai开放 AF3-like 模型带来的新选择Boltz-1 是一个开源生物分子相互作用预测模型目标是接近 AlphaFold3 级别的结构预测能力 [18]。Boltz 系列后续进一步提出联合建模结构和亲和力的方向这对药物设计很有吸引力但在抗体-抗原任务中仍需要独立 benchmark 验证。Chai-1 是另一类多模态生物分子结构预测模型可处理蛋白、多聚体、核酸和蛋白-配体等任务也被用于抗体-抗原建模探索 [19]。这类模型的价值在于开放性和可用性。对于无法使用 AlphaFold3 权重或商业场景受限的研究者Boltz、Chai 等模型提供了替代选择。但从抗体任务角度看开放模型同样面临抗体特异性问题CDR-H3、表位未知、bound/unbound 变化、界面排序困难。使用者不能因为模型是 AF3-like就默认其适合抗体-抗原复合物预测。4. HelixFold-Multimer面向抗原-抗体结构预测的专门扩展HelixFold-Multimer 相关工作提出其在抗原-抗体结构预测方面具有优势并强调其可用于抗体开发中的结合位点识别和相互作用预测 [20]。不过对于这类模型需要区分论文报告、预印本结果、服务描述和独立 benchmark。在抗体结构预测领域模型自称优于现有方法并不罕见。真正需要关注的是数据集是否去冗余是否存在训练集泄漏是否使用真实未见抗原-抗体复合物是否只报告 top-N 最优结果是否有实验验证八、抗体特异深度学习复合物模型HERN、tFold-Ag 与设计一体化趋势除了通用复合物预测模型还有一类方法专门面向抗体-抗原 docking 或抗体设计。HERN也称 Hierarchical Equivariant Refinement Network是一个代表模型。它针对 paratope docking 和设计问题使用层次化 message passing 网络预测原子力并以等变方式迭代 refinement 复合物结构在生成阶段其自回归 decoder 会逐步 docking 生成的 paratope并利用界面几何指导后续残基选择 [21]。HERN 的意义在于它把 docking 和 paratope design 放在了一个统一几何框架中。它不只是预测已有抗体如何结合抗原而是进一步尝试生成能结合目标表位的 paratope。tFold System 则是另一条高通量路线。2025 年 Nature Communications 论文介绍了 tFold System该系统整合 tFold-Ab、tFold-Ag、结构引导虚拟筛选和 de novo 表位特异性抗体设计并针对多个治疗相关抗原进行了设计与验证 [22]。tFold 的早期说明中也强调其 MSA-free、利用预训练蛋白语言模型预测抗体和抗体-抗原复合物结构的特点 [23]。这类模型体现了未来趋势抗体结构预测和抗体设计不再是完全分开的任务。传统流程是先预测抗体结构再 docking 抗原再筛选亲和力再做突变优化。未来模型可能会把表位识别、CDR 生成、结构预测、复合物 refinement 和序列优化放进统一框架。九、从结构预测走向抗体设计AntiFold、Diffusion 与表位条件生成抗体结构预测的最终目的往往不是为了“看结构”而是为了“设计更好的抗体”。因此结构预测自然会走向结构保持的序列设计、CDR 生成、亲和力成熟和可开发性优化。AntiFold 是一个抗体特异 inverse folding 模型它从 ESM-IF1 微调而来使用已解析和预测抗体结构进行训练目标是在保持抗体结构的前提下设计序列 [24]。与通用 inverse folding 模型相比AntiFold 更关注 CDR 区域序列恢复和抗体结构保持这对抗体优化非常重要。抗体生成模型还包括 DiffAb、MEAN、dyMEAN、IgDiff、AbDesign 等方向。它们通常使用扩散模型、等变图神经网络、语言模型或结构条件生成技术来设计 CDR 序列或结构。部分方法将抗原表位作为条件尝试实现 epitope-specific antibody design。未来真正有价值的模型不会只问“这条抗体结构准不准”而会问给定一个抗原表位能否生成一条 CDR-H3生成的 CDR 是否能稳定折叠是否能形成合理 paratope-epitope 接触是否保留人源性是否降低聚集风险是否提升亲和力和特异性是否具有良好表达和可开发性这意味着抗体 AI 正在从结构预测走向结构-功能-可开发性联合建模。十、评价指标不要只看 RMSD也不要迷信 pLDDT / ipTM抗体结构预测和复合物预测需要不同指标。对于抗体单体结构预测常用指标包括Framework RMSDCDR RMSDCDR-H3 RMSDbackbone RMSDside-chain accuracyVH/VL orientation errorlDDT / pLDDTstereochemistry qualityclash scoreRamachandran outlierprediction uncertainty。其中CDR-H3 RMSD 往往最受关注因为它直接影响 paratope 几何。对于抗原-抗体复合物预测常用指标包括DockQCAPRI quality rankingligand RMSDinterface RMSDFnatparatope / epitope contact recoveryinterface precision / recallbinding-site RMSDcomplex pLDDTipTMinterface PAEtop-1 / top-N success rate。DockQ 将 Fnat、ligand RMSD 和 interface RMSD 组合为 0 到 1 的连续评分常用于评价 docking 模型质量 [25]。CAPRI 则使用 Fnat、iRMSD、lRMSD 等指标将复合物模型分为 incorrect、acceptable、medium 和 high quality 等等级 [26]。但这些结构指标仍然不能替代功能指标。结构接近真实复合物不代表亲和力高界面接触正确不代表功能阻断有效CDR-H3 RMSD 低不代表可开发性好ipTM 高不代表真实结合pLDDT 高不代表实验结构。对抗体药物研发来说最终还需要 SPR、BLI、ITC、cryo-EM、X-ray、突变扫描、细胞功能实验、表达纯化、稳定性和可开发性数据共同验证。十一、代表模型优劣比较模型 / 方法类型输入核心思路主要优势主要局限适合场景RosettaAntibody抗体单体VH/VL 序列canonical loop Rosetta 物理建模可解释、物理约束明确CDR-H3 和特殊构象较难精细建模、物理 refinementABodyBuilder抗体单体VH/VL 序列模板 VH/VL orientation CDR modeling快速、自动化、依托 SAbDab模板依赖常规 Fv 快速建模ABlooperCDR loop抗体结构/序列深度学习 CDR loop 预测快速、适合 loop 精修不解决复合物 dockingCDR loop 建模DeepAb抗体单体VH/VL 序列深度学习结构约束 建模早期深度学习代表仍需后处理Fv 结构建模IgFold抗体单体VH/VL 序列AntiBERTy embedding 图网络坐标预测快速、MSA-free、大规模建模CDR-H3/侧链/bound 构象仍有限大规模抗体库结构预测ImmuneBuilder / ABodyBuilder2抗体、VHH、TCR免疫受体序列专门深度学习模型覆盖抗体、纳米抗体、TCR主要是单体结构免疫受体结构预测ABodyBuilder3抗体单体VH/VL 序列语言模型 embedding pLDDT 不确定性CDR loop 更强、可估计置信度仍非复合物预测模型抗体 Fv 建模和不确定性分析SnugDock抗原-抗体 docking抗体/抗原结构Rosetta flexible docking适合局部 refinement可解释需较好初始姿势排序困难已知/部分已知表位 dockingHADDOCK信息驱动 docking结构 实验约束约束驱动 docking可整合实验信息依赖约束质量有表位/突变/交联信息时AlphaFold-Multimer通用蛋白复合物多链序列深度学习复合物预测易用可生成结构假设抗体-抗原成功率有限初步复合物假设AlphaFold3多分子复合物蛋白、核酸、小分子等扩散式联合结构预测多模态、能力更广抗体任务仍需谨慎非亲和力预测多分子复合物假设Boltz / ChaiAF3-like 多分子预测序列、配体等开放多模态结构预测可用性强适合探索抗体 benchmark 仍在变化AF3 替代/交叉验证HERN抗体 docking 设计抗原、paratope等变 refinement 生成结合 docking 与设计benchmark 与泛化仍需检验paratope docking/designtFold-Ab / tFold-Ag抗体与复合物序列PLM 结构预测模块高通量覆盖 Ab/Ag 设计流程需关注独立评测表位特异性设计流程AntiFold抗体 inverse folding抗体结构抗体特异 inverse folding保持结构的序列设计不是 docking 模型抗体序列优化十二、当前主要瓶颈尽管模型发展很快抗体结构预测仍有几个核心瓶颈。第一CDR-H3 仍然最难。它长度变化大、构象多样、与抗原结合密切是抗体结构误差的主要来源。第二bound/unbound 构象差异难处理。抗体未结合抗原时的结构不一定等于结合态结构。CDR loops 可能发生诱导契合。第三抗原表位未知时搜索空间太大。如果没有 epitope 信息模型需要在整个抗原表面寻找结合区域难度显著增加。第四抗体-抗原缺少共进化信号。这使得 AlphaFold-Multimer 一类模型在抗体任务上天然受限。第五复合物 ranking 仍然困难。很多方法可以生成候选构象但正确构象未必排在 top-1。第六数据集存在偏倚和泄漏风险。抗体结构数据中同源性、抗原重复、治疗抗体偏倚、PDB 冗余都可能影响 benchmark 可信度。第七结构预测与药物可开发性尚未打通。一个结构合理的抗体仍可能表达差、聚集高、黏度高、免疫原性强或非特异性结合严重。十三、未来发展方向1. 抗体 foundation model 会成为核心底座未来抗体模型需要同时理解序列、结构、胚系基因、体细胞高突变、CDR 构象、结合数据和功能标签。抗体语言模型、蛋白语言模型、等变结构模型和多模态模型会逐步融合。2. 显式建模 bound/unbound 构象未来模型不应只输出一个静态结构而要输出多个可能构象区分 apo、bound 和中间状态。尤其 CDR-H3 和 VH/VL orientation需要构象 ensemble 和不确定性表示。3. 表位条件化设计会成为重点抗体设计的目标会从“生成一个能结合的抗体”走向“给定一个功能表位生成能识别该表位的抗体”。模型需要显式接受 epitope、hotspot、逃逸突变位点和功能位点作为条件。4. 结构预测和抗体生成会统一未来 docking、CDR 生成、inverse folding、亲和力成熟和结构 refinement 可能会进入同一闭环。HERN、tFold System、AntiFold 等方法已经展示了这种趋势 [21,22,24]。5. 物理模型仍然重要深度学习模型能快速生成结构假设但局部界面、侧链、氢键、水分子、构象动力学和自由能仍需要物理模型补充。Rosetta、MD、自由能计算不会消失而会成为深度学习模型后的 refinement 与验证环节。6. 实验数据闭环将决定上限真正能改变抗体研发的不是单个预测模型而是“预测—设计—表达—结合—功能—结构解析—再训练”的闭环。深度突变扫描、Tite-Seq、BLI/SPR、高通量表达和 cryo-EM 数据都可能成为未来模型迭代的关键燃料 [27]。7. 从结构准确性走向可开发性联合优化抗体药物不是只要能结合。未来模型需要同时考虑亲和力、特异性、表达、稳定性、聚集、人源性、免疫原性、黏度、PK 和 CMC 风险。结构预测只是入口可开发性才决定候选能否真正走下去。十四、结语抗体结构预测的终点不是结构而是设计闭环抗体结构预测已经从模板建模时代走向语言模型、等变网络和多分子复合物预测时代。IgFold、ImmuneBuilder、ABodyBuilder3 等模型让抗体单体结构预测更加快速和规模化。AlphaFold-Multimer、AlphaFold3、Boltz、Chai 等模型拓展了抗体-抗原复合物建模的可能性。HERN、tFold、AntiFold 等方法则开始把结构预测、docking 和抗体设计放入统一框架。但必须承认抗原-抗体复合物预测还远没有完全解决。CDR-H3 仍然困难表位未知仍然困难bound/unbound 构象仍然困难复合物排序仍然困难模型置信度与真实亲和力之间仍然有距离。因此在抗体药物研发中最合理的态度不是把模型当作最终裁判而是把模型当作高质量假设生成器。它可以帮助我们更快看到候选结构更快定位可能表位更快设计突变更快筛掉不合理候选更快组织实验验证。但真正决定一个抗体能否成为药物的仍然是实验数据和可开发性表现。换句话说抗体结构预测的终点不是一张漂亮的结构图。它的终点是一个能够不断迭代的设计闭环。参考文献[1] Yin R, Pierce BG. Evaluation of AlphaFold antibody–antigen modeling with implications for improving predictive accuracy. Protein Science, 2024.[2] Fromm S, et al. Evaluating deep learning based structure prediction methods for antibody–antigen complexes. Bioinformatics, 2026.[3] Dunbar J, Krawczyk K, Leem J, et al. SAbDab: the structural antibody database. Nucleic Acids Research, 2014.[4] Leem J, Dunbar J, Georges G, et al. ABodyBuilder: automated antibody structure prediction with data-driven accuracy estimation. mAbs, 2016.[5] Weitzner BD, Jeliazkov JR, Lyskov S, et al. Modeling and docking of antibody structures with Rosetta. Nature Protocols, 2017.[6] Sircar A, Gray JJ. SnugDock: paratope structural optimization during antibody-antigen docking compensates for errors in antibody homology models. PLoS Computational Biology, 2010.[7] Jeliazkov JR, Sljoka A, Kuroda D, et al. Robustification of RosettaAntibody and Rosetta SnugDock. PLoS ONE, 2021.[8] Ruffolo JA, Sulam J, Gray JJ. Antibody structure prediction using interpretable deep learning. Patterns, 2022.[9] Abanades B, Georges G, Bujotzek A, Deane CM. ABlooper: fast accurate antibody CDR loop structure prediction with accuracy estimation. Bioinformatics, 2022.[10] Ruffolo JA, Chu LS, Mahajan SP, Gray JJ. Fast, accurate antibody structure prediction from deep learning on massive set of natural antibodies. Nature Communications, 2023.[11] Abanades B, Wong WK, Boyles F, et al. ImmuneBuilder: deep-learning models for predicting the structures of immune proteins. Communications Biology, 2023.[12] Kenlay H, Dreyer FA, Cutting D, Nissley D, Deane CM. ABodyBuilder3: improved and scalable antibody structure predictions. Bioinformatics, 2024.[13] Quast NP, et al. T-cell receptor structures and predictive models reveal sequence-structure relationships. Communications Biology, 2025.[14] Kim Y, Jeong W, Seok C, Baek M. GalaxyTongDock antibody-antigen complex modeling protocol. GalaxyWeb, 2024.[15] Abramson J, Adler J, Dunger J, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 2024.[16] Hitawala FN, et al. What does AlphaFold 3 learn about antibody and nanobody interactions? 2025.[17] Xu S, et al. Benchmarking all-atom biomolecular structure prediction with FoldBench. Nature Communications, 2025.[18] Wohlwend J, et al. Boltz-1: democratizing biomolecular interaction modeling. 2024/2025.[19] Chai Discovery. Chai-1: a multi-modal foundation model for biomolecular structure prediction. Technical Report, 2024.[20] Gao J, Hu J, Liu L, et al. Precise antigen-antibody structure predictions enhance antibody development with HelixFold-Multimer. arXiv, 2024.[21] Jin W, Barzilay R, Jaakkola T. Antibody-antigen docking and design via hierarchical equivariant refinement. ICML, 2022.[22] Wu F, et al. De novo design of epitope-specific antibodies via a high-throughput computational workflow. Nature Communications, 2025.[23] Tencent AI Lab. tFold-Ab / tFold-Ag: fast and accurate prediction of structures of antibodies and antibody-antigen complexes. Preprint / GitHub resources, 2024.[24] Høie MH, Hummer A, Olsen TH, Aguilar-Sanjuan B, Nielsen M, Deane CM. AntiFold: improved antibody structure-based design using inverse folding. arXiv, 2024.[25] Basu S, Wallner B. DockQ: a quality measure for protein-protein docking models. PLoS ONE, 2016.[26] Lensink MF, Velankar S, Wodak SJ. CAPRI: a critical assessment of predicted interactions. Proteins / CAPRI series.[27] Adams RM, Mora T, Walczak AM, Kinney JB. Measuring the sequence-affinity landscape of antibodies with massively parallel titration curves. eLife / related preprint, 2016.[28] Raybould MIJ, Marks C, Lewis AP, et al. Thera-SAbDab: the therapeutic structural antibody database. Nucleic Acids Research, 2020.