NPJ Precis Oncol(IF=8)中国科学院深圳先进技术研究院吴红艳教授等团队:深度可解释放射基因组学解析乳腺MRI肿瘤微环境
01文献学习今天分享的文献是由中国科学院深圳先进技术研究院吴红艳教授等团队于2026年5月在肿瘤学顶刊《npj Precision Oncology》中科院1区topIF8上发表的研究“Deep interpretable radiogenomic workflow deciphers tumor microenvironment from breast MRI and identifies clinician-interpretable biomarkers”即深度可解释放射基因组学工作流程通过乳腺MRI解析肿瘤微环境并识别临床可解释的生物标志物该研究提出一个名为DiRG的深度可解释放射基因组学工作流程结合乳腺MRI和基因表达数据非侵入性地解析肿瘤微环境。通过自研的iBayesPrism反卷积算法从bulk转录组数据中推断TME细胞组分结合深度学习模型识别与TME相关的影像标志物特别是癌症相关成纤维细胞CAFs。研究在多中心数据中验证了CAF相关影像特征在TNBC亚型分型中的稳定性和可解释性并首次揭示了CAF比例与T细胞浸润之间的负相关关系。关键词放射基因组学乳腺MRI肿瘤微环境 (TME)癌症相关成纤维细胞 (CAFs)三阴性乳腺癌 (TNBC)可解释人工智能影像生物标志物肿瘤无创分型创新点①提出肿瘤异质性感知的反卷积算法iBayesPrism通过迭代更新参考矩阵从bulk转录组数据中精准推断TME细胞组分与表达。②首次揭示TNBC中CAF比例与T细胞浸润呈显著负相关阐明CAF可能的免疫抑制机制为靶向联合免疫治疗提供新依据。③构建结合Grad‑CAM与影像组学的可解释框架实现无监督病变标注从MRI中识别临床可理解的CAF相关成像标志物。临床价值①实现术前无创 TME评估替代有创活检避免信息滞后为早期诊断和个体化治疗提供关键依据。②通过 CAF 影像标志物预测免疫治疗反应利用 CAF‑T 细胞负相关关系指导免疫联合方案提升疗效。③识别六个跨数据中心稳定的影像组学特征如球形度、熵值构建高精度XGBoost 模型实现 TNBC 的无创、鲁棒分型。图 1深度可解释放射基因组学框架DiRG与数据集总览ADiRG完整工作流5步核心流程肿瘤微环境推断TMIiBayesPrism反卷积解析bulk数据得到8类细胞比例与基因表达深度放射组学特征提取UNet提取乳腺MRI多尺度深度特征放射基因组学建模融合基因影像特征预测TME组分与乳腺癌亚型MRI生物标志物识别Grad-CAM定位关键影像区域得到免疫微环境标志物I-markers无创分型建模基于可解释放射组学特征构建TNBC无创分型模型B研究数据集详情5大队列单细胞队列GEO84样本/337200细胞用于反卷积算法验证放射基因组学队列TCGA分发现集88人、验证集29人配对基因MRI放射组学队列ISPY181人、NACT-Pilot39人仅MRI数据临床队列中山大学肿瘤防治中心SYSUCC237人96例TNBC真实临床数据02研究背景和目的研究背景肿瘤微环境TME在癌症的发生、发展、转移及治疗响应中发挥着关键作用尤其是在乳腺癌等实体瘤中TME的组成如免疫细胞、癌症相关成纤维细胞、内皮细胞等与患者的预后和免疫治疗疗效密切相关。然而目前TME的评估主要依赖于有创的病理活检或手术切除组织这不仅增加了患者的风险也难以实现动态监测导致信息滞后。此外肿瘤的高度异质性使得基于少量活检样本的评估难以全面反映整体TME状态从而限制了可靠生物标志物的发现。放射基因组学旨在通过将医学影像与基因组学数据关联实现非侵入性地评估TME但现有方法多依赖固定的基因表达参考矩阵或基因签名难以适应不同肿瘤亚型间的异质性且缺乏对TME中细粒度细胞类型如CAFs、CD4 T细胞等的精确推断能力。因此亟需一种稳健、可解释且能适应肿瘤异质性的放射基因组学工作流以从常规乳腺MRI中深度解码TME信息并识别出临床医生可理解的影像生物标志物从而推动个性化治疗策略的发展。研究目的本研究旨在开发一个深度可解释的放射基因组学工作流DiRG用于从乳腺MRI图像中非侵入性地解码肿瘤微环境并识别出临床可解释的影像生物标志物特别是针对三阴性乳腺癌TNBC的亚型分型和免疫治疗响应预测。具体目标包括构建一个基于iBayesPrism的自适应反卷积算法结合定制化的单细胞参考矩阵从批量转录组数据中稳健地推断出包括CAFs、CD4 T细胞、巨噬细胞、内皮细胞等在内的八种关键TME细胞类型的比例和基因表达建立一套深度放射基因组学模型将MRI图像特征与TME组分和癌症亚型进行关联并通过Grad-CAM等可解释性模块识别出与TME最相关的影像区域从而提取CAF相关的影像组学特征开发一个基于XGBoost的非侵入性分型模型仅使用影像组学特征即可区分TNBC与非TNBC患者并在多中心数据集中验证其泛化能力揭示CAF比例与T细胞浸润之间的负相关关系为理解TNBC中的免疫逃逸机制提供新见解最终通过基因重要性分析SMPL模块识别与TNBC和CAF相关的关键基因促进新型标志物的发现和临床应用转化。03数据和方法研究数据总样本479例乳腺癌患者 79例肺癌患者数据来源5个队列单细胞队列GEOWu et al., GSE136831放射基因组学发现队列TCGA-BRCAn88放射基因组学验证队列TCGA-BRCAn29放射组学队列ISPY1n81NACT-Pilotn39临床队列中山大学肿瘤中心n237数据类型DCE-MRI影像、bulk RNA-seq、单细胞RNA-seq、临床病理信息技术方法iBayesPrism反卷积基于BayesPrism和定制化参考矩阵从bulk数据中推断TME细胞组分。深度学习模型U-Net提取影像特征结合基因特征预测TME和亚型。Grad-CAM注意力机制识别与TME最相关的影像区域。放射组学特征提取提取36个可解释特征一阶、形状、GLCM。XGBoost建模构建非侵入性亚型分型模型。SMLP基因重要性分析识别关键驱动基因。04实验结果反卷积性能iBayesPrism在Wu数据集上Pearson相似度 0.9优于CIBERSORT、xCell等。TME差异TNBC组中CAF比例显著低于非TNBC组CD4 T细胞、巨噬细胞、内皮细胞比例更高。新发现首次揭示CAF比例与T细胞浸润呈负相关。预测模型性能影像-CAF模型准确率0.87影像-TNBC模型准确率1.0放射组学特征TNBC组SumAverage、Sphericity ↑TNBC组MaximumDiameter、Skewness、InterquartileRange、Entropy ↓多中心验证平均准确率 0.8特征分布高度一致。基因重要性识别出KRT8、CCT6A、ENO1、TUBB等TNBC相关基因。图 2去卷积结果与统计分析图2A显示iBayesPrism方法在Wu数据集中预测的细胞比例最接近真实分布优于其他方法。图2B显示其与真实值的Pearson和余弦相似度均超过0.9。图2C表明在TNBC与非TNBC之间CD4 T细胞、CAF、巨噬细胞等五种细胞比例存在显著差异。图2D展示了两组细胞比例的平均分布差异。图2E的PCA分析显示CAF对非TNBC和TNBC分组的影响最大突出了其在亚型区分中的关键作用。图 3基因集富集分析结果图3A比较了去卷积前后富集通路的差异去卷积后新出现间隙连接通路等。图3B显示去卷积后识别出PSAT1、CCNE1等与TNBC相关的显著差异表达基因。图3C和3D进一步展示了IL-17信号通路、AMPK信号通路、抗原处理与呈递通路等在TNBC中的富集情况。去卷积后的数据在保留原有信息的同时揭示了新的生物学通路增强了对肿瘤微环境功能状态的理解。图 4放射基因组学模型性能与影像标志物图4A和4B展示了两位患者的Grad-CAM热图高CAF组比低CAF组有更大的注意力区域集中在肿瘤周边。图4C和4D展示了CAF相关影像组学特征在TNBC与非TNBC之间的显著差异如Minimum、JointEntropy升高StandardDeviation、Kurtosis降低。图4E显示Image-CAF模型的准确率达0.87Image-TNBC模型准确率为1.0验证了模型在独立队列中的稳健性。图 5多中心验证与非侵入性分型结果图5A–5C展示了在ISPY、NACT-Pilot和临床队列中CAF-I-marker自动生成的病灶注释与真实标注高度一致。图5D显示了13个在多个模型中重复出现的重要影像组特征其中MaximumDiameter、Sphericity、Entropy等6个特征在所有数据集中分布一致。图5E显示XGBoost模型在五个数据集中的准确率分别为0.89、0.94、0.73、0.87、0.70显著优于UNetFC模型证明CAF引导的影像组特征具有强泛化能力05研究结论该研究提出的深度可解释影像基因组学工作流程DiRG通过整合乳腺MRI与肿瘤微环境TME数据实现了非侵入性的三阴性乳腺癌TNBC精准分型并识别出具有临床可解释性的影像生物标志物。核心结论包括首先研究开发的iBayesPrism去卷积算法能准确从bulk转录组数据中推断TME细胞组成并首次揭示癌症相关成纤维细胞CAF比例与T细胞浸润水平呈显著负相关提示CAF在免疫逃逸中的关键作用。其次基于影像组学特征构建的模型在多个多中心数据集中平均准确率超过0.8成功识别出与CAF相关的稳定影像标志物如Sphericity、Entropy、MaximumDiameter等这些特征在TNBC与非TNBC组间分布差异显著且与BI-RADS语义描述具有良好对应关系。最后通过基因重要性分析模型不仅验证了KRT8、CCT6A等多个已知TNBC相关基因还发现了CRABP2、S100A11等潜在新标志物增强了模型的生物学可解释性。总体而言该工作为无需手术活检的肿瘤微环境评估与乳腺癌亚型预测提供了高效、可泛化的计算框架具有重要的临床转化潜力。06QAQ1该研究试图解决肿瘤诊疗中的哪一个关键难题A1研究旨在解决肿瘤微环境无法术前、无创、动态评估的临床难题。目前TME分析依赖有创活检或手术标本存在风险、信息滞后且难以重复。本研究通过乳腺MRI与基因数据的深度整合实现了非侵入性解析TME并识别出可被临床医生理解的影像生物标志物从而为早期诊断、免疫治疗反应预测和个性化治疗提供无创工具。Q2该研究提出的DiRG工作流程中最核心的技术创新是什么A2最核心的技术创新有三项①iBayesPrism反卷积算法基于BayesPrism与迭代更新的定制化参考矩阵能够从bulk转录组数据中稳健推断TME中8种关键细胞类型包括CAF、CD4 T细胞等克服了传统方法因肿瘤异质性导致的偏差。②可解释的放射基因组学模型结合U-Net影像特征提取、Grad-CAM注意力机制与SMLP基因重要性分析实现了影像-基因-表型的深度关联并首次从乳腺MRI中识别出与CAF相关的稳定影像标志物。③无监督病灶标注方法利用CAF标志物自动标注MRI中的关键区域无需人工勾画提升了临床可推广性。参考文献Peng Q, Xu Y, Shen L, Bao X, Zhou S, Ye X, Gu Y, Gong J. Habitat-based CT radiomics profiling spatial-temporal heterogeneity in resectable NSCLC predict pathological response to neoadjuvant chemoimmunotherapy: a multi-center study. NPJ Precis Oncol. 2026 Mar 31. doi: 10.1038/s41698-026-01388-z.