摘要本文是对发表在《Artificial Intelligence Review》期刊上的论文A systematic review of Green Machine Learning: practices and challenges for sustainability的文献精读第二篇。该论文由Samara Santos、André L. C. Ottoni、Rita Borgo、Danton Ferreira和Erivelton Nepomuceno共同撰写。本篇聚焦于原文第3章绿色机器学习维度的前半部分内容系统阐述GML的概念基础、定义框架、以及问题域分类。通过对GML五个基本维度算法效率、能源优化、硬件效率、碳足迹追踪和绿色基准的深入分析为读者建立对绿色机器学习领域的系统性认知框架。本篇还将详细讨论GML研究中的问题域分类包括机器学习任务类型、数据模态和应用场景等关键要素。1 绿色机器学习的概念基础1.1 GML的定义与内涵绿色机器学习Green Machine Learning, GML作为一个新兴的研究领域其定义随着研究的深入而不断演进和完善。从广义上讲GML是指在机器学习系统的整个生命周期中通过算法优化、硬件选择和操作策略来最小化能源消耗和环境影响的方法论与实践框架。GML的定义可以从以下几个核心维度进行理解生命周期视角GML关注机器学习系统从数据收集、模型训练、推理部署到系统维护的全生命周期环境影响。这种全生命周期视角要求研究者在设计和优化机器学习系统时不仅要考虑单一阶段的能效还要综合评估各阶段之间的相互影响和累积效应。多目标优化GML本质上是一个多目标优化问题需要在模型性能如准确率、召回率、计算效率如训练时间、推理延迟和环境指标如能源消耗、碳排放之间寻求平衡。这种多目标特性使得GML研究具有独特的理论挑战和实践复杂性。跨学科融合GML融合了机器学习、计算机体系结构、能源系统、环境科学等多个学科的知识。这种跨学科特性要求研究者具备广泛的知识背景和系统思维能力。从形式化角度GML可以表述为在给定性能约束下最小化环境影响的优化问题min⁡θE(θ)s.t.P(θ)≥Pmin\min_{\theta} E(\theta) \quad \text{s.t.} \quad P(\theta) \geq P_{min}θmin​E(θ)s.t.P(θ)≥Pmin​其中E(θ)E(\theta)E(θ)表示模型参数θ\thetaθ对应的环境影响如能源消耗或碳排放P(θ)P(\theta)P(θ)表示模型性能PminP_{min}Pmin​表示最低可接受性能阈值。1.2 GML的五个基本维度本综述识别出GML的五个基本维度这些维度构成了理解和实践绿色机器学习的概念框架。图6直观展示了这五个维度及其相互关系。表1 GML的五个基本维度维度核心关注点关键技术/方法算法效率设计低计算复杂度的模型剪枝、量化、知识蒸馏、神经架构搜索能源优化减少训练和推理过程的能耗高效训练策略、动态资源分配、碳感知调度硬件效率利用能效优化的计算平台低功耗处理器、专用加速器、神经形态计算碳足迹追踪量化和报告碳排放能源监控工具、碳排放计算器、生命周期评估绿色基准建立标准化评估体系基准数据集、评估协议、可重复性标准算法效率维度关注设计能够在保持竞争性性能的同时降低计算需求的机器学习模型。这包括模型压缩技术如剪枝、量化、高效架构设计如轻量级网络、以及训练过程优化如早停、课程学习等。算法效率是GML研究中最活跃的领域之一产生了大量创新性的技术方法。能源优化维度聚焦于减少机器学习工作流中的能源消耗。这包括优化训练策略如混合精度训练、动态资源管理如弹性批处理、以及碳感知计算调度如根据电网碳强度调整计算时间等。能源优化强调从系统层面考虑能效问题与算法效率形成互补。硬件效率维度探讨利用能效优化的硬件平台来执行机器学习任务。这包括使用低功耗处理器如ARM架构、专用加速器如GPU、TPU、FPGA、以及新兴的神经形态计算设备。硬件效率是实现GML目标的重要技术途径但需要在硬件成本、开发复杂度和能效收益之间进行权衡。碳足迹追踪维度关注如何准确测量和报告机器学习系统的碳排放。这涉及能源监控工具的开发、碳排放因子的确定、以及标准化报告框架的建立。碳足迹追踪是实现GML可重复性和透明性的基础也是推动该领域规范化发展的关键。绿色基准维度致力于建立标准化的评估体系使不同GML方法能够进行公平比较。这包括基准数据集的建设、评估协议的制定、以及可重复性标准的推广。绿色基准是连接GML研究与实际应用的桥梁对于推动技术转化具有重要意义。1.3 GML与可持续发展目标的对齐GML研究与国际可持续发展议程特别是联合国可持续发展目标SDGs具有天然的契合性。本综述明确将GML研究与相关SDGs建立联系这是区别于现有综述的重要特色。SDG 13气候行动GML通过减少机器学习系统的碳排放直接贡献于气候行动目标。随着机器学习应用的普及其累积碳足迹已不容忽视。研究表明训练一个大型语言模型可能产生相当于多辆汽车全生命周期碳排放量的环境影响。GML技术为降低这种影响提供了可行路径。SDG 7经济适用的清洁能源GML与清洁能源目标存在双向关系。一方面GML通过提高计算能效减少能源需求另一方面机器学习技术可以优化能源系统的运行如智能电网调度、可再生能源预测等从而促进清洁能源的利用。SDG 9产业、创新和基础设施GML推动机器学习产业向可持续方向发展促进绿色计算基础设施的建设。这包括开发能效优化的数据中心、推广碳感知计算实践、以及建立绿色AI评估标准等。这种与SDGs的对齐不仅赋予了GML研究更广泛的社会意义也为政策制定者和产业界提供了采纳GML实践的价值论据。通过将GML置于可持续发展框架下可以更好地理解其重要性和紧迫性。1.4 GML的理论框架从理论层面看GML可以被视为一个多层次、多约束的优化问题。在算法层面GML关注如何在模型容量、泛化能力和计算效率之间取得平衡在系统层面GML关注如何优化计算资源分配和能源使用在环境层面GML关注如何最小化碳排放和生态影响。这种多层次特性可以用以下理论框架来描述计算复杂度理论视角传统计算复杂度理论关注算法的时间和空间复杂度而GML引入了能源复杂度的概念。能源复杂度可以定义为算法执行过程中消耗的总能量它与时间复杂度相关但不完全等同。例如某些算法可能具有较低的时间复杂度但由于内存访问模式不佳其能源复杂度可能较高。EtotalEcomputeEmemoryEcommunicationE_{total} E_{compute} E_{memory} E_{communication}Etotal​Ecompute​Ememory​Ecommunication​其中EcomputeE_{compute}Ecompute​表示计算能耗EmemoryE_{memory}Ememory​表示内存访问能耗EcommunicationE_{communication}Ecommunication​表示数据通信能耗。这一分解揭示了GML优化的多个可能切入点。信息论视角从信息论角度看机器学习过程可以被视为信息压缩和提取的过程。GML关注如何在保持关键信息的前提下最小化处理这些信息所需的能量。这涉及信息表示效率、特征选择和模型压缩等信息论问题。优化理论视角GML本质上是一个约束优化问题需要在多个目标之间寻求帕累托最优解。这涉及多目标优化理论、约束满足问题、以及权衡分析等优化理论问题。2 问题域分类2.1 问题域概述问题域Problem Domain是GML研究分类的重要维度它描述了研究关注的机器学习任务类型、数据模态和应用场景。清晰的问题域分类有助于研究者定位相关工作、识别研究空白、并进行跨领域的方法迁移。本综述从三个维度对问题域进行分类机器学习任务类型、数据模态和应用领域。这种多维度分类框架能够全面刻画GML研究的覆盖范围和分布特征。2.2 机器学习任务类型机器学习任务类型是问题域分类的核心维度。本综述识别出GML研究中涉及的主要任务类型并分析各类任务的能源效率特点和优化策略。表2 GML研究中的机器学习任务类型任务类型描述能源效率特点典型优化策略分类将输入分配到预定义类别训练能耗高推理可优化模型压缩、知识蒸馏回归预测连续值输出与分类类似特征选择、模型简化聚类无监督分组迭代计算密集高效距离计算、采样目标检测定位和识别图像中的对象计算密集多尺度处理轻量级架构、锚框优化语义分割像素级分类高分辨率处理需求编码器-解码器优化序列建模处理序列数据时序依赖长程建模高效注意力机制生成任务生成新数据样本采样过程能耗高高效采样、蒸馏强化学习通过交互学习策略大量环境交互经验重放、模型压缩分类任务是GML研究中最为常见的任务类型。分类任务的能源效率优化主要关注模型压缩和训练加速。研究表明通过剪枝可以移除神经网络中50%-90%的参数而不显著影响分类准确率通过量化可以将模型大小减少4-8倍同时保持可接受的性能损失。目标检测和语义分割等计算机视觉任务由于需要处理高分辨率输入和进行密集预测通常具有较高的计算复杂度。GML研究在这些领域主要关注设计轻量级网络架构如MobileNet、EfficientDet等以及开发高效的注意力机制和特征金字塔结构。序列建模任务特别是基于Transformer的模型近年来因大型语言模型的兴起而备受关注。然而Transformer的自注意力机制具有二次复杂度在处理长序列时能耗显著。GML研究在这一领域主要关注高效注意力变体如线性注意力、稀疏注意力和模型压缩技术。强化学习任务由于其需要大量环境交互来学习策略通常具有极高的能源消耗。GML研究在强化学习领域主要关注样本效率提升如离线强化学习、模型基方法和策略网络压缩。2.3 数据模态分类数据模态是影响机器学习系统能源消耗的重要因素。不同模态的数据具有不同的特征维度、稀疏性和处理复杂度因此需要针对性的GML策略。表3 GML研究中的数据模态数据模态特征维度计算特点能耗挑战GML策略图像高像素级卷积运算密集高分辨率处理轻量级CNN、图像压缩文本中高词向量序列建模长序列处理高效Transformer、词表优化音频中时频特征时序卷积/循环实时性要求流式处理、模型压缩视频极高时空3D卷积/时序建模帧间冗余时序采样、关键帧提取表格低中特征全连接层特征工程特征选择、树模型多变量时序中高时序建模长序列、多变量降维、注意力优化图数据可变图卷积大规模图采样、图压缩图像数据是GML研究中最常见的数据模态。图像数据通常具有高维度像素级特征需要大量的卷积运算。GML在图像领域的策略主要包括设计轻量级卷积架构如深度可分离卷积、图像压缩和分辨率自适应处理、以及模型压缩技术。文本数据的处理随着预训练语言模型的普及而成为能源消耗的重要来源。大型语言模型如GPT系列包含数十亿甚至数千亿参数训练成本极高。GML在文本领域的策略包括高效预训练方法如 ELECTRA、模型压缩如 DistilBERT、以及参数高效微调如 LoRA。音频数据处理在语音识别、音乐分析等应用中广泛使用。音频数据的GML策略主要关注实时处理约束下的能效优化包括流式处理架构、模型压缩和量化等。视频数据由于其时空特性计算复杂度远高于静态图像。GML在视频领域的策略包括时序采样减少处理帧数、关键帧提取聚焦重要内容、以及时空特征的高效建模。表格数据在传统机器学习应用中占主导地位。虽然深度学习在表格数据上的应用日益增多但传统方法如梯度提升树在能效方面仍具有优势。GML在表格数据领域的策略包括特征选择、模型简化和混合架构设计。2.4 应用领域分布GML研究的应用领域分布反映了该技术的实际需求和部署场景。本综述识别出GML研究涉及的主要应用领域并分析各领域的特点和挑战。表4 GML研究的应用领域分布应用领域典型任务能源挑战GML重点计算机视觉分类、检测、分割高分辨率处理轻量级网络自然语言处理分类、生成、翻译大模型训练模型压缩、高效预训练语音处理识别、合成实时处理流式架构、量化推荐系统排序、召回大规模嵌入嵌入压缩、采样医疗健康诊断、预测高精度要求不确定性感知压缩自动驾驶感知、决策实时性、安全性边缘部署、模型压缩物联网感知、预测资源受限轻量级模型、联邦学习金融科技风控、预测低延迟高效推理、增量学习计算机视觉是GML研究最活跃的应用领域涵盖了图像分类、目标检测、语义分割、人脸识别等众多任务。计算机视觉应用的能源挑战主要来自高分辨率图像处理和实时性要求。GML在该领域的策略包括轻量级网络架构设计、神经网络架构搜索和模型压缩技术。自然语言处理领域因大型语言模型的兴起而成为能源消耗的重要来源。训练一个大型语言模型可能消耗数十万到数百万千瓦时的电力产生显著的碳排放。GML在该领域的策略包括高效预训练方法、模型压缩和参数高效微调。物联网和边缘计算场景对GML提出了特殊要求。边缘设备通常具有有限的计算资源、内存容量和电池续航因此需要极致的模型压缩和能效优化。联邦学习作为一种保护隐私的分布式学习范式在物联网场景中应用广泛但其能源效率问题也日益受到关注。医疗健康领域的机器学习应用对模型精度有严格要求这给GML带来了独特挑战。如何在保证诊断准确性的前提下优化能源效率是医疗AI可持续发展的关键问题。不确定性感知的模型压缩方法在该领域显示出潜力。2.5 问题域交叉分析问题域的三个维度任务类型、数据模态、应用领域之间存在复杂的交叉关系。某些组合在GML研究中更为常见反映了研究热点和实际需求的分布。图像分类任务结合图像数据模态和计算机视觉应用领域是GML研究中最常见的组合。大量研究聚焦于设计轻量级图像分类网络如MobileNet系列、ShuffleNet系列等这些工作奠定了GML在计算机视觉领域的技术基础。序列建模任务结合文本数据模态和自然语言处理应用领域近年来因大型语言模型的兴起而成为GML研究的热点。如何降低大模型的训练和推理成本是该领域GML研究的核心问题。强化学习任务结合多模态数据和自动驾驶/机器人应用领域代表了GML研究的前沿方向。强化学习的高样本复杂度和实时决策要求使其成为GML最具挑战性的应用场景之一。这种交叉分析揭示了GML研究的覆盖范围和空白区域。某些组合如表格数据上的分类任务虽然在实际应用中常见但在GML研究中相对较少受到关注这可能代表了未来的研究方向。3 GML研究现状的定量分析3.1 研究分布统计基于系统综述收集的66篇文献本节对GML研究现状进行定量分析揭示研究热点和发展趋势。图7展示了GML研究中机器学习任务类型的分布。分类任务占据最大比例其次是目标检测和序列建模任务。这一分布反映了GML研究对常见机器学习任务的关注同时也表明某些任务类型如生成任务、强化学习的GML研究仍有较大发展空间。图8展示了数据模态的分布情况。图像数据是最常见的研究对象其次是文本和多变量时序数据。视频数据虽然计算复杂度高但由于研究难度较大相关GML研究相对较少。3.2 能源测量方法分析能源测量是GML研究的基础准确的能源测量是评估和比较不同方法的前提。本综述分析了现有研究中使用的能源测量方法识别出主要的方法类型和特点。表5 GML研究中的能源测量方法测量方法原理优点局限性适用场景硬件功率计直接测量设备功耗高精度需要专用设备实验室研究软件监控通过API获取功耗数据易于部署精度受限大规模实验模型估算基于计算量估算能耗无需测量设备估算误差快速评估碳排放计算器基于能源和碳强度计算考虑区域差异依赖外部数据碳足迹报告硬件功率计通过直接测量设备的电力消耗来获取精确的能耗数据。常用设备包括Watts Up? Pro功率计、NVIDIA的NVML库用于GPU功耗监控等。硬件功率计提供最高精度的测量但需要专用设备限制了其在大规模实验中的应用。软件监控方法通过操作系统或硬件提供的API获取功耗数据。例如Intel的RAPLRunning Average Power Limit接口可以获取CPU和内存的功耗数据NVIDIA的NVML库可以获取GPU的实时功耗。软件监控方法易于部署适合大规模实验但精度通常低于硬件功率计。模型估算方法基于理论计算量如FLOPs和硬件特性估算能耗。这种方法不需要实际测量设备可以快速评估不同方法的相对能效。然而模型估算忽略了内存访问、数据通信等因素可能导致显著的估算误差。碳排放计算器如Carbontracker、CodeCarbon、Green Algorithms等工具结合能源消耗数据和区域碳强度信息估算机器学习过程的碳排放。这些工具为GML研究提供了标准化的碳足迹报告方法但依赖于外部数据的准确性和时效性。3.3 研究质量评估本综述对纳入研究的质量进行了系统评估考察了能源测量的透明性、可重复性和报告完整性。图9展示了研究中能源测量报告的完整性分布。仅有约40%的研究完整报告了能源测量的硬件配置、软件环境和测量方法这反映了GML研究在方法论标准化方面的不足。研究质量评估揭示了GML领域面临的几个关键挑战测量方法不一致不同研究使用不同的能源测量方法使得跨研究比较变得困难。建立标准化的测量协议是推动GML研究规范化的重要前提。报告不完整许多研究未能完整报告能源测量的关键细节如硬件配置、测量时长、能源来源等。这种不完整性限制了研究的可重复性和可比较性。基准缺失缺乏标准化的基准数据集和评估协议使得不同研究的性能和能效比较缺乏共同基础。这些发现为GML领域的未来发展指明了方向需要建立标准化的方法论框架、报告规范和基准体系以支持可重复、可比较的GML研究。小结本篇文献精读系统阐述了绿色机器学习的概念基础和问题域分类。GML作为一个多维度、跨学科的研究领域其五个基本维度算法效率、能源优化、硬件效率、碳足迹追踪、绿色基准构成了理解和实践绿色机器学习的概念框架。问题域分类从机器学习任务类型、数据模态和应用领域三个维度刻画了GML研究的覆盖范围和分布特征。定量分析揭示了GML研究的热点分布和方法论挑战为后续深入探讨GML的算法策略和测量工具奠定了基础。下一篇将深入分析GML的核心算法策略和能源测量工具。参考文献来源Santos S, Ottoni ALC, Borgo R, Ferreira D, Nepomuceno E. A systematic review of Green Machine Learning: practices and challenges for sustainability. Artificial Intelligence Review (2026) 59:132. https://doi.org/10.1007/s10462-026-11515-8