深度学习椭偏术(DLE):光学常数、薄膜结构和带隙的超快高精度确定
光谱椭偏术是表征薄膜光学常数折射率n、消光系数k、厚度和带隙的重要手段但传统数据分析依赖专家手动建模耗时长且门槛高。近年来基于深度学习的椭偏术DLE开始兴起但早期方法存在明显局限直接转换法难以处理复杂吸收特征迭代法则需要额外测量透射/反射光谱测量时间长达数十分钟。Flexfilm费曼仪器全光谱椭偏仪可以非接触对薄膜的厚度与折射率的高精度表征广泛应用于薄膜材料、半导体和表面科学等领域,在材料光学特性分析领域具有重要地位。本研究提出了一套全新的深度学习椭偏术框架在以下四个方面实现突破采用高达1亿组数据的超大规模训练将线性尺度的k光谱与对数尺度的α光谱相结合引入噪声学习与迁移学习策略提升对实验噪声的鲁棒性优化深度卷积神经网络CNN架构通过零填充技术构建更深网络。最终该方法仅需2秒即可完成从椭偏光谱到光学常数、结构参数和带隙的全自动分析且无需任何样品先验知识或辅助光谱测量。基本流程与网络结构本研究所开发的DLE分析整体流程包含两步过程本研究的DLE分析分为两个阶段第一阶段预训练方法A使用模拟生成的理想无噪声椭偏光谱训练CNN建立ψ,Δ与n,k,db,ds以及logα之间的映射关系。第二阶段微调方法B在模拟光谱中加入人工高斯噪声标准差σ0.2且Δ噪声为ψ噪声的2倍对预训练模型进行迁移学习以增强对真实实验噪声的适应性。本研究所使用的DLE算法包括通过带零填充的卷积神经网络层、展平层以及带跳跃连接的全连接层对椭偏原始数据进行处理生成(n,k)光谱和结构参数nkd模型以及对数α光谱logα模型网络结构输入为五个入射角50°~70°步长5°下100个光子能量点的ψ,Δ光谱构成能量-入射角二维伪图像。经过6个卷积层每层3×3滤波器步长1零填充防止维度收缩再经展平和5个全连接层带跳跃连接分别输出两个平行模型nkd模型预测n、k、体层厚度db、表面粗糙层厚度dslogα模型预测对数吸收系数logα。训练数据的生成为覆盖实际材料的多样性作者采用Tauc-Lorentz模型组合生成假设介电函数每个介电函数由1~10个TL峰叠加而成峰参数振幅、展宽、带隙、跃迁能量等范围来自对90种真实半导体材料的统计。薄膜结构模型为“表面粗糙层/体层/硅衬底含20Å原生氧化层”db变化范围10~300nmds为0~10nm。总计生成多达1亿组训练数据计算耗时约10天。实验验证与手动分析对照实验样品包括CIGS、CZTS、ZnO、a-Si:H、有机光刻材料等32种器件级薄膜均生长于硅衬底上。椭偏测量使用旋转补偿器椭偏仪五个入射角总测量时间2分26秒。手动分析采用Kramers-Kronig一致的B样条法商业软件CompleteEase每个样品耗时约5分钟作为DLE结果的参考真值。预训练方法A的关键发现对于CdTe(a)k光谱和(b)α光谱随预训练所用训练数据集总数N的变化(a)平均绝对误差MAE和(b)k光谱精度KSA随N的变化大规模训练数据的必要性以CdTe为例当训练数据量N10^4时预测的k和α光谱噪声极大N10^6时仍有残余波纹N≥10^7千万级后方可获得平滑准确的光谱。对34种模拟材料的定量评估表明MAE和KSA随着N从10^4增至10^8持续改善在10^7以上趋于饱和。因此至少千万级数据集是获得高精度的前提。混合方法得到的α光谱与真实光谱几乎完全重合混合线性-对数模型的优势单独使用nkd模型在低能区α10^4cm⁻¹会产生伪影而logα模型在高能区误差较大。最佳策略是在α10^4cm⁻¹处拼接高能区强吸收采用nkd模型的结果低能区弱吸收带边附近采用logα模型的结果再经KK积分得到完整的n光谱。本研究所开发的算法红色线和先前文献报道的算法蓝色线预测的a-Si:H和CdTe的(n,k)光谱与先前方法的对比对于a-Si:H非晶和CdTe晶态先前文献的算法蓝线与真实光谱黑线偏差明显而本研究算法红线几乎完美重合证实了超大规模训练和深度CNN结构的必要性。微调方法B解决噪声问题(a)CuIn₀.₈Ga₀.₂Se₂在不同入射角50°~70°下获得的实验(ψ,Δ)光谱(b)方法A仅基于无噪声学习的预训练得到的k和α光谱蓝色线以及基于B样条方法的手动分析结果黑色线(c)方法B基于带噪声学习的微调得到的k和α光谱红色线以及基于B样条方法的手动分析结果黑色线实验噪声引发的伪影将仅用理想光谱训练的方法A直接应用于真实CIGS实验光谱时预测的k和α光谱在带边附近约1.2eV出现强烈伪影蓝线而B样条手动分析黑线平滑准确。这是由于方法A从未见过含噪声数据对实验噪声过度敏感。迁移学习的显著效果经过噪声数据微调的方法B红线与B样条结果黑线几乎完全一致且厚度估计db37.93nmds9.22nm也与手动分析42.50nm和9.48nm接近。更重要的是DLE分析仅需2秒而手动分析需5分钟速度提升150倍。基于方法B的DLE分析红色线和B样条手动分析黑色线得到的a-Si:H、有机薄膜和CuIn₀.₈Ga₀.₂Se₂的(n,k)和α光谱(a)DLE方法B与手动B样条分析得到的db值之间的关系以及(b)两者得到的ds值之间的关系广泛适用性验证对a-Si:H、有机薄膜和CIGS方法B得到的n、k、α光谱与B样条结果高度吻合。db的统计R²值达0.994而ds的R²为0.669后者相关性稍差主要源于少数db50nm的超薄样品。总体误差统计n的MAE0.057k的MAE0.032db的MAPE8.6%ds的MAPE35.3%但81%样品ds的MAPE20%。超快带隙分析(a)直接带隙半导体材料CIGS基于Tauc图的带隙分析(b)非晶半导体材料a-Si:H基于Cody带隙的带隙分析(c)全自动DLE与手动B样条方法推导出的带隙值之间的关系利用DLE得到的α光谱可自动进行带隙提取直接带隙半导体采用Tauc图非晶半导体采用Cody带隙。对32个样品的分析表明DLE带隙与B样条结果的相关性极高R²0.997平均绝对误差仅31meV。整个分析包括光学常数和带隙总时间2秒相比传统透射/反射法需透明衬底、测量时间长、易受散射干扰具有全面优势。后B样条精细修正本研究中使用的B样条基函数的Kramers-Kronig积分流程(a)有机层和(b)CIGS层进行后B样条分析的结果红色线对于有机薄膜等具有尖锐跃迁的材料DLE结果与B样条结果仍存在细微差异。此时可以DLE输出的光学常数和厚度作为初始猜测自动执行一次B样条拟合并利用KK积分保证因果性。结果显示后B样条分析红线比原始DLE结果蓝线更好地拟合了实验ψ,Δ光谱且光学函数更为平滑可靠。薄层分析的固有困难(a)对无噪声模拟CdTe光谱进行DLE方法A分析得到的k光谱精度KSA的映射结果(b)对含人工光谱噪声的模拟光谱进行DLE分析方法A得到的KSA映射结果(c)对含噪声模拟光谱应用微调模型方法B分析得到的KSA映射结果结果表明即使在无噪声的理想条件下当db70nm时k光谱精度KSA也从98%以上急剧下降至约90%。这是因为薄层缺乏强烈干涉椭偏信息量不足属于物理本质上的困难。噪声会进一步加剧这一趋势但方法B能有效恢复大部分精度然而薄层区间db70nm的低精度仍是固有局限。AI“幻觉”与材料类型限制当前基于半导体材料训练的 DLE 模型红色线和详细手动分析黑色线得到的 In₂O₃:SnITO薄膜的 (n, k) 光谱本研究训练的DLE模型基于半导体介电函数TL峰组合对包含自由载流子吸收的透明导电氧化物如ITO不适用。手动分析的ITO光学常数在低能区E1.5eV呈现典型的Drude型自由载流子吸收而半导体DLE模型却错误地在1eV处生成了一个人工峰试图“强行拟合”该宽吸收特征。这是典型的AI“幻觉”——由于训练数据中从未出现自由载流子吸收模型只能用不合理的峰形来补偿。因此应用DLE时必须清楚模型的训练域超出域的材料需重新训练或采用其他方法。本研究通过四项核心创新——超大规模训练1亿数据、线性/对数混合建模、噪声鲁棒迁移学习、带零填充的深度CNN——成功建立了实用化的深度学习椭偏术。在32种真实薄膜上验证表明光学常数和体层厚度可达到与手动B样条分析相当的精度nMAE 0.057,kMAE 0.032,db MAPE 8.6%带隙分析误差仅31meV而单样品分析时间从5分钟降至2秒。对于表面粗糙层厚度ds和超薄样品db70nm精度仍有待提升对于训练域外的材料如金属、TCO模型可能产生幻觉结果需要谨慎使用或针对性重新训练。作为补充可采用DLE结果为初始猜测的B样条后分析进一步精修。总体而言本研究为椭偏术的自动化、高通量分析提供了可靠且通用的AI解决方案在材料合成机器人、在线过程监控等领域具有广阔应用前景。Flexfilm费曼仪器全光谱椭偏仪全光谱椭偏仪拥有高灵敏度探测单元和光谱椭偏仪分析软件专门用于测量和分析光伏领域中单层或多层纳米薄膜的层构参数如厚度和物理参数如折射率n、消光系数k先进的旋转补偿器测量技术无测量死角问题。粗糙绒面纳米薄膜的高灵敏测量先进的光能量增强技术高信噪比的探测技术。秒级的全光谱测量速度全光谱测量典型5-10秒。原子层量级的检测灵敏度测量精度可达0,05nm。Flexfilm全光谱椭偏仪能非破坏、非接触地原位精确测量超薄图案化薄膜的厚度、折射率,结合费曼仪器全流程薄膜测量技术助力半导体薄膜材料领域的高质量发展。原文参考《Deep learning ellipsometry: Ultrafast and high-accuracy determination of optical constants, film structures, and bandgaps》