1. 近场CSI反馈的技术挑战与NEFT框架概述在6G通信系统中极大规模MIMOXL-MIMO技术正成为实现超高速数据传输的关键使能技术。随着天线阵列规模扩展到数百甚至数千个单元传统的远场平面波假设适用范围急剧缩小大量用户设备UE将处于近场传播区域。这种物理特性的改变带来了独特的信道特性电磁波的球面波特性导致信道矩阵呈现复杂的非线性相位变化和空间变化的幅度分布这与远场场景中相对简单的线性相位关系形成鲜明对比。在频分双工FDD系统中由于上下行链路使用不同载波频率基站BS无法利用信道互易性获取下行CSI用户设备必须本地估计下行CSI并反馈给基站。当天线数量非常大时这种CSI反馈会导致极高的开销。传统的CSI反馈方法主要依赖基于码本的技术和压缩感知CS方法但在近场环境中面临根本性限制码本方法的局限性码本大小随天线数量呈指数增长且难以捕捉近场信道的复杂空间特性压缩感知的不足丰富的散射环境破坏了稀疏性假设迭代重建算法计算开销巨大现有深度学习方法的缺陷CNN编码器固定感受野难以捕捉近场CSI的空间变化基于Transformer的方法直接迁移计算机视觉架构而忽略CSI结构特性导致计算成本过高针对这些挑战我们提出了近场高效反馈TransformerNEFT框架其核心创新体现在三个方面层次化视觉Transformer架构通过渐进式token缩减和多尺度特征提取平衡全局注意力计算与内存效率多级知识蒸馏策略通过联合对齐注意力图、码字和重建输出在降低模型复杂度的同时保持精度混合设计范式针对不同硬件约束场景提供从高性能服务器到边缘设备的全谱系解决方案2. NEFT核心架构设计解析2.1 层次化视觉Transformer骨干网络NEFT采用两阶段编码器-解码器结构如图1所示。输入CSI张量C, H, W2, 32, 32被划分为8×8个不重叠的2×4×4大小patch每个patch投影到嵌入维度C形成第一个ViT块的输入token数组。经过第一个ViT块后patch merging通过2×2卷积将2×2相邻token聚合空间token数量减少而通道维度翻倍至2C×4×4。粗粒度token通过第二个ViT块和线性投影形成编码器的码字。解码器从重塑后的码字2C×4×4开始经过第一个ViT块后通过2×2转置卷积ConvT的patch division操作逆转patch merging将token扩展为C×8×8用于第二个块。最终的patch division重建原始2×32×32 CSI矩阵。这种设计的关键优势在于通过patch merging/division实现渐进式下采样和上采样显著降低自注意力的二次计算复杂度保留全局MSA多头自注意力而非窗口MSA直接建模近场CSI的长程空间依赖编码器使用较小嵌入维度C32解码器使用较大维度C48适应硬件不对称性2.2 计算效率优化分析NEFT的计算效率通过以下机制实现token序列长度缩减使用较大patch嵌入4×4将token序列从256和64缩减到64和16使MSA计算可行复杂度对比优势与窗口MSAW-MSA相比完整MSA层在NEFT中仅消耗SwinCFNet中W-MSA堆栈11.7%的计算量具体计算复杂度公式对比如下W-MSA复杂度Ω(W-MSA) 4hwC² 2M²hwCMSA复杂度Ω(MSA) 4hwC² 2(hw)²C其中h×w为特征图尺寸C为通道维度M为窗口大小。当嵌入维度C40时NEFT在8×8和4×4分辨率下仅需N1N21个块分别需要0.737M和0.451M操作远低于SwinCFNet的3.44M和6.72M。3. 多级知识蒸馏框架设计3.1 蒸馏框架架构针对CSI反馈任务的三个特性我们设计了多级知识蒸馏框架CSI重建是回归任务直接输出对齐比分类中的软标签模仿更合适MSA机制编码的空间依赖为学习相关性感知表示提供结构化指导码字直接编码压缩信道信息对齐这一潜在表示对下游重建精度至关重要如图4所示我们从冻结的教师网络中提取三种监督形式最终重建输出提供回归特定的暗知识中间注意力图提炼教师空间相关的内部表示瓶颈码字提供紧凑的潜在监督信号3.2 三级对齐机制重建对齐RAL_{RA} \|\hat{H}_{NEFT} - \hat{H}_{compact}\|_2^2通过对齐教师和学生网络的最终重建输出加速收敛并增强稳定性注意力对齐AAL_{AA} \frac{1}{L_{MSA}}\sum_{l1}^{L_{MSA}}\frac{1}{N_h^{(l)}}\sum_{i1}^{N_h^{(l)}}\|A_{NEFT}^{(l,i)} - A_{compact}^{(l,i)}\|_2^2将教师MSA捕获的结构化空间相关性转移给学生码字对齐CAL_{CA} \frac{1}{N_d}\|z_{NEFT} - z_{compact}\|_2^2约束学生的码字与教师匹配提高编码过程和后续解码的保真度3.3 训练策略训练分为两个连续阶段教师预训练使用传统CSI反馈重建目标最小化原始与重建信道矩阵之间的MSE学生蒸馏结合重建损失与三个蒸馏目标L_{total} L_{rec} \lambda_1L_{RA} \lambda_2L_{AA} \lambda_3L_{CA}权重系数经实证分析设为λ₁0.3λ₂2.0λ₃2.04. 混合架构设计与边缘适配4.1 NEFT-Hybrid设计原理通过注意力可视化分析发现编码器阶段2呈现强对角线注意力模式图6a表明特征交互保持空间局部化解码器阶段1显示广泛分布的注意力模式图6b表明需要全局上下文建模基于此NEFT-Hybrid采用轻量级CNN编码器三阶段设计每阶段空间维度减半通道数加倍使用3×3卷积核实现受控的感受野扩展计算复杂度FLOPs Hₒ × Wₒ × Cₒ × Kₕ × Kₙ × Cᵢ保留ViT解码器维持从压缩表示重建长程空间相关性的能力4.2 NEFT-Edge实现对NEFT-Hybrid应用多级知识蒸馏得到适配超约束IoT环境的NEFT-Edge在编码器和解码器中同时减少token维度保持混合编码器-解码器结构计算成本显著低于现有CNN近场CSI反馈模型5. 实验验证与性能分析5.1 实验设置数据集基于LoS信道模型生成BS使用N₁1024天线的ULA每个UE有N₂1天线评估指标归一化均方误差NMSE\text{NMSE(dB)} 10\log_{10}\left(\frac{\mathbb{E}[\|H - \hat{H}\|_F^2]}{\mathbb{E}[\|H\|_F^2]}\right)余弦相似度\rho \mathbb{E}\left[\frac{\langle H, \hat{H}\rangle_F}{\|H\|_F\|\hat{H}\|_F}\right]5.2 性能对比表II显示在不同压缩率γ下的性能对比γ16时NEFT达到最佳性能NMSE比ExtendNLNet提升17.95dBNEFT-Hybrid性能接近NEFT同时具有最低计算成本和参数量在高压缩率γ64下NEFT仍保持显著优势NMSE比基准提升9.66dB5.3 蒸馏效果验证表III展示多级KD框架效果γ16时NEFT-Compact减少20.39%参数和25.98%FLOPsNMSE仅降低3.22%NEFT-Edge减少29.80%参数和35.87%FLOPsNMSE降低7.20%消融实验证明不使用KD的模型NMSE退化显著NEFT-Compact-w/o-KD达9.00%6. 实际部署建议基于实验结果我们给出不同场景的部署建议高性能智能终端推荐方案完整版NEFT优势最高重建质量NMSE -31.14dB γ16硬件要求中等存储需求较高计算能力普通移动设备推荐方案NEFT-Compact优势参数量减少20-34%FLOPs减少25-36%精度损失可忽略调优建议可适当降低token维度进一步优化强编码端约束场景推荐方案NEFT-Hybrid优势编码端计算减少达64%注意需保证解码端有足够计算资源边缘/IoT设备推荐方案NEFT-Edge优势参数量减少22-30%总FLOPs减少24-36%部署要点优先保障编码效率可接受适度精度损失关键实施细节在实际系统中部署时建议采用动态选择机制根据设备能力自动切换NEFT变体。对于BS端可预加载所有解码器模型根据接收的码字头部标识选择对应解码器。