XL-MIMO近场定位：攻克PC-HAD相位模糊与球面波挑战

张

张建站

2026/5/24 4:22:13

10分钟阅读

1. 项目概述与核心挑战在无线通信和雷达感知领域精确确定信号源的物理位置——即到达方向DOA和距离Range——是一项基础且关键的任务。无论是实现精准的波束赋形以提升通信质量还是进行环境感知以支持自动驾驶、无人机导航等应用都离不开高精度的定位技术。其核心原理并不复杂当信号以电磁波形式传播到由多个天线组成的阵列时由于每个天线与信号源的距离存在微小差异信号到达不同天线时会形成特定的相位差。通过精确测量并分析这些相位差我们就能反推出信号源在空间中的方位。然而技术演进总是伴随着新的挑战。随着我们迈向6G时代为了追求更高的频谱效率和更大的网络容量天线阵列的规模正在急剧膨胀从传统的大规模MIMO走向“极大规模MIMO”XL-MIMO。同时为了降低硬件成本和功耗业界广泛采用“部分连接混合模拟数字”PC-HAD架构。这种架构虽然经济高效但它引入了一个棘手的问题相位模糊。简单来说由于模拟移相器的相位周期特性一个接收到的信号相位可能对应多个不同的真实入射角就像时钟的指针指向12点时你无法区分是中午12点还是午夜12点。更大的挑战在于“近场”效应。传统定位技术大多基于“远场”假设即信号源距离天线阵列足够远电磁波可以近似为平面波所有天线接收到的波前方向一致。但在XL-MIMO系统中巨大的阵列孔径使得信号源更容易落在“近场”区域。此时电磁波是以球面波形式传播的波前是弯曲的不同天线接收到的信号方向并不相同。这彻底颠覆了传统基于平面波模型的估计算法使得问题从单纯的角度估计升级为需要同时求解角度和距离的二维联合估计复杂度呈指数级上升。因此本项目的核心目标就是攻克在采用PC-HAD架构的XL-MIMO接收阵列下进行近场辐射源高精度定位这一工程难题。我们不仅要解决PC-HAD固有的相位模糊问题还要应对近场球面波带来的模型非线性最终实现在硬件成本、计算复杂度和定位精度之间的最佳平衡。2. 系统模型与问题形式化2.1 近场信号模型与PC-HAD接收阵列我们考虑一个典型的近场定位场景一个窄带信号源位于接收天线的近场区域菲涅尔区信号以球面波形式传播。一个包含M个天线的均匀线性阵列ULA负责接收信号。那么第m个天线接收到的信号可以建模为x_m(t) s(t) * exp(j * φ_m) v_m(t)其中s(t)是信号波形v_m(t)是加性高斯白噪声而最关键的部分是相位项φ_m。在球面波模型下φ_m由信号源到第m个天线与到参考点如阵列中心或第一个天线的波程差决定φ_m (2π/λ) * [ sqrt(r² (m-1)²d² - 2(m-1)d r sinθ) - r ]这里λ是信号波长d是天线间距通常设为半波长λ/2θ和r就是我们最终要估计的目标入射角和距离。现在引入PC-HAD架构。为了节省昂贵的射频链和模数转换器整个M根天线的阵列被划分为K个子阵列每个子阵列包含M_s根天线M K * M_s并共享一个射频链。每个子阵列前端有一组模拟移相器对接收信号进行模拟波束成形。因此第k个射频链的输出信号是它所属子阵列所有天线信号的加权和y_k(t) w_k^H * x_k(t) (1/√M_s) * Σ [ s(t) * exp(j*(φ_{k,l} α_{k,l})) v_{k,l}(t)*exp(j*α_{k,l}) ]其中w_k是第k个子阵列的模拟波束成形向量α_{k,l}是移相器引入的相位。将所有K个射频链的输出堆叠起来就得到了整个阵列的接收信号向量模型y(t) W^H * a(θ, r) * s(t) W^H * v(t)这里W是一个块对角矩阵代表了所有子阵列的模拟波束成形权重a(θ, r)是近场导向矢量。这个模型清晰地揭示了我们的问题从被模拟预处理矩阵W扭曲过的观测信号y(t)中高精度地估计出原始的θ和r。注意PC-HAD架构的核心折衷在于它用硬件复杂度的降低K个射频链 vs M个射频链换来了信号模型的“降维”或“失真”。我们的算法必须在这种失真下依然能鲁棒地工作。2.2 相位模糊问题的根源与近场特殊性相位模糊是PC-HAD架构下DOA估计的“阿喀琉斯之踵”。其根源在于模拟移相器的相位响应具有周期性。在远场平面波模型下阵列导向矢量a(θ)中相邻天线的相位差是线性的Δφ (2π/λ) * d * sinθ。在PC-HAD架构中每个子阵列被等效视为一个“超级天线”其等效天线间距变为M_s * d。这导致相位差可能出现2π整数倍的模糊即sinθ_estimated sinθ_true (λ / (M_s * d)) * i 其中i 0, ±1, ±2, ...对于半波长间距(dλ/2)上式简化为sinθ_estimated sinθ_true (2 / M_s) * i。这意味着一次测量会得到M_s个可能的候选角度解其中只有一个是真实的。有趣的是在近场模型下事情出现了转机。近场导向矢量a(θ, r)中的相位项φ_m是关于天线索引m的非线性函数包含平方根。这种非线性使得不同子阵列接收到的信号相位关系无法被简单的周期性模糊所完全刻画。换句话说近场球面波的曲率本身携带了额外的信息在某种程度上“破坏”了远场下严格的相位模糊周期性。这是我们后续算法设计的一个重要出发点近场效应虽然增加了问题维度但也为化解PC-HAD的相位模糊提供了新的可能性。3. 核心方案分组PC-HAD结构与问题转化3.1 分组思想化近场为远场直接处理整个大规模阵列的近场模型是极其复杂的。我们提出了一种“分而治之”的巧妙思路分组PC-HAD结构。我们将整个包含K个子阵列的大规模接收阵列均匀划分为L个组Group每个组包含G个子阵列K L * G。分组的核心依据是近场-远场转换条件。回忆一下判断一个信号源是近场还是远场的瑞利距离公式为2D²/λ其中D是阵列孔径。对于一个子阵列组其物理孔径D_g远小于整个阵列的孔径D。因此只要信号源到阵列的距离r满足r 2 * D_g² / λ那么对于单个组内部的G个子阵列而言信号就可以被近似为来自远场的平面波。这是一个非常关键的简化。虽然对于整个阵列信号仍然是近场球面波但对于每个独立的“小阵列”即一个组我们却可以沿用成熟的远场DOA估计算法。3.2 组内远场DOA估计与相位模糊集生成在每个组内部问题被简化为一个具有G个“等效天线”每个等效天线对应一个子阵列的ULA接收一个远场信号。此时我们可以采用计算效率高、精度优秀的Root-MUSIC算法来进行DOA估计。具体步骤如下计算协方差矩阵对第l个组的接收信号y_l(t)计算其采样协方差矩阵R_l (1/T) * Σ y_l(t) * y_l^H(t)其中T是快拍数。特征分解对R_l进行特征值分解将特征向量张成的空间划分为信号子空间和噪声子空间。构建多项式与求根利用噪声子空间构造一个多项式f(z_l)其最接近单位圆的根ẑ_l包含了DOA信息。这是Root-MUSIC的核心避免了谱峰搜索计算量低。生成模糊解集由于等效天线间距为M_s * d根据前述相位模糊原理一个根ẑ_l会对应M_s个可能的DOA估计值θ̂_{l,i} arcsin[ (λ * (arg(ẑ_l) 2π*i)) / (2π * M_s * d) ],i 0, 1, ..., M_s-1这样对于第l个组我们就得到了一个包含M_s个候选角度的初始解集Θ̂_l。至此我们通过分组将原来的一个近场问题转化为了L个独立的远场DOA估计子问题并分别得到了它们的模糊解集。接下来的挑战是第一如何从每个组的M_s个模糊解中挑出唯一真值第二如何将L个组估计出的、彼此不同的角度因为它们对应信号源相对于不同组参考点的方向融合得到最终相对于整个阵列参考点的统一角度θ和距离r4. 角度校准与候选位置集构建4.1 几何校准原理虽然每个组将自己内部的信号视为远场但不同组观测到的角度θ_l是不同的因为它们相对于信号源的位置不同。图4清晰地展示了这种几何关系。假设整个阵列的参考点为p_r第l1和l2个组的参考点分别为p_{l1}和p_{l2}。信号源的位置可以用(θ, r)相对于p_r或(θ_{l1}, r_{l1})、(θ_{l2}, r_{l2})分别相对于p_{l1}和p_{l2}来描述。根据简单的几何三角关系我们可以建立方程组将不同组的观测值关联起来。例如通过联立(θ_{l1}, r_{l1})和(θ_{l2}, r_{l2})可以推导出相对于整个阵列参考点的校准角度θ的表达式tanθ [Δd_{l2} * tanθ_{l1} - Δd_{l1} * tanθ_{l2}] / Δd_{l1,l2}其中Δd_{l1,l2}是两个组参考点之间的距离。这个公式就是我们的角度校准器。它将任意两个组的局部观测角度映射到了全局坐标系下。4.2 构建全局候选位置集现在我们将角度校准与相位模糊解集结合起来。对于任意两个组l1和l2以及每一个可能的模糊系数ii0,..., M_s-1我们可以将第l1组的候选角θ̂_{l1,i}和第l2组的候选角θ̂_{l2,i}代入校准公式计算出一个校准后的全局候选角θ̂_{l1,l2,i}。同时利用几何关系我们还可以计算出一个对应的候选距离r̂_{l1,l2,i}r̂_{l1,l2,i} [Δd_{l1,l2} * cosθ̂_{l1,i} * cosθ̂_{l2,i}] / [cosθ̂_{l1,l2,i} * (sinθ̂_{l1,i} cosθ̂_{l2,i} - cosθ̂_{l1,i} sinθ̂_{l2,i})]这样每一对组(l1, l2)和每一个模糊系数i都生成一个候选的发射源位置ω_{l1,l2,i} (θ̂_{l1,l2,i}, r̂_{l1,l2,i})。将所有L个组两两组合共有N C(L,2)种组合并对每个组合遍历所有M_s个模糊系数我们就得到了一个包含N * M_s个样本的全局候选位置集Ω。这个集合Ω具有一个关键特性所有基于真实模糊系数i_true生成的样本ω_{l1,l2,i_true}在无噪声情况下都应该收敛于真实的发射源位置(θ, r)而基于错误模糊系数生成的样本则会分散在位置空间的各个地方。我们的任务就是从这N * M_s个点中找出那N个聚集在一起的“真实点簇”。5. 基于机器学习的相位模糊消除与定位有了候选位置集Ω问题就转化为一个典型的聚类问题从大量噪声干扰的样本中找出密度最高、最紧凑的那个簇该簇的中心即对应最终估计值。我们提出了两种低复杂度数据驱动聚类方法和一种高精度模型驱动回归方法。5.1 方法一最小样本距离聚类MSDC这是一种直观且计算量极低的方法。其核心思想是真实解对应的那个簇其样本点之间的离散程度应该是最小的。操作步骤按模糊系数划分将候选集Ω按模糊系数i划分为M_s个子簇Ω_i每个子簇包含N个样本来自N个不同的组对。计算簇内离散度对于每个子簇Ω_i计算其所有样本点两两之间的欧氏距离平方和作为该簇的离散度度量d̄_i。这个值越小说明该簇的样本点越集中。选择最紧凑簇比较所有M_s个子簇的离散度d̄_i选择离散度最小的那个簇其对应的模糊系数î即为估计的真实模糊系数。î argmin_i d̄_i位置估计将选出的簇Ω_î中所有N个样本的坐标分别取平均即得到最终的DOA和距离估计θ̂ (1/N) Σ θ̂_{n,î},r̂ (1/N) Σ r̂_{n,î}实操心得与注意事项优势MSDC原理简单无需迭代计算复杂度仅为O(M_s * N²)在信噪比较高时性能接近理论下界。劣势其性能严重依赖于“真实解簇最紧凑”的假设。在低信噪比下噪声会使得所有簇的离散度都变大真实簇的“紧凑性”优势不再明显容易选错簇导致估计性能急剧下降。参数选择无需调参开箱即用。但在实际部署时建议先对Ω中的角度值进行模2π处理确保其在[-π, π]范围内避免因相位卷绕导致的距离计算错误。5.2 方法二基于距离-角度散点图的DBSCAN聚类RSD-ASD-DBSCANMSDC方法同时利用了角度和距离信息进行聚类。我们观察到错误解在角度维和距离维的分布特性可能不同。RSD-ASD-DBSCAN方法通过分别构建距离散点图RSD和角度散点图ASD并利用DBSCAN密度聚类算法实现了更鲁棒的模糊消除。核心步骤解析数据变换与散点图构建RSD构建将候选距离集R̂中的每个距离值r转换为极坐标形式r * exp(j*r)然后取其实部和虚部(ℜ, ℑ)作为一个二维点。所有点构成RSD。这个变换将一维距离数据映射到二维平面放大了不同簇之间的可分性。ASD构建类似地构建一个角度候选集Â它包含第一组的初始解集Θ̂_1以及所有包含第一组的校准角集Θ̂_{1,l}。同样进行极坐标变换θ * exp(j*θ)并取实虚部得到ASD。利用ASD进行预筛选根据公式θ̂_{1,l,i} arctan(tanθ̂_{1,i})在无噪声下如果i是真实模糊系数则θ̂_{1,i}应与所有θ̂_{1,l,i}相等。因此在ASD中我们可以计算每个模糊系数i对应的θ̂_{1,i}点与所有θ̂_{1,l,i}点之间的距离和。若该距离和超过一个阈值ε则可直接判定该i为错误模糊系数从而在RSD中提前剔除其对应的整个距离子簇R̂_i。这一步显著减少了后续聚类处理的样本数和干扰。DBSCAN密度聚类对预筛选后的“改进RSD”R̂_imp应用DBSCAN算法。参数设置这是关键。邻域半径ϵ初始值设置为所有剩余子簇中样本点间最大距离的最小值。最小点数MinPts设为N真实解簇的样本数。迭代聚类运行DBSCAN找到样本数最多的簇C_max。如果|C_max| N说明聚类仍不够精细需要减小邻域半径ϵ乘以一个收缩因子η 1然后重新聚类直到找到恰好包含N个点的簇该簇即被认定为真实距离解簇R̂_true。位置反推与估计从R̂_true中的每个距离估计值r̂_{true,n}反向在原始候选集Ω中找到与之配对的θ̂_{true,n}。最后对N个(θ̂_{true,n}, r̂_{true,n})对分别取平均得到最终定位结果。算法优势与调参经验鲁棒性更强DBSCAN对噪声和离群点不敏感且通过ASD预筛选进一步提升了在低信噪比下的性能。复杂度可控虽然比MSDC复杂但通过预筛选减少了DBSCAN的处理规模。其复杂度约为O(Σ N_{s,j}²)其中N_{s,j}是第j次迭代时需要聚类的样本数。关键参数ε和η阈值ε用于ASD预筛选应与信噪比负相关。实践中可以设置为一个与噪声方差成正比的小量。收缩因子η通常设置在0.7到0.9之间过小可能导致收敛慢过大可能无法有效分离密集错误点。5.3 方法三回归网络RegNet—— 一种模型驱动的高精度方案前述两种方法都是无监督的数据驱动方法。为了在更低信噪比下获得接近理论极限的精度我们提出了一种有监督的、模型驱动的解决方案——RegNet。它将相位模糊消除和角度融合两个步骤建模为一个端到端的回归问题。网络结构设计RegNet由两部分组成如图7所示多层神经网络MLNN—— 模糊消除器输入将所有L个组的初始模糊解集Θ̂拼接成一个长向量维度L * M_s。这个向量包含了所有可能的正确和错误的角度信息。功能MLNN的目标是学习一个复杂的非线性映射f_nl从包含大量错误解的输入中精准地输出每个组对应的真实角度解Θ̂_true维度L。这本质上是一个“去伪存真”的滤波过程。设计细节采用全连接网络隐藏层使用ReLU激活函数引入非线性输出层使用线性激活函数用于回归。网络规模深度和宽度需要与输入维度L*M_s匹配以确保足够的表达能力。单层感知机Perceptron—— 角度融合器输入MLNN输出的L个真实组角度Θ̂_true。功能由于这L个角度是信号源相对于不同组参考点的方向它们并不相等。感知机学习一个最优的线性组合将这些局部角度融合为一个全局角度估计θ̂。其数学形式为θ̂ W_p * Θ̂_true b_p其中W_p和b_p是待学习的权重和偏置。训练与实现要点数据生成训练数据无需真实测量可通过仿真生成。在DOA范围[-π/2, π/2]内均匀采样大量角度θ根据系统模型生成对应的带噪声的初始模糊解集Θ̂作为输入对应的真实组角度Θ̂_true和全局角度θ作为标签。损失函数均方误差MSE。分别训练MLNN损失函数为MSE (1/L) Σ (θ̂_{l,true} - θ_{l,true})²和感知机损失函数为MSE_p (θ̂ - θ)²或联合训练整个RegNet。距离估计网络输出全局角度θ̂后结合MLNN输出的各组成角θ̂_{l,true}利用几何关系公式r̂_{l1,l2}计算所有组对的距离再取平均得到最终r̂。这一步是确定性的无需网络学习。优势与适用场景高精度在低信噪比区域RegNet的性能显著优于两种聚类方法能更早地达到克拉美-罗下界CRLB。离线训练在线推理训练阶段可能耗时但一旦训练完成在线定位阶段只是一个简单的前向传播速度极快。泛化能力网络在训练时见到了各种角度和噪声情况对于训练集范围内的场景其模糊消除和融合能力非常鲁棒。6. 性能边界分析与工程启示6.1 克拉美-罗下界CRLB推导与解读为了评估所提方法的性能极限我们推导了分组PC-HAD结构下近场定位的CRLB。CRLB给出了任何无偏估计器方差的理论下界是衡量算法优劣的金标准。推导结果详见附录表明DOA和距离估计的CRLB表达式具有相似的形式CRLB_θ [Σ F_{rr}^{(l)}] / [T * ( (Σ F_{θθ}^{(l)})*(Σ F_{rr}^{(l)}) - (Σ F_{θr}^{(l)})² )]CRLB_r [Σ F_{θθ}^{(l)}] / [T * ( (Σ F_{θθ}^{(l)})*(Σ F_{rr}^{(l)}) - (Σ F_{θr}^{(l)})² )]其中F_{θθ}^{(l)}, F_{rr}^{(l)}, F_{θr}^{(l)}是第l个组的Fisher信息矩阵元素求和Σ是对所有L个组进行。T是快拍数。一个关键结论Remark 1在总子阵列数K和每组子阵列数M_s固定的前提下CRLB的值随着每组内子阵列数量G的增加而单调递减。换句话说组越大即组数L越少理论上能达到的定位精度越高。工程启示这给了我们一个重要的设计折衷。更少、更大的组大G小L意味着精度潜力更高因为每个组的孔径D_g变大其角度分辨能力本身增强。计算量可能增加组内Root-MUSIC的复杂度与G²或G³相关。近场假设可能被破坏分组的前提是组内满足远场近似。如果G太大导致D_g过大可能使得r 2D_g²/λ的条件不再成立从而影响模型准确性。因此在实际系统设计中需要根据预期的目标距离r、信号波长λ以及硬件能容忍的计算复杂度来折衷选择最优的组大小G或组数L。6.2 复杂度对比与选型建议我们对三种方法的计算复杂度进行了分析见表IMSDC复杂度最低主要为O(M_s * N²)级的样本距离计算。适合对功耗极度敏感、且工作环境信噪比较高的场景。RSD-ASD-DBSCAN复杂度中等涉及预筛选和迭代DBSCAN聚类约为O(Σ N_{s,j}²)。在中等信噪比下提供了比MSDC更好的鲁棒性是精度和复杂度之间的良好平衡点。RegNet离线训练复杂度高依赖于网络规模。但在线推理复杂度是固定的仅为一次神经网络前向传播O(L*M_s * Π N_h)。适合那些可以承受离线训练成本且对低信噪比下实时定位精度要求极高的应用。选型决策流程图是否允许离线训练且追求极限低信噪比性能 | |-- 是 -- 选择 RegNet | |-- 否 -- 预估工作场景的平均信噪比(SNR) | |-- SNR 高 (如 12dB) -- 选择 MSDC (最经济) | |-- SNR 中低 (如 12dB) -- 选择 RSD-ASD-DBSCAN7. 仿真验证与结果分析我们通过大量的蒙特卡洛仿真验证了所提方法的有效性。系统参数设置如下总天线数M240子阵列大小M_s3组数L5载频30GHz发射源位于(60°, 20m)。关键发现性能收敛性如图8和图9所示在足够的信噪比SNR或快拍数T下所有三种方法均能达到CRLB理论下界。这证明了我们提出的分组框架以及后续处理算法的有效性。低信噪比优势RegNet在低信噪比区域如SNR 8dB展现出了显著优势其性能曲线最贴近CRLB。这是因为神经网络能够学习噪声的统计特性从而更好地抑制噪声干扰。复杂度与性能权衡RSD-ASD-DBSCAN的性能介于RegNet和MSDC之间在中等信噪比下优于MSDC。MSDC则在信噪比足够高时以最低的复杂度达到了与另外两者相近的精度。结构参数影响图10验证了理论分析CRLB随着组数L的增加即每组子阵列数G的减少而上升。这意味着在硬件允许的情况下采用更大的组更少的组数有利于提升定位精度极限。8. 扩展讨论与未来方向8.1 多辐射源场景的适应性本文主要针对单辐射源场景进行阐述以清晰呈现原理。但所提框架天然支持多辐射源定位。在Root-MUSIC阶段每个组会针对Q个信号源估计出Q个角度从而生成Q个初始模糊解集。后续的校准、候选集构建和聚类/回归处理可以对这Q个源独立并行地进行。本质上多源问题被分解为了多个并行的单源问题。需要注意的是这要求信号源在角度-距离域是可分的并且算法特别是聚类方法需要具备区分不同簇的能力。8.2 实际部署考量与挑战校准误差算法依赖于精确的阵列几何知识如组间距离Δd。在实际系统中天线位置误差、通道不一致性等都需要通过精密的阵列校准来补偿。模型失配算法基于理想的球面波模型和已知的阵列结构。在实际复杂环境中如存在多径、非视距传播模型可能出现失配需要引入鲁棒性设计或采用数据驱动的深度学习方法进行端到端建模。动态场景对于移动的辐射源需要结合跟踪算法如卡尔曼滤波对连续估计结果进行平滑和预测。硬件非理想性模拟移相器的量化误差、幅相不一致性以及射频链的噪声系数等都会在实际性能中有所体现。在算法设计初期考虑这些非理想因素能提升方案的实用性。8.3 与更广泛技术的结合本方案的核心思想——通过分组降维、再利用机器学习处理模糊和融合——可以与其他先进技术结合宽带信号处理对于宽带信号可以结合频域信息利用不同频点的相位差异来进一步消除模糊或提升精度。深度学习增强可以用更复杂的网络结构如CNN处理空-时二维信号或Transformer捕捉长距离依赖替代RegNet中的MLNN可能进一步提升在极端复杂环境下的性能。集成感知与通信ISAC本定位模块可以无缝嵌入到6G的ISAC系统中利用通信信号同时完成对用户设备的定位实现通信-感知一体化。这个基于分组混合架构和机器学习的近场定位框架为未来XL-MIMO系统实现高精度、低成本的定位感知功能提供了一条清晰且富有潜力的技术路径。从理论分析到算法设计再到仿真验证它展示了如何通过巧妙的系统建模和先进的信号处理工具解决前沿通信系统中的核心挑战。