当ADF检验说‘不平稳’：时间序列预测前，你还可以试试这2种平稳化方法

张

张建站

2026/5/28 11:30:52

10分钟阅读

当ADF检验说‘不平稳’时间序列预测前你还可以试试这2种平稳化方法面对时间序列分析时许多数据科学家和业务分析师都曾经历过这样的挫败精心收集的数据经过ADF检验后却被告知不平稳。这就像准备烹饪一道大餐时发现食材还没处理好。但别急着放弃——非平稳序列并非分析的终点而是深度理解的起点。本文将带你突破单一检验的局限探索两种更聪明的平稳化策略让你的预测模型重获新生。1. 为什么ADF检验的不平稳结论需要谨慎对待ADF检验Augmented Dickey-Fuller test作为最常用的单位根检验方法其核心假设是序列非平稳源于单位根存在。但现实中非平稳性可能来自多种复杂因素# 典型ADF检验Python实现 from statsmodels.tsa.stattools import adfuller def adf_test(timeseries): print(ADF检验结果:) dftest adfuller(timeseries, autolagAIC) dfoutput pd.Series(dftest[0:4], index[Test Statistic,p-value,#Lags Used,Number of Observations Used]) for key,value in dftest[4].items(): dfoutput[Critical Value (%s)%key] value print(dfoutput) return dfoutput检验结果的三大盲区趋势主导型非平稳序列包含确定性趋势如线性增长但可能不存在单位根结构突变问题2008年金融危机前后的经济数据往往呈现均值突变季节性伪非平稳电商数据在双十一期间的峰值可能被误判为单位根效应提示当ADF检验p值接近0.05阈值时如0.06建议结合下文方法进行交叉验证2. 方法一确定性成分分解——像外科医生般精准剥离非平稳因素这种方法的核心思想是将序列分解为确定性成分趋势、周期和随机成分处理后再重组。比起粗暴的差分它保留了更多原始信息。2.1 操作步骤详解趋势提取与剔除移动平均法rolling_mean series.rolling(window12).mean()多项式拟合np.polyfit配合np.polyval实现# 使用STL分解的Python示例 from statsmodels.tsa.seasonal import STL stl STL(series, period12) res stl.fit() trend_removed series - res.trend季节性调整经典分解法seasonal_decompose(series, modeladditive)STL分解更适合复杂季节模式残差诊断对处理后的残差序列重新进行ADF检验检查ACF/PACF图确认自相关结构2.2 业务场景应用案例某零售企业2015-2023年月度销售额数据呈现明显上升趋势和年末峰值处理方法趋势R²季节强度残差平稳性一阶差分0.820.15平稳趋势剔除0.910.22平稳完整分解0.950.05平稳结果显示完整分解法在保留业务解释性的同时达到了更好的平稳化效果。3. 方法二KPSSADF联合诊断——构建双重检验防火墙KPSS检验与ADF检验形成互补关系就像医学诊断中的阴性阳性双确认检验假设对比ADF原假设为存在单位根非平稳KPSS原假设为趋势平稳无单位根3.1 联合诊断决策矩阵ADF结果KPSS结果真实状态处理建议不拒绝拒绝含单位根非平稳需要差分拒绝不拒绝趋势平稳移除趋势即可拒绝拒绝差分过度减少差分阶数不拒绝不拒绝可能含结构突变需进行断点检验# KPSS检验实现 from statsmodels.tsa.stattools import kpss def kpss_test(timeseries): print(KPSS检验结果:) kpsstest kpss(timeseries, regressionc, nlagsauto) kpss_output pd.Series(kpsstest[0:3], index[Test Statistic,p-value,Lags Used]) for key,value in kpsstest[3].items(): kpss_output[Critical Value (%s)%key] value print(kpss_output) return kpss_output3.2 实际应用中的注意事项检验参数选择ADFautolagAIC自动选择最佳滞后阶数KPSSregressionct包含截距和趋势项样本量影响小样本50时KPSS容易过度拒绝大样本1000时ADF过于敏感临界值调整经济数据建议使用10%显著性水平高频金融数据可使用5%水平4. 进阶技巧当常规方法失效时的应对策略即使经过上述处理某些顽固序列仍可能表现非平稳特征。这时需要更专业的工具箱4.1 结构突变检测与处理使用Bai-Perron检验检测多个断点from statsmodels.tsa.regime_switching.tests.test_markov_regression import breakvar_heteroskedasticity # 检测结构突变 break_points breakvar_heteroskedasticity(series) print(f检测到的断点位置{break_points})4.2 分数差分技术对于长记忆过程传统整数差分可能过度# 分数差分实现 from statsmodels.tsa.statespace.tools import cfa_loglikelihood def fractional_diff(series, d): # ...实现分数差分算法... return diff_series4.3 非线性变换组合有时简单的对数变换就能解决问题# 常用非线性变换 transformed np.log1p(series) # 对数变换 transformed np.sqrt(series) # 平方根变换 transformed boxcox(series) # Box-Cox变换5. 模型构建前的最终检查清单在将处理后的序列投入ARIMA等模型前建议完成以下验证视觉确认绘制处理前后序列对比图观察ACF/PACF衰减模式统计验证ADF/KPSS双检验一致性Ljung-Box检验残差自相关业务合理性处理后的波动幅度是否符合业务认知季节性因素是否被适当保留/剔除# 综合诊断函数示例 def final_check(processed_series): # 绘制图形 fig, axes plt.subplots(3, 1, figsize(12, 8)) axes[0].plot(processed_series) plot_acf(processed_series, axaxes[1]) plot_pacf(processed_series, axaxes[2]) # 统计检验 adf_result adf_test(processed_series) kpss_result kpss_test(processed_series) return { visual_inspection: Pass if ... else Fail, statistical_tests: { ADF: adf_result[p-value], KPSS: kpss_result[p-value] } }实践中发现许多业务指标经过适当处理后虽然统计检验仍显示轻微非平稳但模型预测效果已经很好。这时不必过度追求完美的统计显著性而应关注模型的实际预测能力。