这是一个非常好的问题!“卷单位根”这个说法很形象,它通常指的是在单位根检验 中,选择哪种检验方法或模型设定更合适、更可靠。

没有一个“最好”的检验方法,只有“最合适”的检验方法。 选择哪种单位根检验,取决于你的数据特性、样本量大小以及你的研究目的。
下面我将详细解释几种主流的单位根检验方法,并给出选择它们的指导原则。
主流的单位根检验方法
我们通常说的“卷单位根”,主要是在以下几个检验方法中选择:
ADF检验 - 最常用、最经典的检验
- 全称: Augmented Dickey-Fuller Test (增广迪基-富勒检验)
- 核心思想: 在基本的DF检验基础上,增加了滞后差分项来消除误差项中的自相关,从而使得检验更有效。
- 优点:
- 应用广泛: 几乎所有计量经济学软件都内置,是教科书和论文中最常见的方法。
- 稳健性较好: 在大多数情况下表现不错。
- 缺点:
- 滞后阶数选择敏感: 检验结果对滞后阶数
p的选择很敏感,选择过少会导致自相关,检验失效;选择过多则会损失自由度,降低检验功效。 - 假设固定: 默认假设数据中只包含一个截距项或趋势项,如果模型设定错误(比如包含了不该有的趋势),可能会导致错误的结论。
- 滞后阶数选择敏感: 检验结果对滞后阶数
- 适用场景: 作为首选的试探性检验,当你对数据结构不太确定时,从ADF开始是一个不错的选择。
PP检验 - ADF的有力竞争者
- 全称: Phillips-Perron Test (菲利普斯-佩龙检验)
- 核心思想: 也用来解决DF检验中的自相关问题,但它不通过增加滞后项,而是直接对DF检验的统计量进行非参数修正,以考虑误差项的自相关和异方差性。
- 优点:
- 不依赖滞后阶数: 这是它相对于ADF的最大优势,你不需要担心选择多少滞后项的问题。
- 考虑异方差: 它能处理误差项中的异方差问题,这在现实数据中很常见。
- 缺点:
- 小样本表现不佳: 在样本量较小的情况下,PP检验的检验功效可能不如ADF,且其统计量的分布在大样本下才更可靠。
- 对带宽选择敏感: 虽然不用选滞后项,但需要选择一个“带宽”或“截断滞后”来进行修正,这也会影响结果。
- 适用场景: 当你怀疑数据存在异方差性,或者样本量较大时,PP检验是一个很好的补充或替代。
KPSS检验 - “反向”的检验
- 全称: Kwiatkowski-Phillips-Schmidt-Shin Test
- 核心思想: 这是最重要的区别!ADF和PP的原假设是“序列有单位根(非平稳)”,而KPSS的原假设是“序列是平稳的”。
- 优点:
- 提供互补视角: 因为原假设不同,KPSS可以用来验证ADF/PP的结果。
- 如果ADF拒绝“有单位根”(即认为平稳),同时KPSS也拒绝“是平稳”(即认为非平稳),这就产生了矛盾,需要进一步检查。
- 如果ADF不能拒绝“有单位根”,而KPSS也不能拒绝“是平稳”,这强烈说明序列是平稳的。
- 提供互补视角: 因为原假设不同,KPSS可以用来验证ADF/PP的结果。
- 缺点:
- 原假设不同: 必须正确理解其原假设,否则容易解释错误。
- 对趋势项设定敏感: 和ADF一样,需要正确选择是否包含截距项或趋势项。
- 适用场景: 强烈建议将KPSS与ADF或PP结合使用,作为交叉验证的工具,可以大大提高结论的可靠性。
DF-GLS检验 - 目前公认功效最高的检验
- 全称: Dickey-Fuller Test with GLS Detrending (基于GLS退势的DF检验)
- 核心思想: 在进行ADF检验之前,先对数据进行广义最小二乘法变换,剔除确定性趋势(趋势项和截距项)的影响,然后再对变换后的序列进行DF检验。
- 优点:
- 检验功效高: 在大多数情况下,DF-GLS比ADF和PP有更高的概率拒绝错误的原假设(即,当序列确实平稳时,它更可能平稳地识别出来)。
- 对小样本更友好: 在样本量较小的时候,其表现依然稳健。
- 缺点:
- 相对复杂: 计算过程比ADF复杂,一些软件(如EViews)需要手动操作或运行特殊程序。
- 不如ADF普及: 在一些基础软件中可能不是默认选项。
- 适用场景: 当你追求最高检验功效,尤其是在样本量有限,或者你对序列的平稳性有较强怀疑时,DF-GLS是最佳选择之一。
如何选择?一张图帮你决策
| 检验方法 | 原假设 | 主要优点 | 主要缺点 | 选择建议 |
|---|---|---|---|---|
| ADF | 有单位根(非平稳) | 最经典、最普及 | 对滞后阶数敏感 | 首选试探性检验,当不确定时使用。 |
| PP | 有单位根(非平稳) | 不选滞后项,能处理异方差 | 小样本功效较低 | 当怀疑存在异方差或样本量大时使用。 |
| KPSS | 是平稳的 | 提供与ADF/PP完全不同的视角 | 原假设与ADF相反,易混淆 | 必须与ADF/PP结合使用,用于交叉验证。 |
| DF-GLS | 有单位根(非平稳) | 检验功效最高,小样本表现好 | 计算复杂,普及度不高 | 追求最高可靠性时的首选,尤其是在小样本下。 |
实战操作流程建议
当你拿到一个时间序列,想知道它是不是平稳时,可以遵循以下步骤:
-
第一步:观察图形
画出序列的时序图,如果序列有明显的上升/下降趋势或波动性随时间增大,那它很可能是非平稳的,这一步能给你一个直观的判断。
-
第二步:选择主检验方法
- 首选组合: ADF + KPSS,这是最常用且可靠的组合。
- 追求卓越: DF-GLS + KPSS,如果你使用支持DF-GLS的软件(如R的
urca包,Stata),这是功效最高的组合。
-
第三步:设定模型形式
- 在进行ADF、PP或DF-GLS检验时,你需要选择模型是否包含“截距项”和“趋势项”,通常有三种选择:
- 模型1 (None): 既无截距也无趋势,适用于围绕0波动的序列。
- 模型2 (Drift): 有截距无趋势,适用于有均值但无趋势的序列。
- 模型3 (Trend): 有截距也有趋势,适用于有明显上升/下降趋势的序列。
- 选择技巧: 通常根据时序图来判断,有明显趋势就选模型3,有均值就选模型2,否则选模型1,很多软件(如EViews)会根据信息准则自动推荐一个。
- 在进行ADF、PP或DF-GLS检验时,你需要选择模型是否包含“截距项”和“趋势项”,通常有三种选择:
-
第四步:解读结果
- 对于ADF/PP/DF-GLS:
- p值 < 显著性水平 (如0.05),则拒绝原假设,认为序列是平稳的。
- p值 > 显著性水平,则不能拒绝原假设,认为序列有单位根,是非平稳的。
- 对于KPSS:
- p值 < 显著性水平,则拒绝原假设,认为序列是非平稳的。
- p值 > 显著性水平,则不能拒绝原假设,认为序列是平稳的。
- 对于ADF/PP/DF-GLS:
-
第五步:综合判断
- 理想情况: ADF/PP拒绝非平稳,KPSS不拒绝平稳,结论明确:序列平稳。
- 矛盾情况: ADF/PP不拒绝非平稳,KPSS也不拒绝平稳,这强烈说明序列是平稳的,ADF/PP可能因为功效不足而未能拒绝。
- 最坏情况: ADF/PP拒绝非平稳,KPSS也拒绝平稳,这说明检验结果不可靠,需要检查模型设定(趋势项选择是否正确)、样本量是否太小,或者考虑使用其他更复杂的模型(如结构断点检验)。
“卷单位根”的核心在于严谨和稳健。
- 如果你只是想快速得到一个结果,用 ADF检验 就够了。
- 如果你想让你的研究更扎实、结论更可靠,强烈建议你使用 ADF/PP + KPSS 的组合,或者功效更高的 DF-GLS + KPSS 组合。
- 永远不要只依赖一个检验结果,结合图形观察和多种检验方法进行交叉验证,才是做出正确判断的最佳路径。
