You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

如何计算投资组合t统计量及分组收益差的统计显著性

判断投资组合分组收益率及收益差的统计显著性方法

嘿,针对你这个投资组合分组收益率的统计显著性问题,我来给你梳理几个量化研究里常用的实用方法,都是业内验证过的套路:

一、直接检验p5-p1收益差的显著性:单样本t检验(含稳健调整)

这是最直接的思路,核心聚焦你最关心的p5-p1收益差序列:

  • 步骤:先整理每个月的p5p1收益率,计算出每月的收益差diff = p5_return - p1_return,得到一个时间序列。然后对这个序列做单样本t检验,原假设是“收益差的均值等于0”,备择假设是“均值不等于0”。
  • 关键修正:金融时间序列往往存在异方差和自相关性,普通t检验的标准误会被低估,导致显著性被高估。这时候一定要用Newey-West调整的t统计量来修正,这是金融研究里的标准操作。
  • 代码示例(Python)
    import statsmodels.api as sm
    # 假设diff是存储每月p5-p1收益差的numpy数组或列表
    # 普通单样本t检验
    t_stat, p_value, df = sm.stats.ttest_1samp(diff, 0)
    # Newey-West调整的稳健t检验(maxlags可根据数据自相关长度调整,一般取3-6)
    nw_stats = sm.stats.DescrStatsW(diff, cov_type='HAC', cov_kwds={'maxlags': 3})
    nw_t_stat = nw_stats.ttest_mean(0)[0]
    nw_p_value = nw_stats.ttest_mean(0)[1]
    
    解读:如果p值小于你设定的显著性水平(比如0.05),就可以拒绝原假设,认为p5-p1的收益差具有统计显著性。

二、同时检验所有分组差异:多元回归法

如果你想同时验证所有分组和基准组(比如p1)的收益率差异,多元回归是更系统的方法:

  • 模型构建:把每个样本的收益率作为因变量,分组作为虚拟变量(以p1为基准组,设置4个虚拟变量)。回归方程如下:
    return_i = α + β2*D2_i + β3*D3_i + β4*D4_i + β5*D5_i + ε_i
    其中D2_i表示第i个样本是否属于p2组(是则为1,否则为0),以此类推。
  • 结果解读β5的系数就是p5相对于p1的平均收益差,其对应的t统计量和p值直接反映这个差异的显著性;其他β系数则对应其他分组与p1的差异显著性。同样要给回归加上Newey-West稳健标准误来修正时间序列问题。

三、非参数检验:应对收益率非正态分布

金融收益率数据经常呈现厚尾、非正态的特征,这时候参数检验(比如t检验)的效力会下降,可以用非参数方法替代:

  • 推荐方法Wilcoxon符号秩检验,它不需要正态性假设,检验的是收益差的中位数是否显著不等于0,适合小样本或非正态数据。
  • 代码示例(Python)
    from scipy.stats import wilcoxon
    stat, p_value = wilcoxon(diff)
    
    解读:同样看p值是否小于显著性水平,来判断收益差是否显著。

几个关键注意事项

  • 样本量:如果你的月度数据样本量较小(比如少于30个月),非参数检验的结果会比t检验更可靠;
  • 多重检验校正:如果你同时检验多个分组差异(比如p2-p1、p3-p1等),要考虑Bonferroni校正来控制“家族wise错误率”,避免出现假阳性结果;
  • 稳健性验证:最好同时用2-3种方法交叉验证,如果不同方法得到的结论一致,显著性结果的可信度会更高。

内容的提问来源于stack exchange,提问作者user9259005

火山引擎 最新活动