混合效应模型含交互项结果解读求助:长格式重复测量数据分析
让我一步步帮你拆解带交互项的混合效应模型结果的解读思路——毕竟针对重复测量数据的随机系数混合模型,核心就是把固定效应+随机效应+交互项这三块掰明白,咱们一个个来:
第一步:先锚定模型整体拟合的基础情况
先别急着看单个系数,先确认模型本身的价值:
- 先看模型的显著性检验(比如
LRT似然比检验,或者和空模型的ANOVA对比):如果结果显著,说明你加入的预测变量确实能比只考虑个体随机差异的空模型,更好地解释ln_slope的变化,这是后续解读的前提。 - 关注随机效应的方差/协方差:
- 个体截距的方差:反映不同受试者的ln_slope基线水平差异有多大;
- 个体时间斜率的方差:反映不同受试者的ln_slope随时间变化的趋势差异是否明显;
- 截距-斜率的协方差:如果为正,说明基线ln_slope越高的个体,随时间变化的幅度越大(反之则越小)。
第二步:拆解固定效应(主效应+交互项)
这部分是你研究问题的核心,尤其是交互项的解读不能孤立看:
主效应的解读(无交互时的“单独作用”)
- 分类预测变量(比如性别、吸烟状态):系数代表在其他变量固定(时间=0、其他协变量取均值)时,该类别相对于参照组的ln_slope平均差异。比如性别系数为0.2,代表基线时男性(假设女性是参照组)的ln_slope比女性平均高0.2。
- 连续预测变量(比如年龄、BMI):系数代表在其他变量固定时,该变量每增加1单位,ln_slope的平均变化量——注意这是时间=0(基线)时的效应。
- 时间变量的主效应:代表所有受试者的平均ln_slope随时间变化的整体趋势,系数为正说明ln_slope随时间上升,负则说明下降。
交互项的解读(核心中的核心)
交互项的本质是“某变量的效应会随另一个变量的变化而改变”,必须结合主效应一起解读,绝对不能单独看交互项系数:
- 举个分类×时间的例子:比如
时间×吸烟状态交互项显著,系数为-0.15:- 这说明吸烟和不吸烟的受试者,ln_slope随时间变化的趋势存在差异;
- 具体来说,不吸烟者的时间斜率是「时间主效应系数」,而吸烟者的时间斜率是「时间主效应系数 + 交互项系数」——如果时间主效应是0.1,那吸烟者的斜率就是0.1-0.15=-0.05,意味着吸烟者的ln_slope随时间在下降,而不吸烟者在上升。
- 再举个连续变量×时间的例子:比如
时间×BMI交互项系数为-0.02:- 这说明BMI每增加1单位,ln_slope随时间变化的速度就会减少0.02;
- 如果时间主效应是0.08,那BMI=25的受试者时间斜率是0.08,BMI=30的受试者斜率就是0.08 + (-0.02×5)= -0.02,BMI越高,ln_slope随时间上升的速度越慢,甚至转为下降。
- 关键提醒:如果交互项显著,那主效应的含义就变成“有条件的”——比如时间的主效应不再是所有受试者的平均趋势,而是交互变量取参照值(分类)或0值(连续)时的趋势。
第三步:结合研究场景落地解读
最后一定要把统计结果拉回你的研究目的:
- 如果某个交互项显著,就直接回应了你“ln_slope的变化是否受某些因素影响”的问题——比如上述
时间×吸烟状态的结果,就说明吸烟状态会影响支气管高反应性随时间的变化趋势; - 如果随机效应的方差很大,说明个体间的差异非常突出,可能需要进一步挖掘能解释这种个体差异的因素。
内容的提问来源于stack exchange,提问作者guaguncher




