R语言中ggplot添加含斜体与变量的注释失败及解析错误问题解决

阿华AIGC实验室

2026-4-30

解决ggplot中添加带斜体统计量名的ANOVA交互项及配对d值注释问题

我明白你遇到的痛点：既要让统计量名称（p、η、d）斜体显示，又要避免注释文本重叠，还得绕开stat_compare_means无法直接提取交互项的限制。下面我给你一套完整的解决方案，从统计量计算到注释的正确实现一步到位：

步骤1：手动计算所需统计量

首先我们先模拟符合你结构的数据集，然后计算混合ANOVA的交互项p值、偏η²，以及各组的配对Cohen's d：

library(tidyverse)
library(effectsize) # 用于计算偏η²和Cohen's d
library(ggrepel) # 可选，用于自动避免文本重叠

# 模拟数据集：Session是重复测量（2个水平），Group是组间（2个水平）
set.seed(123)
df <- expand.grid(First.Name = paste0("Subj_", 1:20),
                  Session = c("Pre", "Post"),
                  Group = c("Control", "Intervention")) %>%
  mutate(Age = sample(18:30, n(), replace=TRUE),
         RHR = case_when(Group == "Intervention" & Session == "Post" ~ rnorm(n(), 60, 5),
                         Group == "Intervention" & Session == "Pre" ~ rnorm(n(), 65, 5),
                         Group == "Control" & Session == "Post" ~ rnorm(n(), 64, 5),
                         TRUE ~ rnorm(n(), 65, 5)))

# 混合ANOVA（Session为重复测量，Group为组间）
anova_model <- aov(RHR ~ Session*Group + Error(First.Name/Session), data = df)
anova_summary <- summary(anova_model)

# 提取Session*Group交互项的p值和偏η²
int_p <- anova_summary[[2]][["Pr(>F)"]][2] %>% round(3)
partial_eta2 <- eta_squared(anova_model, partial = TRUE) %>% 
  filter(Effect == "Session:Group") %>% 
  pull(Eta2_partial) %>% round(2)

# 计算各组的配对Cohen's d（Session前后）
cohens_d <- df %>%
  group_by(Group) %>%
  summarize(d = cohens_d(RHR ~ Session, paired = TRUE)$Cohens_d %>% round(2))

步骤2：构造符合plotmath语法的注释文本

ggplot的parse=TRUE使用的是plotmath语法，这也是你之前报错的原因——直接拼接普通字符串会触发解析错误。正确的做法是用plotmath的语法构造表达式，比如用italic()实现斜体，用==连接符号和数值，用[]添加下标：

# 构造交互项的注释文本
int_annot <- paste0("italic(p) == ", int_p, "~','~italic(eta)[p]^2 == ", partial_eta2)

# 构造各组Cohen's d的注释文本
d_annots <- cohens_d %>%
  mutate(text = paste0("italic(d)[", Group, "] == ", d))

这里的~是plotmath里的空格，[]用来给d添加组下标，确保语法完全符合解析要求。

步骤3：在ggplot中添加注释并避免重叠

现在我们可以把这些注释添加到图表里，分两种方式实现：

方式1：手动指定位置（精准控制）

如果你想自己控制注释的位置，用annotate()分别添加每个注释：

ggplot(df, aes(x = Session, y = RHR, color = Group)) +
  geom_boxplot() +
  geom_jitter(width = 0.1, alpha = 0.5) +
  # 添加交互项注释，放在右上角
  annotate("text", x = 1.5, y = max(df$RHR) + 2, 
           label = int_annot, parse = TRUE, size = 4) +
  # 添加各组的d值注释，分别放在不同位置
  annotate("text", x = 1, y = max(df$RHR) - 1, 
           label = d_annots$text[1], parse = TRUE, size = 4, color = "#F8766D") +
  annotate("text", x = 2, y = max(df$RHR) - 1, 
           label = d_annots$text[2], parse = TRUE, size = 4, color = "#00BFC4") +
  theme_minimal()

方式2：自动避免重叠（推荐）

如果怕手动调整麻烦，可以用ggrepel包的geom_text_repel()，它会自动调整注释位置避免重叠：

# 先准备注释数据框，指定每个注释的初始位置
annot_df <- bind_rows(
  tibble(x = 1.5, y = max(df$RHR) + 3, text = int_annot),
  d_annots %>% mutate(x = case_when(Group == "Control" ~ 1, TRUE ~ 2),
                      y = max(df$RHR) - 2)
)

ggplot(df, aes(x = Session, y = RHR, color = Group)) +
  geom_boxplot() +
  geom_jitter(width = 0.1, alpha = 0.5) +
  geom_text_repel(data = annot_df, aes(x = x, y = y, label = text),
                  parse = TRUE, size = 4, show.legend = FALSE) +
  theme_minimal()

关键注意点

为什么之前parse=TRUE报错？因为你用了普通的字符串拼接，而plotmath要求严格的语法：变量名、运算符要符合规则，空格用~或*分隔，下标用[]实现。
偏η²的下标p可以用italic(eta)[p]^2完美实现斜体加下标效果。
如果你的Session是多个水平，只需要调整ANOVA模型和注释的初始位置即可，核心逻辑完全通用。

内容的提问来源于stack exchange，提问作者CanyonView