如何在R语言中找出数据集里出现频率最高的值及其占比？

如何在R语言中找出数据集里出现频率最高的值及其占比？

阿华AIGC实验室

2026-5-21

解决R语言中找出数据集中出现次数最多的值及其占比的问题

嘿，这事儿好办！你已经用prop.table(table(data$foo))拿到了占比表，接下来只需要几步就能定位到出现次数最多的值和它的占比：

方法一：基础分步实现

先把频率表和占比表存下来，再精准定位最大值：

# 计算频率表和对应的占比表
freq_table <- table(data$foo)
prop_table <- prop.table(freq_table)

# 找到占比最高的条目位置
top_index <- which.max(prop_table)

# 提取对应的数值和占比
most_common_val <- names(freq_table)[top_index]
top_proportion <- prop_table[top_index]

# 友好输出结果，也可以直接打印变量查看
cat("出现次数最多的值是：", most_common_val, "\n对应的占比是：", round(top_proportion, 4), "\n")

方法二：简洁写法

如果不想分步操作，也可以用更紧凑的代码完成核心逻辑：

# 直接计算并提取占比最高的条目
top_result <- prop.table(table(data$foo))[which.max(prop.table(table(data$foo)))]
top_result

运行后会直接显示类似X 0.XXXXX的结果，其中X就是你要找的数值，后面跟着对应的占比。

额外提醒：处理并列最高的情况

如果有多个值的占比相同且都是最高的，which.max只会返回第一个匹配项。这时候可以用下面的代码找出所有并列最高的条目：

prop_result <- prop.table(table(data$foo))
max_prop <- max(prop_result)
all_top_results <- prop_result[prop_result == max_prop]
all_top_results

这样就能一次性得到所有占比最高的数值及其对应的占比啦。

内容的提问来源于stack exchange，提问作者Rüdiger

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，最新支持 DeepSeek-V4 系列与 GLM-5.1，受邀下单叠加9.5折

ArkClaw

7×24在线专属智能伙伴

Seedance 2.0 全面开放 API

创作无限可能，一键生成电影级 AI 视频

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠