You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

如何创建频率表?请解释Raw frequency等四项统计指标的含义

频率表核心指标解析与制作步骤

没问题!我来帮你拆解这四个频率指标,再一步步教你怎么制作包含这些指标的频率表——这是描述统计里非常实用的工具,搞懂了能帮你快速理清数据分布~

一、四个核心指标的含义

先把每个指标的定义和实际意义讲清楚,用例子帮你理解:

  • Raw frequency(原始频数):就是某类别/数值区间内,数据出现的实际次数。比如统计班级学生的考试分数段,80-90分的有12人,这个12就是原始频数。
  • Cumulative raw frequency(累计原始频数):从第一个类别开始,把到当前类别的所有原始频数累加起来的结果。还是用分数段举例:60-70分有5人,70-80分有8人,80-90分12人,那80-90分的累计原始频数就是5+8+12=25,代表分数≤90分的总人数。
  • Relative frequency(相对频数):某类别的原始频数除以数据总个数,得到该类别在整体中的占比(可以用小数或百分比表示)。比如总共有50个学生,80-90分的相对频数就是12/50=0.24(或24%)。
  • Cumulative percentage(累计百分比):把从第一个类别到当前类别的相对频数(百分比形式)累加,用来展示“当前类别及之前所有类别”在整体中的占比。比如60-70分占10%,70-80占16%,80-90占24%,那80-90分的累计百分比就是10%+16%+24%=50%,意思是有一半学生的分数≤90分。

二、制作频率表的详细步骤

我用一组学生身高数据(单位:cm)做示例,数据如下:152,155,158,160,162,162,165,165,165,170,172,175,一步步带你做:

1. 整理数据,确定类别/区间

如果是连续型数据(比如身高、分数),先划分合理的区间;如果是分类数据(比如性别、学科),直接用类别即可。
这里我们把身高分成5个区间:150-155156-160161-165166-170171-175

2. 计算原始频数(Raw frequency)

逐个统计每个区间内的数据个数:

  • 150-155:2个(152,155)
  • 156-160:2个(158,160)
  • 161-165:5个(162,162,165,165,165)
  • 166-170:1个(170)
  • 171-175:2个(172,175)

3. 计算累计原始频数(Cumulative raw frequency)

从第一个区间开始,依次累加前面的原始频数:

  • 150-155:2
  • 156-160:2+2=4
  • 161-165:4+5=9
  • 166-170:9+1=10
  • 171-175:10+2=12(等于总数据数,说明计算正确)

4. 计算相对频数(Relative frequency)

用每个区间的原始频数除以总数据数(这里总共有12个数据),可以保留两位小数或转化为百分比:

  • 150-155:2/12≈16.67%
  • 156-160:2/12≈16.67%
  • 161-165:5/12≈41.67%
  • 166-170:1/12≈8.33%
  • 171-175:2/12≈16.67%

5. 计算累计百分比(Cumulative percentage)

把前面的相对百分比依次累加,最后结果应该接近100%(四舍五入可能有微小误差):

  • 150-155:16.67%
  • 156-160:16.67%+16.67%=33.34%
  • 161-165:33.34%+41.67%=75.01%
  • 166-170:75.01%+8.33%=83.34%
  • 171-175:83.34%+16.67%=100.01%

6. 整理成规范表格

最后把所有指标整合到表格里,看起来更清晰:

身高区间(cm)原始频数(Raw frequency)累计原始频数(Cumulative raw frequency)相对频数(Relative frequency)累计百分比(Cumulative percentage)
150-1552216.67%16.67%
156-1602416.67%33.34%
161-1655941.67%75.01%
166-1701108.33%83.34%
171-17521216.67%100.01%

小提示

  • 如果是分类数据(比如性别:男/女),直接把区间换成类别即可,计算逻辑完全一样。
  • 累计百分比最后应该接近100%,如果误差过大,一定要检查原始频数或累加步骤有没有出错。
  • 相对频数可以用小数(比如0.1667)或百分比,根据你的需求选择就行。

内容的提问来源于stack exchange,提问作者yre

火山引擎 最新活动