如何创建频率表?请解释Raw frequency等四项统计指标的含义
频率表核心指标解析与制作步骤
没问题!我来帮你拆解这四个频率指标,再一步步教你怎么制作包含这些指标的频率表——这是描述统计里非常实用的工具,搞懂了能帮你快速理清数据分布~
一、四个核心指标的含义
先把每个指标的定义和实际意义讲清楚,用例子帮你理解:
- Raw frequency(原始频数):就是某类别/数值区间内,数据出现的实际次数。比如统计班级学生的考试分数段,80-90分的有12人,这个12就是原始频数。
- Cumulative raw frequency(累计原始频数):从第一个类别开始,把到当前类别的所有原始频数累加起来的结果。还是用分数段举例:60-70分有5人,70-80分有8人,80-90分12人,那80-90分的累计原始频数就是5+8+12=25,代表分数≤90分的总人数。
- Relative frequency(相对频数):某类别的原始频数除以数据总个数,得到该类别在整体中的占比(可以用小数或百分比表示)。比如总共有50个学生,80-90分的相对频数就是12/50=0.24(或24%)。
- Cumulative percentage(累计百分比):把从第一个类别到当前类别的相对频数(百分比形式)累加,用来展示“当前类别及之前所有类别”在整体中的占比。比如60-70分占10%,70-80占16%,80-90占24%,那80-90分的累计百分比就是10%+16%+24%=50%,意思是有一半学生的分数≤90分。
二、制作频率表的详细步骤
我用一组学生身高数据(单位:cm)做示例,数据如下:152,155,158,160,162,162,165,165,165,170,172,175,一步步带你做:
1. 整理数据,确定类别/区间
如果是连续型数据(比如身高、分数),先划分合理的区间;如果是分类数据(比如性别、学科),直接用类别即可。
这里我们把身高分成5个区间:150-155、156-160、161-165、166-170、171-175。
2. 计算原始频数(Raw frequency)
逐个统计每个区间内的数据个数:
- 150-155:2个(152,155)
- 156-160:2个(158,160)
- 161-165:5个(162,162,165,165,165)
- 166-170:1个(170)
- 171-175:2个(172,175)
3. 计算累计原始频数(Cumulative raw frequency)
从第一个区间开始,依次累加前面的原始频数:
- 150-155:2
- 156-160:2+2=4
- 161-165:4+5=9
- 166-170:9+1=10
- 171-175:10+2=12(等于总数据数,说明计算正确)
4. 计算相对频数(Relative frequency)
用每个区间的原始频数除以总数据数(这里总共有12个数据),可以保留两位小数或转化为百分比:
- 150-155:2/12≈16.67%
- 156-160:2/12≈16.67%
- 161-165:5/12≈41.67%
- 166-170:1/12≈8.33%
- 171-175:2/12≈16.67%
5. 计算累计百分比(Cumulative percentage)
把前面的相对百分比依次累加,最后结果应该接近100%(四舍五入可能有微小误差):
- 150-155:16.67%
- 156-160:16.67%+16.67%=33.34%
- 161-165:33.34%+41.67%=75.01%
- 166-170:75.01%+8.33%=83.34%
- 171-175:83.34%+16.67%=100.01%
6. 整理成规范表格
最后把所有指标整合到表格里,看起来更清晰:
| 身高区间(cm) | 原始频数(Raw frequency) | 累计原始频数(Cumulative raw frequency) | 相对频数(Relative frequency) | 累计百分比(Cumulative percentage) |
|---|---|---|---|---|
| 150-155 | 2 | 2 | 16.67% | 16.67% |
| 156-160 | 2 | 4 | 16.67% | 33.34% |
| 161-165 | 5 | 9 | 41.67% | 75.01% |
| 166-170 | 1 | 10 | 8.33% | 83.34% |
| 171-175 | 2 | 12 | 16.67% | 100.01% |
小提示
- 如果是分类数据(比如性别:男/女),直接把区间换成类别即可,计算逻辑完全一样。
- 累计百分比最后应该接近100%,如果误差过大,一定要检查原始频数或累加步骤有没有出错。
- 相对频数可以用小数(比如0.1667)或百分比,根据你的需求选择就行。
内容的提问来源于stack exchange,提问作者yre




