【四分位差怎么计算】四分位差(Interquartile Range,简称IQR)是统计学中用于衡量数据分布离散程度的一个重要指标。它表示中间50%的数据范围,即第三四分位数(Q3)与第一四分位数(Q1)之间的差值。相比极差(最大值减最小值),四分位差更能反映数据的集中趋势,且对异常值不敏感。
一、四分位差的定义
四分位差 = Q3 - Q1
其中:
- Q1(第一四分位数):将数据从小到大排列后,位于25%位置的数值。
- Q3(第三四分位数):将数据从小到大排列后,位于75%位置的数值。
二、四分位差的计算步骤
1. 将数据按从小到大的顺序排列。
2. 确定数据个数 n。
3. 计算 Q1 和 Q3 的位置:
- Q1 的位置为:(n + 1) × 0.25
- Q3 的位置为:(n + 1) × 0.75
4. 根据位置找出对应的数值,若位置为整数,则取该位置的数值;若为小数,则进行插值计算。
5. 计算四分位差:IQR = Q3 - Q1
三、举例说明
假设有一组数据:
`10, 15, 20, 25, 30, 35, 40`
1. 数据已排序,n = 7
2. Q1 的位置:(7 + 1) × 0.25 = 2 → 第2个数,即15
3. Q3 的位置:(7 + 1) × 0.75 = 6 → 第6个数,即35
4. 四分位差 IQR = 35 - 15 = 20
四、四分位差的意义
- 衡量数据分布的离散程度:IQR 越大,说明数据越分散;反之则越集中。
- 识别异常值:在箱线图中,通常以 Q1 - 1.5×IQR 和 Q3 + 1.5×IQR 作为判断异常值的界限。
- 适用于偏态分布或存在极端值的数据集。
五、总结表格
| 指标 | 含义 | 计算公式 | 用途 |
| Q1(第一四分位数) | 25%位置的数值 | (n + 1) × 0.25 | 表示数据下25%的上限 |
| Q3(第三四分位数) | 75%位置的数值 | (n + 1) × 0.75 | 表示数据上75%的下限 |
| 四分位差(IQR) | 中间50%数据的范围 | IQR = Q3 - Q1 | 衡量数据离散程度,识别异常值 |
通过以上方法,我们可以准确地计算出四分位差,并据此分析数据的分布特征。在实际应用中,四分位差是一个非常实用的工具,尤其在数据分析和统计报告中被广泛使用。


