【median】在统计学中,“median”(中位数)是一个重要的描述性统计量,用于衡量一组数据的中心趋势。与平均数不同,中位数对异常值不敏感,因此在数据分布偏斜或存在极端值时,中位数更能代表数据的典型值。
一、什么是中位数?
中位数是将一组数据按大小顺序排列后,位于中间位置的数值。如果数据个数为奇数,则中位数是正中间的那个数;如果数据个数为偶数,则中位数是中间两个数的平均值。
二、中位数的特点
特点 | 说明 |
对异常值不敏感 | 相比于平均数,中位数不易受到极端值的影响 |
简单直观 | 计算方法简单,易于理解 |
适用于非对称分布 | 在偏态分布中,中位数更能反映数据的集中趋势 |
不受极端值影响 | 在数据中存在极大或极小值时,中位数仍能保持稳定 |
三、如何计算中位数?
1. 步骤一:排序数据
将所有数据从小到大排列。
2. 步骤二:确定数据个数
记录数据的总数 $ n $。
3. 步骤三:计算中位数位置
- 若 $ n $ 为奇数,则中位数为第 $ \frac{n+1}{2} $ 个数;
- 若 $ n $ 为偶数,则中位数为第 $ \frac{n}{2} $ 和第 $ \frac{n}{2} + 1 $ 个数的平均值。
四、举例说明
示例1:奇数个数据
数据:3, 5, 7, 9, 11
排序后:3, 5, 7, 9, 11
中位数 = 第3个数 = 7
示例2:偶数个数据
数据:2, 4, 6, 8, 10, 12
排序后:2, 4, 6, 8, 10, 12
中位数 = (第3个数 + 第4个数) / 2 = (6 + 8) / 2 = 7
五、中位数与平均数的区别
指标 | 中位数 | 平均数 |
定义 | 数据中间的值 | 所有数据之和除以数量 |
敏感性 | 对异常值不敏感 | 对异常值敏感 |
适用场景 | 偏态分布、有极端值的数据 | 正态分布、无明显异常值的数据 |
计算复杂度 | 简单 | 稍微复杂 |
六、总结
中位数是一种稳健的统计指标,能够有效反映数据的中心位置,尤其在数据分布不均衡或存在极端值的情况下,其应用更为广泛。通过简单的排序和计算,可以快速得出中位数,从而帮助我们更好地理解和分析数据。