【相关系数r公式化简】在统计学中,相关系数(Pearson相关系数)是衡量两个变量之间线性关系强度和方向的指标。其原始公式较为复杂,但在实际应用中可以通过数学推导进行化简,使其更易于理解和计算。本文将对相关系数r的公式进行总结与化简,并通过表格形式展示不同形式之间的转换。
一、相关系数r的原始公式
相关系数r的原始定义公式为:
$$
r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}
$$
其中:
- $ x_i, y_i $:分别为两个变量的观测值;
- $ \bar{x}, \bar{y} $:分别为两个变量的均值;
- 分子为协方差的无量纲形式;
- 分母为两个变量标准差的乘积。
二、相关系数r的化简公式
为了简化计算,可以将上述公式进一步展开和化简。以下是几种常见的化简形式:
1. 基于原始数据的展开式
$$
r = \frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{\sqrt{[n\sum x_i^2 - (\sum x_i)^2][n\sum y_i^2 - (\sum y_i)^2]}}
$$
其中:
- $ n $:样本数量;
- 公式中的各项均为原始数据的总和与平方和。
2. 基于标准分数的表达式
$$
r = \frac{1}{n-1} \sum \left( \frac{x_i - \bar{x}}{s_x} \right) \left( \frac{y_i - \bar{y}}{s_y} \right)
$$
其中:
- $ s_x, s_y $:分别为变量x和y的标准差;
- 此公式强调了变量标准化后的关系。
三、公式对比表
| 公式类型 | 表达式 | 说明 |
| 原始公式 | $ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} $ | 基于协方差与标准差的原始定义 |
| 展开公式 | $ r = \frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{\sqrt{[n\sum x_i^2 - (\sum x_i)^2][n\sum y_i^2 - (\sum y_i)^2]}} $ | 适用于直接计算原始数据的总和与平方和 |
| 标准化公式 | $ r = \frac{1}{n-1} \sum \left( \frac{x_i - \bar{x}}{s_x} \right) \left( \frac{y_i - \bar{y}}{s_y} \right) $ | 强调变量标准化后的乘积之和 |
四、小结
相关系数r的公式可以根据不同的计算需求进行化简,以适应不同场景下的使用。无论是基于原始数据的展开式,还是基于标准分数的表达方式,都能有效反映两变量之间的线性关系。在实际操作中,推荐使用展开式进行计算,因其便于编程实现且计算效率较高。
通过以上总结与表格对比,可以更清晰地理解相关系数r的不同形式及其适用范围。


