11.3 多元变量相关分析方法
多元变量相关分析是研究三个或三个以上变量之间相关关系的相关分析。生活中往往有一种现象可能与多种现象之间存在相互的关系,如综合素质的提升不仅与文化教育有关,而且与健康状况、思想素质等也密切相关。
11.3.1 描述多元变量相关分析的方法
多元变量相关分析方法一般有两种:一种是使用多元相关系数来度量多个变量间的相关关系,另一种是使用多元协方差来进行相关关系的描述。本书中分析的多元相关均指线性多元相关。
1.多元相关系数
多元相关系数是用来测定因变量与一组自变量之间相关程度的指标。在此,以三个变量的相关性为例,假定三个变量分别为x1,x2,x3,其对应变量x1的取值分别为x11,x12,……,变量x2的取值分别为x21,x22,……,变量x3的取值分别为x31,x32,……。
变量x1与x2之间的简单相关关系记为r12,x1与x3之间的简单相关关系记为r13,x2与x3之间的简单相关关系记为r23。多元相关系数度量因变量x1与自变量x2、x3之间总的相关性,记为R1,23。R1,23的计算公式如下:
多元相关系数R1,23具有如下性质:
●0<R1,23<1。
●|R1,23|越小,则x1、x2与x3的线性相关程度越小;|R1,23|越大,则x1、x2与x3的线性相关程度越大。
●R1,23=1时,称x1、x2与x3完全线性相关。
2.多元协方差
除了多元相关系数以外,通过多元协方差矩阵也同样可以描述多个变量之间的相关关系。此处,仍以x1、x2和x3三个变量为例,则任意两个变量之间的协方差公式如下:
一般情况下,协方差也只能处理二维问题,那么维数多了自然就需要计算多个协方差。比如n维的数据集就需要计算
个协方差,那么就需要使用协方差矩阵来组织这些数据。协方差矩阵的定义如下:
为了更好地理解协方差矩阵的定义,在此举一个简单的三维的例子,假定某数据集有三个维度,则协方差矩阵为
可见,多元协方差矩阵是一个对称的矩阵,而且对角线上的数据是各个维度上变量的方差,非对角线上的数据则代表的是各个维度上变量之间的协方差,可以用来描述变量之间的相关关系。非对角线上的数据均为正,表明变量之间存在正向的相关关系;非对角线上的数据均为负,表明变量之间存在反向的相关关系。