11.1 相关分析概述
11.1.1 相关分析基本概念
相关分析用于描述双变量数据之间的关系。从性质角度来说,存在三种不同的关系类型,分别是因果关系、共变关系和相关关系。
因果关系是指一个变量是另一个变量的因,而另一个变量则是这个变量的果。例如工作认真投入是工作效率高的因,工作效率高则是工作认真投入的果。
共变关系是指表面上看来有联系的两个变量都与第三个变量有关,这两个变量间的关系就是共变关系。例如春天出生的婴儿与春天栽种的小树,就高度而言,表面上看来都在增长,其实这两者都受时间因素的影响。
相关关系是指两个变量在发展变化的方向及大小方面存在一定的关系,例如采光量与植物的生产量、植物采光能力之间具有相关关系。
不同变量之间的依存关系,从数量联系上来说,存在两种不同的类型,一种是函数关系,另一种是相关关系。
函数关系指的是变量之间存在的严格的依存关系。它们之间的关系值是固定的。对于某一变量的每一个值,都有另一个变量的完全确定的值与之相对应。例如,长方形的面积等于长乘宽。
相关关系则是指变量之间确实存在的但关系值不固定的相互依存关系。在相关关系中,当一个或几个相互联系的变量的值确定以后,与之对应的另一变量值也相应发生变化,但却不能完全确定,其关系值不是固定的,往往按照某种规律在一定的范围内变化。因此,相关关系是一种非确定性的关系。例如,购买能力与收入水平有关,但对于人均收入水平相同的地区,其购买能力可能不尽相同。
(1)相关的实质
相关是指不同变量之间的不严格确定的依存关系。它的实质是给定一个变量的值,而另一个变量的取值在一定范围内变动,且这种变化是受随机因素影响的。
(2)相关系数
相关系数是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值一般介于-1~1之间。相关系数不是等距度量值,而只是一个顺序数据。计算相关系数一般需要大样本。
(3)相关中的变量
在相关关系中,通常,在相互联系的变量之间存在一定的因果关系,这时就把其中的起着影响作用的变量称为自变量。受到自变量变动的影响而发生变动的变量称为因变量。例如,在销售成本与销售定价之间,销售定价往往会因为销售成本的变动而产生相应的变动,所以销售成本这一变量是自变量,销售定价这一变量是因变量。
在相关关系中,有时两个变量之间只存在相互联系而并不存在明显的因果关系。确定哪一个是自变量,哪一个是因变量,主要取决于研究的目的。