3.1 描述集中趋势的统计分析
集中趋势指一组数据向其中心值靠拢的倾向和程度,它反映了一组数据中心点的位置所在。集中趋势测度就是寻找数据水平的代表值或中心值。低层次数据的集中趋势测度值适用于高层次的测量数据,能够揭示总体中众多观察值所围绕与集中的中心;反之,高层次数据的集中趋势测度值并不适用于低层次的测量数据。
因此,选择什么样的测度值来反映数据的集中趋势,要根据数据的类型和特点来决定。描述集中趋势的统计指标有:算术平均值、几何平均值、调和平均值、众数、中位数等。
3.1.1 算术平均值
算术平均值也称均值,是变量数列中各单位标志值的总和除以全部单位数。它反映变量数列中各单位标志值的一般水平。算术平均值是集中趋势的最常用测度值,主要适用于数值型数据。
1.简单算术平均值
设一组样本数据为x1,x2,……,xn,样本量为n,则简单算术平均值的计算公式为:
示例1:
某生产组6名工人生产同一种零件的日产量分别为67、68、69、71、72、73件。计算这6名工人的平均日产量。
通过简单的算术平均值计算公式对其进行计算,则其计算结果为:
具体操作步骤如下:
①以该生产组工人生产零件的日产量数据创建一个数据文件,以该数据为基础进行操作计算。原始数据如图3.1所示。
图 3.1 示例1原始数据
②单击G2单元格,输入函数"=AVERAGE(A2:F2)"后,按Enter键即可在G2单元格中计算出平均日产量的数值。其中,函数中A2:F2表示引用A2到F2单元格区域中的数据。计算结果如图3.2所示。
图 3.2 计算结果
2.加权算术平均值
设两组样本数据分别为x1,x2,……,xn和f1,f2,……,fn,样本量为n,则加权算术平均值的计算公式为:
示例2:
某车间有10名工人,经调查,他们每月的工资如图3.3所示。
图 3.3 工人月工资
要求:计算该车间工人的平均工资。
分析可得如图3.4所示的分组表格。
图 3.4 分组表格
由分组表格得出如图3.5所示的加权项。
图 3.5 求得加权项
则该例的计算过程如下:
具体操作步骤如下:
①以记录车间工人每月工资文件中的数据为基础,结合以上分析进行操作计算。原始数据如图3.6所示。
图 3.6 示例2原始数据
②先计算出每组数据中月工资x与频数f的乘积xf,单击C2单元格,输入公式"=A2*B2",按下Enter键后,使用自动填充柄将公式复制到C3至C6区域,计算结果如图3.7所示。
图 3.7 计算各组月工资与频数的乘积
③单击B7单元格,输入函数"=SUM(B2:B6)",按Enter键即可在B7单元格中算出样本容量,使用自动填充柄将公式复制到C7单元格。计算结果如图3.8所示。
图 3.8 计算合计项
④单击D2单元格,输入公式"=C7/B7",按Enter键即可求得该车间的加权平均工资,计算结果如图3.9所示。
图 3.9 计算结果
若需求一个组距式变量分布数列的加权平均值,则需将每组数据中的组中值列出,如图3.10所示。
图 3.10 列出组中值
通过组中值按以上步骤操作,便可计算出组距式变量分布数列的加权平均值。