统计分析
总体平均数:若一组数据X1,X2, ,XN代表一个大小为N的有限总体,则其总体平均数为:
(3.1)
样本平均数:若一组数据x1,x2, ,xn代表一个大小为n的有限样本,则其样本平均数为:
(3.2)
样本数据是从总体数据中抽取出来的,但在不同次抽样中得到的样本是不同的。虽然在一定程度上,样本数据可以反映总体数据的特征,但由于抽样等原因,样本数据是总体数据的随机变量。同样,虽然样本均值可以反映总体数据的特征,但在不同次抽样中所得的样本均值是不同的,并且它们与总体均值间存在差异。
均值标准误差(Standard Error of Mean,S.E. Mean,简称标准误)就是描述这些样本均值与总体均值之间平均差异程度的统计量。
3.1.2 中位数(Median)
中位数是将总体数据的各个数值按大小顺序排列,居于中间位置的变量,用Median表示。中位数将所有的数据等分成两半,中位数两端的数据个数相同,因此它也被称为二分位数。中位数的确定,仅仅取决于它在数列中的位置,不受极端值的影响,因此可以用它表示总体的一般水平。同时,中位数比算术平均数具有更好的稳定性。
一个大小为N的数列,要求其中位数,首先应把该数列按大小顺序排列,如果N为奇数,那么该数列的中位数就是
是该数列中第与第位置上的数;如果N为偶数,中位数则位置上的两个数值的平均数。
3.1.3 众数(Mode)
众数是指总体数据中出现次数最多的变量,用Mode表示。它同样不受数据极端值的影响,从而在一定程度上提高了平均水平的代表性。例如,制衣厂可以根据消费者所需服装尺码的众数来安排生产。此外,如果众数的值出现的频数或频率较大,那么说明众数的代表性就越高,数列的集中趋势也就越显著。