标准差也称为均方差,是反映一组数据离散程度最常用的一种量化形式,是表示精确度的重要指标。方差是各个数据与其算术平均数的离差平方和的平均数,由于方差的计量单位和量纲不便于从经济意义上进行解释,所以实际的统计工作中多用标准差来反映统计数据的差异程度。
方差和标准差的计算方法包括简单平均法和加权平均法。简单平均法即将过去各数据之和除以数据总点数以求得算术平均数作为预测值;加权平均法即利用过去若干个按照发生时间顺序排列起来的同一变量的观测值,并以时间顺序数为权数计算出观测值的加权算术平均数,以作为预测未来期间该变量的预测值。
标准差(Standard Deviation) ,是离均差平方的算术平均数的平方根,用σ表示。在概率统计中最常使用作为统计分布程度上的测量。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
方差和标准差其实就是一回事嘛,不过就是平方或者开方,没有什么情况用方差、什么情况用标准差计算这样的问题,不过就是一个数学公式中的一个变量而已。
级差用来描述数据的离散程度太粗糙了,正如比赛中很多时候都要去掉一个最高分去掉一个最低分,级差很多时候仅做一个简单参考,因为更多的时候,在数据量大的情况下,任何一点突然的偶然因素都可能导致级差异常放大。
对比而言,均方差能够更好的反应数据的离散程度。
更重要的,为了描述在日常生活中出现的事件,已经研究出了若干种数学模型,平均分布、高斯分布,这些都能很好模拟现实生活中不同场合下数据的概率分布状况,其中高斯分布等模型就是建立在方差这类概念之上的。
标准计算公式
此组数值的标准差为:
样本标准差
在真实世界中,除非在某些特殊情况下,找到一个总体的真实的标准差是不现实的。大多数情况下,总体标准差是通过随机抽取一定量的样本并计算样本标准差估计的。
样本标准差
sn
这里示范如何计算一组数的标准差。例如一群儿童年龄的数值为 { 5, 6, 8, 9 } :
第一步计算平均值
在这里,5, 6, 8, 9的平均值为(5+6+8+9)/4=7
第二步计算标准差
σ=√0.25*{
√10/√4=1.58

方差,标准差之间的联系与区别:
1. 方差和标准差都是对一组(一维)数据进行统计的,反映的是一维数组的离散程度;
2. 标准差和均值的量纲(单位)是一致的,在描述一个波动范围是标准差比方差更方便。比如一个班男生的平均身高是170cm,标准差是10cm,那么方差就是10cm^2。可以进行的比较简便的描述是本班男生身高分布是170±10cm,方差就无法做到这点。
