如何添加数据分析工具?

在文件工具栏选择【选项】中的【加载项】对话框,在图中蓝笔圈出来的位置点击【转到】(如图1),勾选【分析工具库】,点击确定(如图2)。可在数据工具栏中看到【数据分析】工具。


数据分析工具有哪些功能?
数据分析工具可实现简单的描述统计分析,也可进行方差分析、相关分析、回归分析、时间序列分析等,还可进行假设检验,如t检验、F检验、z检验。按照数据分析的大致流程,对功能进行操作详解如下:
抽样
输入区域为抽样样本区,勾选标志则将样本名称【GDP】作为系统识别要素之一。一般总体数据较多时(最小总体数量最少为250,抽样比例5%-15%)。
抽样方法中随机抽样是无限制规则进行抽样,抽样时会出现重复值,如下图3。在【数据】工具栏的数据工具中选择删除重复值即可。间隔抽样的样本量为输入总体数量/间隔数,即样本量为72时,抽样样本数量为18。

描述统计
同样的方法选择数据分析--描述统计。不管按行、按列都最好勾选标志位于第一行/列,便于数据处理。输出的数据如红色框内数据,当前会出现重复标题等,如图4。
可将G1等案例所在行错位复制到表中空白列,再选择全表,点击排序与筛选中的自定义排序,勾选数据包含标题,点击选项,将按列排序改成按行排序,即可重复行删除,如图5。再一键将重复的重复的标题列全删即可。
峰度:衡量数据分布起伏变化的指标,以正态分布为基准,比其平缓时值为正,反之则为负;
偏度:衡量数据峰值偏移的指数,根据峰值在均值左侧或者右侧分别为正值或负值。


排位与百分比排位
对选中的多个属性列进行自动排序编号,并从底部开始给出累计百分比。

相关分析
相关分析是在因子分析之前,确定因子、因素之间相关程度的分析方法,相关系数是衡量两因子、因素之间的关系密切程度指标,常标为R或r。点击数据分析——相关系数操作即可,如图7。
相关系数区间为[-1,1],0为完全不相关,1为完全正相关,-1为完全负相关,弱相关、相关、强相关的临界值分别为0.3、0.5、0.7。
设(X,Y)为二元随机变量,P为随机变量x和y的相关系数,公式为:

回归分析
按要求输入y与x1...xn的值即可。勾选残差图、正态分布图等方便直观对回归方程模拟效果进行判断,再从输出的表格中提取回归系数等指标。
常熟为零是指该方程拟合的是严格正比例模型,x=0时,y应为0,因此勾选。
时间序列分析
可选择移动平均、指数平滑进行操作。移动平均的间隔为移动点数,即间隔为3时,进行的是三点移动平均,较为实用。指数平滑在上一周使用时,给到的以当值和上期历史预测值为当期预测基数值,实际无法进行未来预测;本次进行预测时,公式已盖将上期数值和上期预测值作为基数进行未来1年数值预测。建议在使用时,先观察公式是否具有参考性。

在时间序列分析中,仅阻尼系数设定需斟酌。根据《现代地理学中的数学方法》中的设置:
若时间序列数据波动较小时,α的取值范围在(0.05,0.3),以增大远期数据的权数和作用;若时间序列数据波动较大时,则取值范围为(0.7,0.95)。以误差最小原则,依据经验合理选取。