excel学习库

excel表格_excel函数公式大全_execl从入门到精通

线性回归分析详解10(完结篇):线性回归分析预测的十大步骤

许栩原创专栏《从入门到高手:线性回归分析详解》第10章,这是本专栏的最后一章,是专栏的完结篇:用线性回归分析做预测,多元线性回归分析预测的十大步骤。 线性回归分析专格栏总目录请见上图,前9章,我分别讲述了回归分析及与回分析相关的概念,一元、多元线性回归分析的公式与计算方法,以及多重共线性、回归方程的精度、显著性验证和置信区间等进行回归分析的重要步骤及其计算方法。至此,以回归分析进行需求预测的各项知识点及各项准备工作全部完成,我们可以正式的以回归分析进行需求预测。 本章,我将详细讲解用多元线性回归分析进行需求预测的十大步骤:数据收集、数据清洗、列出所有的变量、确定纳入回归方程的自变量、确定并消除多重共线性、求解多元线性回归方程、确认回归方程的精度、显著性验证、计算置信区间、正式预测。一、数据收集。 我们做统计,进行数据分析,首先的,都是需要有数据。有数据才能统计,有数据才能进行数据分析。以回归分析做需求预测,同样需要有数据,最先开始的,是数据收集。 数据收集是按照确定的数据分析和框架内容,有目的的收集、整合相关数据的一个过程。 从上面数据收集的定义可以看出,数据收集需要有明确的目的,即我们先要确定我们是为了什么事而去收集数据。本专栏的主题是用回归分析进行需求预测,所以,在这里,我们收集数据的目的非常明确,收集数据就是为了有效的采用回归分析的方法来进行需求预测。 所以,我们需要收集的,就是与需求预测这个目的相关的数据,比如销量数据(因变量),以及各种影响销量因素的数据(自变量)等等。对需求预测没有帮助的数据,在回归分析中不需要收集(比喻相关财务数据)。 回归分析需要的数据一般来源于我们日常的记录(含人工记录与系统生成),比如生产原始单据与报表、出入库报单、销售数据、促销信息、重大事件特殊事件记录、调查与调研信息等等。二、数据清洗。 我们收集到了一定量的数据,但这些数据往往不是直接能用的,我们需要对数据进行一些处理与加工,使数据能够被我们后续进行各分析所使用,这个过程就是数据清洗。 数据清洗一般包括以下工作(数据清洗方法比较多也比较有针对性,本专栏不深入,大家感兴趣,可以私下交流):清除不必要的数据,清除错误的数据,填补缺失的数据,转换数据,提取或合并数据,计算与分组分类等等。三、列出所有的变量。 数据收集并清洗后,需要根据数据,列出所有有效的变量(指经收集清洗后有完整可用数据的变量)。 以本专栏回归火锅店为例,在收集数据并经必要的整理清洗后,我们得到了如上图的数据(回归火锅店每日业绩),根据这些数据,可以列出了全部变量(自变量:气温、折扣、帅哥站台;因变量:业绩)。四、进行相关分析,确定纳入回归方程的自变量。 列出全部的自变量后,接下来,对每个自变量与因变量进行相关分析,以确定将哪些自变量纳入回归方程。 如上图右上所示,我们采取Excel函数CORREL计算相关系数,三个自变量的相关系数分别为气温-0.818、折扣-0.793、帅哥站台0.122。(相关系数计算详见本专栏第2章。) 按照自变量相关程度的标准和是否纳入回归方程的标准(如上图右下所示),气温和折扣为强相关,直接纳入回归方程;帅哥站台为不相关,将其排除在回归方程之外。即:回归火锅店这个例子,经相关分析后,我们确定了回归方程的两个自变量:气温和折扣。五、确定并消除多重共线性。 确定纳入回归方程的自变量,我们接下来需要判定回归方程存不存在多重共线性,如果存在多重共线性话,我们需要进行消除多重共线性的操作。(关于多重共线性,详见本专栏第6章。) 我们用方差膨胀因子(VIF)来判定回归方程存不存在多重共线性。如上图,本例中,VIF计算结果,气温(VIF=3.022),折扣(VIF=2.694)。根据方差膨胀因子可接受到标准,本案例中,两个自变量VIF都小于5,表明我们两个自变量之间不存在多重共线性,不需要进行消除多重共线性的操作。六、求解多元线性回归方程。 经过以上步骤,按回归火锅店的数据,最终选择两个自变量,气温和促销折扣,我们列出多元线性回归方程:y=a1x1+a2x2+b。接下来,就是进行多元线性回归方程的求解。(求解多元回归方程详见本专栏第5章。) 如上图, 我们采用Excel函数LINEST求解多元回归方程。(LINEST函数的用法详见本专栏的第4、5两章。特别提醒,LINEST函数是一个数组函数,一起选中需要输入公式的三个单元格,完成公式内容输入后,Ctrl+Shift+Enter三键同按最终完成公式录入,得出函数计算结果。) 本例两个自变量从左到右依次是气温和折扣,LINEST函数计划出来的回归系数从左到右依次是折扣和气温,顺序相反。本例两个自变量回归系数分别是,气温回归系数-140.7,折扣回归系数是-10582.7,截距为15801.2(两个回归系数均为负数,代表这两个自变量和因变量都是反相关关系。即气温越高,业绩越低,折扣力度越大,业绩越高)。 本例多元回归方程求解结果:y=-140.7x1-10582.7x2+15801.2。七、确认回归方程的精度。 求出回归方程后,我们需要对这个回归方程进行一系列评价和评估,第一个要做的是确认回归方程的精度。 我们用给调整后的R2来衡量回归方程精度。(判定系数R2与调整后的R2详见本专栏第2章)。 确认回归方程的精度具体步骤如下(详细如上图)。 1、按求出的回归方程对已有数据进行预测,得到预测业绩数据列(y’)。 2、计算因变量实际业绩y与预测业绩y’的相关系数R,计算结果为0.857。 3、计算因变量实际业绩y与预测业绩y’的判定系数R2,计算结果为0.734。 4、计算调整后的R2,计算结果为0.686 5、按我建议的确认回归方程精度的判定标准(详见本专栏第7章),本例调整后的R2为0.686,接近0.75,表示回归模型拟合度较好,回归方程的精度较高,回归方程的精度确认成功。八、显著性验证。 显著性验证的方法一般有两种,一是测算回归方程总体显著性的F检验,二是测算回归系数个体显著性的t检验。(显著性验证详见本专栏第8章。) 本例采用第一种方法,即回归方程的总体显著性验证的F检验。 F检验测算的是回归方程的总体显著性,我们以Excel的数据分析工具来进行F检验。 请见上图。本例F检验,上图是以5%的显著性水平(置信度95%),用Excel的数据分析工具中的回归分析计算的结果。结果显示,F统计值为15.19。 我们用Excel函数FINV来计算标准的F统计值,将显著性水平0.05,第1自由度2,第2自由度11(14-2-1)输入函数,得出标准的F统计值3.98。 计算的F统计值为15.19,远大于标准的F统计值3.98,本例显著性验证F检验成功。九、计算置信区间。 经过回归方程的显著性验证,接下来,我们计算置信区间。(关于置信度与置信区间,详见本专栏第9章。) 我们用Excel函数TINV+STDEVA+ SQRT来计算置信区间,详细如下(见上图)。 1、用TINV函数计算t值。将显著性水平α=0.05,样本个数n=14,输入函数,t值=TINV(0.05,14-1)=2.16。 2、用STDEVA函数计算预测业绩y’的标准差,如下图,y’的标准差=747。 3、将以上数据套入置信区间的计算公式,计算置信区间,得出,置信区间=±2.16*747/SQRT(14)=±431。十、正式预测并得出预测结果。 好,我们经过上述九步的一系列动作,现在可以正式预测了。 经天气预报查询,未来1月26日气温为-2℃,经回归火锅店管理层决定,当天火锅店进行97折促销,我们以回归分析来预测1月26日回归火锅店的业绩,具体的有以下几点(见上图)。 1、我们将需要预测当天的两个自变量(气温为-2℃,折扣0.97),代入上几步我们解出的,已经确认过精度的,并进行过显著性验证的多元回归方程y=-140.7x1-10582.7x2+15801.2,得出当天业绩预测的基准结果(如预测过程中没有引进置信区间,那这个基准结果就是最终预测结果),即y=-140.7*(-2)-10582.7*0.97+15801.2= 5817元。 2、我们设定的置信水平是95%,根据第九步的计算,置信区间=±431,我们以预测的基准结果±431,得到当日预测业绩的上下限,即5817±431,最大6248元,最小5386元。 3、当气温-2度,并进行97折促销时,我们得出预测结果:1月26日,回归火锅店的业绩,有95%的可能在5386元~6248元之间。专栏总结。 至此,许栩原创专栏《从入门到高手:线性回归分析详解》共10章,全部更新完成。下面再回顾一下专栏的全部内容,作为总结。 第1章,我讲述了变量、因变量、自变量和“哑变量”的相关概念。 第2章,详细介绍确定关系与相关关系,相关系数与判定系数的概念及其计算方法。 第3章,从头说明回归分析的历史、概念和分类。 第4章和第5章,分别讲解一元线性回归方程和多元线性回归方程的公式和计算方法。 第6章,重点介绍多元回归分析的常见现象,多重共线性。 第7章~第9章,我分别讲述了如何确认回归方程的精度,如何进行显著性验证,以及如何计算置信区间。 第10章,正式预测。许栩原创专栏《从入门到高手:线性回归分析详解》全部内容就讲解到这里,感谢您的支持与阅读,许栩原创下一个专栏再见,谢谢!

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接