excel学习库

excel表格_excel函数公式大全_execl从入门到精通

用Excel函数公式,自己就能做一元线性回归预测

销售报表中,对已发生的历史进行汇总是不可或缺的。不过若还能对未来做一点有启发的预测就更好了。由于有函数公式的支持,在Excel中实现这个目标,相比其它所有方案是最容易,成本最低的。本文我们就来探讨怎么实现它。

沿着时间维度做预测有很多种方法。回归、时间序列是主流方案。它们各自又有多种细分的方法。不过我们通常优先选择那些既简单又能解决问题的方法。

Excel函数公式能支持的,只有一元线性回归方法。其它一部分算法,Excel可以实现,但需要迭代计算。目前Excel里要想实现迭代,主要还依靠手工操作(Excel2021和Microsoft 365除外)。所以情况很明显了,我们这里选择一元线性回归。思路确定。

~且慢。这回事情没有那么简单。

能选择的方法是明确了,但这个方法是否奏效呢?当我们选择一个方案的时候,第一考虑因素是它是否管用,第二位才是能不能用。不能拿着锤子找钉子。那么一元线性回归在这里行不行?这里结论能猜到,它行。否则这篇文章就没法进行下去了。但我们多少还是要弄明白一点,它是怎么行的。

一元线性回归函数,本质就是一元一次函数。K为斜率,b为截距。自变量只有一个变量x,因变量为y。当然因为实际测量数据总有一定的波动,因此完整的一元线性回归还需要加上一个代表噪声的波动量,它是随机的。抛开随机噪声分量不谈,上面只是中学代数的内容,看起来非常简单,以至于恐怕很多朋友在此后的工作里再也没有接触过它,误认为这么个简单的小玩意能有什么用呢?其实它用途挺大。一元线性回归能帮助我们预测,而且面对短期预测,效果还不错(比人的判断强)。

在预测领域,几年时间跨度范围内的预测都算短期。我们只把长达几十年跨度的预测称为长期。这么一看,一元线性回归预测的应用范围很广。

我们说一元线性回归用于预测有效,是怎么有效的呢?这里真正的关键是:需要抓住影响因变量y变化的主要因素x。这就是说,一个变量y,影响它的因素有很多,但影响力不同。我们只要抓住影响最大的那个因素x,然后观察x,y的变化规律也就大体了解了。预测与现实发生的真值之间的差异统称为残差。

测试

所谓测试,就是拿已经发生过的数据来比划比划。看看时间变量与目标变量有多强的相关性。如果像上面图片中显示的那样,相关性非常强,那就意味着时间几乎主宰了目标变量的大部分波动变化。在实践中,这个相关性大约30%就可以考虑采纳了。相关性最高为100%。

对大多数业务来说,时间是一个非常显著的影响因素。怎么证明呢?请想一想你的业务,是否有淡旺季之分?有淡旺季那么就已经意味着时间是挺显著的一个影响因素。除非业务的变化总是忽高忽低,令人捉摸不定,我们从来都搞不清业务行情什么时候好,什么时候不好。这种情况下才没有办法用时间来描述业务变化。这种情况非常少见吧?所以这就是为什么大多数情况下,一元线性回归预测业务指标有效的原因了。

以上就是大体背景,现在是时候在Excel里用函数公式实现它了。

动态范围

第三个参数始终是当前行的数值+1。这就是在说,我们是基于历史信息,预测下一个时刻的数值。外推1个时间单位的预测是最常用的。外推范围尽量小是确保预测准确率的关键窍门之一。

最后让我们来看看一元线性回归的预测效果吧。顺便在此提醒诸位:模型一定要保持跟踪监测。因为任何模型都有失效的一天。

为什么一元线性回归看似十分简单,预测却有效?

在大多数情况下,以时间为自变量的一元线性回归是有效的。具体原因在前面已经做过解释。实际上我们应该说,所有看似简单的预测方法,其实都有效。既通常优于看似复杂的算法,也远远超过人类的判断。这大概就是简约原则在我们这个世界能通行的生动体现吧。一般性地看,简单方法之所以奏效,根本原因在于它很好地抑制了噪声。无论是复杂算法,还是人的判断,通常都很容易带入更多噪声,使得预测不那么准确。尤其是人的判断,是三种方法(简单算法预测、复杂算法预测,人类判断预测)中表现最差的,无论任何领域。因为人有情绪,有偏见,有谎言。而算法没有情绪,但可能会引入偏见。情绪、偏见,这些都是噪声的重要来源之一。简单算法更是可能连偏见也很好地排除掉了,因此有效抑制了噪声。

不过可能与很多读者朋友理解的不同,预测是并非首要追求预测准确率的。因为从局部(微观)来看,预测根本不能说准。有人可能因此疑问,那还要预测干什么?预测更大的价值是给我们提前警示方向。在之前的文章《指标要有值,有界,有方向》里,我们探讨过了指标方向的问题。就像本文演示的那样,通过预测,我们能够捕捉到销售额变化的方向和趋势,进而做出决策判断,再进而采取行动。这是预测实际的价值。

另外与很多人猜测不同的是,通常预测恰恰不能过分准确。按经验,在商业领域,预测的准确率通常在70%就不错,80%就很优秀。如果遇到预测非常准确的情况,反倒不是好现象。这意味着要么数据在说谎,要么是预测的输入参数有错误。在数据分析领域,这种情况被称为过拟合,过拟合是错误的预测,即表现为用已知数据集来测试时,发现效果很棒。但在真实情况下预测,立即拉垮。过拟合是预测必须要杜绝的情况。细想一下,预测这件事充满哲理性。这个世界没有面面俱到的事情,如果表现过于完美,也许恰恰是假象。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接