excel学习库

excel表格_excel函数公式大全_execl从入门到精通

预测,基于经验和知识,方法论提高准确性

预测是基于经验和知识而展开的活动,是一个根据已知条件和知识,寻求未知事物的过程。因此,准确的预测离不开丰富的经验和知识。但是预测也作为一种独立的思维活动,有一些相应的方法论。我们可以通过一些方法提高预测的准确性。

最有助于预测的方法论是建模思维。 模型是基于实际问题或者客观事物的经验和规律,通过抽象、概括和总结而成的。 [3] 它被创造出来就是为了分析事物之间的关系、解决特定的问题,以及预测事物的发展。

我们用几道数学题来帮助大家了解模型对我们预测的重要性。

在三角形 ABC 中,∠A=90°,∠B=60°,请问 ∠C 是多少度?

我想大家都会很快算出 ∠C=30°。因为我们都学过:三角形内角之和等于 180°。在这里,「三角形内角之和等于 180°」就是一个模型,一个帮助我们根据已知预测未知的模型。只不过这种预测,结果比较单一和确定,以至于大家不认为这是一种预测。

那么接下来,我们用另一道题目帮助大家理解模型和预测(在两千年前,要是你能算出这个答案,就是一个天才数字家)。

某城市拥有本地人口 1400 万人,预计该城市未来每年流入人口约 15 万人,该城市 10 年后会有多少万人口?

比起前面的问题,这个问题更贴近生活,也更有预测的味道。在这个问题中,我们运用到的就是线性函数模型。我们假设 X 年后的人口为 Y ,那么人口预测模型为: Y =1400+15 X 。将 X =10 带入该模型,即可得出 Y =1550,即该城市 10 年后人口为 1550 万人。

预测的事物和问题越复杂,需要运用的模型就会越复杂,比如,在预测群体的智力时,会用到正态分布模型;在预测生物繁殖速度时,会用到指数模型;在预测污染物扩散时,会用到高斯模型;在预测传染病传播时,会用到传染病传播模型;在预测产品的价格和购买量的关系时,会用到供需模型;在预测重金属衰变后的含量时,会用到半衰期模型……

我们在前面已经提及如何寻找事物之间的因果关系,但是寻找因果关系只是一种定性的判断。模型的价值则是对这种因果关系进行定量分析,让我们可以更具体、更详尽地了解这种因果关系。

定性预测:因果

定量预测:模型

举个例子,假设要对大气污染物的扩散进行预测和控制。我们知道「风速越大,污染物的扩散越快」,这是一个定性的因果判断。而大气扩散高斯模型可以让我们看到风速和污染物扩散速度之间的函数关系,甚至可以让我们知道污染物的落点在哪些范围内。

虽然公式看上去比较复杂,但是这种模型的定量预测能够给我们带来更大的价值。这可以用来界定一家企业是否违法排放废气,是否会对某个区域的居民造成影响,是否需要做更进一步的废气净化,甚至是否需要拆除厂房。通过模型,人们也更容易界定问题所在和需要改进的地方。

定性预测:风速越大,污染物的扩散越快

定量预测:

式中:

C ——任意点的污染物浓度,mg/m 3 或 g/m 3

Q ——源强,单位时间内污染物排放量,mg/s 或 g/s;

σy ——侧向扩散系数,污染物在 y 方向分布的标准偏差,是距离 x 的函数;

σz ——竖向扩散系数,污染物在 z 方向分布的标准偏差,是距离 x 的函数;

u ——排放口处的平均风速,m/s;

H ——烟囱的有效高度,简称有效源高,m;

x ——污染源排放点至下风向上任意点的距离,m;

y ——烟气的中心轴在直角水平方向上到任意点的距离,m;

z ——从地表到任意点的高度,m。

模型的价值在于,将粗糙的定性关系转变为更准确的定量关系。 如果我们想要更好地预测事物的发展规律,就必须时刻保持建模的思维。

而想要给事物建立一个预测模型,我们必须先根据生活现象或者数据做一个初步的假设和判断。这里的假设和判断不一定是正确的,我们后面可以通过一些方法对其进行评估。

接下来,我们要确定因素。哪些是影响因素,哪些是想要预测的因素,还有哪些是会影响预测的其他因素;然后,我们要收集数据,根据数据之间的关系,寻找比较适合因果假设的模型;最后,将这个模型应用到实际中去,通过真实反馈来评估这一模型的可靠性。如果出现了较大的偏差,则需要修正模型。

我们采用一个比较简单的例子作为建模思维的引例,帮助大家加深对建模过程的理解和掌握。

以下数据为某新兴行业 10 年以来的历年销售额(见表 3—1),请推测该行业第 11 年的销售额。

表 3—1 某新兴行业的历年销售额

对数据做初步观察后, 我们可以大概感知到, 这个新兴行业的销售额正处于逐年增长的状态。不过对于具体的增长幅度和变化趋势, 我们还需要通过数据建模的方式来评估。

我们将数据放进坐标轴中, 然后用初中时学过的线性回归知识,或者借用 Excel 软件,可以算出它们之间的关系: y =207.08 x —232.13, 得到图 3—1 中的函数关系,然后带入 x =11,得到 y =2045.75。我们由此可以预测, 该新兴行业第 11 年的销售额为 2045.75 万元。

但是, 我们也要意识到一个行业的增长不可能一直持续,还需要评估用一元一次线性回归的方式来预测是否合理。如果接下来数据结果的偏差很大, 我们很可能需要用其他的函数模型来做预测,比如用对数函数的模型来预测接下来的销售额。

图 3—1 某新兴行业销售额变化图

在这个建模的例子中, 我们先根据数据得到了一个模糊的感知, 然后再利用模型确认两个变化因素的函数关系,进而预测未来的销售额情况。同时, 我们还需要结合实际情况,评估是否需要对模型进行修正。

除了线性模型,常用的函数模型还有正态分布、指数分布和对数分布。这些分布曲线可以让我们理解和推测非常多的生活现象。

我们在网上经常会看到一些关于收入的内容,看多了会对这个世界产生偏差,以为遍地都是年入百万元的富翁。事实如何呢?如果我们懂得正态分布模型, 结合两三个可以查阅到的数据,就可以评估出这个数值。

据统计研究, 人群的收入基本符合正态分布。我们结合高中的数学知识,大抵知道正态分布的函数关系,以及在坐标轴上的表现(见图 3—2)。

图 3—2 正态分布各个标准差所占的百分比

正态分布函数关系见下面公式。其中, μ 为数学期望, σ 为标准差。

即使我们假设人们的年平均收入为 10 万元, 标准差为 5 万元,那么大于年入 25 万元的可能性已经只剩下 0.13%。实际上, 在中国家庭金融调查和中国社会综合调查的数据比对中,年入百万元以上的比例约为万分之五。

通过简单的正态分布模型, 我们减少了被表象迷惑的可能性。其他模型也是如此, 它们都可以用来预测特定领域的事物。这类定量的推理比起各种奇闻轶事和小道消息要更接近真实。

每一门学科都有很多预测模型作为我们了解特定领域的工具,我们显然无法全部掌握, 但是, 其中一些常见的、重要的、客观的,以及具有广度和深度的模型, 可以作为我们重点学习的对象。

斯科特·佩奇(Scott Page)在《模型思维》( The model thinker )一书中做了一些关于思维模型的阐述。 [3] 他在书中总结了 28 个重要的思维模型, 这些模型可以解释生活中的大部分现象和问题。

随机游走模型可以解释,即使是胜率为 50% 的赌博,赌徒依旧会输得倾家荡产;博弈论模型可以预测,人们在什么情况下选择合作,什么情况下选择竞争;信息论模型可以帮助你用尽可能小的代价找出问题所在;阈值模型可以帮助你预测在哪些情况下可能出现难以承受的问题……

了解这些模型, 对我们理解事物有非常大的帮助。这就像文案设计师先设计一些模板,当后面遇到类似的设计工作时,只需要在模板上进行简单的修改,从而大大提高了工作效率。同样地, 当我们需要思考生活现象时,这些模型可以让我们更快看到其内在机制和工作原理,提高思考的效率。

【本篇故事完结】

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接