excel学习库

excel表格_excel函数公式大全_execl从入门到精通

「数据分析10」分析数据相关性常用工具——皮尔逊相关方法

两个连续数值变量之间相关性强度皮尔逊相关方法

相关系数P值

  • 接近+1,表示较大的正相关性
  • 接近-1,表示较大的负相关性
  • 接近0,表示变量之间没有相关性

对于 P 值,可以理解为:当原假设(H0,通常假设变量间没有相关性)为真,根据观测值拒绝它而犯错的概率。当这个P值越小,则表明我们拒绝它犯错的概率越小,那它就更应该更确定地被拒绝,因为这里面默认了小概率事件,不会在有限次的实验中被轻易地观测到,相当于是所计算的相关性的确定程度,越是确定,说明越是认为样本能代表总体。取值说明如下:

  • <0.001,相关系数有很强的确定性
  • 0.001~0.05,相关系数有适度的确定性(依据于置信水平,但通常用的是0.05)
  • 0.05~0.1,相关系数的确定性较为微弱
  • >0.1,相关系数没有确定性

1. 相关系数绝对值接近于1;2. P值小于0.001。stats

1. 仍旧以如下数据为例:
scipy
fromimport
importas
# 导入数据
"demo1.xlsx"
'no''num'

3. 输入如下结果,说明可以拒绝原假设(两变量不相关的假设),认为两个变量之间具有确定的较强的相关性。

当然了,变量自己与自己的相关系数为1。

皮尔逊相关方法

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接