两个连续数值变量之间相关性强度皮尔逊相关方法
相关系数P值
接近+1,表示较大的正相关性 接近-1,表示较大的负相关性 接近0,表示变量之间没有相关性
对于 P 值,可以理解为:当原假设(H0,通常假设变量间没有相关性)为真,根据观测值拒绝它而犯错的概率。当这个P值越小,则表明我们拒绝它犯错的概率越小,那它就更应该更确定地被拒绝,因为这里面默认了小概率事件,不会在有限次的实验中被轻易地观测到,相当于是所计算的相关性的确定程度,越是确定,说明越是认为样本能代表总体。取值说明如下:
<0.001,相关系数有很强的确定性 0.001~0.05,相关系数有适度的确定性(依据于置信水平,但通常用的是0.05) 0.05~0.1,相关系数的确定性较为微弱 >0.1,相关系数没有确定性
1. 相关系数绝对值接近于1;2. P值小于0.001。stats

scipyfromimport
importas
# 导入数据
"demo1.xlsx"
'no''num'

当然了,变量自己与自己的相关系数为1。
皮尔逊相关方法