在统计学中,p值(p-value)是用于测试假设的一个重要概念。
p值的定义是:在假设成立的条件下,得到等于或更极端于实际观察结果的概率。

p值常见的应用场景有:
检验参数估计的显著性
例如通过t检验检验样本 mean 是否等于某值时,会计算得到一个p值。p值越小,表示样本mean与假设值差异越显著。
比较两组样本差异的显著性
通过两样本t检验或方差分析计算p值,来判断两组是否存在显著差异。p值越小,说明两组差异越明显。
相关性分析
计算两个变量间相关系数时,其对应的p值可以判断两变量间关系是否显著。
回归模型拟合优度
回归分析中,可以通过检验回归方程整体的p值,来判断自变量是否对应变量有显著预测作用。
确定统计学意义
一般将p值阈值设为0.05或0.01,p值低于该阈值则认为结果在统计学上是显著的。
所以p值在很多统计推断中都起到关键作用,可以看作是检验结果显著性的一种判据。

当p值小于0.05时,表示结果在统计学上具有显著性。
这是因为在统计学中,研究者通常会采用显著性水平(Significance Level,α)为0.05作为判断的标准。
换句话说,α=0.05表示研究者可接受出现错误判断(Type I Error,即将无效结果判断为有效)的概率不超过5%。
那么,当p值小于0.05时,说明在显著性水平α=0.05下,观察到的结果仅有不超过5%的概率是由于采样误差或其他随机因素造成的。
因此,p值小于0.05意味着研究结果具有统计学意义,即结果被认为在95%的可信度下,拒绝原假设,表示该测试有统计学上的显著性。
简言之,p<0.05表示有小于5%的概率是观察到假阳性结果,因此我们有足够的证据支持研究结果的统计学意义。这就是p值在统计推断中被广泛应用的原因。