偏度与峰度的正态性分布判断

摘要:
峰度≈0,分布服从正态分布;峰度˃0,分布陡峭;峰度˂0,分布平缓;2、正态性检验计算偏度和峰度的Z评分。因此,当样本量小于100时,用偏度和峰度来判断样本的正态分布性比较合理。

来自:https://mp.weixin.qq.com/s/VgwRuEIyvsC5K8dtgIjDuQ

偏度与峰度的正态性分布判断

用统计方法对数据进行分析,有很多方法如T检验、方差分析、相关分析以及线性回归等。都要求数据服从正态分布或近似正态分布。上篇博客用Q-Q图验证数据集符合正态分布。这篇博客先介绍偏度与峰度定义,然后用偏度与峰度检测数据集是否符合正态分布,最后分析该检测算法的使用条件以及spss的结果分析。

1、偏度与峰度

(1)偏度(Skewness)

偏度的衡量是相对于正态分布来说,正态分布的偏度为0,即若数据分布是对称的,偏度为0。偏度大于0,则分布偏右,即分布有一条长尾在右;偏度小于0,则分布偏左,即分布有一条长尾在左;

同时偏度的绝对值越大,说明分布的偏移程度越严重。

偏度与峰度的正态性分布判断第1张

注意:数据分布的左偏或右偏,指的是数值拖尾的方向,而不是峰的位置。

(2)峰度(Kurtosis)

峰度,是研究数据分布陡峭或平滑的统计量,通过对峰度系数的测量,判定数据相对于正态分布而言是平缓还是陡峭。比如正态分布的峰度为0,均匀分布的峰度为-1.2(平缓),指数分布的峰度为6(陡峭)。

峰度≈0,分布服从正态分布;

峰度>0,分布陡峭;

峰度<0,分布平缓;

偏度与峰度的正态性分布判断第2张

2、正态性检验

计算偏度和峰度的Z评分(Z-score)。

偏度Z-score = 偏度值 ÷偏度值的标准差

峰度Z-score = 峰度值 ÷峰度值的标准差

α=0.05的检验水平下,偏度Z-score和峰度Z-score是否满足假设条件所限制的变量范围,若都满足则可认为服从正态分布,若一个不满足则认为不服从正态分布。

3、正态性检验的适用条件

样本的增加会减小偏度值和峰度值的标准差,相应的Z-score会变大,最终会拒绝条件假设,会给正确判断样本数据的正态性情况造成一定的干扰。因此,当样本量小于100时,用偏度和峰度来判断样本的正态分布性比较合理。  

4、SPSS结果分析

偏度与峰度的正态性分布判断第3张

峰度Z-score = 5.166/0.425 > Z(α),α=0.05;因此该特征不符合正态分布。

免责声明:文章转载自《偏度与峰度的正态性分布判断》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇[转]mysql 存储过程中使用多游标Maven中央仓库——你可能不知道的细节下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

图像处理之基础---滤波器 高斯滤波

引用 keendawn 的 高斯(核)函数简介1函数的基本概念 所谓径向基函数 (Radial Basis Function 简称 RBF), 就是某种沿径向对称的标量函数。 通常定义为空间中任一点x到某一中心xc之间欧氏距离的单调函数 , 可记作 k(||x-xc||), 其作用往往是局部的 , 即当x远离xc时函数取值很小。最常用的径向基函数是高斯核...

偏态分布(Skewed distribution)

频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置,两端的频数分布大致对称。 偏态分布是指频数分布不对称,集中位置偏向一侧。若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。 如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布;同样的,如果频数分布的高峰向右偏移,长尾向左延伸则成...

高斯模糊的算法(高斯卷积 高斯核)

通常,图像处理软件会提供"模糊"(blur)滤镜,使图片产生模糊的效果。 "模糊"的算法有很多种,其中有一种叫做"高斯模糊"(Gaussian Blur)。它将正态分布(又名"高斯分布")用于图像处理。 本文介绍"高斯模糊"的算法,你会看到这是一个非常简单易懂的算法。本质上,它是一种数据平滑技术(data smoothing),适用于多个场合,图像处理...

假设检验的Python实现

结合假设检验的理论知识,本文使用Python对实际数据进行假设检验。 导入测试数据 从线上下载测试数据文件,数据链接:https://pan.baidu.com/s/1t4SKF6U2yyjT365FaE692A* 数据字段说明: gender:性别,1为男性,2为女性 Temperature:体温 HeartRate:心率 下载后,使用pandas的re...

截断正态分布(Truncated normal distribution)

Normal Distribution 称为正态分布,也称为高斯分布, Truncated Normal Distribution 一般译为截断正态分布,也有称为截尾正太分布。 截断正态分布是截断分布(Truncated Distribution)的一种,那么截断分布是什么?截断分布,限制变量x取值范围(scope)的一种分布。例如,限制x取值在0到50之...

说说高斯过程回归

说说高斯过程回归作者介绍:新浪微博ID @妖僧老冯, 9月将赴南京大学(直博生),方向是机器学习与数据挖掘 编者:小便和作者打过几次交道,一直以为是他是已“修成正果”的某某博士,便“毕恭毕敬”地去邀请他写篇牛文。细聊之后才得知小伙子原来是90后,9月份才博士入学。这篇文章对GP进行了深度科普,数学公式是有一些的,但耐心读读,都不是问题的。高斯过程是机器学习...