四分位数

摘要:
四分位数是统计学里一个很重要的概念,实际应用中,所画出来的箱图,就使用到了这个概念,只有懂了四分位的概念才能看懂箱图所表达的意思。我这里通过一个实际的案例来说明四分位数的求取过程。首先我们看下数据的情况,如下图所示,数据的总个数为10个1、在求取四分位数据时,首先必须做的是要对数据进行升序排序,如下图。例如:n的值为5、9、13等等,就是可以在数列中直接找到各四分位数。

四分位数是统计学里一个很重要的概念,实际应用中,所画出来的箱图,就使用到了这个概念,只有懂了四分位的概念才能看懂箱图所表达的意思。我这里通过一个实际的案例来说明四分位数的求取过程。

首先我们看下数据的情况,如下图所示,数据的总个数为10个

1、在求取四分位数据时,首先必须做的是要对数据进行升序排序,如下图。

image

2、四分位求取,首先需要得出该四分位数的位置,如下是四分位数在排序后数据中的位置的公式

image

在Excel中使用以上的公式来计算第0、1、2、3、4个四分位值处的位置,得出如下结果

image

3、四分位数的求取,使用的是以下所说明的一套计算规则

image

公式可能看起来较为复杂,说明一下:

1、四分位数最终的结果由2部分相加得到,其一是四分位位置的整数部分对应的数据,其二是四分位位置的小数部分乘以差值得到

2、差值是四分位位置整数部分对应数据的下一个数据减去四分位位置整数部分对应的数据。

在Excel中将上面那个公式实现的结果如下:

image

注意:如果数据的总个数n减去1,得到的结果是4的整数倍的话,那么四分位数的位置都是整数值,各四分位数就可以在升序排序后的数列中直接找到,否则就需要通过以上方式计算小数部分。

例如:n的值为5、9、13等等,就是可以在数列中直接找到各四分位数。

最后我们用一张图来看看箱图中各个图形元素:

1、Q1表示第1个四分位值,Q2表示第2个四分位值,即中位数,Q3表示第3个中位数

2、IQR是第3个中位数与第1个中位数的差值

3、虚线最左侧的划线表示Q1-1.5倍IQR,虚线最右侧的划线表示Q1+1.5倍IQR

4、左右的黑点是离群点,最左侧的离群点是最小值,最右侧离群点是最大值

image

从以上结果可以解答以往对四分位数的误区:

1、四分之一分位数并非中位数的2倍,也并非是四分之三分为的3倍

2、不要将箱图虚线左右侧的划线理解为四分之0分位,四分之四分位值,这2个分位值分别是最小值和最大值,它们可能会成为离群点

免责声明:文章转载自《四分位数》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇iOS开发之关闭暗黑模式SQLServer之视图篇下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

统计学基础知识(一)---描述统计(Descriptive Statistics)

描述统计(Descriptive Statistics):将数据的信息以表格,图形或数值的形式进行汇总。 数据类型:分为定量数据(数值型数据)和定性数据(类别型数据)。数值型数据又可以分为连续型和离散型,类别型数据又可以分为有序型和无序型。 定性数据: 频数(frequency):数据出现的次数。 相对频数(relative frequency):数据出现...

分位函数(四分位数)概念与pandas中的quantile函数

p分位函数(四分位数)概念与pandas中的quantile函数 函数原型 DataFrame.quantile(q=0.5, axis=0, numeric_only=True, interpolation=’linear’) 参数 - q : float or array-like, default 0.5 (50% quantile 即中位数-第2...

Excel-箱线图(数据分布)分析

http://blog.csdn.net/zhanghongju/article/details/18446131 本文摘自作者《网站数据分析:数据驱动的网站管理、优化和运营 》:http://item.jd.com/11295690.html箱线图(Boxplot)也称箱须图(Box-whisker Plot),它是用一组数据中的最小值、第一四分位数、中...

各种图示的介绍及绘制(boxplot、stem)

1. 箱线图(boxplot) 也叫作箱形图; 一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。 主要包含六个数据节点,将一组数据从大到小排列,分别计算出它的: 上边缘, 上四分位数Q3, 中位数, 下四分位数Q1, 下边缘, 还有一个异常值。 2. stem:茎叶图(刻画序列) clear,...

常用数据清洗方法大盘点

本文来自网易云社区 数据清洗是将重复、多余的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或者删除,最后整理成为我们可以进一步加工、使用的数据。 所谓的数据清洗,也就是ETL处理,包含抽取Extract、转换Transform、加载load这三大法宝。在大数据挖掘过程中,面对的至少是G级别的数据量,包括用户基本数据、行为数据、交易数据、资金流数据以...