卡方分布

摘要:
卡方分布通过小数量的样本容量去预估计总体容量的分布情况。卡方检验是统计样本的实际观测值与理论推断值之间的偏离程度,基本思想是根据样本数据推断总体的频次与期望频次是否有显著性差异。如果n个相互独立的随机变量均服从标准正态分布,则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布。卡方分布的概率密度函数为:当x˃0时,$fleft=dfrac{x^{dfrac{k}{2}-1}e^{-dfrac{x}{2}}}{2^{dfrac{k}{2}}Gammaleft}$当$xleq0$时,$fleft=0$k是自由度。
卡方分布

通过小数量的样本容量去预估计总体容量的分布情况。卡方检验是统计样本的实际观测值与理论推断值之间的偏离程度,基本思想是根据样本数据推断总体的频次与期望频次是否有显著性差异。
如果n个相互独立的随机变量均服从标准正态分布,则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布
自由度:假设随机取n个样本,但又要求这n个样本均值固定,那么就有一些样本不能随意的取值,剩下可以随意取值的样本个数就是自由度
卡方分布的概率密度函数为:

当x>0时,$fleft( x|k ight) =dfrac {x^{dfrac {k}{2}-1}e^{-dfrac {x}{2}}}{2^{dfrac {k}{2}}Gamma left( dfrac {k}{2} ight) }$

当$xleq 0$时,$fleft( x|k ight) =0$

k是自由度。


卡方分布相关代码
#导入库
importnumpy as np
importmatplotlib.pyplot as plt
import scipy.stats as stats

PDF

#PDF
plt.figure(figsize=(14,7))

x=np.linspace(0,20,100)
y=stats.chi2.pdf(x,df=4)

plt.plot(x,y,color='b',label='PDF')
plt.fill_between(x,y,color='b',alpha=0.25)

plt.legend()
plt.show()

卡方分布第1张

自由度

#自由度的影响
plt.figure(figsize=(14,7))

x=np.linspace(0,20,100)
y1=stats.chi2.pdf(x,df=1)
y2=stats.chi2.pdf(x,df=3)
y3=stats.chi2.pdf(x,df=6)

plt.plot(x,y1,color='r',label='k=1')
plt.fill_between(x,y1,color='r',alpha=0.25)

plt.plot(x,y2,color='g',label='k=3')
plt.fill_between(x,y2,color='g',alpha=0.25)

plt.plot(x,y3,color='b',label='k=6')
plt.fill_between(x,y3,color='b',alpha=0.25)

plt.legend()
plt.show()

卡方分布第2张

随机样本

np.random.seed(0)
print(stats.chi2.rvs(df=4),end='
')
print(stats.chi2.rvs(df=4,size=10),end='
')

卡方分布第3张

CDF

#CDF
plt.figure(figsize=(14,7))

x=np.linspace(0,20,100)
y=stats.chi2.cdf(x,df=4)

plt.plot(x,y,color='b',label='CDF')

plt.legend()
plt.show()

卡方分布第4张

区间概率

print('
P(X<=3)={}

'.format(stats.chi2.cdf(x=3,df=4)))
print('P(2<X<=8)={}

'.format(stats.chi2.cdf(x=8,df=4)-stats.chi2.cdf(x=2,df=4)))

卡方分布第5张

免责声明:文章转载自《卡方分布》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇单片机中断的IE和IP寄存器(摘抄)Simulink仿真入门到精通(十一) 模块的封装下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

使用matplotlib画出log的图像

以下内容是学习笔记,若有侵权,立即删除! import math import matplotlib.pyplot as plt import numpy as np if __name__ == '__main__': #获得浮点类型numpy数组 x = np.arange(0.05,3,0.05) #获得函数结果 y1...

python的2D绘图库matplotlib

matplotlib的官方文档https://matplotlib.org/api/,以下介绍基本操作。 1、指定画布 画布的像素大小为指定画布的尺寸figsize及每尺寸表达的像素点数dpi的乘积。 plt.figure(figsize=(5,5),dpi=100)#figsize指定画布的大小(单位为英寸),dpi指定每英寸点(像素点)的个数 可参看官...

Matplotlib基础--简单散点图

2.简单散点图 接着上一章讲的,另一种常用的图表类型是简单散点图,它是折线图的近亲。不像折线图,图中的点连接起来组成连线,散点图中的点都是独立分布的点状、圆圈或其他形状。本节开始我们也是首先将需要用到的图表工具和函数导入到 Pycharm 中: import matplotlib.pyplot as plt plt.style.use('seaborn-w...

Python之Numpy:二元函数绘制/三维数据可视化/3D

意义 在机器学习任务中选择计算模型或者学习数学时,可视化有助于研究函数值的变化趋势(观察收敛、分布、几何形状等),带来直观的感受。 源码 # 绘制二元函数 # 参考文献 # + python画二元函数的图像(3D) https://blog.csdn.net/your_answer/article/details/79135076 f...

R语言学习——数据框

> #数据框可以包含不同模式(数值型、字符型、逻辑型等)的数据,是R中最常处理的数据结构。数据框可以通过函数data.frame()创建:mydata<-data.frame(coll,col2,col3,...)> #其中的列向量col1、col2、col3等可以为任何类型(如数值型、字符型或者逻辑型)每一列的名称可由函数names指定...

系统发育树邻接法(NJ)和非加权组平均法(UPGMA)之比较

目录 1.原理的区别 2.实操比较 UPGMA NJ法 保存树文件 更深理解 1.原理的区别 主要区别在于,非加权组平均法(UPGMA)是基于平均链接方法的聚集层次聚类方法,而邻接法(NJ)是基于最小演化准则的迭代聚类法。 UPGMA的假定条件是:在进化过程中,每一世系发生趋异的次数相同,即核苷酸或氨基酸的替换速率是均等且恒定的。 UPG...