概率质量函数(PMF)、概率密度函数(PDF)和累积概率密度函数(CDF)

摘要:
所有随机变量取值的概率总和是1。比如扔硬币事件,概率分布表:扔硬币事件概率分布表x概率正面0.5反面0.5概率质量函数就是离散随机变量在各个特定取值的概率。把离散型随机变量的概率分布表扩展到无限情况,就是连续型随机变量的概率密度函数。把概率密度函数映射到图像上,就是一条曲线,x轴是随机变量,y是概率,求某一个区间的概率,就是给概率密度函数求该区间的积分。
随机变量

变量是变化的量,随机变量是跟概率相关的变量,取每一个变量都有一定的概率。随机变量的取值是一个集合。比如扔硬币,随机变量的集合就是正面和反面。所有随机变量取值的概率总和是1。

随机变量有离散型随机变量和连续型随机变量。

离散型随机变量

离散型随机变量就是随机变量的集合是有限或无限可列个。

用来描述离散型随机变量的概率分布的是概率分布表,就是把每个取值的概率都列出来。

比如扔硬币事件,概率分布表:

扔硬币事件概率分布表
x概率
正面0.5
反面0.5

概率质量函数(PMF)就是离散随机变量在各个特定取值的概率。就是对于一个离散概率事件来说,使用这个函数来求它的各个成功事件结果的概率。

连续型随机变量

连续型随机变量就是随机变量的集合是无限不可列个。

把离散型随机变量的概率分布表扩展到无限情况,就是连续型随机变量的概率密度函数

取某一个具体值的概率是0,但落在点上是有概率的,可以想象成一个物体,这个物体是有密度的,在这个物体的不同部分,相对质量都是不一样的,那么密度也是有区别的,但只看一点的话,是没有质量的。

比如说在区间[0,1]上,要取一个实数,在这个区间上,有无数多个实数,具体到一个实数上,取该实数的概率是0,但要比较取到小于0.1和大于0.1的数的概率,那肯定是取到大于0.1的数的概率要大的。

把概率密度函数映射到图像上,就是一条曲线,x轴是随机变量,y是概率,求某一个区间的概率,就是给概率密度函数求该区间的积分。

累积概率密度函数就是给概率密度函数求积分,区间上某一点的累积概率密度函数就是从最小值到该点的区间上给概率密度函数求积分。

免责声明:文章转载自《概率质量函数(PMF)、概率密度函数(PDF)和累积概率密度函数(CDF)》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇机器学习 -- 统计与分布从零开始配置TypeScript + React + React-Router + Redux + Webpack开发环境下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

机器学习 —— 概率图模型(推理:MAP)

  MAP 是最大后验概率的缩写。后验概率指的是当有一定观测结果的情况下,对其他随机变量进行推理。假设随机变量的集合为X ,观察到的变量为 e, W = X-e , AP = P(W|e). 后验概率和联合概率是不同的两个概念。事实上,后验概率更接近推理本身的“意义”,并且被越来越多的用于诊断系统中。在医疗诊断系统中,存在包括病症,症状等许多随机变量,使用...

协方差矩阵

在做数字图像处理的时候,特别是PCA降维的时候,很多情况下要遇到协方差矩阵,其实一直糊里糊涂的不知道到底是个什么东西, 以下是我收集的网上资料做的整理和自己的一些理解。 统计学的基本概念 学过概率统计的孩子都知道,统计里最基本的概念就是样本的均值,方差,或者再加个标准差。首先我们给你一个含有n个样本的集合,依次给出这些概念的公式描述,这些高中学过数学的孩子...

图像分割之mean shift

阅读目的:理解quick shift,同时理解mean shift原理,mean shift用于图像聚类,优点是不需要指定聚类中心个数,缺点是计算量太大(原因)。 mean shift主要用来寻找符合一些数据样本的模型,证明样本符合某一概率密度函数(PDF),是一种非参数迭代算法能够寻找模型和聚类。 数据经过非参数密度估计能够得到符合数据分布的概率密度函...

高斯分布(Gaussian Distribution)的概率密度函数(probability density function)

高斯分布(Gaussian Distribution)的概率密度函数(probability density function) 对应于numpy中: numpy.random.normal(loc=0.0, scale=1.0, size=None) 参数的意义为: loc:float 此概率分布的均值(对应着整个分布的中心centre) scale...

超几何分布和二项分布

前言 二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析. 一、概念辨析 超几何分布 一般的,在含有(M)件次品的(N)件产品中,任取(n)件,其中恰有(X)件次品,则事件({X=k})发生的概率为(P(X=k)=cfrac{C_M...

Kendall Rank(肯德尔等级)相关系数

1、简介在统计学中,肯德尔相关系数是以Maurice Kendall命名的,并经常用希腊字母τ(tau)表示其值。肯德尔相关系数是一个用来测量两个随机变量相关性的统计值。一个肯德尔检验是一个无参数假设检验,它使用计算而得的相关系数去检验两个随机变量的统计依赖性。肯德尔相关系数的取值范围在-1到1之间,当τ为1时,表示两个随机变量拥有一致的等级相关性;当τ为...