离散型随机变量期望、方差的一些公式与证明

摘要:
声明本文基于人民教育出版社高中数学选修课2-3。本文中的随机变量是离散随机变量。通常,如果随机变量服从参数和的二项式分布,我们可以记住测试中第二次成功的概率是[P(x=k)=C_n^kp^k(1-P)^{n-k}]。如果是这样,则[oxed{E=np}]证明简单证明记录[x_i=egin{case}1&ext{$i$测试的成功}0&ext{$1$测试的失败}end{case}]显然是因为,根据预期的线性性质,然后[egin{aligned}E&=sum_{k=0}^nkP(X=k)&=sum{k=0}^ nkC_{n}^{k}p ^ kq ^{n-k}&=sum_{k=1}^ nkC_{n}p ^kq ^{n-k}&=psum_{k=1}^nnC_{n-1}{k-1}p^{k-1}q ^(n-1)-(k-1)}&=npsum_{k=1}^ nC_{n-1}p ^{k-1 1}q ^{(n-1)-(k-1)}&=npcdot(p+q)^{n-1}qquadex{}&=npend{aligned}]方差[氧化{D=np(1-p)}]简单的证明方法类似于预期方法。

声明

本文基于人教版高中数学选修 2-3,本中随机变量均为离散型随机变量。

本文中 (displaystylesum_x)(displaystylesum_{x in Range(X)})(Range(X)) 表示随机变量 (X) 可能的取值的集合)的简写。

期望

期望的线性性质

[oxed{E(aX+b) = aE(X)+b} ]

课本上就有,证明略。

公式 1

[oxed{E(X+Y)=E(X)+E(Y)} ]

证明

[egin{aligned} E(X+Y) &=sum_{x} sum_{y}(x+y) P(X=x, Y=y) \ &=sum_{x} sum_{y} x P(X=x, Y=y)+sum_{x} sum_{y} y P(X=x, Y=y) \ &=sum_{x} x sum_{y} P(X=x, Y=y)+sum_{y} y sum_{x} P(X=x, Y=y) \ &=sum_{x} x P(X=x)+sum_{y} y P(Y=y) \ &=E(X)+E(Y) end{aligned} ]

公式 2

(X,Y) 相互独立的情况下,有

[oxed{E(XY)=E(X)E(Y)} ]

证明

(X,Y) 相互独立知 (P(X=x,Y=y)=P(X=x)P(Y=y))

所以

[egin{aligned} E(XY) &=sum_{x} sum_{y} xy P(X=x, Y=y) \ &=sum_{x} sum_{y} xy P(X=x)P(Y=y) \ &=sum_{x} x P(X=x)sum_{y} yP(Y=y) \ &=sum_{x} x P(X=x)E(Y) \ &=E(Y)sum_{x} x P(X=x) \ &=E(X)E(Y) end{aligned} ]

方差

定义

[oxed{D(X)=sum_x (x-E(X))^2 P(X=x)} ]

换种写法

[oxed{D(X)=E(x-E(X))^2} ]

再换种写法

[egin{aligned} D(X) &= E[X-E(X)]^2 \ &=E[X^2-2Xcdot E(X)+(E(X))^2] \ &=E(X^2)-2E(X)E(X)+(E(X))^2 \ &=E(X^2)-(E(X))^2 end{aligned} ]

[oxed{D(X)=E(X^2)-(E(X))^2 } ]

公式 1

[oxed{D(aX+b) = a^2D(X)} ]

课本上就有,证明略。

公式 2

(X,Y) 相互独立的情况下,有

[oxed{D(X+Y)=D(X)+D(Y)} ]

证明

[egin{aligned} D(X+Y) &= E{(X+Y)^2 - (E(X+Y))^2} \ &= E{(X^2+Y^2+2XY) - (E(X)+E(Y))^2} \ &= E(X^2 - E^2(X)) + E(Y^2 - E^2(Y))+ E(2XY) - 2E(X) E(Y) \ &= D(X) + D(Y) + 0 end{aligned} ]

即:(D(X+Y) = D(X) + D(Y))

超几何分布

定义

(N) 个物品中有 (M) 个次品,超几何分布描述了在这 (N) 个样本中选 (n) 个,其中有 (k) 个次品的概率。

[P(X = k) = frac{C_M^k C_{N - M}^{n - k}}{C_N^n} ]

若随机变量 (X) 服从参数为 (n, M, N) 的超几何分布,则记为

[x sim H(n, M, N) ]

期望

(x sim H(n, M, N)),则

[oxed{E(X) = frac{nM}{N}} ]

证明

引理 1

由组合数公式可以得到 (k cdot C_M^k = M cdot C_{M - 1}^{k - 1})

引理 2

由组合数公式可以得到 (C_{N}^n = dfrac Nn cdot C_{N - 1}^{n - 1})

引理 3

由超几何分布概率和为 (1),即 (displaystyle sum_{k=0}^m P(X=k) = sum_{k = 0}^m frac{C_M^k C_{N - M}^{n - k}}{C_N^n} = 1)

可得 (displaystylesum_{k = 0}^m C_M^k C_{N - M}^{n - k} = C_N^n)

推导过程

[egin{aligned} E(x) &= sum_{k = 0}^m k * frac{C_M^k * C_{N - M}^{n - k}}{C_N^n} \ &=frac{1}{C_N^n} sum_{k = 0}^m k C_M^K * C_{N - M}^{n - k}\ &=frac{1}{C_N^n} sum_{k = 1}^m M C_{M - 1}^{k - 1} C_{N - M}^{n - k}\ &=frac{M}{C_N^n} sum_{k = 1}^m C_{M - 1}^{k - 1}C_{N - M}^{n - k}\ &=frac{M}{C_N^n} C_{N - 1}^{n - 1} \ &=frac{nM}{N} end{aligned} ]

方差

[D(x) = {n(frac{M}{N})(1-frac{M}{N})(N-n) over (N-1)} ]

二项分布

定义

二项分布(Binomial distribution)是 (n) 个 独立重复试验中成功的次数的离散概率分布,其中每次试验的成功概率为 (p)。这样的单次成功/失败试验又称为 伯努利试验

实际上,当 (n = 1) 时,二项分布就是两点分布。

一般地,如果随机变量 (X) 服从参数 (n)(p) 的二项分布,我们记 (x sim b(n, p))(X sim B(n, p)). (n) 次试验中正好得到 (k) 次成功的概率为

[P(x = k) = C_n^k p^k (1-p)^{n- k} ]

期望

(Xsim B(n,p)),则

[oxed{E(x) = np} ]

证明

简单的证明

[x_i = egin{cases} 1 & ext{第 $i$ 次试验成功}\ 0 & ext{第 $i$ 次试验不成功} end{cases} ]

显然 (E(x_i)=p)

由于 (X=x_1+x_2+cdots+x_n),根据期望的线性性质,
(E(X) = E(x_1) + E(x_2) + cdots + E(x_n) = np)

复杂的证明

(q = 1-p),那么

[egin{aligned} E(X) &= sum_{k=0}^n k P(X=k)\ &= sum_{k=0}^n k C_{n}^{k}p^kq^{n-k} \ &= sum_{k=1}^n k C_{n}^{k}p^kq^{n-k} \ &= psum_{k=1}^n nC_{n-1}^{k-1}p^{k-1}q^{(n-1)-(k-1)}\ &= npsum_{k=1}^n C_{n-1}^{k-1}p^{k-1}q^{(n-1)-(k-1)} \ &= npcdot (p+q)^{n-1} qquad ext{(二项式定理)}\ &= np end{aligned} ]

方差

[oxed{D(x) = np(1 - p)} ]

证明

简单的方法

类似于期望的那种证明方法。

复杂的方法

[egin{aligned} D(X) &=sum_{k=0}^{n}left[k-E(X) ight]^{2} cdot p_{k}=sum_{k=0}^{n}(k-n p)^{2} cdot mathrm{C}_{n}^{k} p^{k} q^{n-k} \ &=sum_{k=0}^{n} k^{2} cdot mathrm{C}_{n}^{k} p^{k} q^{n-k}+sum_{k=0}^{n}-2 n p k cdot mathrm{C}_{n}^{k} p^{k} q^{n-k}+sum_{k=0}^{n} n^{2} p^{2} cdot mathrm{C}_{n}^{k} p^{k} q^{n-k} \ &=sum_{k=0}^{n}(k-1) cdot k cdot mathrm{C}_{n}^{k} p^{k} q^{n-k}+sum_{k=0}^{n} k cdot mathrm{C}_{n}^{k} p^{k} q^{n-k}-2 n p sum_{k=0}^{n} k cdot mathrm{C}_{n}^{k} p^{k} q^{n-k} \ &+n^{2} p^{2} sum_{k=0}^{n} mathrm{C}_{n}^{k} p^{k} q^{n-k} \ &=sum_{k=1}^{n}(k-1) cdot k cdot mathrm{C}_{n}^{k} p^{k} q^{n-k}+n p-2 n p cdot n p+n^{2} p^{2} \ &=n sum_{k=2}^{n}(k-1) cdot mathrm{C}_{n-1}^{k-1} p^{k} q^{n-k}+n p-n^{2} p^{2} \ &=n(n-1) p^{2} sum_{k=2}^{n} mathrm{C}_{n-2}^{k-2} p^{k-2} q^{(n-2)-(k-2)}+n p-n^{2} p^{2} quad( ext{令} k-2=i) \ &=n(n-1) p^{2} sum_{i=0}^{n-2} mathrm{C}_{n-2}^{i} p^{i} q^{(n-2)-i}+n p-n^{2} p^{2} \ &=n(n-1) p^{2}+n p-n^{2} p^{2} \ &=n p q end{aligned} ]

免责声明:文章转载自《离散型随机变量期望、方差的一些公式与证明》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇【转】SHarpPcap(winpcap基于c#封转的库)网络嗅探程序核心20189222 《网络攻防实践》安全工具、库的简介以及使用教程下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

统计学中抽样比例一般占百分之多少

要具体问题具体分析,一般和要求的误差限、置信区间及总体方差有关系.比如最基本的简单随机抽样,其样本量确定公式就是1/n=1/N+d^2/(u^2*S^2).样本量和误差限成反比,和置信区间及总体方差成正比.请问一堆url怎么算方差。(。。。)...

ML——决策树模型

决策树模型   优点:高效简单、易于理解,可以处理不相关特征。   缺点:容易过拟合,训练集在特征上是完备的   决策树过程:特征选择、划分数据集、构建决策树、决策树剪枝   决策树选择最优的划分特征,将数据集按照最优划分特征的取值划分成不同的子集,然后依次对子集重复上述步骤,指导子集中数据都归属于同一个类别,或者没有特征可以再划分了。   特征选择通常有...

平均值(Mean)、方差(Variance)、标准差(Standard Deviation) 区别

原文链接:https://blog.csdn.net/xidiancoder/article/details/71341345 对于一维数据的分析,最常见的就是计算平均值(Mean)、方差(Variance)和标准差(Standard Deviation)。在做【特征工程】的时候,会出现缺失值,那么经常会用到使用 平均值 或者 中位数等进行填充。 平均值...

牛客网2017校招真题在线编程之合唱团问题——动态规划问题首秀

先贴题目 题目描述 有 n 个学生站成一排,每个学生有一个能力值,牛牛想从这 n 个学生中按照顺序选取 k 名学生,要求相邻两个学生的位置编号的差不超过 d,使得这 k 个学生的能力值的乘积最大,你能返回最大的乘积吗? 输入描述: 每个输入包含 1 个测试用例。每个测试数据的第一行包含一个整数 n (1 <= n <= 50),表示学生的个数...

FLOYD 求最小环

首先 先介绍一下 FLOYD算法的基本思想   设d[i,j,k]是在只允许经过结点1…k的情况下i到j的最短路长度则它有两种情况(想一想,为什么):最短路经过点k,d[i,j,k]=d[i,k,k-1]+d[k,j,k-1]最短路不经过点k,d[i,j,k]=d[i,j,k-1]综合起来: d[i,j,k]=min{d[i,k,k-1]+d[k,j,k-...

概率图模型(PGM):贝叶斯网(Bayesian network)初探

1. 从贝叶斯方法(思想)说起 - 我对世界的看法随世界变化而随时变化 用一句话概括贝叶斯方法创始人Thomas Bayes的观点就是:任何时候,我对世界总有一个主观的先验判断,但是这个判断会随着世界的真实变化而随机修正,我对世界永远保持开放的态度。 1763年,民间科学家Thomas Bayes发表了一篇名为《An essay towards solv...