什么是无偏估计?

摘要:
由于双方之间的沟通将在很长一段时间内多次发生,因此可以采用无偏估计,以达到总体上互不损失的效果。另一个是估计误差不能相互补偿,所以“平均”不能。如果估计器的数学期望值等于估计参数,则称为无偏估计。是的,可以将总体大小设置为3,将样本大小设置为2。总体方差的无偏估计是样本方差,样本方差除以n-1,而不是n。
无偏估计

所谓总体参数估计量的无偏性指的是基于不同的样本,使用该估计量可算出多个估计值,但它们的平均值等于被估参数的真值。

在某些场合下,无偏性的要求是有实际意义的。例如,假设在某厂商与某销售商之间存在长期的供货关系,则在对产品出厂质量检验方法的选择上,采用随机抽样的方法来估计次品率就很公平。这是因为从长期来看,这种估计方法是无偏的。比如这一次所估计出来的次品率实际上偏高,厂商吃亏了;但下一次的估计很可能偏低,厂商的损失就可以补回来。由于双方的交往会长期多次发生这时采用无偏估计,总的来说可以达到互不吃亏的效果。

不过,在某些场合中,无偏性的要求毫无实际意义。这里又有两种情况:一种情况是在某些场合中不可能发生多次抽样。例如,假设在某厂商和某销售商之间只会发生一次买卖交易,此后不可能再发生第二次商业往来。这时双方谁也吃亏不起,这里就没有什么“平均”可言。另一种情况则是估计误差不可能相互补偿,因此“平均”不得。例如,假设需要通过试验对一个批量的某种型号导弹的系统误差做出估计。这个时候,既使我们的估计的确做到了无偏,但如果这一批导弹的系统误差实际上要么偏左,要么偏右,结果只能是大部分导弹都不能命中目标,不可能存在“偏左”与“偏右”相互抵消,从而“平均命中”的概念。

由此可见,具有无偏性的估计量不一定就是我们“最需要”的“恰当”估计量

在概率论和数量统计中,学习过无偏估计,最近在学习论文时候,也经常论文中提到无偏估计。虽然对无偏估计有所了解,但是还是有些问题:

1)总体期望的无偏估计量是样本均值x-,总体方差的无偏估计是样本方差S^2,为什么样本方差需要除以n-1,而不是除以n;

2)样本在总体中是怎样的抽样过程,是放回抽样,是随机抽样,还是不放回抽样等等。

为了解决这个问题,首先来回忆一下什么叫无偏估计:

无偏估计是参数的样本估计值的期望值等于参数的真实值。估计量的数学期望等于被估计参数,则称此为无偏估计。 设A'=g(X1,X2,...,Xn)是未知参数A的一个点估计量,若A'满足 E(A')= A 则称A'为A的无偏估计量,否则为有偏估计量。 注:无偏估计就是系统误差为零的估计。

由于公式A'=g(X1,X2,...,Xn)中的X1,X2,...,Xn一般为一次抽样的结果,没有明确是怎么抽样的一个过程,所以导致不好理解为什么A'就是A的无偏估计量,特别是很难举出实例来给与证明。经过自己的查阅资料和理解,实际上无偏估计量可以理解如下:

简单的理解,无偏估计量就是:在样本中进行n次随机的抽样,每次抽样都可以计算出一个对某一个参数的点估计量,计算n次,得到n个点估计量,然后对n个点估计量计算期望,得到的值和需要估计的总体参数相等,则称n中的任何点估计量为总体参数的无偏估计量。

能否举出一个例子呢?因为实际的应用中总体是不知道,只有样本,这能够举例子吗?是可以的,不妨设总体容量为3,样本容量为2,计算出总体方差的无偏估计为样本方差,而且样本方差是除以n-1,而不是除以n。

举例:

比如我要对某个学校一个年级的上千个学生估计他们的平均水平(真实值,上帝才知道的数字),那么我决定抽样来计算。

我抽出一个10个人的样本,可以计算出一个均值。那么如果我下次重新抽样,抽到的10个人可能就不一样了,那么这个从样本里面计算出来的均值可能就变了,对不对?

因为这个均值是随着我抽样变化的,而我抽出哪10个人来计算这个数字是随机的,那么这个均值也是随机的。但是这个均值也会服从一个规律(一个分布),那就是如果我抽很多次样本,计算出很多个这样的均值,这么多均值们的平均数应该接近上帝才知道的真实平均水平。

如果你能理解“样本均值”其实也是一个随机变量,那么就可以理解为这个随机变量的期望是真实值,所以无偏(这是无偏的定义);而它又是一个随机变量,只是估计而不精确地等于,所以是无偏估计量。

作者:TomHall 链接:https://www.zhihu.com/question/22983179/answer/23470969 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

免责声明:文章转载自《什么是无偏估计?》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇ts中类的属性的封装Scala使用jackson解析JSON下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

《统计学习方法》笔记--蒙特卡洛法

蒙特卡洛法(Monte carlo method),也称为统计模拟方法,通过从概率模型的随机抽样进行近似数值计算的方法。 它要解决的问题是,假设概率分布的定义已知,通过抽样获得概率分布的随机样本,并通过得到的随机样本对概率分布的特征进行分析。故这种方法的核心即是随机抽样。 一般的蒙特卡洛法有直接抽样法、接受-拒绝抽样法、重要性抽样法等。 接受-拒绝抽...

参数估计|无偏性|有效性|一致性|

生物统计学-参数估计 参数估计需要未知参数的估计量和一定置信度 估计方法:用点估计估计一个值;用区间估计估计值的可能区间和是该值的可能性。 对估计值的评价标准: 无偏性是估计量(不一定是样本均值)抽样分布的数学期望等与总体参数的真值。 有效是有时几组数据都是无偏的,但是此时有效数是方差最小的。 一致性是指样本变大,估计越准。 现存方法都是通过这三个评价标准...

超几何分布和二项分布

前言 二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析. 一、概念辨析 超几何分布 一般的,在含有(M)件次品的(N)件产品中,任取(n)件,其中恰有(X)件次品,则事件({X=k})发生的概率为(P(X=k)=cfrac{C_M...