线性模型的概率分析

摘要:
接下来,我们将给出一系列概率假设,并假设该ε(i)服从一定的概率分布ε(i)~N(0,我们可以通过替换当前回归方程得到(因为该误差值服从正态分布,σ^2)。这意味着这将给出一个x^(i)θ是参数y^(i)的分布。小心θ不能用作条件。误差项彼此独立。现在定义一个θ参数。

抛出问题:为什么前面的线性回归要用最小二乘法?为什么要用这样的指标?

下面我们会给出一系列的概率假设,从而导出最小二乘法是一个很自然的算法:

先设              y^(i) = θTx^(i) + ε(i), 其中ε(i)叫做误差项 error term,这个可以看作是对未建模的效应的捕获,简单的说就是没有考虑到的特征,像预测房子中的这个房子有没有花园,房子的噪音多不多什么的,这些特征我们没有考虑到,但它对预测结果又确实有影响。

又假设这个ε(i)服从某个概率分布   ε(i)~N(0,σ^2),——即它服从正态分布,均值为0,方差为σ^2

于是根据正正态分布的概率密度函数就有:                                                                                                         技术分享    

将现行回归方程代入我们可以得到(因为这个误差值是服从正态分布的,所以房屋的价格也服从正态分布,所以它的概率密度函数也是):

线性模型的概率分析第2张

也即:

y(i) | x(i);θ ∼N(θTx^(i),σ^2)

这个表示这是给一个x^(i)以θ为参数的y^(i)的分布。注意θ不能当作条件,因为它不是个随机变量,它是个参数。

又假设这个error terms ,误差项之间是彼此独立的

现在定义一个θ参数的函数,似然函数L(θ) (likehood function)

L(θ) = L(θ;X,~y) = p(~y|X;θ),因为那个误差项的独立分布,我们可以把它写成:

技术分享    即高斯密度函数的乘积

L(θ)似然性和概率其实差不多,只是L(θ)强调是个关于θ的函数,所以要注意这个语句的正确,是参数的似然性和数据的概率。

接下来就是选择θ的问题了,现在我们要做的是maximize  L(θ),即选择θ使数据出现的可能性尽可能大

为了数学上的便利,现在又定义   ℓ(θ):

技术分享

此时,要maxmize 这个L(θ)也就是要minimizing这个技术分享最小,看着玩意是不是很眼熟!!这就是我们之前的线性回归函数J(θ)!

其实讲了这么多就是为了证明之前的那个普通最小二乘法的目的实际上是假设误差项满足高斯分布且独立分布的情况下。

免责声明:文章转载自《线性模型的概率分析》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇【SQL】日期型函数oracle 表空间不足解决办法下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

深度之眼PyTorch训练营第二期 ---6、nn.Module与网络模型构建

一、网络模型创建步骤 数据->模型->损失函数->优化器 1、模型创建 (1)构建子模块->卷积层,池化层,激活函数层 (2)拼接子模块->LeNet,AlexNet,ResNet等 2、权值初始化->Xavier,Kaiming,均匀分布,正态分布 二、nn.Module属性 torch.nn  nn.Parame...

3D局部光照模型 (转)

对于光照模型,从算法理论基础而言,可分为两类,一类是基于物理理论的光照模型,另一种是基于经验的模型。从使用角度而言,可分为全局光照模型和局部光照模型,本文简单地介绍了几种最基础的经典局部光照模型. 1、 局部光照模型之Lambert Lambert光照模型是一个非常简单的模型,早在200多年前,一个叫Lambert的家伙提出,当光照射到粗糙的表面时,它将...

线程中CreateEvent和SetEvent及WaitForSingleObject的用法

线程中CreateEvent和SetEvent及WaitForSingleObject的用法 首先介绍CreateEvent是创建windows事件的意思,作用主要用在判断线程退出,程锁定方面. CreateEvent 函功能描述:创建或打开一个命名的或无名的事件对象. EVENT有两种状态:发信号,不发信号。 SetEvent/ResetEvent分别将...

关于QSocket的释放的一个需要注意的情况(必须先断开连接)

最近在用QtNetwork编写服务器程序进行TCP/IP通信,大体过程如下: 1. 创建一个QTcpServer实例,监听目标IP和端口; 2. 一旦监听到有连接,获取和客户端之间的socket; 3. 使用socket进行通信; 4. 通信结束后,可以手动释放socket,也可以不管它,在释放QTcpServer的时候会把其下的所有socket全部自动释...

mysql 总结二(自定义函数)

本质:mysql内置函数的一种扩展,本质上与mysql内置函数一样。 函数必要条件:     @1:参数(非必备);     @2:返回值; 模板:   create  function  function_name   returns     {string|integer|real|decimal}   routine_body(函数体) 关于函数体:...

【DSP教程】第36章 FIR滤波器的Matlab设计(含低通,高通,带通和带阻)

完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547 第36章       FIR滤波器的Matlab设计(含低通,高通,带通和带阻) 本章节讲解FIR滤波器的Matlab设计。主要是函数fir1和fir2的使用。 36.1 窗函数 36.2 fir1函数 36.2 fir...