Stanford机器学习笔记-1.线性回归,线性回归模型stata

Stanford机器学习笔记-1.线性回归

摘要：

通常，现有可用数据称为数据集或训练集。然后，设置适当的学习速率来更新θ。同样，以房价为例：此时，对应的量（函数）变化如下：θ从2维变为n+1维；因此，假设函数如下图所示：同样，梯度下降法可以用于解决多变量线性回归问题。注意与单变量线性回归相对应的变化和联系。

Content：

1. Linear Regression

1.1 Linear Regression with one variable

1.1.1 Gradient descent algorithm

1.2 Linear Regression with multiple variable

1.2.1 Feature Scaling

1.2.2 Features and polynomial regression

1.2.3 Normal equation

1.2.4 Probalilistic interpretation for cost function

key words: Linear Regression, Gradient Descent, Learning Rate, Feature Scaling, Normal Equation

1. Linear Regression

1.1 Linear Regression with one variable

某个目标量可能由一个或多个变量决定，单变量线性回归就是我们仅考虑一个变量与目标量的关系。例如，我们可以仅考虑房子的面积X与房价y的关系，如下图。

Stanford机器学习笔记-1.线性回归第1张

通常将已有的可利用的数据成为data set or training set。

首先我们定义出线性的hypothesis function h，然后定义出cost function J，为了使得假设函数接近或等于实际值，目标是使得函数J取最小值。

Stanford机器学习笔记-1.线性回归第2张

1.1.1 Gradient descent algorithm (梯度下降法)

梯度下降法可以求解线性回归问题，具体描述如下：

Stanford机器学习笔记-1.线性回归第3张

函数J是一个二元函数，为使得取最小值，分别对求偏导数，得到对应的变化率。然后，设定一个合适的learning rate，对theta进行更新。更新策略如下：

Stanford机器学习笔记-1.线性回归第4张

注意更新要同步，否则前一个theta0会影响后一个theta1更新（通过影响cost function : J）

其中对J函数求偏导数如下：

Stanford机器学习笔记-1.线性回归第5张

带入得：

Stanford机器学习笔记-1.线性回归第6张

迭代次数和learning rate是影响梯度下降法是否成功收敛到最优值的重要因素。

迭代次数：
- 过少可能使得算法还没有收敛就停止，
- 过多导致资源（时间等）的浪费；
learning rate:
- 过小，使得每次迭代时theta的变化量过小，从而算法收敛过慢，换言之需要增加迭代次数使得算法收敛；
- 过大，使得每次迭代时theta的变化量过大，可能在变化（迭代）过程中越过最优（收敛）点。直观地：

Stanford机器学习笔记-1.线性回归第7张

Stanford机器学习笔记-1.线性回归第8张

正常的收敛应大致如下：

Stanford机器学习笔记-1.线性回归第9张

1.2 Linear Regression with multiple variables

在实际生活中，一个量通常受很多变量的影响。同样以房价为例：

Stanford机器学习笔记-1.线性回归第10张

此时相应的量（函数）有如下变化：theta从2维变成了n+1维向量；从而hypothesis function为下图所示（注意定义x0=1的小细节）:

Stanford机器学习笔记-1.线性回归第11张

同样的，可以用梯度下降法来解决多变量线性回归问题。

Stanford机器学习笔记-1.线性回归第12张

注意与单变量线性回归对应的变化和联系。事实上，单变量线性回归是多变量线性回归的特殊情况(n=1)。

Stanford机器学习笔记-1.线性回归第13张

1.2.1 Feature Scaling（数据规范化）

不同的特征量由于单位不同，可能在数值上相差较大，Feature Scaling可以去量纲，减少梯度下降法的迭代次数，提高速度，所以在算法执行前通常需要Feature Scaling。直观上来说，考虑两个特征量，规范化前的椭圆很瘪，可能导致收敛的路径变长，数据规范化后使得椭圆较均匀，缩短收敛路径，如下：

Stanford机器学习笔记-1.线性回归第14张