机器学习（三）——多元线性回归,线性回归多个因变量

机器学习(3)——多变量线性回归

摘要：

多元线性回归是指输入是多维的情况。为了预测给定条件下的房价，我们需要建立相应的线性回归模型。如果有n个变量，对应的多变量线性回归模型如下：注意上图中的x指的是一个训练样本，即每个训练样本都是（n+1）维向量多变量线性线性回归的成本函数。例如：其中x代表第i个样本，下面列出了单变量线性回归的梯度下降法（左）和多变量线性回归（右）的梯度下降方法α是学习率。

【一、多变量线性回归模型】

多变量线性回归是指输入为多维特征的情况。比如：

这里写图片描写叙述
在上图中可看出房子的价格price由四个变量(size、number of bedrooms、number of floors 、age of home)决定。为了能够预測给定条件（四个变量）下的房子的价格（y），我们须要建立对应的线性回归模型。

如果有n个变量，则对应的多变量线性回归模型例如以下：

这里写图片描写叙述

注意上图中的x是指一个训练样本，即每一个训练样本都是一个（n+1）维向量（包括附加的x0=1）

【二、代价函数】

多变量线性回归的代价函数例如以下：
这里写图片描写叙述
当中x(i)代表第i个样本

【三、梯度下降法寻找最佳theta】

这里写图片描写叙述
以下列出单变量线性回归梯度下降法（左）与多变量线性回归梯度下降法（右）

当中α为学习率。

【梯度下降法的两个细节处理】：
1. Feature Normalization

By looking at the values, note that house sizes are about 1000 times the number of bedrooms. When features differ by orders of magnitude, first performing feature scaling can make gradient descent converge much more quickly。

也就是说当特征之间相差非常大时。比如房子的大小与卧室的数量。这样会导致梯度下降收敛比較慢。例如以下图（左边）所看到的，当对特征进行正规后，梯度下降收敛变快，例如以下图（右边）所看到的。

这里写图片描写叙述
正规化方法能够使用mean value and the standard deviation 法。或者其它方法。

2. Selecting learning rates