损失函数,损失函数的作用是

损失函数

摘要：

机器学习中的损失函数（侧重于比较：hingelossvssoftmaxloss）1.损失函数损失函数用于测量模型的预测值f（x）f（x）与实际值YY之间的不一致性。它是一个非负实值函数，通常用L（Y，f（x））L（Y）表示。损失函数越小，模型的鲁棒性越好。损失函数是经验风险函数的核心，也是结构风险函数的重要组成部分。模型的风险结构包括风险

机器学习中的损失函数（着重比较：hinge loss vs softmax loss）

1. 损失函数

损失函数（Loss function）是用来估量你模型的预测值 $f (x)$

θ^{*} = \arg min_{θ} \frac{1}{N} \sum_{i = 1}^{N} L (y_{i}, f (x_{i}; θ)) + λ Φ (θ)

其中，前面的均值函数表示的是经验风险函数，

L

2. 常用损失函数

常见的损失误差有五种：
1. 铰链损失（Hinge Loss）：主要用于支持向量机（SVM）中；
2. 互熵损失（Cross Entropy Loss，Softmax Loss ）：用于Logistic 回归与Softmax 分类中；
3. 平方损失（Square Loss）：主要是最小二乘法（OLS）中；
4. 指数损失（Exponential Loss）：主要用于Adaboost 集成学习算法中；
5. 其他损失（如0-1损失，绝对值损失）

2.1 Hinge loss

Hinge loss 的叫法来源于其损失函数的图形，为一个折线，通用的函数表达式为：

L (m_{i}) = m a x (0, 1 - m_{i} (w))

L

Hinge Loss

在机器学习中，Hing 可以用来解间距最大化的问题，最有代表性的就是SVM 问题，最初的SVM 优化函数如下：

\underset{w, ζ}{a r g m i n} \frac{1}{2} | | w | |^{2} + C \sum_{i} ζ_{i} s t . \forall y_{i} w^{T} x_{i} \geq 1 - ζ_{i} ζ_{i} \geq 0

L

ζ_{i} \geq 1 - y_{i} w^{T} x_{i}

L

\begin{aligned} J (w) & = \frac{1}{2} | | w | |^{2} + C \sum_{i} m a x (0, 1 - y_{i} w^{T} x_{i}) \\ = \frac{1}{2} | | w | |^{2} + C \sum_{i} m a x (0, 1 - m_{i} (w)) \\ = \frac{1}{2} | | w | |^{2} + C \sum_{i} L_{H i n g e} (m_{i}) \end{aligned}

L

2.2 Softmax Loss

有些人可能觉得逻辑回归的损失函数就是平方损失，其实并不是。平方损失函数可以通过线性回归在假设样本是高斯分布的条件下推导得到，而逻辑回归得到的并不是平方损失。在逻辑回归的推导中，它假设样本服从伯努利分布（0-1分布），然后求得满足该分布的似然函数，接着取对数求极值等等。而逻辑回归并没有求似然函数的极值，而是把极大化当做是一种思想，进而推导出它的经验风险函数为：最小化负的似然函数（即 $max F (y, f (x)) \to min - F (y, f (x)))$

log损失函数的标准形式：

L (Y, P (Y | X)) = - \log P (Y | X)

L

逻辑回归的 $P (Y = y | x)$

Logistic

其中

h_{θ} (x) = \frac{1}{1 + \exp (- f (x))}

2.3 Squared Loss

最小二乘法是线性回归的一种，OLS将问题转化成了一个凸优化问题。在线性回归中，它假设样本和噪声都服从高斯分布（中心极限定理），最后通过极大似然估计（MLE）可以推导出最小二乘式子。最小二乘的基本原则是：最优拟合直线应该是使各点到回归直线的距离和最小的直线，即平方和最小。

平方损失（Square loss）的标准形式如下：

L (Y, f (X)) = (Y - f (X))^{2}

当样本个数为 $n$

L (Y, f (X)) = \sum_{i = 1}^{n} (Y - f (X))^{2}

L

在实际应用中，我们使用均方差（MSE）作为一项衡量指标，公式如下：

M S E = \frac{1}{n} \sum_{i = 1}^{n} (\tilde{Y_{i}} - Y_{i})^{2}

2.4 Exponentially Loss

损失函数的标准形式是：

L (Y, f (X)) = \exp [- Y f (X)]

L

f_{m} (x) = f_{m - 1} (x) + α_{m} G_{m} (x)

L

\arg min_{α, G} = \sum_{i = 1}^{N} \exp [- y_{i} (f_{m - 1} (x_{i}) + α G (x_{i}))]

L

L (Y, f (X)) = \frac{1}{2} \sum_{i = 1}^{n} \exp [- y_{i} f (x_{I})]

L

2.5 其他损失

0-1 损失函数

L (Y, f (X)) = {\begin{aligned} 0 & i f Y \neq f (X) \\ 1 & i f Y = f (X) \end{aligned}

L

L (Y, f (X)) = | Y - f (X) |

上述几种损失函数比较的可视化图像如下：

损失函数可视化

3. Hinge loss 与 Softmax loss

SVM和Softmax分类器是最常用的两个分类器。

SVM将输出 $f (x_{i}, W)$
与SVM 不同，Softmax 分类器可以理解为逻辑回归分类器面对多个分类的一般话归纳，其输出(归一化的分类概率)更加直观,且可以从概率上解释。

在Softmax分类器中, 函数映射 $f (x_{i}, W)$

L_{i} = - \log (\frac{e^{f_{y_{i}}}}{\sum_{j} e^{f_{j}}})

L

L_{i} = - f_{y_{i}} + \log \sum_{j} f_{j}

$f_{j}$

概率论解释:

P (y_{i} | x_{i}, W) = \frac{e^{f_{y_{i}}}}{\sum_{j} e^{f_{j}}}

解释为给定数据 $x_{i}$

实际操作注意事项——数值稳定: 编程实现softmax函数计算的时候,中间项 $e^{f_{y_{i}}}$

P (y_{i} | x_{i}, W) = \frac{C e^{f_{y_{i}}}}{C \sum_{j} e^{f_{j}}} = \frac{e^{f_{y_{i}} + \log C}}{\sum_{j} e^{f_{j} + \log C}}

C的值可自由选择,不会影响计算结果,通过这个技巧可以提高计算中的数值稳定性.通常将C设为:

\log C = - max f_{j}

该技巧就是将向量f中的数值进行平移,使得最大值为0。

准确地说，SVM分类器使用的是铰链损失（hinge loss），有时候又被称为最大边界损失（max-margin loss）。Softmax分类器使用的是交叉熵损失（corss-entropy loss）。Softmax分类器的命名是从softmax函数那里得来的，softmax函数将原始分类评分变成正的归一化数值，所有数值和为1，这样处理后交叉熵损失才能应用。

Example：图像识别

example

针对给出的图像，SVM分类器可能给你的是一个 $[- 2.85, 0.86, 0.28]$

这里Hinge Loss计算公式为：

L_{i} = \sum_{j \neq y_{i}} max (0, f (x_{i}, W)_{j} - f (x_{i}, W))_{y_{i}} +

L

设 $x_{i}$

L_{i} = max (0, - 2.85 - 0.28 + 1) + max (0, 0.86 - 0.28 + 1) = 1.58

L

delta

而Softmax 损失则是对向量 $f_{y_{i}}$

L_{i} = - \log (\frac{e^{f_{y_{i}}}}{\sum_{j} e^{f_{j}}}) = - \log (0.353) \approx 1.04

4.总结

机器学习作为一种优化方法，学习目标就是找到优化的目标函数——损失函数和正则项的组合；有了目标函数的“正确的打开方式”，才能通过合适的机器学习算法求解优化。

不同机器学习方法的损失函数有差异，合理理解各种损失优化函数的的特点更有利于我们对相关算法的理解。

免责声明：文章转载自《损失函数》仅用于学习参考。如对内容有疑问，请及时联系本站处理。

损失函数

1. 损失函数

2. 常用损失函数

2.1 Hinge loss

2.2 Softmax Loss

2.3 Squared Loss

2.4 Exponentially Loss

2.5 其他损失

3. Hinge loss 与 Softmax loss

4.总结

相关文章

解决Windows Git Bash中文乱码问题

【Golang】Go语言之log的使用

zookeeper 日志输出到指定文件夹

libvlc外部api的简单整理（转载）

（转）MySQL 8 新特性之Clone Plugin

python2.7实现websocket服务器，可以在web实时显示远程服务器日志

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表