全连接层、softmax的loss

摘要:
假设一个5分类问题,然后样本I的标签为y=[0,0,0,1,0],也就是说,样本I的真实标签为4,模型预测的结果概率为p=[0.1,0.15,0.05,0.6,0.1],我们可以看到预测是正确的,那么相应的损失L=-log(0.6),即当样本通过这样的网络参数生成这样的预测p时,其损失为-log(0.6)。

在这里插入图片描述
这张图的等号左边部分就是全连接层做的事,W是全连接层的参数,我们也称为权值X是全连接层的输入,也就是特征
从图上可以看出特征X是N*1的向量,这是怎么得到的呢?这个特征就是由全连接层前面多个卷积层和池化层处理后得到的,假设全连接层前面连接的是一个卷积层,这个卷积层的输出是100个特征(也就是我们常说的feature map的channel为100),每个特征的大小是44,那么在将这些特征输入给全连接层之前会将这些特征flat成**N1的向量(这个时候N就是100* 4* 4=1600)。
解释完X,再来看W,W是全连接层的参数,是个TN的矩阵,这个N和X的N对应,T表示类别数,比如你是7分类,那么T就是7。我们所说的训练一个网络,对于全连接层而言就是寻找最合适的W矩阵。因此全连接层就是执行WX得到一个T1的向量(也就是图中的logits[T*1]),这个向量里面的每个数都没有大小限制的,也就是从负无穷大到正无穷大。
然后如果你是多分类问题,一般会在全连接层后面接一个softmax层**,这个softmax的输入是T1的向量,输出也是T1的向量(也就是图中的prob[T*1],这个向量的每个值表示这个样本属于每个类的概率),只不过输出的向量的每个值的大小范围为0到1。

现在你知道softmax的输出向量是什么意思了,就是概率,该样本属于各个类的概率!

softmax loss

在这里插入图片描述
来举个例子吧。假设一个5分类问题,然后一个样本I的标签y=[0,0,0,1,0],也就是说样本I的真实标签是4,假设模型预测的结果概率(softmax的输出)p=[0.1,0.15,0.05,0.6,0.1],可以看出这个预测是对的,那么对应的损失L=-log(0.6),也就是当这个样本经过这样的网络参数产生这样的预测p时,它的损失是-log(0.6)。那么假设p=[0.15,0.2,0.4,0.1,0.15],这个预测结果就很离谱了,因为真实标签是4,而你觉得这个样本是4的概率只有0.1(远不如其他概率高,如果是在测试阶段,那么模型就会预测该样本属于类别3),对应损失L=-log(0.1)。那么假设p=[0.05,0.15,0.4,0.3,0.1],这个预测结果虽然也错了,但是没有前面那个那么离谱,对应的损失L=-log(0.3)。我们知道log函数在输入小于1的时候是个负数,而且log函数是递增函数,所以-log(0.6) < -log(0.3) < -log(0.1)。简单讲就是你预测错比预测对的损失要大,预测错得离谱比预测错得轻微的损失要大。

转载自:https://blog.csdn.net/u014380165/article/details/77284921

免责声明:文章转载自《全连接层、softmax的loss》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Spring data jpa 之 Query update的坑vb.net的数据类型下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Mysql数据按天分区,定期删除

需求:   1.日志表需要按天分区   2.只保留一个月数据 方案:   1.创建两个事件,一个事件生成未来需要的分区,另一个事件定期检查过期数据(移除分区)   2.创建事件每小时执行一次,删除事件每天执行一次   3.事件开始时需要先创建一个当前所需分区 全量方法:   1.先构造存储过程 create_partition_today :将表转化为分区...

react生命周期

1 // import React from 'react'; 2 // import ReactDOM from 'react-dom'; 3 // import './index.css'; 4 // import App from './App'; 5 // import registerServiceWorker from '....

android: 记录app运行过程中产生的log

有时在解决问题时,经常需要借助logcat才能分析定位问题,这里写了一个小工具,能够记录app运行期间的log, 这样测试人员在反馈bug时,只需要把logcat发给我们就可以了。具体代码如下: import android.content.Context; import android.content.Intent; import android.net...

uni-app 数据缓存(setStorage)

uni-app 数据缓存(setStorage) 1 <template> 2 <view> 3 4 </view> 5 </template> 6 7 <script> 8 var_self; 9 export default{ 10 data() {...

Generator函数

1,概念: Generator函数有多种理解角度。从语法上,首先可以把它理解成,Generator函数一个状态机,封装了多个内部状态。 执行Generator函数会返回一个遍历器对象,也就是说,Generator函数除了状态机,还是一个遍历器对象生成函数。 2,特征: 一是,function关键字与函数名之间有一个星号; 二是,函数体内部使用yield语句...

小程序下载canvas生成图片

save_share_img:function(img){ var that = this; let { result } = that.data; getData.getData( "save_share_img", { id...