深度学习之Batch归一化

摘要:
我们对每一层的激活值进行了归一化,使得大部分数据都从梯度趋于零的区域转换到中间梯度较大的区域,但如何求解这些参数增加了任务。连续迭代γ、β的倒数的成本函数。同一水平上不同维度的量表通常需要不同的学习率。通常,需要最小的学习率来确保损失函数的有效下降。然后我们可以直接使用更高的学习率进行优化。如果初始化权重已经在数据中。

前言

           以下内容是个人学习之后的感悟,转载请注明出处~

Batch归一化

  在神经网络中,我们常常会遇到梯度消失的情况,比如下图中的sigmod激活函数,当离零点很远时,梯度基本为0。为了

解决这个问题,我们可以采用Batch归一化。

                                                 深度学习之Batch归一化第1张

  通过BN法,我们将每层的激活值都进行归一化,将它们拉到均值为0、方差为1的区域,这样大部分数据都从梯度趋于0变

换到中间梯度较大的区域,如上图中红线所示,从而解决梯度消失的问题。但是做完归一化后,函数近似于一个线性函数,多

层网络相当于一层,这不是我们想要的效果,故又加入了两个参数γ、β,整体步骤如下所示:

                                                              深度学习之Batch归一化第2张

  参数的加入固然可以解决问题,但是如何求解参数又增加了任务量。求法很简单,和求Wx+b中的W、b参数一样,不断

迭代减去代价函数对于Υ、β的倒数。

此算法的优势:

(1) 可以使用更高的学习率。如果每层的scale不一致,实际上每层需要的学习率是不一样的,同一层不同维度的scale往往也需

要不同大小的学习率,通常需要使用最小的那个学习率才能保证损失函数有效下降,Batch Normalization将每层、每维的scale

保持一致,那么我们就可以直接使用较高的学习率进行优化。

(2) 移除或使用较低的dropout。 dropout是常用的防止overfitting的方法,而导致overfit的位置往往在数据边界处,如果初始化权重

就已经落在数据内部,overfit现象就可以得到一定的缓解。论文中最后的模型分别使用10%、5%和0%的dropout训练模型,与之前

的40%-50%相比,可以大大提高训练速度。

(3) 降低L2权重衰减系数。 还是一样的问题,边界处的局部最优往往有几维的权重(斜率)较大,使用L2衰减可以缓解这一问题,

现在用了Batch Normalization,就可以把这个值降低了,论文中降低为原来的5倍。

(4) 取消Local Response Normalization层。 由于使用了一种Normalization,再使用LRN就显得没那么必要了。而且LRN实际上

也没那么work。

(5) 减少图像扭曲的使用。 由于现在训练epoch数降低,所以要对输入数据少做一些扭曲,让神经网络多看看真实的数据。

 

  

以上是全部内容,如果有什么地方不对,请在下面留言,谢谢~

免责声明:文章转载自《深度学习之Batch归一化》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Java安装方法延时模糊查询下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

LRU缓存及其实现

缓存是我们日常开发中来提高性能最直接的方式,经常会听到有人说:性能不行?是因为你没加缓存!常见的缓存有外部缓存服务以及程序内部缓存,外部缓存服务包括:Redis、Memcached等,内部缓存就是我们可以在程序内使用类似HashMap这种方式来建立缓存,另外比如Web中常见的cdn静态资源缓存等也属于缓存,以及我们计算机中的CPU缓存,文件系统缓存等都不约...

postgresql批量备份和恢复数据表

备份数据库:pg_dump -h localhost -U root demo02 > /home/arno/dumps/demo02.bak恢复数据库:psql -h localhost -U root -d demo <  demo.bak备份表:pg_dump -h localhost -U root demo02 -t books &g...

ODOO 新API修饰符

Odoo8中,API接口分为traditaional style和record style两种类型: traditional style指的就是我们在7.0中使用的类型,def(self,cr,uid,ids,context)式的语法. record style 8.0及以后版本精简化参数后的风格,只保留了self和args,形如def(self,args...

Delphi7快捷键

转自:http://blog.csdn.net/weide001/article/details/4100481 Ctrl+PageUp 将光标移至本屏的第一行,屏幕不滚动。   Ctrl+PageDown 将光标移至本屏的最后一行,屏幕不滚动。   Ctrl+↓ 向下滚动屏幕,光标跟随滚动不出本屏。   Ctrl+↑ 向上滚动屏幕,光标跟随滚动不出本...

【Python与机器学习】:利用Keras进行多类分类

多类分类问题本质上可以分解为多个二分类问题,而解决二分类问题的方法有很多。这里我们利用Keras机器学习框架中的ANN(artificial neural network)来解决多分类问题。这里我们采用的例子是著名的UCI Machine Learning Repository中的鸢尾花数据集(iris flower dataset)。 1. 编码输出便签...

CA 证书

1.ubuntu curl 命令报错(CA) kamil@vm-ubuntu:~$ curl https://szxyzs.vanke.com/DataCenter/datacenter/api curl: (60) SSL certificate problem: unable to get local issuer certificate More d...