李宏毅深度学习笔记04---RNN 循环神经网络01

摘要:
当然,RNN的结构可以是深层的。

1.RNN导出案例---Neural network needs memory

李宏毅深度学习笔记04---RNN 循环神经网络01第1张

加入记忆元素的案例:

李宏毅深度学习笔记04---RNN 循环神经网络01第2张

2.RNN的结构

李宏毅深度学习笔记04---RNN 循环神经网络01第3张

当神经网络有了记忆后,由于存储在memory中的值不同,模型的输出也会不同。

李宏毅深度学习笔记04---RNN 循环神经网络01第4张

当然,RNN的结构可以是深层的。

李宏毅深度学习笔记04---RNN 循环神经网络01第5张

3.Bidirectional RNN 双向的循环神经网络

李宏毅深度学习笔记04---RNN 循环神经网络01第6张

双向RNN的优点:例如填写完形填空时,读了这个句子中挖空前的所有词汇(X1,X2,...Xt-1),也读了挖空后的所有词汇(Xt+1,...Xtn),可以理解为读了整个句子,再去做填空

4.Long Short-term Memory(LSTM)长短时记忆网络

李宏毅深度学习笔记04---RNN 循环神经网络01第7张

LSTM执行的具体过程图如下所示:

sigmoid 函数及其图像:

李宏毅深度学习笔记04---RNN 循环神经网络01第8张

下图中,f(zi) 是一个激活函数,通常使用sigmoid函数,取值在0-1之间

g(z)*f(zi) :若f(zi)=0 ,则不输入z,若f(zi)=1,则输入z

李宏毅深度学习笔记04---RNN 循环神经网络01第9张

计算案例分析:

下图中输入第1组(x1,x2,x3)=(3,1,0)

李宏毅深度学习笔记04---RNN 循环神经网络01第10张

下图输入第2组(x1,x2,x3)=(4,1,0)

李宏毅深度学习笔记04---RNN 循环神经网络01第11张

下图输入第3组(x1,x2,x3)=(2,0,0)

李宏毅深度学习笔记04---RNN 循环神经网络01第12张

下图输入第4组(x1,x2,x3)=(1,0,1)

李宏毅深度学习笔记04---RNN 循环神经网络01第13张

下图输入第5组(x1,x2,x3)=(3,-1,0)

此时遗忘门的f(zf)=0,则遗忘门中原来存储的值7会被清洗掉

李宏毅深度学习笔记04---RNN 循环神经网络01第14张

李宏毅深度学习笔记04---RNN 循环神经网络01第15张

总结:其实可以将一个LSTM看成一个神经元neural

李宏毅深度学习笔记04---RNN 循环神经网络01第16张

另一种解释:

下图是对上面计算过程的逻辑归纳图

下图中zf,zi,z,zo均是向量

李宏毅深度学习笔记04---RNN 循环神经网络01第17张表示乘法,李宏毅深度学习笔记04---RNN 循环神经网络01第18张表示加法

李宏毅深度学习笔记04---RNN 循环神经网络01第19张

LSTM结构的连接图:

李宏毅深度学习笔记04---RNN 循环神经网络01第20张

现在说利用RNN,一般都在使用LSTM.

现在集成的开发框架都支持LSTM、GRU等网络结构。

李宏毅深度学习笔记04---RNN 循环神经网络01第21张

免责声明:文章转载自《李宏毅深度学习笔记04---RNN 循环神经网络01》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇[SoapUI] Java转换各种日期格式setsockopt()使用方法(參数具体说明)下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

零基础入门深度学习(5)

无论即将到来的是大数据时代还是人工智能时代,亦或是传统行业使用人工智能在云上处理大数据的时代,作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的技术,会不会感觉马上就out了?现在救命稻草来了,《零基础入门深度学习》系列文章旨在讲帮助爱编程的你从零基础达到入门级水平。零基础意味着你不需要太多的数学知识,只要会写程序就行了,...

CNN网络的基本介绍(三)

七、全连接层 全连接层在整个网络卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的特征表示映射到样本的标记空间的作用。   一段来自知乎的通俗理解:   从卷积网络谈起,卷积网络在形式上有一点点像咱们正在召开的“人民代表大会”。卷积核的个数相当于候选人,图像中不同的特征会激活不...

教你用神经网络求解高级数学方程!

  教你用神经网络求解高级数学方程!   本文介绍了一种利用深度学习中的神经机器翻译(NMT)技术求解方程问题的方法和系统,该系统展示了深度学习应用在更广泛领域的潜力。   Facebook AI建立了第一个可以使用符号推理解决高级数学方程的AI系统。通过开发一种将复杂数学表达式表示为一种语言的新方法,然后将解决方案视为序列到序列的神经网络的翻译问题,我们...

吴恩达《卷积神经网络》课程笔记(1)-- 卷积神经网络基础

1. Computer Vision计算机视觉是深度学习应用的主要方向之一。一般的CV问题包括以下三类: Image Classification图像分类,Object detection目标检测,Neural Style Transfer图片风格迁移 下图展示了一个Neural Style Transfer的例子:   使用传统神经网络处理计算机视觉的一...

《【GraphTER】通过逐点变换实现无监督图神经网络共变特征学习》

【GraphTER】通过逐点变换实现无监督图神经网络共变特征学习 齐国君 MAPLE(maple-lab.net)实验室 已关注 王晋东不在家 等21 人赞同了该文章 GraphTER: Unsupervised Learning of Graph Transformation Equivariant Representations...

Recurrent Neural Network系列2--利用Python,Theano实现RNN

作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明。谢谢! 本文翻译自 RECURRENT NEURAL NETWORKS TUTORIAL, PART 2 – IMPLEMENTING A RNN WITH PYTHON, NUMPY AND THEANO 。 github地址 在...