深度学习——0 神经网络初探

摘要:
McCulloch和Pitts设计了一个简单的神经元模型,因为它的工作原理是模仿人脑神经元,而神经元模型的工作原理非常简单。近年来,深度学习和神经网络开始进入人们的视野,因为深度学习需要强大的计算能力和足够的数据支持。激活函数的功能是在一定范围内压缩值;同时,权重或偏移量的微小变化会略微影响网络输出,从而可以更好地训练权重和偏移量。)将此值设置为0-1之前的数字。

1.历史渊源

深度学习(deep learning)和神经网络(netural networks)这几年随着“阿尔法狗”以及ImageNet挑战赛的兴起而被炒得火热,然鹅这俩大兄弟已经不是生面孔了,而可以算是“老家伙了”。早在1943年,McCulloch and Pitts就设计了一个简单的神经元模型。之所以叫做神经元模型,是因为它的工作原理是模仿人类的大脑神经元。人类大脑中约有1000亿个神经元,互相之间的连接突触可达100万亿个。神经元有两种形态——兴奋或者抑制,兴奋就会把电信号传递给下一个神经元。通过数以亿计的神经元互相作用,最终使我们人类拥有了高级智慧。而神经元模型工作原理很简单,它也有两种状态——兴奋(标1)跟抑制(标0)。而之所以近几年深度学习跟神经网络开始广泛进入人们的视野是因为深度学习需要强大的计算能力跟足够的数据的支撑,以前由于技术跟数据的限制,所以没能发扬光大,所以科技是第一生产力

                                                  深度学习——0 神经网络初探第1张                深度学习——0 神经网络初探第2张 

2.工作原理

如上图中所示,只有一层一个神经元,多个输入,我们可以通过y=wx+b求和得到一个数值,然后通过激活函数(图上是sigmoid函数;激活函数作用是把数值压缩在一定范围内,同时权重或者偏移的细小改变能够轻微影响到网络输出,这样可以更好的训练权重跟偏移)把该数值转为0-1之前的一个数,我们可以定义大于0.5为兴奋,小于0.5为抑制,这样就模拟了一个神经单元的工作过程。

当然,神经网络是由多个神经单元、多层神经结构构成的(下图是一个简单的前馈 神经网络),根据神经网络定义的不同可以分为卷积神经网络、循环神经网络以及各种变体等等,但是思想是不变的。

深度学习——0 神经网络初探第3张

3.算法核心

深度学习一个强大之处是不用人工调整大量的参数,因为很多参数是模型自己根据大量的数据主动学习的!

主动学习的法宝就是误差逆传播(BackPropagation,简称BP),通过损失函数(Loss Function,用于描述模型输出值与真实值的差异)数值最小的原则,对各层输入向量求偏导,不断更新权重跟偏移的数值,最终求得参数的最优解——即模型输出很接近与真实输出。当然,如何更有效的学习,如何防止过拟合与欠拟合以及局部最优情况的出现也是一个很重要的问题,下次再详细讨论。

深度学习——0 神经网络初探第4张

免责声明:文章转载自《深度学习——0 神经网络初探》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇解决Vue报错:Invalid prop: type check failed for prop "id". Expected Number with value 14, got String with value "14".测试与开发如何有效沟通,QC11(HP ALM 11)的简单使用记录下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

C#设置System.Net.ServicePointManager.DefaultConnectionLimit,突破Http协议的并发连接数限制

在Http协议中,规定了同个Http请求的并发连接数最大为2. 这个数值,可谓是太小了。 而目前的浏览器,已基本不再遵循这个限制,但是Dot Net平台上的 System.Net 还是默认遵循了这个标准的。 从而造成了,在使用HttpWebRequset 或者 WebClient 利用多线程的方式,访问某个网站时,经常出现 连接被异常关闭 的错误,大大降...

Laravel模型事件的实现原理详解

模型事件在 Laravel 的世界中,你对 Eloquent 大多数操作都会或多或少的触发一些模型事件,下面这篇文章主要给大家介绍了关于Laravel模型事件的实现原理,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴。 前言 Laravel的ORM模型在一些特定的情况下,会触发一系列的事件,目前支持的事件有这些:creating, created,...

基于WebGL的三维交通监控可视化技术应用(实践版) ThingJS

三维可视化##3D开发# WebGL, SVG,BIM技术对比 ThingJS整合Echarts数据分析 隧道监控三维可视化5大场景 互联网技术为交通行业的可视化带来了多样性的发展。从传统的二维平面变形图、二维SVG矢量图到如今的SVG三维矢量技术、BIM技术、GIS+BIM技术、 WebGL技术,甚至连AR、VR、MR等虚拟现实技术,也开始应用于交通领域...

强化学习(Reinforcement Learning)中的Q-Learning、DQN,面试看这篇就够了!

1. 什么是强化学习 其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learning, RL)是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报。在很多场景中,当前的行动不仅会影响当前的rewards,还会影响之后的状态和一系列的rewards。RL最重要的3个特定在于: 基本是以一种闭环的形式; 不...

MySQL数据库中几种数据类型的长度

在MySQL里新建表自然会涉及设置字段长度,但有时会发现长度限制在一些字段类型中不起作用?字段长度是按字节算还是字符算? 如图中:int看起来只要还在本身类型取值范围内就行,字段长度没有起到作用;而char确实被限制在了5个字符中,甚至不是字节。 背后玄机在于不同数据类型的规则不同。 1、整数类型 这里的宽度和数据类型的取值是没有关系的,显示宽度只指明M...

TensorFlow利用A3C算法训练智能体玩CartPole游戏

本教程讲解如何使用深度强化学习训练一个可以在 CartPole 游戏中获胜的模型。研究人员使用 tf.keras、OpenAI 训练了一个使用「异步优势动作评价」(Asynchronous Advantage Actor Critic,A3C)算法的智能体,通过 A3C 的实现解决了 CartPole 游戏问题,过程中使用了贪婪执行、模型子类和自定义训练循...