人工智能与智能家居

摘要:
1.家庭AI系统的任务是将AI技术应用于智能家居。有必要构建一个承载AI算法的家庭AI系统。这种任务要求系统通过分析用户的使用数据,根据用户的习惯自动控制家庭的内部设备或调整家庭的环境状态。这种任务要求系统分析家庭数据,推断家庭事件,并自动评估和匹配相关的外部家庭服务。监督和控制是指智能家居系统自动完成操作。监控可分为设置条件控制和自动学习控制。

1.家庭AI系统的任务

在智能家居中应用人工智能技术,需要构建承载人工智能算法的家庭AI系统。家庭AI系统用以实现两类家庭任务:

(1)家庭设备的控制任务。

这类任务需要系统通过分析用户使用数据,按照用户习惯自动控制家庭内部设备、或调整家庭内环境状态。例如Nest温控器,按照用户习惯控制房间温度,并且兼顾节能。

(2)家庭状态的监测任务。

这类任务需要系统通过分析家庭数据、推理家庭事件,并自动做出评估、匹配相关的家庭外部服务。例如分析空巢老人的健康数据,判断老人的健康状态等。

家庭AI系统为人们提供更为舒适的家庭环境和良好的城市服务。但是,如何分配人和系统的功能是个有趣的问题。目前,智能家居的控制可以分为:人工控制和监督控制。人工控制是通过人在控制终端上操作完成的,例如在平板上操作空调,通过墙上的触摸开关控制背景音乐的播放等。监督控制是智能家居系统自动完成某项操作,并把该部分告知他的主人。

【例6-1】 某智能家居系统的监督控制。早上定时打开电动窗帘,布防之后有人闯入短信报警等。

监督控制又可分为设定条件控制和自动学习控制。设定条件控制动作的触发是事先设定好的。自动学习控制是控制器利用人工智能技术根据主人的习惯或者喜好,自动学习设备的运行模式,并在适当的条件下自动发出控制指令。

【例6-2】 某智能家居系统的监督控制自动学习控制。知道主人晚上七点准时收看新闻联播,则在主人在的时候准时打开电视。检测到主人每天早上7点起床,这一习惯很规律,如果哪天7点没有起床,则向相关人员发送信息等。

 

那么在智能家居系统设计中,人工控制和监督控制如何分配,即自动化程度需要多高?目前人工智能的伦理正在建立,还没有形成体系,但按照人因工程的理论,分配可参照以下策略:

(3)强制分配。

有些控制必须是人要参与的,例如取消安防设备报警、利用可视对讲为楼下的访客开门等。这些动作的执行必须由使用者发出。另外强制分配还应考虑系统设计者和使用者之间的法律层面的问题。有些操作从法律层面,动作的发出者必须是人,例如自动拨打报警电话等。

(4)价值平衡。

在家庭中有些任务人完成更有优势,有些机器完成更具有优势。那么任务的分配就发挥各自的优势。例如,做饭,当前阶段肯定是人的水平要高于设备,那么就由人来完成;洗衣服,洗衣机的工作大部分能够令人满意,因此由洗衣机来完成。

(5)情感和认知支持分配。

这一条准则意识到了人类的独特需求。情感支持指人们的情感需要,例如,在某些情况下,人们时常能感觉到做家务的乐趣,这也是人们家庭生活的组成。认知支持指人员对信息的需要,以便为行动做好准备或做出可能的决策。例如,在检测到燃气泄漏时,不仅应该立即关闭阀门,而且应该及时告知主人,并由主人检查处理。

以上分配不是绝对的,随着家庭AI系统知识库越来越丰富,实现某些功能的成本和效果比人更好,人工控制则有可能转换为监督控制。

2 相关算法

1)深度学习

深度学习最早由Hinton等人于2006年提出,深度学习的本质就是人工神经网络,指多层神经网络上运用各种机器学习算法解决图像、文本等各种问题的算法集合。深度学习的核心是特征学习,旨在通过分层网络获取分层次的特征信息,从而解决以往需要人工设计特征的重要难题。深度学习是一个框架,包含多个重要算法:

l Convolutional Neural Networks(CNN)卷积神经网络

l AutoEncoder自动编码器

l Sparse Coding稀疏编码

l Restricted Boltzmann Machine(RBM)限制波尔兹曼机

l Deep Belief Networks(DBN)深信度网络

l Recurrent neural Network(RNN)多层反馈循环神经网络

对于不同问题(图像、语音、文本),需要选用不同网络模型才能达到最好效果。此外,最近几年增强学习(Reinforcement Learning)与深度学习的结合也创造了许多了不起的成果,AlphaGo就是其中之一。深度学习从概念提出到现在,也已经有14年了,已经应用于诸多领域。

(1)人脸识别。

图像识别是深度学习领域最受青睐的应用方向,无论是深度学习,还是其他机器学习方法(如VM即向量机),都非常喜欢用图像识别来进行研究。正是因为如此,ImageNet大赛应运而生,ImageNet通过建立强大的图片库,来邀请各大人工智能研究者前来检验其算法的效果,促进了这一领域的蓬勃发展,也导致今天人工智能领域,人脸识别几乎是最为成熟的应用。

(2)语音识别。

从2009年深度学习被引入语音识别领域,短短几年时间内,其在TIMIT数据集上基于传统的混合高斯模型(GMM)的错误率就从21.7%下降到17.9%,引起业界的广泛关注。谷歌的GoogleNow、苹果的Siri、微软的Skype Translator、科大讯飞等都是基于深度学习的算法。语音识别目前发展得很好,在国内有些方言都可以非常精准的识别了,属于成熟应用。

(3)自然语言处理。

自然语言处理(NLP)是通过构建计算算法自动分析、表征人类自然语言的一个学科领域。自然语言处理有五大主要任务,分别是分类、匹配、翻译、结构预测和序贯决策过程。自然语言处理中的大多数问题都可以形式化地归到这五个任务中。在这些任务中,单词、短语、句子、段落甚至文档通常被视为一系列标记(字符串)进行处理,尽管它们的复杂性不尽相同。但是实际上,句子是使用最广泛的处理单元。最近研究表明,深度学习可以提高前四项任务的性能,并成为了解决这些任务的最先进技术。如今,基于NLP的系统已经实现广泛应用,例如Google强大的搜索引擎、亚马逊的语音助手Alexa。此外,NLP还可以帮助机器执行和复杂的自然语言有关的任务,例如机器翻译和对话生成。

2) 智能空间

智能空间(Smart Space)理论用来计算家庭内部用户需求,用以匹配家庭外部服务。智能空间是嵌入了计算、信息设备和多模态的传感装置的工作或生活空间,具有自然便捷的交互接口,以帮助人们方便地获得计算机系统(或智能家居系统)的服务。NIST(美国国家技术标准研究院)给出的智能空间具备的功能和为用户提供的服务包括:

(1)能识别和感知用户以及他们的动作和目的,理解和预测用户在完成任务过程中的需求;

(2)用户能方便地与各种信息源(包括设备和数据)进行交互;

(3)用户携带的移动设备可以无缝地与智能空间的基础设施进行交互;

(4)提供丰富的信息显示;

(5)提供对发生在智能空间中的经历的记录,以便在以后检索回放;

(6)支持空间中多人的协同工作以及与远程用户的沉浸式的协同工作。

智能空间的发展经历了以下几个阶段:

首先,处于计算环境中的计算设备不再像在桌面计算模式下一样,要求用户端坐在计算机前或者处于某个固定位置才能完成计算任务。大量的计算设备、多模态交互技术模块、情景感知(context awareness)模块被嵌入并隐藏在实际的物理环境中,这些模块需要能互相协作并能主动为用户提供服务,使得智能空间能拥有立体、连续的交互通道。例如,一个智能书房能检测到用户在其内阅读书籍,它可能会打开窗帘来为用户提供足够的照明;随着时间的推移,夜幕降临,智能书房还可能根据当前的光照条件,逐渐加强房间中的灯光照明。

其次,智能空间的一个重要特性称为游牧服务(cyber foraging)。它是指用户携带入空间的无线手持设备可以充分利用其周围基础设施中的相对较强的设备的能力,同时其上运行的模块也可以与空间中的其他模块进行交互和协作,以共同为用户提供增强的服务。这也是信息空间与物理空间融合的一个体现。这种融合使得空间距离对计算的含义与传统分布式计算中正好相反。传统的分布式计算是试图用网络消灭空间距离,而智能空间是强调找到离用户最近的各种资源和服务。反过来,基础设施也应该能够利用用户所携带的移动设备的功能,为用户提供个性化或者增强的服务。例如,当用户甲在一个智能会议室开会时,系统检查到乙给甲发了一个重要的E-mail,并希望甲马上能阅读其内容。智能会议室则应该根据当前的情景(在开会)以及甲所携带的移动设备(手机或者PDA)做出判断,将此E-mail转发到手机上,并通过震动提醒甲,而不是通过会议室的大屏幕显示出来。而如果只是甲单独待在智能会议室,该E-mail则可经由声音提示,显示在大屏幕上。

3 家庭智能化模型

3.1 Agent技术

Agent和多Agent技术起源于分布式人工智能研究,自20 世纪70年代出现以来得到迅速发展,目前已经成为一种进行复杂系统分析与模拟的思想方法与工具。Agent是指驻留在某一环境下,能持续自主地发挥作用,具备驻留性、反应性、社会性、主动性等特征的计算实体。

多Agent系统是一种全新的分布式计算技术,由在一个环境中交互的多个Agent组成。多Agent系统也能被用在解决分离的Agent以及单层系统难以解决的问题上。智能可以由一些方法、函数、过程、搜索算法或加强学习来实现。多主体系统的研究课题可以提供一个合适的视角去观察网络贸易,灾害应对以及社会结构建模。多Agent具有下列基本特性:

(1)自治性(Autonomy):Agent能根据外界环境的变化,自动地对自己的行为和状态进行调整,而不是仅仅被动地接受外界的刺激,具有自我管理自我调节的能力。

(2)反应性(Reactive):能对外界的刺激做出反应的能力。

(3)主动性(Proactive):对于外界环境的改变,Agent能主动采取行动的能力。

(4)社会性(Social):Agent具有与其他Agent或人进行合作的能力,不同的Agent可根据各自的意图与其他Agent进行交互,以达到解决问题的目的。

(5)进化性:Agent能积累经验或学习知识,并修改自己的行为以适应新环境。

免责声明:文章转载自《人工智能与智能家居》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇关于Git GUI克隆代码范数与距离下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

图解固件、驱动、软件的区别

大家好,我是良许。 不管我们使用什么操作系统,无论是 Windows、macOS 还是 Linux ,里面都安装了许多软件、驱动程序和固件。但是,这三者概念有区别呢? 我在朋友圈做了个小调查,发现居然很多人不清楚他们的关系,因此写下此文来给大家做个简单的科普。 文字描述太抽象了,我们直接来看漫画吧。 好了,看完漫画,我们再来看正规的解释是怎样的...

Linux文件目录权限浅谈

1、基本权限三种(1)r (read) 读 针对目录,有读(r)权限就代表能对此目录有列表功能,就是可以执行ls命令进行查看,另外还有cp的功能。针对文件,有读(r)权限就代表能对此文件有阅读功能,可以通过cat等命令查看文件内容。 (2)w (write) 写 针对目录,有写(w)权限就代表着在此目录下创建文件和目录,可以通过touch,mkdir等命令...

双系统开机引导菜单修复方法 进win7无须重启|metro引导|双系统菜单名字修改

此文转自互联网,一部分是原创。 主要内容 1.修复双系统菜单(win7与win8双系统),进入win7不再需要重启,普通菜单样式(普通引导,非metro界面),更加简洁,实用,开机即可选择操作系统 2.改双系统启动菜单的名字或者改成中文。 3.使用NTbootautofix强力修复 双系统 用win8 metro引导 考虑到win8的稳定性和兼容性,相信很...

Restful API 设计参考原则

在项目中,需要为后台服务撰写API。刚开始接触的时候,并没有考虑太多,就想提供URL,服务端通过该URL进行查询、创建、更新等操作即可。但再对相关规范进行了解后,才发现,API的设计并没有那么简单,远远不是URL的问题,而是一个通信协议的整体架构 1. 使用GET、POST、PUT、DELETE这几种请求模式 请求模式也可以说是动作、数据传输方式,通常我们...

00.充电桩的那些事儿

许继电源意见表 对27930的意见: 1. 在启动绝缘,闭合K1K2前,和投泄放前,建议应该增加“检测并判断接触器外侧电”预防K5K6有粘连。 同意闭合K1K2前增加,后续K5、K6未闭合,投泄放前无须再检。 2. 图A.5 正常充电时序流程图(续1)中,”自检测到插头插入起5s”超时条件描述不对,应该“为设备第一次启动锁定后”。因为电子锁锁定命令是由用户...

Android输入法架构学习总结

  此文为本人学习输入法之后所做的一个总结报告。与大家分享。   安卓输入法框架(Input Method Framework)IMF 一.输入法框架简介   自Android平台1.5版本以后,Google开放了 Android平台输入法框架(InputMethod Framework, IMF) , IMF是Android平台的特色设计。它的出现大大推...