结构化数据、半结构化数据、非结构化数据——Hadoop处理非结构化数据

摘要:
刚开始接触Hadoop,指南中说Hadoop处理非结构化数据,学习数据库的时候,老师总提结构化数据,就是一张二维表,那非结构化数据是什么呢?数据模型:树、图3.非结构化数据:各种文档、图片、视频/音频等。

刚开始接触Hadoop ,指南中说Hadoop处理非结构化数据,学习数据库的时候,老师总提结构化数据,就是一张二维表,那非结构化数据是什么呢?难道是文本那样的文件?经过上网搜索,感觉这个帖子不错

网址:http://blog.sina.com.cn/s/blog_49c1385f01014bf6.html

1. 结构化数据(structured data):
传统的关系数据模型、行数据,存储于数据库,可用二维表结构表示。
数据模型:
二维表
2. 半结构化数据(semi-structured data):
类似XML、HTML之类,自描述,数据结构和内容混杂在一起。
数据模型:
树、图
3. 非结构化数据(unstructured data):
各种文档、图片、视频/音频等。
数据模型:
PS :MapReduce对于非结构化或半结构化数据非常有效,因为在处理数据时才对数据进行解释,换句话说,MapReduce 输入的键和值并不是数据固有的属性,而是由分析数据的人员来选择的。

免责声明:文章转载自《结构化数据、半结构化数据、非结构化数据——Hadoop处理非结构化数据》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Windows上安装-kivy如何自定义MVC控件?下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

解决:Access模糊匹配查询查不到数据

今天遇到一个可笑的问题,直接操作Access的SQL语句: Select * from table where txtTitle like '%数据%' 匹配竟然无效。后来才发现在Access中模糊匹配应该用*代替% Select * from table where txtTitle like '*数据*' 狂晕。。。...

SQL serve 数据库--视图、事物、分离附加、备份还原

视图是数据库中的一种虚拟表,与真实的表一样,视图包含一系列带有名称的行和列数据。行和列数据用来自定义视图的查询所引用的表,并且在引用视图时动态生成。 视图只能用来查询,不能增删改;不允许出现重复列 1. 视图的概念 视图是从一个或者多个表中导出的,其行为与表相似,但视图是一个虚拟表。视图可以在已经存在的视图的基础上定义。在视图上用户可以使用SELECT语...

UniGUI的SQLite数据库(04)

1]放FDConnection1和FDQuery1到界面上 一定要 放一个 FDPhysSQLiteDriverLink1到ServerModule上 2]在OnFormCreate事件里写 FDQuery1.Connection := FDConnection1;FDConnection1.LoginPrompt:=false; //取消登录提示框...

ArcMap 2 数据矢量化

若有不妥,还请见谅。留下留言,与君共勉。 前言:GIS专业的同学或与GIS接触的专业或其它,应该了解到数据的“矢量化”的不(酸)易(爽)。以目前博主的水平,本文暂时只能提供两种数据“矢量化”的方式。大家有好的方法或以后我接触的更多,会再次更新本博文。该博客的系列文章都会时常更新,离不开大家的建议。 本篇博文请与下一篇博文ArcMap 3 矢量数据下载(下载...

tableau(1.入门操作2.数据分析、数据可视化3.数据分析地图可视化)

关于Tableau tabaleau是一款BI软件,能对数据进行可视化展示,数据图表制作能力强;只支持本地端 安装下载地址: http://xiazai.zol.com.cn/detail/45/443509.shtml 链接: https://pan.baidu.com/s/1nw1Uuxbl2dK6xPZMtCh66A 提取码: hhpe 打开页面:...

MySQL Workbench 怎么创建数据库

第1步:单击MySQLWorkbench.exe快捷方式,弹出MySQLWorkbench界面 第2步:单击菜单栏Database按钮,弹出下拉菜单,单击Connect to Database,第3步:单击OK按钮,输入数据库密码第4步:单击工具栏按钮(第四个,即鼠标放在 上面显示Create a new schema in the connected s...