Apache NiFi之Kafka流数据到HBase

摘要:
一.说明在大数据平台的业务场景中,处理实时kafka数据流数据,以成为必要的能力;此篇将尝试通过ApacheNiFi来接入Kafka数据然后处理后存储之HBase二.开拔Ⅰ).配置ConsumeKafka_0_10测试使用了kafka0.10版本,所以NiFi中也选择对于版本a).选择ConsumeKafka_0_10在Processor中搜索ConsumeKafka_0_10b).配置Consu
一.说明

在大数据平台的业务场景中,处理实时kafka数据流数据,以成为必要的能力;此篇将尝试通过Apache NiFi来接入Kafka数据然后处理后存储之HBase

二.开拔

Ⅰ).配置ConsumeKafka_0_10

测试使用了kafka0.10版本,所以NiFi中也选择对于版本

a).选择ConsumeKafka_0_10

在Processor中搜索ConsumeKafka_0_10

Apache NiFi之Kafka流数据到HBase第1张

b).配置ConsumeKafka_0_10

1.Kafka Brokers: hostname1:9092,hostname2:9092:hostname3:9092
2.Topic Name(s): entry_index_nifi
3.Group ID: entry_index_nifi

Apache NiFi之Kafka流数据到HBase第2张

Ⅱ).配置PutHBaseJSON

a).选择PutHBaseJSON

在Processor中搜索PutHBaseJSON

Apache NiFi之Kafka流数据到HBase第3张

b).配置PutHBaseJSON

1.HBase Client Service: 选择匹配版本的HBaseClient
2.Table Name: 配置入库HBase表名
3.Row Identifier Field Name: 配置RowKey值
4.Column Family: 配置列簇

Apache NiFi之Kafka流数据到HBase第4张

c).选择HBase_1_1_2_ClientService

在Processor中搜索HBase_1_1_2_ClientService

Apache NiFi之Kafka流数据到HBase第5张

d).配置HBase_1_1_2_ClientService

1.Zookeeper Quorum: hostname1:2181,hostname2:2181,hostname3:2181
2.Zookeeper Client Port: 2181
3.Zookeeper ZNode Parent: /hbase

Apache NiFi之Kafka流数据到HBase第6张
Apache NiFi之Kafka流数据到HBase第7张

e).激活HBase_1_1_2_ClientService

Apache NiFi之Kafka流数据到HBase第8张

Ⅲ).启动服务

可以点击选择单个Processor启动,也可以在空白处点击流程启动

Apache NiFi之Kafka流数据到HBase第9张

Ⅳ).验证结果

a).Kafka源数据

./bin/kafak-console-consumer.sh --zookeeper hostname1:2181,hostname2:2181,hostname3:2181 ---topic entry_index_nifi

Apache NiFi之Kafka流数据到HBase第10张

b).HBase入库数据

scan 'kafka.entry_index_nifi',{LIMIT=>10}

Apache NiFi之Kafka流数据到HBase第11张

三.HBase命令
## 创建表空间
create_namespace 'kafka'
## 查看表空间
list_namespace_tables 'kafka'
## 创建表
create 'kafka.entry_index_nifi','cf1'
## 查看表数据
scan 'kafka.entry_index_nifi',{LIMIT=>10}

免责声明:文章转载自《Apache NiFi之Kafka流数据到HBase》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇PyTorch-网络的创建,预训练模型的加载data.table包使用总结下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

人脸数据库汇总

■Annotated Database (Hand, Meat, LV Cardiac, IMM face) (http://www2.imm.dtu.dk/~aam/) ■AR Face Database (http://cobweb.ecn.purdue.edu/~aleix/aleix_face_DB.html)■BioID Face Databas...

Hive 建外链表到 Hbase(分内部表、外部表两种方式)

一、 Hive 建内部表,链到hbase ;特点:Hive drop表后,Hbase 表同步删除 drop table if exists hbase_kimbo_test1;CREATE TABLE hbase_kimbo_test1(id string comment '主键ID',name string comment '名称',cate_name...

结构化数据、半结构化数据、非结构化数据——Hadoop处理非结构化数据

刚开始接触Hadoop ,指南中说Hadoop处理非结构化数据,学习数据库的时候,老师总提结构化数据,就是一张二维表,那非结构化数据是什么呢?难道是文本那样的文件?经过上网搜索,感觉这个帖子不错 网址:http://blog.sina.com.cn/s/blog_49c1385f01014bf6.html 1. 结构化数据(structured data)...

饿了么技术往事

小结: 1、从技术骨干再到技术团队负责人这一转变过程中,很容易被忽略的就是团队的人员结构。 2、领域职责没有收口,带来很多一致性问题。 领域边界的分歧 3、 Leader的个人能力,决定了他(她)是这个团队的地基还是天花板。 4、 业务领域拆分、基础设施和业务系统分别建设后,给业务快速发展解绑了。但是包括稳定性在内的一系列挑战依然需要面对:   基础设施...

unigui如何连接数据库

unigui如何连接数据库 UNIGUI既可以二层直连数据库,也可以通过中间件连接数据库。 这里只介绍UNIGUI二层直连数据库。 数据库连接控件、数据集控件都要拖放在MainModule窗体上。UNIGUI会为每一个HTTP SESSION创建一个TUniMainModule对象。 附上ADO数据引擎连接MSSQL数据库的代码。 unit MainMod...

一文详解特征缩放、标准化、归一化的定义、区别、特点和作用

前言 我在学李宏毅的机器学习课程,助教给的回归作业代码中有数据标准化的操作。 我听过数据标准化,还有归一化、批量归一化等等,但不是很懂,不知道他们具体是什么、有什么区别。 百度上找了挺多文章,讲得都不是很系统,比如大多文章都没讲懂标准化和归一化的区别或者是不同文章讲的内容矛盾了。 用谷歌一搜,就找到了很多很有价值的相关文章,然后我也写了这篇文章做个记录。...