Flume安装部署

摘要:
Flume安装和部署Flume的安装包被上传到数据源所在的节点。事实上,它也可能不是数据源节点。只要运行Flume的机器和数据源节点的机器可以通过某种协议进行通信。关键是体验如何配置Flume的三个组件。

Flume安装部署

  • Flume的安装(非常简单)

上传安装包到数据源所在节点上,实际上不是数据源节点也是可以的,只要运行Flume的这台机器与数据源节点的这台机器能够通过某种协议进行通信即可。

然后解压tar –zxvf apache-flume-1.8.0-bin.tar.gz,并修改(mv)文件名为flume

然后进入flume的目录,修改conf下的flume-env.sh,没有的话复制(cp)flume-env.sh.template,在里面配置JAVA_HOME为jdk的根目录。

Flume安装部署第1张

  • 根据数据采集需求配置采集方案,描述在配置文件中(文件名可任意自定义)
  • 指定采集方案配置文件,在相应的节点上启动flume agent

先用一个最简单的例子来测试一下程序环境是否正常。重点是体会一下Flume三个组件之间该怎么配置。

需求:往一个网络端口上发送数据,Flume监听该端口,把这个端口里面接收到的数据收集起来,并下沉到终端上以日志的形式打印出来。

1、 配置采集方案(在flume的conf目录下新建一个文件)

vi netcat-logger.conf(命名规则:source-sink.conf)

#从网络端口接受数据,下沉到logger
#采集配置文件,netcat-logger.conf

#定义这个agent中各组件的名字
a1.sources=r1
a1.sinks=k1
a1.channels=c1

#描述和配置source组件:r1
# netcat类型用来监听端口数据源
a1.sources.r1.type=netcat
a1.sources.r1.bind=localhost
a1.sources.r1.port=44444

#描述和配置sink组件:k1
a1.sinks.k1.type=logger

#描述和配置channel组件,此处使用是内存缓存的方式
a1.channels.c1.type=memory
a1.channels.c1.capacity=1000
a1.channels.c1.transactionCapacity=100

#描述和配置source channel sink之间的连接关系
a1.sources.r1.channels=c1
a1.sinks.k1.channel=c1

2、 启动agent去采集数据

bin/flume-ng agent -c conf –f conf /netcat-logger.conf –n a1 -Dflume.root.logger=INFO,console

示例:

bin/flume-ng agent --conf conf --conf-file conf/netcat-logger.conf --name a1 -Dflume.root.logger=INFO,console

解释1:

-c conf 指定flume自身的配置文件所在目录

-f conf/netcat-logger.conf 指定我们所描述的采集方案

-n a1 指定本次启动agent的名字,与采集方案配置文件中一致

解释2:

-c (或--conf) : flume自身所需的conf文件路径

-f (--conf-file) : 自定义的flume配置文件,也就是采集方案文件

-n (--name): 自定义的flume配置文件中agent的name

3、 测试

先要往agent采集监听的端口上发送数据,让agent有数据可采。

随便在一个能跟agent节点联网的机器上,也可以在本机:telnet agent-hostname port (如:telnet localhost  44444)

注意:如果telnet还没有安装,则需要执行yum install -y telnet进行安装

 Flume安装部署第2张

Flume安装部署第3张

免责声明:文章转载自《Flume安装部署》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇.NET Core 使用 WebApiClient.JIT 调用第三方接口一篇文章教会你创建vue项目和使用vue.js实现数据增删改查下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

[从源码学设计] Flume 之 memory channel

[从源码学设计] Flume 之 memory channel 目录 [从源码学设计] Flume 之 memory channel 0x00 摘要 0x01 业务范畴 1.1 用途和特点 1.2 Channel 1.3 研究重点 1.4 实际能够学到什么 1.5 总述 0x02 定义 2.1 接口 2.2 配置参数2.2.1 channe...

Flume简介及安装

Hadoop业务的大致开发流程以及Flume在业务中的地位: 从Hadoop的业务开发流程图中可以看出,在大数据的业务处理过程中,对于数据的采集是十分重要的一步,也是不可避免的一步,从而引出我们本文的主角—Flume。 Flume概念 flume是分布式的日志收集系统,它将各个服务器中的数据收集起来并送到指定的地方去,比如说送到图中的HDFS,简单来...

Flume技术原理

转:https://www.e-learn.cn/content/qita/690288 Flume是开源日志系统。是一个分布式、可靠性和高可用的海量日志聚合系统,支持在系统中定制各类数据发送方,用于收集数据;同时,FLume提供对数据进行简单处理,并写到各种数据接收方(可定制)的能力。 Flume是流式日志采集工具,FLume提供对数据进行简单处理并且写...

【基础组件2】Flume入门(二)Agent

工作方式 Flume-og采用了多Master的方式。为了保证配置数据的一致性,Flume引入了ZooKeeper,用于保存配置数据,ZooKeeper本身可保证配置数据的一致性和高可用,另外,在配置数据发生变化时,ZooKeeper可以通知Flume Master节点。Flume Master间使用gossip协议同步数据。 Flume-ng最明显的改动...

flume kafka 配置指南

1、官方网站也有配置: https://flume.apache.org/FlumeUserGuide.html#kafka-source 2、clodera 官方配置 https://www.cloudera.com/documentation/kafka/2-0-x/topics/kafka_flume.html 1 tier1.sources =...

Hbase关于Java常用API举例

1. HBase相关对Admin操作的的API封装在HBaseAdmin中,封装了HBase常用操作的API 使用方法: pom.xml <!-- https://mvnrepository.com/artifact/org.apache.hbase/hbase-client --> <dependency>...