hadoop安装笔记

摘要:
最近,我在学习hadoop。hadoop的安装过程如下。我选择了ubuntu14桌面版+hadoop 3.1.1。然后按提示输入密码hadoop,这样您就可以登录到本地计算机。输入以下命令以检查Hadoop是否可用。如果成功,将显示Hadoop版本信息:cd/usr/local/hhadoop/Bin/hadoopversionHadoop伪分布式配置Hadoop配置文件位于/usr/local/hadooop/etc/Hadoop/中。伪分布式配置需要修改两个配置文件,即核心站点。xml和hdfs站点xmlHadoop配置文件采用xml格式。每个配置都是通过声明属性的名称和值来实现的。

 最近在学习hadoop,hadoop的安装过程如下

我选用的是ubuntu 14桌面版+hadoop3.1.1。

1,ubuntu的安装

  需要准备的有:ubuntu镜像文件,VMware虚拟机

  首先我们需要linux系统,但是由于平时大家基本都是使用windows系统,而且hadoop集群又需要多个节点,所以我们需要使用虚拟机,这里选用的是VM ware ,当然你也可以使用virtual box,两者孰优孰劣,仁者见仁,全凭喜好。

  安装好VMware之后(VMware是商业软件,作为一个学生,如何去使用它,相信难不住各位看官,在此便不作赘述),新建虚拟机-->自定义-->下一步-->稍后安装操作系统,下一步-->操作系统linux,版本:ubuntu64位,下一步-->编辑虚拟机名称,安装位置,下一步-->根据实际需要进行处理器配置,我直接next-->为虚拟机分配内存,我电脑8G,分给虚拟机2G-->选择网络类型:桥接网络-->控制器类型:选推荐-->磁盘类型:选推荐-->选择磁盘:创建虚拟磁盘-->分配磁盘空间:将虚拟磁盘存储为单个文件-->next-->完成。至此虚拟机新建完成。

  接下来安装ubuntu系统,ubuntu系统可以在ubuntu官网http://ubuntu.com.cn/download/alternative-downloads下载,这里使用的是ubuntu14桌面版,首先编辑虚拟机设置-->CD/DVD,右侧连接,使用ISO映像文件,选择你下载的ubuntu镜像,确定,开机。

  ubuntu安装过程如下:

    1,选择语言,中文简体,然后选择安装ubuntu

hadoop安装笔记第1张

    2,直接点Next

hadoop安装笔记第2张

    3,选择其他选项,新建分区表

hadoop安装笔记第3张

hadoop安装笔记第4张

      4分配交换空间。一般来说,我们选择512MB到1G大小作为交换空间,剩下空间全部用来作为根目录

hadoop安装笔记第5张

hadoop安装笔记第6张

hadoop安装笔记第7张

 hadoop安装笔记第8张

      5键盘布局

hadoop安装笔记第9张

      6,设置主机名和密码

hadoop安装笔记第10张

      7,等待安装完成,不要点skip

hadoop安装笔记第11张

        安装完毕后,重启即可,你可以在显示设置里修改屏幕分辨率

hadoop安装笔记第12张

hadoop安装笔记第13张

    完成。

    首先创建hadoop用户:

sudo useradd -m hadoop -s /bin/bash

    接着使用如下命令设置密码,可简单设置为 hadoop,按提示输入两次密码:

sudo passwd hadoop

    为 hadoop 用户增加管理员权限

sudo adduser hadoop sudo

    然后更换为hadoop用户。

    更新apt

sudo apt-get update

    安装vim

sudo apt-get install vim

    安装ssh,Ubuntu 默认已安装了 SSH client,我们需要安装 SSH server:

sudo apt-get install openssh-server

    安装后,可以使用如下命令登陆本机

ssh localhost

    此时会有如下提示(SSH首次登陆提示),输入 yes 。然后按提示输入密码 hadoop,这样就登陆到本机了。

    但这样登陆是需要每次输入密码的,我们需要配置成SSH无密码登陆比较方便。

    首先退出刚才的 ssh,就回到了我们原先的终端窗口,然后利用 ssh-keygen 生成密钥,并将密钥加入到授权中

exit                           # 退出刚才的 ssh localhost
cd ~/.ssh/                     # 若没有该目录,请先执行一次ssh localhost
ssh-keygen -t rsa              # 会有提示,都按回车就可以
cat ./id_rsa.pub >> ./authorized_keys  # 加入授权

     接下来下载jdk和hadoop,都在官网下载,jdk:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

                        hadoop:http://mirror.bit.edu.cn/apache/hadoop/common/

     网上已有的linux安装jdk的经验https://www.jianshu.com/p/c43b73e7edd8

     安装好jdk后来安装hadoop

     我们选择将 Hadoop 安装至 /usr/local/ 中:    

sudo tar -zxf ~/下载/hadoop-2.6.0.tar.gz -C /usr/local    # 解压到/usr/local中
cd /usr/local/
sudo mv ./hadoop-2.6.0/ ./hadoop            # 将文件夹名改为hadoop
sudo chown -R hadoop ./hadoop       # 修改文件权限

Hadoop 解压后即可使用。输入如下命令来检查 Hadoop 是否可用,成功则会显示 Hadoop 版本信息:

cd /usr/local/hadoop
./bin/hadoop version

Hadoop伪分布式配置

Hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/ 中,伪分布式需要修改2个配置文件 core-site.xml 和 hdfs-site.xml 。Hadoop的配置文件是 xml 格式,每个配置以声明 property 的 name 和 value 的方式来实现。修改配置文件 core-site.xml (通过 gedit 编辑会比较方便: gedit ./etc/hadoop/core-site.xml)

 将以下内容插入到<configuration></configuration>里

  <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>

同样地,对于hdfs-site.xml

    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/data</value>
    </property>

配置完成后,执行 NameNode 的格式化:

./bin/hdfs namenode -format

看到 “successfully formatted” 和 “Exitting with status 0” 的提示,表示成功

接着开启 NameNode 和 DataNode 守护进程。

./sbin/start-dfs.sh

启动完成后,可以通过命令 jps 来判断是否成功启动,若成功启动则会列出如下进程: “NameNode”、”DataNode” 和 “SecondaryNameNode”

成功启动后,可以访问 Web 界面 http://localhost:50070 查看 NameNode 和 Datanode 信息,还可以在线查看 HDFS 中的文件。

免责声明:文章转载自《hadoop安装笔记》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇YY 数据库平台化建设实践Vue中的computed属性下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

关于xshell使用遇到的问题

好久不用xshell,之前怎么使用的都忘记了,这次做个笔记,方便以后使用。 1.首先下载xshell,直接去官网上下载。 填好信息,去邮箱查看,下载。 2 安装xshell也没什么问题,直接下一步即可。 3 xshell的使用   选择新建,弹出下面窗口,填好ip。 如果出现输入用户名密码窗口,直接输入即可。 没有出现的情况下,首先判断ssh服务有没有...

windbg源码驱动调试 + 无源码驱动调试

windbg源码驱动调试   环境信息 虚拟机:win7 32位 windbg:6.12(版本不存在太大影响) 设置过程 windbg与虚拟机连接:链接 配置windbg 配置好双机调试后,点击windbg菜单栏的debug->Break产生中断,控制权交给windbg 中断产生后,点击File->Open Sourse File(Ct...

centos 7-8 安装 ms sql server 2019

https://docs.microsoft.com/zh-cn/sql/linux/sql-server-linux-overview?view=sql-server-ver15 ###下载安装 sudo curl -o /etc/yum.repos.d/mssql-server.repo https://packages.microsoft.com...

把Gitlab迁移到Docker容器里

把Gitlab迁移到Docker容器里 Apr 9, 2015. | By: 任怀林 公司的gitlab一直是运行在ovm的虚拟机里的,版本还是6.7.5。版本有点老了,最近在研究docker,于是想把gitlab迁移到docker container里去。发现真的有人已经做了gitlab的image了,真心赞。 1 规划 规划: 一个容器运行gitl...

SSH常见错误

错误一: IOException parsing XML document from ServletContext resource [/WEB-INF/applicationContext.xml]; nested exception is java.io.FileNotFoundException: Could not open ServletCon...

云端远程Ubuntu系统进行无桌面Web浏览器自动化测试

【摘要】 利用xvfb提供的显卡帧缓冲区,让浏览器以为有桌面,以达到无桌面系统下测试真实浏览器兼容性的目的。 自动化web界面测试往往需要验证真实浏览器的兼容性,但是云端系统往往并不提供图形化的桌面,所以自动化web界面测试在云端就成为一个问题。本文描述了一个技巧解决这个问题,其主要原理是利用xvfb提供的显卡帧缓冲区,让浏览器以为有桌面。 Install...