Hadoop2.7.3完全分布式集群安装过程

2019-11-08 19:45:08

字体：大中小

来源：转载

供稿：网友

需要安装的软件

Hadoop包含HDFS集群和YARN集群。部署Hadoop就是部署HDFS和YARN集群。

机器数量、角色

4台。 NameNode 1台、DataNode 3台

主机名	ip	角色
amaster	192.168.37.143	Name Node:9000Resource Manager
anode1	192.168.37.129	Data NodeNode Manager
anode2	192.168.37.130	Data NodeNode Manager
anode3	192.168.37.131	Data NodeNode Manager

因为Node Manager负责进行计算，Data Node负责存放数据。所以它们部署在同一台机器会避免很多网络的传输，大大提高效率，因此它们两种角色部署在一台机器上是比较妥当的。

Name Node负责存放文件位置的索引。非常重要，因此单独拿出一台机器来部署。同样，Resource Manager负责计算资源的调度也非常重要，一般来说单独拿出一台机器来部署。

但是我现在是准备学习Hadoop，并不是实际的部署，因此节省一台机器，将NameNode和ResourceManager放在一台机器上。

下面开始Hadoop的安装。推荐一篇博客http://blog.csdn.net/dream_an/article/details/52946840，记录从零开始的安装过程，很详细。我自己的话就写的稍简略一些。

虚拟机配置

内存：2G（至少1G）

下载安装文件

这边下载2.7.3的稳定版

https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz

准备工作

一般来说，生产环境的Hadoop需要有一个专门的用户来安装，我这边主要是练习，就继续用root了。

简单说一下新建用户以后需要做的一些准备工作：

配置/etc/sudoers各节点ssh免密码登录JDK的安装和java_HOME的配置关闭防火墙

上传安装文件到虚拟机

sftp> put -r "C:/Users/Yang/Desktop/hadoop-2.7.3.tar.gz"

使用下面的命令统一把Hadoop安装到/root/apps/hadoop-2.7.3目录下

tar -zxvf hadoop-2.7.3.tar.gz -C /root/apps

修改配置文件

hadoop-env.sh

vim /root/apps/hadoop-2.7.3/etc/hadoop/hadoop-env.sh

然后配置JAVA_HOME,可以先用echo $JAVA_HOME命令取得JAVA_HOME的位置

export JAVA_HOME=/root/apps/jdk1.8.0_111

core-site.xml

vim /root/apps/hadoop-2.7.3/etc/hadoop/core-site.xml

修改成下面的内容：

<configuration>  <PRoperty> <name>fs.defaultFS</name> <value>hdfs://amaster:9000</value> </property>  <property> <name>io.file.buffer.size</name> <value>131072</value> </property>  <property> <name>hadoop.tmp.dir</name> <value>/root/apps/hadoop-2.7.3/tmp</value> </property></configuration>

hdfs-site.xml

vim /root/apps/hadoop-2.7.3/etc/hadoop/hdfs-site.xml

修改成下面的内容：

<configuration> <property> <name>dfs.namenode.secondary.http-address</name> <value>amaster:50090</value> </property> <property> <name>dfs.replication</name> <value>2</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/root/apps/hadoop-2.7.3/data/hdfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/root/apps/hadoop-2.7.3/data/hdfs/data</value> </property></configuration>

mapred-site.xml

cp /root/apps/hadoop-2.7.3/etc/hadoop/mapred-site.xml.template /root/apps/hadoop-2.7.3/etc/hadoop/mapred-site.xml

vim /root/apps/hadoop-2.7.3/etc/hadoop/mapred-site.xml

修改成下面的内容：

<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property></configuration>

yarn-site.xml

vim /root/apps/hadoop-2.7.3/etc/hadoop/yarn-site.xml

修改成下面的内容：

<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.resourcemanager.hostname</name> <value>amaster</value> </property> <property> <name>yarn.resourcemanager.webapp.address</name> <value>amaster:8088</value> </property></configuration>

slaves

vim /root/apps/hadoop-2.7.3/etc/hadoop/slaves

修改成下面的内容：

anode1anode2anode3

把Hadoop拷贝到其他机器

分别执行下列命令：

scp -r /root/apps/hadoop-2.7.3 root@anode1:/root/apps/hadoop-2.7.3scp -r /root/apps/hadoop-2.7.3 root@anode2:/root/apps/hadoop-2.7.3scp -r /root/apps/hadoop-2.7.3 root@anode3:/root/apps/hadoop-2.7.3