CentOS 6.5集群安装64位Hadoop2.2.0

网络环境,整3台虚拟机或者物理机,配置好相应网络,编辑/etc/hosts, 如:

CentOS 6.5集群安装64位Hadoop2.2.0

ssh无密码登录,很简单,每台机器都生成公钥,密钥(事先建立一个统一的Hadoop用户) 

// 生成key, 都不输入密码
ssh-keygen -t rsa

// 于是在用户主目录下会有.ssh/文件夹生成, 文件有:
 id_rsa id_rsa.pub
将三台机器的id_rsa.pub的内容合并到一个authorized_keys文件,并复制到三台机器用户主目录/.ssh/下。

注意, CentOS默认没有启动ssh无密登录,去掉/etc/ssh/sshd_config其中3行的注释:

CentOS 6.5集群安装64位Hadoop2.2.0

完成后就可以无密ssh了,如:

CentOS 6.5集群安装64位Hadoop2.2.0

安装hadoop:

解压,并做配置$HADOOP_HOME/etc/hadoop下:

详细配置可见:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/ClusterSetup.html

--------------------------------------分割线 --------------------------------------

--------------------------------------分割线 --------------------------------------

//1. hadoop-env.sh中添加JAVA_HOME, 如:
# The java implementation to use.
export JAVA_HOME=/usr/java/jdk1.7.0_45

//2. core-site.xml(tmp目录需手动创建):
<configuration>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/home/hadoop/tmp/hadoop-${user.name}</value>
        </property>
        <property>
                <name>fs.default.name</name>
                <value>hdfs://hadoopmaster:9000</value>
        </property>
</configuration>

//3. mapred-site.xml
<configuration>
        <property>
                <name>mapred.job.tracker</name>
                <value>hadoopmaster:9001</value>
        </property>
</configuration>

//4. hdfs-site.xml
<configuration>
        <property>
                <name>dfs.replication</name>
                <value>2</value>
        </property>
</configuration>

//5. slaves
hadoopslave1
hadoopslave2

相关推荐