Hadoop Single Node Installation in Centos 6.X

We have virtual machine with Centos IP 192.168.1.11

Java should be installed
here

Grant permission to access on localhost by SSH without password

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
$ chmod 0700 ~/.ssh/authorized_keys

Hadoop Installation

# yum install -y \
openssh-clients

# cd /tmp
# wget http://apache.claz.org/hadoop/common/hadoop-2.7.1/hadoop-2.7.1.tar.gz

# tar -xvzpf hadoop-2.7.1.tar.gz
# mkdir -p /opt/hadoop/2.7.1
# mv hadoop-2.7.1/* /opt/hadoop/2.7.1/

# useradd hadoop
# passwd hadoop
# chown -R hadoop /opt/hadoop/

# su - hadoop

$ vi ~/.bash_profile

#### HADOOP 2.7.1 #######################

	export HADOOP_HOME=/opt/hadoop/2.7.1
	export PATH=$PATH:$HADOOP_HOME/bin
	export PATH=$PATH:$HADOOP_HOME/sbin

#### HADOOP 2.7.1 #######################

 $ source ~/.bash_profile

$ hadoop version

Configuration scripts

$ vi /opt/hadoop/2.7.1/etc/hadoop/hadoop-env.sh

export JAVA_HOME=${JAVA_HOME}

replace on:

# export JAVA_HOME=${JAVA_HOME}
export JAVA_HOME=/opt/jdk/current

$ vi /opt/hadoop/2.7.1/etc/hadoop/core-site.xml

***

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

mkdir -p ~/hadoop_data/hdfs/namenode
mkdir -p ~/hadoop_data/hdfs/datanode

$ vi /opt/hadoop/2.7.1/etc/hadoop/hdfs-site.xml

***

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
	<property>
		<name>dfs.namenode.name.dir</name>
		<value>file:/home/hadoop/hadoop_data/hdfs/namenode</value>
	</property>
	<property>
		<name>dfs.datanode.name.dir</name>
		<value>file:/home/hadoop/hadoop_data/hdfs/datanode</value>
	</property>
</configuration>

$ vi /opt/hadoop/2.7.1/etc/hadoop/yarn-site.xml

***

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
	<property>
		<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
		<value>org.apache.hadoop.mapred.ShuffleHandler</value>
	</property>
</configuration>

$ cp /opt/hadoop/2.7.1/etc/hadoop/mapred-site.xml.template /opt/hadoop/2.7.1/etc/hadoop/mapred-site.xml
$ vi /opt/hadoop/2.7.1/etc/hadoop/mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

Start hadoop daemons

$ hadoop namenode -format
$ hadoop-daemon.sh start datanode
$ hadoop-daemon.sh start namenode

$ jps
DataNode
NameNode
Jps

$ yarn-daemon.sh start resourcemanager
$ yarn-daemon.sh start nodemanager

$ jps
DataNode
Jps
NodeManager
NameNode
ResourceManager

$ mr-jobhistory-daemon.sh start historyserver

$ jps
DataNode
Jps
JobHistoryServer
NodeManager
NameNode
ResourceManager

Connect to hadoop browser console

Summary

http://192.168.1.11:50070/

All Applications

http://192.168.1.11:8088/

job history

http://192.168.1.11:19888

Links:

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.html

http://www.youtube.com/watch?v=-XW7IHYTdQc

fix: Unable to load native-hadoop library (NOT TESTED)
http://www.ercoppa.org/Linux-Compile-Hadoop-220-fix-Unable-to-load-native-hadoop-library.htm