centos 7 hadoop centos-7

本篇文章给大家谈谈centos 7 hadoop,以及centos-7对应的知识点,文章可能有点长,但是希望大家可以阅读完,增长自己的知识,最重要的是希望对各位有所帮助,可以解决了您的问题,不要忘了收藏本站喔。

请教hadoop2.0的ha如何配置

1 Hadoop HA架构详解

1.1 HDFS HA背景

HDFS集群中NameNode存在单点故障(SPOF)。对于只有一个NameNode的集群,如果NameNode机器出现意外情况,将导致整个集群无法使用,直到NameNode重新启动。

影响HDFS集群不可用主要包括以下两种情况:一是NameNode机器宕机,将导致集群不可用,重启NameNode之后才可使用;二是计划内的NameNode节点软件或硬件升级,导致集群在短时间内不可用。

为了解决上述问题,Hadoop给出了HDFS的高可用HA方案:HDFS通常由两个NameNode组成,一个处于active状态,另一个处于standby状态。Active NameNode对外提供服务,比如处理来自客户端的RPC请求,而Standby NameNode则不对外提供服务,仅同步Active NameNode的状态,以便能够在它失败时快速进行切换。

1.2 HDFS HA架构

一个典型的HA集群,NameNode会被配置在两台独立的机器上,在任何时间上,一个NameNode处于活动状态,而另一个NameNode处于备份状态,活动状态的NameNode会响应集群中所有的客户端,备份状态的NameNode只是作为一个副本,保证在必要的时候提供一个快速的转移。

为了让Standby Node与Active Node保持同步,这两个Node都与一组称为JNS的互相独立的进程保持通信(Journal Nodes)。当Active Node上更新了namespace,它将记录修改日志发送给JNS的多数派。Standby noes将会从JNS中读取这些edits,并持续关注它们对日志的变更。Standby Node将日志变更应用在自己的namespace中,当failover发生时,Standby将会在提升自己为Active之前,确保能够从JNS中读取所有的edits,即在failover发生之前Standy持有的namespace应该与Active保持完全同步。

为了支持快速failover,Standby node持有集群中blocks的最新位置是非常必要的。为了达到这一目的,DataNodes上需要同时配置这两个Namenode的地址,同时和它们都建立心跳链接,并把block位置发送给它们。

任何时刻,只有一个Active NameNode是非常重要的,否则将会导致集群操作的混乱,那么两个NameNode将会分别有两种不同的数据状态,可能会导致数据丢失,或者状态异常,这种情况通常称为“split-brain”(脑裂,三节点通讯阻断,即集群中不同的Datanodes却看到了两个Active NameNodes)。对于JNS而言,任何时候只允许一个NameNode作为writer;在failover期间,原来的Standby Node将会接管Active的所有职能,并负责向JNS写入日志记录,这就阻止了其他NameNode基于处于Active状态的问题。

基于QJM的HDFS HA方案如上图所示,其处理流程为:集群启动后一个NameNode处于Active状态,并提供服务,处理客户端和DataNode的请求,并把editlog写到本地和share editlog(这里是QJM)中。另外一个NameNode处于Standby状态,它启动的时候加载fsimage,然后周期性的从share editlog中获取editlog,保持与Active节点的状态同步。为了实现Standby在Active挂掉后迅速提供服务,需要DataNode同时向两个NameNode汇报,使得Stadnby保存block to DataNode信息,因为NameNode启动中最费时的工作是处理所有DataNode的blockreport。为了实现热备,增加FailoverController和Zookeeper,FailoverController与Zookeeper通信,通过Zookeeper选举机制,FailoverController通过RPC让NameNode转换为Active或Standby。

1.3 HDFS HA配置要素

NameNode机器:两台配置对等的物理机器,它们分别运行Active和Standby Node。

JouralNode机器:运行JouralNodes的机器。JouralNode守护进程相当的轻量级,可以和Hadoop的其他进程部署在一起,比如NameNode、DataNode、ResourceManager等,至少需要3个且为奇数,如果你运行了N个JNS,那么它可以允许(N-1)/2个JNS进程失效并且不影响工作。

在HA集群中,Standby NameNode还会对namespace进行checkpoint操作(继承Backup Namenode的特性),因此不需要在HA集群中运行SecondaryNameNode、CheckpointNode或者BackupNode。

1.4 HDFS HA配置参数

需要在hdfs.xml中配置如下参数:

dfs.nameservices:HDFS NN的逻辑名称,例如myhdfs。

dfs.ha.namenodes.myhdfs:给定服务逻辑名称myhdfs的节点列表,如nn1、nn2。

dfs.namenode.rpc-address.myhdfs.nn1:myhdfs中nn1对外服务的RPC地址。

dfs.namenode.http-address.myhdfs.nn1:myhdfs中nn1对外服务http地址。

dfs.namenode.shared.edits.dir:JournalNode的服务地址。

dfs.journalnode.edits.dir:JournalNode在本地磁盘存放数据的位置。

dfs.ha.automatic-failover.enabled:是否开启NameNode失败自动切换。

dfs.ha.fencing.methods:配置隔离机制,通常为sshfence。

1.5 HDFS自动故障转移

HDFS的自动故障转移主要由Zookeeper和ZKFC两个组件组成。

Zookeeper集群作用主要有:一是故障监控。每个NameNode将会和Zookeeper建立一个持久session,如果NameNode失效,那么此session将会过期失效,此后Zookeeper将会通知另一个Namenode,然后触发Failover;二是NameNode选举。ZooKeeper提供了简单的机制来实现Acitve Node选举,如果当前Active失效,Standby将会获取一个特定的排他锁,那么获取锁的Node接下来将会成为Active。

ZKFC是一个Zookeeper的客户端,它主要用来监测和管理NameNodes的状态,每个NameNode机器上都会运行一个ZKFC程序,它的职责主要有:一是健康监控。ZKFC间歇性的ping NameNode,得到NameNode返回状态,如果NameNode失效或者不健康,那么ZKFS将会标记其为不健康;二是Zookeeper会话管理。当本地NaneNode运行良好时,ZKFC将会持有一个Zookeeper session,如果本地NameNode为Active,它同时也持有一个“排他锁”znode,如果session过期,那么次lock所对应的znode也将被删除;三是选举。当集群中其中一个NameNode宕机,Zookeeper会自动将另一个激活。

1.6 YARN HA架构

YARN的HA架构和HDFSHA类似,需要启动两个ResourceManager,这两个ResourceManager会向ZooKeeper集群注册,通过ZooKeeper管理它们的状态(Active或Standby)并进行自动故障转移。

2高可用集群规划

2.1集群规划

根据Hadoop的HA架构分析,规划整个集群由5台主机组成,具体情况如下表所示:

主机名

IP地址

安装的软件

JPS

hadoop-master1

172.16.20.81

Jdk/hadoop

Namenode/zkfc/resourcemanager/

JobHistoryServer

hadoop-master2

172.16.20.82

Jdk/hadoop

Namenode/zkfc/resourcemanager/

WebProxyServer

hadoop-slave1

172.16.20.83

Jkd/hadoop/zookeepe

Datanode/journalnode/nodemanager/

quorumPeerMain

hadoop-slave2

172.16.20.84

Jkd/hadoop/zookeeper

Datanode/journalnode/nodemanager/

quorumPeerMain

hadoop-slave3

172.16.20.85

Jkd/hadoop/zookeeper

Datanode/journalnode/nodemanager/

quorumPeerMain

需要说明以下几点:

HDFS HA通常由两个NameNode组成,一个处于Active状态,另一个处于Standby状态。Active NameNode对外提供服务,而Standby NameNode则不对外提供服务,仅同步Active NameNode的状态,以便能够在它失败时快速进行切换。

Hadoop 2.0官方提供了两种HDFS HA的解决方案,一种是NFS,另一种是QJM。这里我们使用简单的QJM。在该方案中,主备NameNode之间通过一组JournalNode同步元数据信息,一条数据只要成功写入多数JournalNode即认为写入成功。通常配置奇数个JournalNode,这里还配置了一个Zookeeper集群,用于ZKFC故障转移,当Active NameNode挂掉了,会自动切换Standby NameNode为Active状态。

YARN的ResourceManager也存在单点故障问题,这个问题在hadoop-2.4.1得到了解决:有两个ResourceManager,一个是Active,一个是Standby,状态由zookeeper进行协调。

YARN框架下的MapReduce可以开启JobHistoryServer来记录历史任务信息,否则只能查看当前正在执行的任务信息。

Zookeeper的作用是负责HDFS中NameNode主备节点的选举,和YARN框架下ResourceManaer主备节点的选举。

2.2软件版本

操作系统:CentOS Linux release 7.0.1406

JDK:Java(TM)SE Runtime Environment(build 1.7.0_79-b15)

Hadoop:Hadoop 2.6.0-cdh5.7.1

ZooKeeper:zookeeper-3.4.5-cdh5.7.1

3 Linux环境准备

集群各节点进行如下修改配置:

3.1创建用户并添加权限

//切换root用户

$ su root

//创建hadoop用户组

# groupadd hadoop

//在hadoop用户组中创建hadoop用户

# useradd-g hadoop hadoop

//修改用户hadoop密码

# passwd hadoop

//修改sudoers配置文件给hadoop用户添加sudo权限

# vim/etc/sudoers

hadoop ALL=(ALL) ALL

//测试是否添加权限成功

# exit

$ sudo ls/root

3.2修改IP地址和主机名

//切换root用户

$ su root

//修改本机IP地址

# vim/etc/sysconfig/network-scripts/ifcfg-eth0

//重启网络服务

# service network restart

//修改主机名

# hostnamectl set-hostname主机名

//查看主机名

# hostnamectl status

3.3设置IP地址与主机名映射

//切换root用户

$ su root

//编辑hosts文件

# vim/etc/hosts

172.16.20.81 hadoop-master1

172.16.20.82 hadoop-master2

172.16.20.83 hadoop-slave1

172.16.20.84 hadoop-slave2

172.16.20.85 hadoop-slave3

3.4关闭防火墙和Selinux

//切换root用户

$ su root

//停止firewall防火墙

# systemctl stop firewalld.service

//禁止firewall开机启动

# systemctl disable firewalld.service

//开机关闭Selinux

# vim/etc/selinux/config

SELINUX=disabled

//重启机器后root用户查看Selinux状态

# getenforce

3.5配置SSH免密码登录

//在hadoop-master1节点生成SSH密钥对

$ ssh-keygen-t rsa

//将公钥复制到集群所有节点机器上

$ ssh-copy-id hadoop-master1

$ ssh-copy-id hadoop-master2

$ ssh-copy-id hadoop-slave1

$ ssh-copy-id hadoop-slave2

$ ssh-copy-id hadoop-slave3

//通过ssh登录各节点测试是否免密码登录成功

$ ssh hadoop-master2

备注:在其余节点上执行同样的操作,确保集群中任意节点都可以ssh免密码登录到其它各节点。

3.6安装JDK

//卸载系统自带的openjdk

$ suroot

# rpm-qa| grep java

# rpm-e--nodeps java-1.7.0-openjdk-1.7.0.75-2.5.4.2.el7_0.x86_64

# rpm-e--nodeps java-1.7.0-openjdk-headless-1.7.0.75-2.5.4.2.el7_0.x86_64

# rpm-e--nodeps tzdata-java-2015a-1.el7_0.noarch

# exit

//解压jdk安装包

$ tar-xvf jdk-7u79-linux-x64.tar.gz

//删除安装包

$ rmjdk-7u79-linux-x64.tar.gz

//修改用户环境变量

$ cd~

$ vim.bash_profile

exportJAVA_HOME=/home/hadoop/app/jdk1.7.0_79

exportPATH=$PATH:$JAVA_HOME/bin

//使修改的环境变量生效

$ source.bash_profile

//测试jdk是否安装成功

$ java-version

4集群时间同步

如果集群节点时间不同步,可能会出现节点宕机或引发其它异常问题,所以在生产环境中一般通过配置NTP服务器实现集群时间同步。本集群在hadoop-master1节点设置ntp服务器,具体方法如下:

//切换root用户

$ su root

//查看是否安装ntp

# rpm-qa| grep ntp

//安装ntp

# yum install-y ntp

//配置时间服务器

# vim/etc/ntp.conf

#禁止所有机器连接ntp服务器

restrict default ignore

#允许局域网内的所有机器连接ntp服务器

restrict 172.16.20.0 mask 255.255.255.0 nomodify notrap

#使用本机作为时间服务器

server 127.127.1.0

//启动ntp服务器

# service ntpd start

//设置ntp服务器开机自动启动

# chkconfig ntpd on

集群其它节点通过执行crontab定时任务,每天在指定时间向ntp服务器进行时间同步,方法如下:

//切换root用户

$ su root

//执行定时任务,每天00:00向服务器同步时间,并写入日志

# crontab-e

0 0***/usr/sbin/ntpdate hadoop-master1>>/home/hadoop/ntpd.log

//查看任务

# crontab-l

5 Zookeeper集群安装

Zookeeper是一个开源分布式协调服务,其独特的Leader-Follower集群结构,很好的解决了分布式单点问题。目前主要用于诸如:统一命名服务、配置管理、锁服务、集群管理等场景。大数据应用中主要使用Zookeeper的集群管理功能。

本集群使用zookeeper-3.4.5-cdh5.7.1版本。首先在hadoop-slave1节点安装Zookeeper,方法如下:

//新建目录

$ mkdir app/cdh

//解压zookeeper安装包

$ tar-xvf zookeeper-3.4.5-cdh5.7.1.tar.gz-C app/cdh/

//删除安装包

$ rm-rf zookeeper-3.4.5-cdh5.7.1.tar.gz

//配置用户环境变量

$ vim.bash_profile

export ZOOKEEPER_HOME=/home/hadoop/app/cdh/zookeeper-3.4.5-cdh5.7.1

export PATH=$PATH:$ZOOKEEPER_HOME/bin

//使修改的环境变量生效

$ source.bash_profile

//修改zookeeper的配置文件

$ cd app/cdh/zookeeper-3.4.5-cdh5.7.1/conf/

$ cp zoo_sample.cfg zoo.cfg

$ vim zoo.cfg

#客户端心跳时间(毫秒)

tickTime=2000

#允许心跳间隔的最大时间

initLimit=10

#同步时限

syncLimit=5

#数据存储目录

dataDir=/home/hadoop/app/cdh/zookeeper-3.4.5-cdh5.7.1/data

#数据日志存储目录

dataLogDir=/home/hadoop/app/cdh/zookeeper-3.4.5-cdh5.7.1/data/log

#端口号

clientPort=2181

#集群节点和服务端口配置

server.1=hadoop-slave1:2888:3888

server.2=hadoop-slave2:2888:3888

server.3=hadoop-slave3:2888:3888

#以下为优化配置

#服务器最大连接数,默认为10,改为0表示无限制

maxClientCnxns=0

#快照数

autopurge.snapRetainCount=3

#快照清理时间,默认为0

autopurge.purgeInterval=1

//创建zookeeper的数据存储目录和日志存储目录

$ cd..

$ mkdir-p data/log

//在data目录中创建一个文件myid,输入内容为1

$ echo"1">> data/myid

//修改zookeeper的日志输出路径(注意CDH版与原生版配置文件不同)

$ vim libexec/zkEnv.sh

if ["x${ZOO_LOG_DIR}"="x" ]

then

ZOO_LOG_DIR="$ZOOKEEPER_HOME/logs"

fi

if ["x${ZOO_LOG4J_PROP}"="x" ]

then

ZOO_LOG4J_PROP="INFO,ROLLINGFILE"

fi

//修改zookeeper的日志配置文件

$ vim conf/log4j.properties

zookeeper.root.logger=INFO,ROLLINGFILE

//创建日志目录

$ mkdir logs

将hadoop-slave1节点上的Zookeeper目录同步到hadoop-slave2和hadoop-slave3节点,并修改Zookeeper的数据文件。此外,不要忘记设置用户环境变量。

//在hadoop-slave1中将zookeeper目录复制到其它节点

$ cd~

$ scp-r app/cdh/zookeeper-3.4.5-cdh5.7.1hadoop-slave2:/home/hadoop/app/cdh

$ scp-r app/cdh/zookeeper-3.4.5-cdh5.7.1 hadoop-slave3:/home/hadoop/app/cdh

//在hadoop-slave2中修改data目录中的myid文件

$ echo"2">app/cdh/zookeeper-3.4.5-cdh5.7.1/data/myid

//在hadoop-slave3中修改data目录中的myid文件

$ echo"3">app/cdh/zookeeper-3.4.5-cdh5.7.1/data/myid

最后,在安装了Zookeeper的各节点上启动Zookeeper,并查看节点状态,方法如下:

//启动

$ zkServer.sh start

//查看状态

$ zkServer.sh status

//关闭

centos 6.5怎么搭建hadoop2.7.3

总体思路,准备主从服务器,配置主服务器可以无密码SSH登录从服务器,解压安装JDK,解压安装Hadoop,配置hdfs、mapreduce等主从关系。

1、环境,3台CentOS6.5,64位,Hadoop2.7.3需要64位Linux,操作系统十几分钟就可以安装完成,

Master 192.168.0.182

Slave1 192.168.0.183

Slave2 192.168.0.184

2、SSH免密码登录,因为Hadoop需要通过SSH登录到各个节点进行操作,我用的是root用户,每台服务器都生成公钥,再合并到authorized_keys

(1)CentOS默认没有启动ssh无密登录,去掉/etc/ssh/sshd_config其中2行的注释,每台服务器都要设置,

#RSAAuthentication yes

#PubkeyAuthentication yes

(2)输入命令,ssh-keygen-t rsa,生成key,都不输入密码,一直回车,/root就会生成.ssh文件夹,每台服务器都要设置,

(3)合并公钥到authorized_keys文件,在Master服务器,进入/root/.ssh目录,通过SSH命令合并,

cat id_rsa.pub>> authorized_keys

ssh root@192.168.0.183 cat~/.ssh/id_rsa.pub>> authorized_keys

ssh root@192.168.0.184 cat~/.ssh/id_rsa.pub>> authorized_keys

(4)把Master服务器的authorized_keys、known_hosts复制到Slave服务器的/root/.ssh目录

(5)完成,ssh root@192.168.0.183、ssh root@192.168.0.184就不需要输入密码了

3、安装JDK,Hadoop2.7需要JDK7,由于我的CentOS是最小化安装,所以没有OpenJDK,直接解压下载的JDK并配置变量即可

(1)下载“jdk-7u79-linux-x64.gz”,放到/home/java目录下

(2)解压,输入命令,tar-zxvf jdk-7u79-linux-x64.gz

(3)编辑/etc/profile

export JAVA_HOME=/home/java/jdk1.7.0_79

export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin

(4)使配置生效,输入命令,source/etc/profile

(5)输入命令,java-version,完成

4、安装Hadoop2.7,只在Master服务器解压,再复制到Slave服务器

(1)下载“hadoop-2.7.0.tar.gz”,放到/home/hadoop目录下

(2)解压,输入命令,tar-xzvf hadoop-2.7.0.tar.gz

(3)在/home/hadoop目录下创建数据存放的文件夹,tmp、hdfs、hdfs/data、hdfs/name

5、配置/home/hadoop/hadoop-2.7.0/etc/hadoop目录下的core-site.xml

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://192.168.0.182:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>file:/home/hadoop/tmp</value>

</property>

<property>

<name>io.file.buffer.size</name>

<value>131702</value>

</property>

</configuration>

6、配置/home/hadoop/hadoop-2.7.0/etc/hadoop目录下的hdfs-site.xml

<configuration>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:/home/hadoop/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/home/hadoop/dfs/data</value>

</property>

<property>

<name>dfs.replication</name>

<value>2</value>

</property>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>192.168.0.182:9001</value>

</property>

<property>

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>

</configuration>

7、配置/home/hadoop/hadoop-2.7.0/etc/hadoop目录下的mapred-site.xml

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>192.168.0.182:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>192.168.0.182:19888</value>

</property>

</configuration>

8、配置/home/hadoop/hadoop-2.7.0/etc/hadoop目录下的mapred-site.xml

<configuration>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<name>yarn.resourcemanager.address</name>

<value>192.168.0.182:8032</value>

</property>

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>192.168.0.182:8030</value>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>192.168.0.182:8031</value>

</property>

<property>

<name>yarn.resourcemanager.admin.address</name>

<value>192.168.0.182:8033</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>192.168.0.182:8088</value>

</property>

<property>

<name>yarn.nodemanager.resource.memory-mb</name>

<value>768</value>

</property>

</configuration>

9、配置/home/hadoop/hadoop-2.7.0/etc/hadoop目录下hadoop-env.sh、yarn-env.sh的JAVA_HOME,不设置的话,启动不了,

export JAVA_HOME=/home/java/jdk1.7.0_79

10、配置/home/hadoop/hadoop-2.7.0/etc/hadoop目录下的slaves,删除默认的localhost,增加2个从节点,

192.168.0.183

192.168.0.184

11、将配置好的Hadoop复制到各个节点对应位置上,通过scp传送,

scp-r/home/hadoop 192.168.0.183:/home/

scp-r/home/hadoop 192.168.0.184:/home/

12、在Master服务器启动hadoop,从节点会自动启动,进入/home/hadoop/hadoop-2.7.0目录

(1)初始化,输入命令,bin/hdfs namenode-format

注意:执行这步的时候可能会报一个错误:

java.net.UnknownHostException: tiancunPC: tiancunPC: unknown error

at java.net.InetAddress.getLocalHost(InetAddress.java:1505)

at org.apache.hadoop.net.DNS.resolveLocalHostname(DNS.java:264)

at org.apache.hadoop.net.DNS.<clinit>(DNS.java:57)

at org.apache.hadoop.hdfs.server.namenode.NNStorage.newBlockPoolID(NNStorage.java:982)

at org.apache.hadoop.hdfs.server.namenode.NNStorage.newNamespaceInfo(NNStorage.java:591)

at org.apache.hadoop.hdfs.server.namenode.FSImage.format(FSImage.java:157)

at org.apache.hadoop.hdfs.server.namenode.NameNode.format(NameNode.java:992)

at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1434)

at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1559)

Caused by: java.net.UnknownHostException: tiancunPC: unknown error

at java.net.Inet4AddressImpl.lookupAllHostAddr(Native Method)

at java.net.InetAddress$2.lookupAllHostAddr(InetAddress.java:928)

at java.net.InetAddress.getAddressesFromNameService(InetAddress.java:1323)

at java.net.InetAddress.getLocalHost(InetAddress.java:1500)

... 8 more

16/11/11 19:15:23 WARN net.DNS: Unable to determine address of the host-falling back to"localhost" address

java.net.UnknownHostException: tiancunPC: tiancunPC: unknown error

at java.net.InetAddress.getLocalHost(InetAddress.java:1505)

at org.apache.hadoop.net.DNS.resolveLocalHostIPAddress(DNS.java:287)

at org.apache.hadoop.net.DNS.<clinit>(DNS.java:58)

at org.apache.hadoop.hdfs.server.namenode.NNStorage.newBlockPoolID(NNStorage.java:982)

at org.apache.hadoop.hdfs.server.namenode.NNStorage.newNamespaceInfo(NNStorage.java:591)

at org.apache.hadoop.hdfs.server.namenode.FSImage.format(FSImage.java:157)

at org.apache.hadoop.hdfs.server.namenode.NameNode.format(NameNode.java:992)

at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1434)

at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1559)

Caused by: java.net.UnknownHostException: tiancunPC: unknown error

at java.net.Inet4AddressImpl.lookupAllHostAddr(Native Method)

at java.net.InetAddress$2.lookupAllHostAddr(InetAddress.java:928)

at java.net.InetAddress.getAddressesFromNameService(InetAddress.java:1323)

at java.net.InetAddress.getLocalHost(InetAddress.java:1500)

... 8 more

linux中使用hostname查看为:

[root@tiancunPC hadoop-2.7.3]# hostname

tiancunPC

查看/etc/hosts为:

[root@tiancunPC hadoop-2.7.3]# cat/etc/hosts

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

难怪会映射不到,修改/etc/hosts

[root@tiancunPC hadoop-2.7.3]# cat/etc/hosts

127.0.0.1 tiancunPC localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

对应修改另外两个机器的主机名,在执行那个命令就可以了

(2)全部启动sbin/start-all.sh,也可以分开sbin/start-dfs.sh、sbin/start-yarn.sh

执行sbin/start-all.sh可能会有错误提示:

maps to localhost(IP), but this does not map back to the address

解决办法:

修改/etc/ssh/ssh_config

vim/etc/ssh/ssh_config

GSSAPIAuthentication no

这个时候可能还会出现这个错误提示:

hadoop出现namenode running as process 18472. Stop it first.,hadoopnamenode

解决办法:重新启动一下hadoop

(3)停止的话,输入命令,sbin/stop-all.sh

(4)输入命令,jps,可以看到相关信息

国内hadoop发行版有哪些公司在做,哪个比较好

国内hadoop发行版有哪些公司在做,哪个比较好?

星环资讯科技(上海)有限公司的TRANSWARP,用着不错,SQL相容性很好。

公司创始人孙元浩是2013年中国Hadoop Summit主席。曾是Intel资料中心软体部亚太区CTO,专注大资料基础技术的研发,并且在国内建立多个大资料应用案例,是Hadoop早期应用的开拓者。

国内有哪些比较好的 Linux发行版

最好的回归发行版:openSUSE

最可定制的发行版: Arch Linux

最好看的发行版:elementary OS

最好的教育作业系统:ezgo Linux

最佳新人:Solus

最好的教育作业系统:ezgo Linux

最好的云作业系统:Chrome OS

最好的笔记本作业系统:Ubuntu MATE

推荐一本书《linux就该这么学》,内容很富,值得一看。

国内linux发行版的话,主推deepin,成熟,有想法。自主软体相对靠谱,符合国人操作习惯。另外就是ubuntu麒麟了,不过个人感觉不如直接安原版ubuntu,虽然其他发行版挺多的,不过好多并不好用,而且一部分就是在骗经费。红旗死过一次,听说复活了,不过也实在没啥亮点

Linux装哪个发行版比较好?

如果你能玩透这两个系统,那基本上离玩家不远了。

玩这个就很Geek了,因为它是教你从0开始编译Linux核心,然后搭建出一个Linux发行版,挺有趣的,在这个过程中会学习到很多关于Linux更底层的东西,对于整个Linux有更深的了解

以上回答你满意么?

国内酒店设计公司都有哪些?哪个比较好?

HHD深圳假日东方设计做的出色,他们设计的酒店,会融入多种设计风格,让酒店的品味整体得到提升,可以更好地吸引住客!

哪个 Linux发行版比较好看

Elementary OS中文版-号称最漂亮的 Linux系统!基于 Ubuntu的精美发行版。

一般用来做桌面系统的linux发行版都是基于Ubuntu的。

建议你可以先选一个入手,以后可以慢慢换。 Gnome,KDE都可以尝试一下。

Linux哪个发行版比较好用?

推荐以下系统:

Fedora 7

Ubuntu 7.04

FedoraCore 6

之所以推荐上面的系统,是因为这些Linux发行版使用者数量多,而且都有很大的交流社群,网上也有很多资料可以查阅。

国内外流行的Linux发行版有哪些

1. RedHat

国内乃至全世界的Linux使用者最熟悉的发行版相比就是RedHat,1994年,Marc Ewing(美国人,卡内基梅隆大学毕业)释出了Red Hat Linux 1.0。目前RedHat分为两个系列:一个是Red Hat Enterprise Linux(简称RHEL),redhat提供收费技术支援和更新,适合伺服器使用者;另一个是Fedora(第七版以前为Fedora Core),它的定位是桌面使用者,Fedora是红帽公司新技术的实验场,许多新的技术都会在Fedora Core中检验,如果稳定的话红帽公司则会考虑加入Red Hat Enterprise Linux中。Fedora预计每年发行2~3次的发行版本。是RHEL的一个测试版本或预发版本,另外一个值得注意的是CentOS(Community Enterprise Operating System),是RHEL原始码再编译的产物的免费版,它继承了Red Hat Linux的稳定性,而且又提供免费更新。2014年1月8日CentOS宣布加入红帽公司,承诺继续免费。目前最新版本分别是RHEL6.5、CentOS6.5、Fedara20。

2. SUSE

SUSE是欧洲大陆最流行的LINUX,也是现存的最古老的商业发行版之一,起源于德国,于2003年末被Novell收购。主要版本有:SUSE Linux,针对个人使用者,可以免费下载;另一个是SUSE Linux Enterprise Server(SLES)是基于企业伺服器端的。如果需要使用资料库高阶服务和电子邮件网路应用可以选SUSE。

3. Debian

Debian最早由Ian Murdock于1993年释出,是迄今为止组遵循GNU规范的linux系统。系统中绝大部分基础工具来自于GNU工程,因此“Debian”常指Debian GNU/Linux。最新版本是2013年5月4日释出的Debian7.0 wheezy。

4. Ubuntu

现在最流行的linux桌面系统是ubuntu。Ubuntu(乌班图)是基于Debian GNU/Linux,支援x86、amd64(即x64)和ppc架构,由全球化的专业开发团队(Canonical Ltd)打造的开源GNU/Linux作业系统。为桌面虚拟化提供支援平台。Ubuntu对GNU/Linux的普及特别是桌面普及作出了巨大贡献,由此使更多人共享开源的成果与精彩。uabntu主要版本有基于Gnome的ubuntu,基于KDE的Kubuntu,基于Xfce的Xubuntu你就根据自己的爱好在ubuntu、kubuntu以及xubuntu中选一款,三者的区别仅仅是桌面程式的不一样。ubuntu最新版本是13.10,于2013年10月17号释出(版本号基于释出日期)。

5. Gentoo

Gentoo是Linux世界最年轻的发行版本,正因为年轻,所以能吸取在她之前的所有发行版本的优点。Gentoo最初由Daniel Robbins(FreeBSD的开发者之一)建立,首个稳定版本释出于2002年。由于开发者对FreeBSD的熟识,所以Gentoo拥有媲美FreeBSD的广受美誉的ports系统——Portage包管理系统。不同于APT和YUM等二进位制档案分发的包管理系统,Portage是基于原始码分发的,必须编译后才能执行,对于大型软体而言比较慢,不过正因为所有软体都是在本地机器编译的,在经过各种定制的编译引数优化后,能将机器的硬体效能发挥到极致。Gentoo是所有Linux发行版本里安装最复杂的,但是又是安装完成后最便于管理的版本,也是在相同硬体环境下执行最快的版本。

国内极客联盟有哪些?哪个比较好?

知乐极客目前是最好的,他们那都是数码达人玩的高科技玩意。

哪个Linux的发行版比较好用

Linux系统开源的,所以有好多公司的,主要看你用作什么?有桌面版的方便从Windows过度:Ubuntu、SUSE等的,伺服器的话目前大部分都是Redhat的centos,目前都到centos 7.X版本了。

2017年度最热门 Linux桌面发行版由 Ubuntu以 18.17%的得票率夺冠,排在第二名的是 Linux Mint,得票率为 18.02%,Slackware以 16.79%排名第三,高于第四名 Debian的 12.82%。在桌面版中排名第三的 Slackware,以 22.40%的得票率获得年度 Linux伺服器版本的第一名,不过第二名与第三名的得票率也非常接近,分别为 21.86%的 CentOS,和 19.67%的 Debian Stable。

阅读剩余
THE END