首頁大數(shù)據(jù)技術(shù)文章正文

hadoop 2.x分布式安裝

更新時間:2018年08月06日15時37分來源:傳智播客瀏覽次數(shù):

　　這個安裝過程經(jīng)歷曲折，遇到了許多坑。

　　環(huán)境：Windows 7 Vm

　　我用了三臺虛擬機 centos

　　192.168.188.128 hadoop1(作為主服務(wù)器)

　　192.168.188.129 hadoop2

　　192.168.188.130 hadoop3

　　如果你們的安裝環(huán)境好了，接下來我們就開始安裝hadoop之旅吧!

　　1.配置jdk

　　jdk的配置這里不做講解，百度太多了。

　　2.下載hadoop

　　官網(wǎng)下載hadoop，我用的是3.0.3的版本。

　　3.我的hadoop 安裝目錄是 /home/user/hadoop

　　解壓出來。

　　4.修改hosts

　　vi /etc/hosts

　　輸入

　　192.168.188.128 hadoop1

　　192.168.188.129 hadoop2

　　192.168.188.130 hadoop3

　　保存退出

　　三臺機器都需要。

　　配置好了之后可以試試 ping hadoop2 試試 ping hadoop3 。各個機器都可以試試是否配置好了。

　　5.配置ssh免密登錄。

　　以上都是準(zhǔn)備工作，準(zhǔn)備工作做好了之后。

　　分別在三臺機器上運行以下

　　ssh-keygen -t rsa

　　一路回車(ENTER)到底

　　然后在主服務(wù)器上生成的id_rsa.pub 發(fā)送到從服務(wù)器

　　ssh-copy-id -i ~/.ssh/id_rsa.pub root@IP(換成你對應(yīng)的IP) -p (端口)

　　兩臺從服務(wù)器都要.如果遇到了需要輸入密碼，輸入密碼即可。

　　完成后，

　　在主服務(wù)器上試試 ssh hadoop2 ssh hadoop3，如果不需要密碼就能登錄說明配置成功.

　　注意：配置ssh我遇到的坑：出現(xiàn)了 WARING:REMOTE HOST IDENFIATE HAS CHANGED

　　這是因為我之前配置的時候將公鑰已經(jīng)添加到了ssh.pub里面。在ssh.pub里面找到出錯對應(yīng)的IP，將ip和公鑰一并刪除。然后在運行ssh-copy-id -i ~/.ssh/id_rsa.pub root@IP(換成你對應(yīng)的IP) -p (端口) 就好了。

　　6.配置各種文件

　　進入到 hadoop里面的etc文件夾下會看到一個hadoop的文件。然后進去

　　(1)配置core-site.xml

　　fs.defaultFS

　　hdfs://hadoop1:9000

　　hadoop.tmp.dir

　　/home/usr/hadoop/hadoopwork

　　下面的那個tmp.dir是臨時工作目錄，建議最好自己設(shè)定。如果是系統(tǒng)默認(rèn)的，linux會在每次開機之前清空。

　　所以最好自己設(shè)定一個。

　　(2)配置hdfs-site.xml

　　dfs.replication

　　dfs.namenode.secondary.http-address