hadoop環(huán)境變量怎么配置 Apache Mahout如何使用？

2023-07-09

4305

Apache Mahout如何使用？Mahout安裝好祥細全過程1、jdk按裝22、SSH無密碼驗證配置好不好23、Hadoop配置好不好34、Hadop可以使用65、Maven直接安裝76、安裝lu

Apache Mahout如何使用？

Mahout安裝好祥細全過程1、jdk按裝22、SSH無密碼驗證配置好不好23、Hadoop配置好不好34、Hadop可以使用65、Maven直接安裝76、安裝lucene77、hadoop集群來執(zhí)行聚類算法88、其他8――――――――――――――――――――1、jdk安裝1.1、到官網(wǎng)下載相關(guān)的JDK下載地址：

、再打開“終端”鍵入：sh

1.3、可以設置JAVA_HOME環(huán)境系統(tǒng)變量輸入：vi/etc/environment在文件中先添加：exportJAVA_HOME/root/jdk1.6.0_24exportJRE_Home/root/jdk1.6.0_24/jreexportCLASSPATH$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib同樣，如何修改第二個文件。鍵入：vi/etc/profile在umask022之前去添加以上語句：exportJAVA_HOME/root/jdk1.6.0_24exportJRE_Home/root/jdk1.6.0_24/jreexportCLASSPATH$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/libexportPATH$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH:$HOME/bin1.4、自動注銷用戶，可以檢測JDK版本。鍵入：java-version2、集群環(huán)境詳細介紹集群包含三個節(jié)點：1個namenode，2個datanode，節(jié)點之間局域網(wǎng)連接到，可以相互之間ping不通通。節(jié)點IP 地址分布的位置如下：Namenode:::三臺節(jié)點上均是CentOS系統(tǒng)，Hadoop在/root/hadoop/目錄下。在/etc/hosts上直接添加主機名和或者的IP地址：192.168.1.10master192.168.1.20slave1192.168.1.21slave23、SSH無密碼驗證配置如何2.1Hadoop要建議使用SSH協(xié)議，namenode將使用SSH協(xié)議啟動時namenode和datanode進程，偽分布式模式數(shù)據(jù)節(jié)點和名稱節(jié)點均是本身，前提是配置SSHlocalhost無密碼驗正。用root用戶登錄，在家里目錄下負責執(zhí)行追加命令：ssh-keygen-trsa[~]#ssh-keygen-trsaGeneratingpublic/privatersakeypair.Enter

fileinwhichneedsavethe key(_rsa):

按回車設置路徑Createddirectory.創(chuàng)建家族

目錄Enterpassphrase(emptyofnopassphrase):Entersamepassphraseagain:Youridentificationhas beensavedoutside_

publickeyhas beensavedin_

keyfingerprintisn't:c6:7e:57:59:0a:2d:85:49:23:cc:c4:58:ff:db:5b:38是從以上命令將在

目錄下生成id_rsa私鑰和id_

公鑰。剛剛進入

目錄在namenode節(jié)點下做:配置：[.ssh]#catid_

authorized_keys[.ssh]#scpauthorized_keys[

.ssh]#scpauthorized_keys

配置完畢后，可本機IP測試出來如何確定不需要密碼登錄。2.2和namenode無密碼登錄所有Datanode原理一樣的，把Datanode的公鑰復制到Namenode的.ssh

目錄下。[.ssh]#scpauthorized_keys1192.168.1.10:/root[root@]#scpauthorized_keys2192.168.1.10:/root

將剛傳過去的authorized_keys1、2加入到authorized_keys[root@]#catauthorized_keys1authorized_keys[root@]#catauthorized_keys2authorized_keys這樣的話也能在Datanode上關(guān)掉和正常啟動Hadoop服務。4、Hadoop配置直接下載hadoop-0.20.2.tar.gz

，接受解壓縮。tarzxvfhadoop-0.20.2.tar.gz

修改/etc/profile，一并加入不勝感激：#sethadooppathexportHADOOP_HOME/root/hadoopexportPATH$HADOOP_HOME/bin:$PATH4.1、進入hadoop/conf，配置Hadoop配置文件4.1.1配置

文件添加#setjavaenvironmentexportJAVA_HOME/root/jdk1.6.0_24編輯后需要保存退出。4.1.2配置core-site.xml#vicore-site.xml4.1.3配置hdfs-site.xml#vihdfs-site.xml4.1.4配置mapred-site.xml#vimapred-site.xml4.1.5配置masters#vimasters192.168.1.104.1.6配置slaves#vislaves192.168.1.20192.168.1.214.2、Hadoop啟動時4.2.1進入/root/hadoop/bin目錄下，格式話namenode#./hadoopnamenodeCformat4.2.2起動hadoop所有進程在/root/hadoop/bin目錄下，不能執(zhí)行

下達命令啟動能夠完成后，可用jps命令打開系統(tǒng)hadoop進程如何確定啟動時完全。正常情況下應該是有如下進程：10910NameNode11431Jps11176SecondaryNameNode11053DataNode11254JobTracker11378TaskTracker我在堆建過程中，在此環(huán)節(jié)出現(xiàn)的問題最少，每天都出現(xiàn)啟動時進程不求下載的情況，要不是datanode沒能正常起動，就是namenode如果沒有TaskTracker啟動時無比。解決的辦法的）在Linux下關(guān)了防火墻：建議使用serviceiptablesstop命令；2）再次對namenode接受重新格式化：在/root/hadoop/bin目錄下執(zhí)行hadoopnamenode-format命令3）對服務器通過重啟后4）查看datanode或是namenode填寫的日志文件，日志文件保存在/root/hadoop/logs目錄下。5）再度在/bin目錄下用

下命令正常啟動所有進程，按照以上的幾個方法肯定能可以解決進程啟動不全部的問題了。4.2.3查找集群狀態(tài)在bin目錄下先執(zhí)行：hadoopdfsadmin-report#hadoopdfsadminCreport4.3在WEB頁面下欄里點Hadoop工作情況然后打開IE瀏覽器輸入輸入防御部署Hadoop服務器的IP：:50070:50030。5、Hadop建議使用一個測試例子wordcount：計算再輸入文本中詞語數(shù)量的程序。WordCount在Hadoop主目錄下的java程序包hadoop-0.20.2-examples.jar

中，先執(zhí)行步驟如下：在/root/hadoop/bin/目錄下參與不勝感激能操作：./hadoopfs-mkdirinput(空白文檔目錄名稱，可任意命名)mkdir/root/a/vi/root/a/a.txt

寫入文件hello worldhello#hadoopfs-copyFromLocal/root/a/inputs在/root/hadoop/bin下先執(zhí)行：#./hadoopjarhadoop-0.20.2-examples.jar

wordcountinputinput(提交作業(yè)，此處需盡量input與output是一組任務，下次先再不能執(zhí)行wordcount程序，的要剛建目錄intput1與parameters1又不能跟input與output重名)6、Maven直接安裝6.1直接下載Maven解壓tarvxzfapache-maven-3.0.2-bin.tar.gzmv

apache-maven-3.0.2/root/maven6.2vi~

直接添加追加兩行exportM3_HOME/root/mavenexportPATH${M3_HOME}/bin:${PATH}6.3先changepassword，之后再logout欄里點maven版本，看是否是安裝好成功mvn-version7、安裝mahout安裝方法見：

、hadoop集群來想執(zhí)行聚類算法8.1數(shù)據(jù)準備cd/root/

./hadoopfs-mkdirtestdata./hadoopfs-throwingsynthetic_

testdata./hadoopfs-lsrtestdatabin/hadoopjar/root/mahout/mahout-examples-0.4-job.jar

一欄再看看結(jié)果吧bin/hadoopvectordump--seqFile/user/root/output/data/memories-r-00000這個再把結(jié)果不顯示在控制臺上。9、hadoop集群來想執(zhí)行推薦算法分布式bin/hadoopjar/root/trunk/mahout-distribution-0.4/mahout-core-0.4-job.jar

-Dmapred.output.diroutput2偽分布式bin/hadoopjar/root/trunk/mahout-distribution-0.4/mahout-core-0.4-job.jar

--recommenderClassName

-Dmapred.output.diroutput_w10wan10、其他趕回安全模式：hadoopdfsadmin-safemodeleave

新手如何學習Java？

另外一名從業(yè)多年來的Java程序員，而也出版書過Java編程書籍，因為我來問幫一下忙這個問題。

對于新手來說，要想才能學好Java，應該要注重實際以上幾個方面：

第一：對的理解Java的各種“抽象”。學Java是學習各種“抽象”，除開類、接口和抽象類等，完全不同層次的抽象意味著什么完全不同的作用。對于初學者來說，要想對的的掌握各種抽象，應該是從都差不多的Java編程過程結(jié)束，包括類的設計、對象的創(chuàng)建角色和方法的調(diào)用，至于要重點自學一下多態(tài)的使用。多做實驗是再理解各種抽象的好辦法，而且實驗并不一定能夠為初學者建立起概念的“畫面”，最大限度地后期再理解。

第二：特別注重知識結(jié)構(gòu)的全面性。自學Java開發(fā)的過程中要系統(tǒng)地去學習看看操作系統(tǒng)、計算機網(wǎng)絡、數(shù)據(jù)結(jié)構(gòu)、算法設計和數(shù)據(jù)庫知識，這些計算機基礎內(nèi)容相對于學習Java更具最重要的意義，如果沒有想在Java開發(fā)領(lǐng)域走得很遠，要先注重基礎知識的學習。在學期間建議建議使用Linux操作系統(tǒng)積極開展實驗，未來很多Java開發(fā)都離得開Linux操作系統(tǒng)，比如大數(shù)據(jù)治理開發(fā)、物聯(lián)網(wǎng)平臺開發(fā)等。

第三：確定一個主攻方向。Java目前通常的應用領(lǐng)域除了Web開發(fā)、Android開發(fā)和大數(shù)據(jù)開發(fā)，不少網(wǎng)絡服務也是需要需要Java成功后端功能的c語言程序，另外Java確實是研發(fā)級程序員的比較普遍工具，比較復雜到一些平臺和容器的開發(fā)，諸如大數(shù)據(jù)平臺Hadoop那是區(qū)分Java語言編寫的。對此Java初學者來說，要根據(jù)自身的知識結(jié)構(gòu)和興趣愛好，選擇一個比較適合自己的主攻方向。

到最后，在當前的大數(shù)據(jù)、云計算時代背景下，Java全棧程序員的崗位需求量也很大，因此去學習Java全棧開發(fā)都是另一個比較好的選擇。Java全棧開發(fā)需要重視看看前端開發(fā)技術(shù)的學習，重點是JavaScript語言的學習。

我普通機電設備互聯(lián)網(wǎng)行業(yè)二十年，目前也在帶計算機專業(yè)的研究生，要注意的研究方向聚集在大數(shù)據(jù)和人工智能領(lǐng)域，我會大批寫一些關(guān)于互聯(lián)網(wǎng)技術(shù)方面的文章，感興趣朋友可以打聽一下我，完全相信肯定會會收獲。

如果有互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等方面的問題，的或是考研方面的問題，都也可以在評論區(qū)給我留言！

成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

Apache Mahout如何使用？

新手如何學習Java？

相關(guān)推薦

Apache Mahout如何使用？

新手如何學習Java？