成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

hadoop環(huán)境變量怎么配置 Apache Mahout如何使用?

Apache Mahout如何使用?Mahout安裝好祥細全過程1、jdk按裝22、SSH無密碼驗證配置好不好23、Hadoop配置好不好34、Hadop可以使用65、Maven直接安裝76、安裝lu

Apache Mahout如何使用?

Mahout安裝好祥細全過程1、jdk按裝22、SSH無密碼驗證配置好不好23、Hadoop配置好不好34、Hadop可以使用65、Maven直接安裝76、安裝lucene77、hadoop集群來執(zhí)行聚類算法88、其他8――――――――――――――――――――1、jdk安裝1.1、到官網(wǎng)下載相關的JDK下載地址:

、再打開“終端”鍵入:sh

1.3、可以設置JAVA_HOME環(huán)境系統(tǒng)變量輸入:vi/etc/environment在文件中先添加:exportJAVA_HOME/root/jdk1.6.0_24exportJRE_Home/root/jdk1.6.0_24/jreexportCLASSPATH$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib同樣,如何修改第二個文件。鍵入:vi/etc/profile在umask022之前去添加以上語句:exportJAVA_HOME/root/jdk1.6.0_24exportJRE_Home/root/jdk1.6.0_24/jreexportCLASSPATH$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/libexportPATH$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH:$HOME/bin1.4、自動注銷用戶,可以檢測JDK版本。鍵入:java-version2、集群環(huán)境詳細介紹集群包含三個節(jié)點:1個namenode,2個datanode,節(jié)點之間局域網(wǎng)連接到,可以相互之間ping不通通。節(jié)點IP 地址分布的位置如下:Namenode:::三臺節(jié)點上均是CentOS系統(tǒng),Hadoop在/root/hadoop/目錄下。在/etc/hosts上直接添加主機名和或者的IP地址:192.168.1.10master192.168.1.20slave1192.168.1.21slave23、SSH無密碼驗證配置如何2.1Hadoop要建議使用SSH協(xié)議,namenode將使用SSH協(xié)議啟動時namenode和datanode進程,偽分布式模式數(shù)據(jù)節(jié)點和名稱節(jié)點均是本身,前提是配置SSHlocalhost無密碼驗正。用root用戶登錄,在家里目錄下負責執(zhí)行追加命令:ssh-keygen-trsa[~]#ssh-keygen-trsaGeneratingpublic/privatersakeypair.Enter

fileinwhichneedsavethe key(_rsa):

按回車設置路徑Createddirectory.創(chuàng)建家族

目錄Enterpassphrase(emptyofnopassphrase):Entersamepassphraseagain:Youridentificationhas beensavedoutside_

publickeyhas beensavedin_

keyfingerprintisn't:c6:7e:57:59:0a:2d:85:49:23:cc:c4:58:ff:db:5b:38是從以上命令將在

目錄下生成id_rsa私鑰和id_

公鑰。剛剛進入

目錄在namenode節(jié)點下做:配置:[.ssh]#catid_

authorized_keys[.ssh]#scpauthorized_keys[

.ssh]#scpauthorized_keys

配置完畢后,可本機IP測試出來如何確定不需要密碼登錄。2.2和namenode無密碼登錄所有Datanode原理一樣的,把Datanode的公鑰復制到Namenode的.ssh

目錄下。[.ssh]#scpauthorized_keys1192.168.1.10:/root[root@]#scpauthorized_keys2192.168.1.10:/root

將剛傳過去的authorized_keys1、2加入到authorized_keys[root@]#catauthorized_keys1authorized_keys[root@]#catauthorized_keys2authorized_keys這樣的話也能在Datanode上關掉和正常啟動Hadoop服務。4、Hadoop配置直接下載hadoop-0.20.2.tar.gz

,接受解壓縮。tarzxvfhadoop-0.20.2.tar.gz

修改/etc/profile,一并加入不勝感激:#sethadooppathexportHADOOP_HOME/root/hadoopexportPATH$HADOOP_HOME/bin:$PATH4.1、進入hadoop/conf,配置Hadoop配置文件4.1.1配置

文件添加#setjavaenvironmentexportJAVA_HOME/root/jdk1.6.0_24編輯后需要保存退出。4.1.2配置core-site.xml#vicore-site.xml4.1.3配置hdfs-site.xml#vihdfs-site.xml4.1.4配置mapred-site.xml#vimapred-site.xml4.1.5配置masters#vimasters192.168.1.104.1.6配置slaves#vislaves192.168.1.20192.168.1.214.2、Hadoop啟動時4.2.1進入/root/hadoop/bin目錄下,格式話namenode#./hadoopnamenodeCformat4.2.2起動hadoop所有進程在/root/hadoop/bin目錄下,不能執(zhí)行

下達命令啟動能夠完成后,可用jps命令打開系統(tǒng)hadoop進程如何確定啟動時完全。正常情況下應該是有如下進程:10910NameNode11431Jps11176SecondaryNameNode11053DataNode11254JobTracker11378TaskTracker我在堆建過程中,在此環(huán)節(jié)出現(xiàn)的問題最少,每天都出現(xiàn)啟動時進程不求下載的情況,要不是datanode沒能正常起動,就是namenode如果沒有TaskTracker啟動時無比。解決的辦法的)在Linux下關了防火墻:建議使用serviceiptablesstop命令;2)再次對namenode接受重新格式化:在/root/hadoop/bin目錄下執(zhí)行hadoopnamenode-format命令3)對服務器通過重啟后4)查看datanode或是namenode填寫的日志文件,日志文件保存在/root/hadoop/logs目錄下。5)再度在/bin目錄下用

下命令正常啟動所有進程,按照以上的幾個方法肯定能可以解決進程啟動不全部的問題了。4.2.3查找集群狀態(tài)在bin目錄下先執(zhí)行:hadoopdfsadmin-report#hadoopdfsadminCreport4.3在WEB頁面下欄里點Hadoop工作情況然后打開IE瀏覽器輸入輸入防御部署Hadoop服務器的IP::50070:50030。5、Hadop建議使用一個測試例子wordcount:計算再輸入文本中詞語數(shù)量的程序。WordCount在Hadoop主目錄下的java程序包hadoop-0.20.2-examples.jar

中,先執(zhí)行步驟如下:在/root/hadoop/bin/目錄下參與不勝感激能操作:./hadoopfs-mkdirinput(空白文檔目錄名稱,可任意命名)mkdir/root/a/vi/root/a/a.txt

寫入文件hello worldhello#hadoopfs-copyFromLocal/root/a/inputs在/root/hadoop/bin下先執(zhí)行:#./hadoopjarhadoop-0.20.2-examples.jar

wordcountinputinput(提交作業(yè),此處需盡量input與output是一組任務,下次先再不能執(zhí)行wordcount程序,的要剛建目錄intput1與parameters1又不能跟input與output重名)6、Maven直接安裝6.1直接下載Maven解壓tarvxzfapache-maven-3.0.2-bin.tar.gzmv

apache-maven-3.0.2/root/maven6.2vi~

直接添加追加兩行exportM3_HOME/root/mavenexportPATH${M3_HOME}/bin:${PATH}6.3先changepassword,之后再logout欄里點maven版本,看是否是安裝好成功mvn-version7、安裝mahout安裝方法見:

、hadoop集群來想執(zhí)行聚類算法8.1數(shù)據(jù)準備cd/root/

./hadoopfs-mkdirtestdata./hadoopfs-throwingsynthetic_

testdata./hadoopfs-lsrtestdatabin/hadoopjar/root/mahout/mahout-examples-0.4-job.jar

一欄再看看結果吧bin/hadoopvectordump--seqFile/user/root/output/data/memories-r-00000這個再把結果不顯示在控制臺上。9、hadoop集群來想執(zhí)行推薦算法分布式bin/hadoopjar/root/trunk/mahout-distribution-0.4/mahout-core-0.4-job.jar

-Dmapred.output.diroutput2偽分布式bin/hadoopjar/root/trunk/mahout-distribution-0.4/mahout-core-0.4-job.jar

--recommenderClassName

-Dmapred.output.diroutput_w10wan10、其他趕回安全模式:hadoopdfsadmin-safemodeleave

新手如何學習Java?

另外一名從業(yè)多年來的Java程序員,而也出版書過Java編程書籍,因為我來問幫一下忙這個問題。

對于新手來說,要想才能學好Java,應該要注重實際以上幾個方面:

第一:對的理解Java的各種“抽象”。學Java是學習各種“抽象”,除開類、接口和抽象類等,完全不同層次的抽象意味著什么完全不同的作用。對于初學者來說,要想對的的掌握各種抽象,應該是從都差不多的Java編程過程結束,包括類的設計、對象的創(chuàng)建角色和方法的調用,至于要重點自學一下多態(tài)的使用。多做實驗是再理解各種抽象的好辦法,而且實驗并不一定能夠為初學者建立起概念的“畫面”,最大限度地后期再理解。

第二:特別注重知識結構的全面性。自學Java開發(fā)的過程中要系統(tǒng)地去學習看看操作系統(tǒng)、計算機網(wǎng)絡、數(shù)據(jù)結構、算法設計和數(shù)據(jù)庫知識,這些計算機基礎內容相對于學習Java更具最重要的意義,如果沒有想在Java開發(fā)領域走得很遠,要先注重基礎知識的學習。在學期間建議建議使用Linux操作系統(tǒng)積極開展實驗,未來很多Java開發(fā)都離得開Linux操作系統(tǒng),比如大數(shù)據(jù)治理開發(fā)、物聯(lián)網(wǎng)平臺開發(fā)等。

第三:確定一個主攻方向。Java目前通常的應用領域除了Web開發(fā)、Android開發(fā)和大數(shù)據(jù)開發(fā),不少網(wǎng)絡服務也是需要需要Java成功后端功能的c語言程序,另外Java確實是研發(fā)級程序員的比較普遍工具,比較復雜到一些平臺和容器的開發(fā),諸如大數(shù)據(jù)平臺Hadoop那是區(qū)分Java語言編寫的。對此Java初學者來說,要根據(jù)自身的知識結構和興趣愛好,選擇一個比較適合自己的主攻方向。

到最后,在當前的大數(shù)據(jù)、云計算時代背景下,Java全棧程序員的崗位需求量也很大,因此去學習Java全棧開發(fā)都是另一個比較好的選擇。Java全棧開發(fā)需要重視看看前端開發(fā)技術的學習,重點是JavaScript語言的學習。

我普通機電設備互聯(lián)網(wǎng)行業(yè)二十年,目前也在帶計算機專業(yè)的研究生,要注意的研究方向聚集在大數(shù)據(jù)和人工智能領域,我會大批寫一些關于互聯(lián)網(wǎng)技術方面的文章,感興趣朋友可以打聽一下我,完全相信肯定會會收獲。

如果有互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等方面的問題,的或是考研方面的問題,都也可以在評論區(qū)給我留言!