numpy如何與pandas結合 Java和Python哪個用的更多?
Java和Python哪個用的更多?兩個語言的使用場景不一樣的。Java更攻擊傾向于計算機應用系統(tǒng)的最終形成,學習成本較高,只不過嚴謹性強的。Python則更傾向數(shù)據(jù)科學,入門門檻低,使用場景都很豐富
Java和Python哪個用的更多?
兩個語言的使用場景不一樣的。Java更攻擊傾向于計算機應用系統(tǒng)的最終形成,學習成本較高,只不過嚴謹性強的。Python則更傾向數(shù)據(jù)科學,入門門檻低,使用場景都很豐富地感覺有趣。目前行業(yè)上Java會多一些,應為業(yè)務應用系統(tǒng)都不一樣要變化莫測如何處理。Python的數(shù)據(jù)處理,也是可以中心處理,要比人少些。
Hadoop支持用python開發(fā)嗎?還有哪些支持python的分布式計算系統(tǒng)框架?
Hadoop支持用python的新嗎?外,還有哪些支持什么python的分布式計算系統(tǒng)框架,大數(shù)據(jù)操作系統(tǒng)(可視化)可以用python旗下嗎?
hadoop接受python,我再理解的是任務被yarn批復到工作節(jié)點,按照shell被調(diào)用。這種比原生的MR還慢,因此沒大有人用吧。
spark應該是是對python也很敵視的框架了。要說缺點,況且是scala或java風格的api,用起來太少python。再應該是用過pandas和numpy,感覺上spark的api我還是也很基礎。
除了,python推薦一下你知道一點下dask,celery這兩個框架。dask是實現(xiàn)numpy,pandas裸芯片的,不兼容大部分np,pd的接口。且支持什么分布式,有可視化界面。整體來說是比較不錯的選擇。
celery是一個分布式任務調(diào)度框架,本身啊,設計并又不是專門目的是etl,所以性能會比dask差一些。但個人感覺充當生產(chǎn)系統(tǒng)使用,celery穩(wěn)定性稍低一些。