成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

hadoop能用python開發(fā)嗎 Hadoop支持用python開發(fā)嗎?還有哪些支持python的分布式計(jì)算系統(tǒng)框架?

Hadoop支持用python開發(fā)嗎?還有哪些支持python的分布式計(jì)算系統(tǒng)框架?Hadoop支持python。我的理解是,任務(wù)通過(guò)yarn分配到工作節(jié)點(diǎn),并通過(guò)shell調(diào)用。這種方法比原生Mr速

Hadoop支持用python開發(fā)嗎?還有哪些支持python的分布式計(jì)算系統(tǒng)框架?

Hadoop支持python。我的理解是,任務(wù)通過(guò)yarn分配到工作節(jié)點(diǎn),并通過(guò)shell調(diào)用。這種方法比原生Mr速度慢,因此沒(méi)有得到廣泛的應(yīng)用。

Spark應(yīng)該是Python的友好框架。要說(shuō)缺點(diǎn),畢竟是Scala或Java風(fēng)格的API,這對(duì)于Python是不夠的。在使用了panda和numpy之后,我覺(jué)得spark的API是比較基本的。

此外,python建議您學(xué)習(xí)dask和芹菜。Dask基于numpy和panda進(jìn)行封裝,兼容大多數(shù)NP和PD接口。它還支持分布式和可視化界面。總的來(lái)說(shuō),這是個(gè)不錯(cuò)的選擇。

作為一個(gè)分布式任務(wù)調(diào)度框架,cellery并不是專門為ETL設(shè)計(jì)的,所以它的性能比dask差。但我覺(jué)得作為一個(gè)生產(chǎn)體系,芹菜比較穩(wěn)定。