成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

hadoop的論文的摘要 淺談Spark和Hadoop作業(yè)之間的區(qū)別?

淺談Spark和Hadoop作業(yè)之間的區(qū)別?我認(rèn)為你所說(shuō)的Hadoop是map/reduce。主要區(qū)別如下:1。Mr-Jobs的資源控制是通過(guò)yarn實(shí)現(xiàn)的。Spark是否可以通過(guò)紗線控制資源。但是,

淺談Spark和Hadoop作業(yè)之間的區(qū)別?

我認(rèn)為你所說(shuō)的Hadoop是map/reduce。主要區(qū)別如下:

1。Mr-Jobs的資源控制是通過(guò)yarn實(shí)現(xiàn)的。Spark是否可以通過(guò)紗線控制資源。但是,如果將多個(gè)組件設(shè)置在一起(例如,群集中同時(shí)存在spark計(jì)劃和HBase查詢),建議使用yarn;

2。Spark基于內(nèi)存計(jì)算。計(jì)算的中間結(jié)果存儲(chǔ)在內(nèi)存中,可以訪問(wèn)行迭代計(jì)算;而Mr計(jì)算的中間結(jié)果是放到磁盤上,所以一個(gè)作業(yè)會(huì)涉及到對(duì)磁盤的重復(fù)讀寫(xiě),這也是性能不如spark的主要原因;

3。Mr的任務(wù)對(duì)應(yīng)于一個(gè)容器,每次都需要花費(fèi)大量的時(shí)間來(lái)啟動(dòng)。一些Hadoop版本(如華為oceaninsight)性能不同,Hadoop實(shí)現(xiàn)了容器預(yù)熱(重用)功能,可能消耗較少,而spark是基于線程池的,因此資源分配會(huì)更快。