成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

hive菜鳥教程 如何通俗地理解Hive的工作原理?

如何通俗地理解Hive的工作原理?有一個(gè)大倉(cāng)庫(kù),里面有10000個(gè)箱子。現(xiàn)在我們需要把這些箱子搬到門對(duì)面的倉(cāng)庫(kù)。我們可以讓一個(gè)工人先移動(dòng)它。如果我們每分鐘移動(dòng)一個(gè),需要一萬(wàn)分鐘?,F(xiàn)在我們找到了一個(gè)速度

如何通俗地理解Hive的工作原理?

有一個(gè)大倉(cāng)庫(kù),里面有10000個(gè)箱子。現(xiàn)在我們需要把這些箱子搬到門對(duì)面的倉(cāng)庫(kù)。

我們可以讓一個(gè)工人先移動(dòng)它。如果我們每分鐘移動(dòng)一個(gè),需要一萬(wàn)分鐘。

現(xiàn)在我們找到了一個(gè)速度更快的工人,他可以在半分鐘內(nèi)移動(dòng)一個(gè)。因此,它將在5000分鐘內(nèi)完成。當(dāng)然很棒,比如說(shuō),讓工人移動(dòng)得更快,比如說(shuō),20秒移動(dòng)一個(gè)?

但總有一個(gè)極限。畢竟,搬一個(gè)箱子很辛苦。這并不容易。

您還需要多少工人?例如,讓我們找100個(gè)工人??煲稽c(diǎn)嗎?

但是,還涉及到另一個(gè)問(wèn)題。雖然工作的人多了,但只有一扇門,100名工人擠在一起。雖然人多了,但效率沒(méi)有多大提高。許多人在門口等著。

玩過(guò)魔獸的人都知道,如果礦主太多,會(huì)有人在礦場(chǎng)外等著,所以如果每個(gè)礦場(chǎng)有5個(gè)以上的礦主,采礦速度不會(huì)提高。

那又怎樣?在游戲中,我們可以開一個(gè)新的礦井,這樣每個(gè)礦井可以分成5個(gè)農(nóng)戶來(lái)開采。

對(duì)于相應(yīng)的倉(cāng)庫(kù),我們可以多開幾扇門。例如,我們可以打開100個(gè)門,并為每個(gè)門分配幾個(gè)工人。這樣,我們能更快更同步地移動(dòng)箱子嗎?

這就是蜂巢中的map和reduce的原理。

當(dāng)然,這只是一個(gè)非常粗略的陳述,它還涉及許多細(xì)節(jié),例如如何在工人之間分配工作?如何將數(shù)據(jù)切割成“盒子”,如何將其堆放在新倉(cāng)庫(kù)中,如何開門,如何按順序移動(dòng)?

hbase和hive的差別是什么,各自適用在什么場(chǎng)景中?

1. HBase:基于Hadoop數(shù)據(jù)庫(kù),是NoSQL數(shù)據(jù)庫(kù);HBase表是物理表,適合存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù)。

2. Hive:它不存儲(chǔ)數(shù)據(jù),而是依賴HDFS和MapReduce,通過(guò)SQL計(jì)算和處理HDFS上的結(jié)構(gòu)化數(shù)據(jù);Hive中的表是純邏輯表。

這兩者通常一起使用。

1. HBase:實(shí)時(shí)隨機(jī)查詢海量詳細(xì)數(shù)據(jù),存儲(chǔ)采集到的web數(shù)據(jù);

2。配置單元:適用于離線批量數(shù)據(jù)計(jì)算,一般用于查詢分析和統(tǒng)計(jì)。