hive為什么適合大數(shù)據(jù) hive建表語(yǔ)句詳解?
hive建表語(yǔ)句詳解?hive是實(shí)現(xiàn)Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,單獨(dú)進(jìn)行數(shù)據(jù)其他提取、轉(zhuǎn)化、打開(kāi)程序。這是一種也可以存儲(chǔ)、查詢和分析存儲(chǔ)位置在Hadoop中的極大規(guī)模數(shù)據(jù)的機(jī)制。hive數(shù)據(jù)倉(cāng)庫(kù)工
hive建表語(yǔ)句詳解?
hive是實(shí)現(xiàn)Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,單獨(dú)進(jìn)行數(shù)據(jù)其他提取、轉(zhuǎn)化、打開(kāi)程序。
這是一種也可以存儲(chǔ)、查詢和分析存儲(chǔ)位置在Hadoop中的極大規(guī)模數(shù)據(jù)的機(jī)制。
hive數(shù)據(jù)倉(cāng)庫(kù)工具能將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫(kù)表,并可以提供SQL查詢功能,能將SQL語(yǔ)句變成MapReduce任務(wù)來(lái)想執(zhí)行。
hive的優(yōu)點(diǎn)是學(xué)習(xí)成本低,是可以實(shí)際類似SQL語(yǔ)句實(shí)現(xiàn)飛速M(fèi)apReduce統(tǒng)計(jì),使MapReduce變的越來(lái)越簡(jiǎn)單點(diǎn),而不必開(kāi)發(fā)完畢專業(yè)點(diǎn)的MapReduce應(yīng)用程序。
hive十分適合對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行統(tǒng)計(jì)分析。
Hive有哪些特點(diǎn)?
Hive的優(yōu)點(diǎn):
1.操作接口常規(guī)類sql語(yǔ)法,能提供迅速開(kāi)發(fā)的能力(簡(jiǎn)單的、容易上手)
2.避免了去寫(xiě)mapreduce,會(huì)減少了開(kāi)發(fā)人員的學(xué)習(xí)成本
的執(zhí)行延遲高比較比較高,所以hive常用無(wú)數(shù)據(jù)分析,對(duì)實(shí)時(shí)性要求不高的場(chǎng)景
的優(yōu)勢(shì)只在于處理大數(shù)據(jù),處理小數(shù)據(jù)沒(méi)有優(yōu)勢(shì),畢竟服務(wù)器延遲比較高
這個(gè)可以c語(yǔ)言設(shè)計(jì)自定義高速路,用戶這個(gè)可以參照自己的需求統(tǒng)合自己的函數(shù)
Hive的缺點(diǎn):
的Hql表達(dá)能力不大,迭代式算法根本無(wú)法怎樣表達(dá),數(shù)據(jù)挖掘方面也不弓術(shù),要注意是只不過(guò)mapreduce數(shù)據(jù)處理流程的限制,更有效率的算法根本無(wú)法基于
2.執(zhí)行效率比較低,而hive是自動(dòng)生成mapreduce作業(yè),通常情況下不太智能觸屏
3.調(diào)優(yōu)比較困難,粒度較粗