什么是批處理 hive和hbase有什么區(qū)別?
hive和hbase有什么區(qū)別?共同點(diǎn):1.hbase與hive都是架構(gòu)在hadoop之上的。都是用hadoop作為底層存儲(chǔ)區(qū)別:2.Hive是建立在Hadoop之上為了減少M(fèi)apReduce job
hive和hbase有什么區(qū)別?
共同點(diǎn):
1.hbase與hive都是架構(gòu)在hadoop之上的。都是用hadoop作為底層存儲(chǔ)區(qū)別:
2.Hive是建立在Hadoop之上為了減少M(fèi)apReduce jobs編寫(xiě)工作的批處理系統(tǒng),HBase是為了支持彌補(bǔ)Hadoop對(duì)實(shí)時(shí)操作的缺陷的項(xiàng)目 。
3.想象你在操作RMDB數(shù)據(jù)庫(kù),如果是全表掃描,就用Hive Hadoop,如果是索引訪問(wèn),就用HBase Hadoop 。
4.Hive query就是MapReduce jobs可以從5分鐘到數(shù)小時(shí)不止,HBase是非常高效的,肯定比Hive高效的多。
5.Hive本身不存儲(chǔ)和計(jì)算數(shù)據(jù),它完全依賴于HDFS和MapReduce,Hive中的表純邏輯。
6.hive借用hadoop的MapReduce來(lái)完成一些hive中的命令的執(zhí)行7.hbase是物理表,不是邏輯表,提供一個(gè)超大的內(nèi)存hash表,搜索引擎通過(guò)它來(lái)存儲(chǔ)索引,方便查詢操作。8.hbase是列存儲(chǔ)。9.hdfs作為底層存儲(chǔ),hdfs是存放文件的系統(tǒng),而Hbase負(fù)責(zé)組織文件。10.hive需要用到hdfs存儲(chǔ)文件,需要用到MapReduce計(jì)算框架。