hbase常用命令及使用方法 hbase和hive的差別是什么,各自適用在什么場(chǎng)景中?
hbase和hive的差別是什么,各自適用在什么場(chǎng)景中? 1. HBase:基于Hadoop數(shù)據(jù)庫(kù),是NoSQL數(shù)據(jù)庫(kù);HBase表是物理表,適合存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù)。2. Hive:它不存儲(chǔ)數(shù)據(jù),而是依
hbase和hive的差別是什么,各自適用在什么場(chǎng)景中?
1. HBase:基于Hadoop數(shù)據(jù)庫(kù),是NoSQL數(shù)據(jù)庫(kù);HBase表是物理表,適合存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù)。
2. Hive:它不存儲(chǔ)數(shù)據(jù),而是依賴HDFS和MapReduce,通過SQL計(jì)算和處理HDFS上的結(jié)構(gòu)化數(shù)據(jù);Hive中的表是純邏輯表。
這兩者通常一起使用。
1. HBase:實(shí)時(shí)隨機(jī)查詢海量詳細(xì)數(shù)據(jù),存儲(chǔ)采集到的web數(shù)據(jù);
2。配置單元:適用于離線批量數(shù)據(jù)計(jì)算,一般用于查詢分析和統(tǒng)計(jì)。
想自學(xué)大數(shù)據(jù),不知道從哪里學(xué)起,有什么書籍和學(xué)習(xí)路線推薦么?
謝謝!筆者剛剛簽了一份大數(shù)據(jù)挖掘工程師的合同,到了研究生階段才轉(zhuǎn)向大數(shù)據(jù)方向。目前大數(shù)據(jù)火爆,很多學(xué)生都想上交,但自學(xué)的學(xué)習(xí)路線因人而異。
以我自己為例,作者出生于Python數(shù)據(jù)分析領(lǐng)域,具有通用編程能力。因此,在此基礎(chǔ)上,他首先學(xué)習(xí)了Linux的基本操作命令,安裝了Ubuntu的雙系統(tǒng),并進(jìn)一步安裝了Hadoop和spark組件。在此基礎(chǔ)上,他利用pypark操作spark大數(shù)據(jù)框架進(jìn)行學(xué)習(xí)。您可以推薦以下書籍:
pypark實(shí)用指南
,由淺入深,非常好用。