亚洲精品免费日日日夜夜夜夜,日本成人午夜,国产欧美日韩在线不卡第一页

Hive和HBase的區(qū)別

2017.11.06

以下由網(wǎng)上內(nèi)容整理：

Hive是為了簡化編寫MapReduce程序而生的，使用MapReduce做過數(shù)據(jù)分析的人都知道，很多分析程序除業(yè)務(wù)邏輯不同外，程序流程基本一樣。在這種情況下，就需要Hive這樣的用戶編程接口。Hive本身不存儲和計算數(shù)據(jù)，它完全依賴于HDFS和MapReduce，Hive中的表純邏輯，就是些表的定義等，也就是表的元數(shù)據(jù)。使用SQL實現(xiàn)Hive是因為SQL大家都熟悉，轉(zhuǎn)換成本低，類似作用的Pig就不是SQL。

HBase為查詢而生的，它通過組織起節(jié)點內(nèi)所有機器的內(nèi)存，提供一個超大的內(nèi)存Hash表，它需要組織自己的數(shù)據(jù)結(jié)構(gòu)，包括磁盤和內(nèi)存中的，而Hive是不做這個的，表在HBase中是物理表，而不是邏輯表，搜索引擎使用它來存儲索引，以滿足查詢的實時性需求。

hive類似CloudBase，也是基于hadoop分布式計算平臺上的提供data warehouse的sql功能的一套軟件。使得存儲在hadoop里面的海量數(shù)據(jù)的匯總，即席查詢簡單化。hive提供了一套QL的查詢語言，以sql為基礎(chǔ)，使用起來很方便。

HBase是一個分布式的基于列存儲的非關(guān)系型數(shù)據(jù)庫。HBase的查詢效率很高，主要由于查詢和展示結(jié)果。
http://fccjxxw.com非常超級學(xué)習(xí)網(wǎng)

hive是分布式的關(guān)系型數(shù)據(jù)庫。主要用來并行分布式處理大量數(shù)據(jù)。hive中的所有查詢除了"select * from table;"都是需要通過Map\Reduce的方式來執(zhí)行的。由于要走M(jìn)ap\Reduce，即使一個只有1行1列的表，如果不是通過select * from table;方式來查詢的，可能也需要8、9秒。但hive比較擅長處理大量數(shù)據(jù)。當(dāng)要處理的數(shù)據(jù)很多，并且Hadoop集群有足夠的規(guī)模，這時就能體現(xiàn)出它的優(yōu)勢。

通過hive的存儲接口，hive和Hbase可以整合使用。

1、hive是sql語言，通過數(shù)據(jù)庫的方式來操作hdfs文件系統(tǒng)，為了簡化編程，底層計算方式為mapreduce。

2、hive是面向行存儲的數(shù)據(jù)庫。

3、Hive本身不存儲和計算數(shù)據(jù)，它完全依賴于HDFS和MapReduce，Hive中的表純邏輯。

4、HBase為查詢而生的，它通過組織起節(jié)點內(nèi)所有機器的內(nèi)存，提供一個超大的內(nèi)存Hash表

5、hbase不是關(guān)系型數(shù)據(jù)庫，而是一個在hdfs上開發(fā)的面向列的分布式數(shù)據(jù)庫，不支持sql。

6、hbase是物理表，不是邏輯表，提供一個超大的內(nèi)存hash表，搜索引擎通過它來存儲索引，方便查詢操作。

7、hbase是列存儲。

Hive只供維護(hù)用，真正查起來非常非常慢的！
這是因為它的底層是要通過mapreduce分布式計算的，hbase、hive、pig底層都是這樣的。但整體來說hadoop還是比較快的，因為它是進(jìn)行海量數(shù)據(jù)存儲和分布式計算，這個速度已經(jīng)很不錯了。

Hive和Hbase有各自不同的特征：hive是高延遲、結(jié)構(gòu)化和面向分析的，hbase是低延遲、非結(jié)構(gòu)化和面向編程的。Hive數(shù)據(jù)倉庫在hadoop上是高延遲的。

其中HBase位于結(jié)構(gòu)化存儲層，Hadoop HDFS為HBase提供了高可靠性的底層存儲支持，Hadoop MapReduce為HBase提供了高性能的計算能力，Zookeeper為HBase提供了穩(wěn)定服務(wù)和failover機制。

此外，Pig和Hive還為HBase提供了高層語言支持，使得在HBase上進(jìn)行數(shù)據(jù)統(tǒng)計處理變的非常簡單。 Sqoop則為HBase提供了方便的RDBMS數(shù)據(jù)導(dǎo)入功能，使得傳統(tǒng)數(shù)據(jù)庫數(shù)據(jù)向HBase中遷移變的非常方便。

轉(zhuǎn)：
覺得在問區(qū)別之前，我應(yīng)該顯示說相同點，這么一想，又糊涂了，hive和hbase哪里像了，好像哪里都不像，既然哪里都不像，又何來的“區(qū)別是什么”這一問題，他倆所有的都算區(qū)別。
那么，hive是什么？
白話一點再加不嚴(yán)格一點，hive可以認(rèn)為是map-reduce的一個包裝。hive的意義就是把好寫的hive的sql轉(zhuǎn)換為復(fù)雜難寫的map-reduce程序。
于是，hbase是什么？
同樣白話一點加不嚴(yán)格一點，hbase可以認(rèn)為是hdfs的一個包裝。他的本質(zhì)是數(shù)據(jù)存儲，是個NoSql數(shù)據(jù)庫；hbase部署于hdfs之上，并且克服了hdfs在隨機讀寫方面的缺點。
所以要問hive和hbase的區(qū)別，就應(yīng)該問問map-reduce和hdfs之間的區(qū)別，問區(qū)別，就要先說說他倆哪里像。
于是，你說map-reduce和hdfs哪里像了呢？

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

打開APP，閱讀全文并永久保存查看更多類似文章

Hbase與Hive的區(qū)別與聯(lián)系

Kudu Impala介紹 | 微店數(shù)據(jù)科學(xué)團(tuán)隊博客

Hadoop生態(tài)上幾個技術(shù)的關(guān)系與區(qū)別：hive、pig、hbase 關(guān)系與區(qū)別

Hive，Hive on Spark和SparkSQL區(qū)別

盤點Hadoop生態(tài)圈：13個讓大象飛起來的開源工具

基于云計算的大數(shù)據(jù)平臺基礎(chǔ)設(shè)施建設(shè)實踐

更多類似文章 >>

九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区