特级西西www大胆无码视频,东京热av人妻中出无码 ,亚洲欧美一区二区三区中文字幕

服務近2000家企業，依托一系列實踐中打磨過的技術和產品，根據企業的具體業務問題和需求，針對性的提供各行業大數據解決方案。

hive的使用場景及其原理
來源：未知　時間：2018-21-25　瀏覽次數：323次

HIVE的使用場景及其原理，在大數據處理中HIVE占有很重要的地位，呢么hive到底適合在什么場景使用個，以及如何使用呢？
Hive是建立在Hadoop (HDFS/MR)上的用于管理和查詢結果化/非結構化的數據倉庫;一種可以存儲、查詢和分析存儲在Hadoop 中的大規模數據的機制;Hive 定義了簡單的類SQL 查詢語言，稱為HQL，它允許熟悉SQL 的用戶查詢數據;允許用Java開發自定義的函數UDF來處理內置無法完成的復雜的分析工作;Hive沒有專門的數據格式(分隔符等可以自己靈活的設定);
一、使用場景
Hive不適用于在線事務處理。它最適用于傳統的數據倉庫任務,Hive的執行延遲比較高，因為hive常用于數據分析的，對實時性要求不高;Hive優勢在于處理大數據，對于處理小數據沒有優勢，因為hive的執行延遲比較高。

二，hive安裝及使用

1 Execute Query

Hive接口，如命令行或Web UI發送查詢驅動程序(任何數據庫驅動程序，如JDBC，ODBC等)來執行。

2 Get Plan

在驅動程序幫助下查詢編譯器，分析查詢檢查語法和查詢計劃或查詢的要求。

3 Get Metadata

編譯器發送元數據請求到Metastore(任何數據庫)。

4 Send Metadata

Metastore發送元數據，以編譯器的響應。

5 Send Plan

編譯器檢查要求，并重新發送計劃給驅動程序。到此為止，查詢解析和編譯完成。

6 Execute Plan

驅動程序發送的執行計劃到執行引擎。

7 Execute Job

在內部，執行作業的過程是一個MapReduce工作。執行引擎發送作業給JobTracker，在名稱節點并把它分配作業到TaskTracker，這是在數據節點。在這里，查詢執行MapReduce工作。

7.1 Metadata Ops

與此同時，在執行時，執行引擎可以通過Metastore執行元數據操作。

8 Fetch Result

執行引擎接收來自數據節點的結果。

9 Send Results

執行引擎發送這些結果值給驅動程序。

10 Send Results

驅動程序將結果發送給Hive接口。Hadoop中實際應用，通過上面流程解釋，要想在hadoop中使用hive,至少需要安裝hive和Metastore(任何數據庫)本文安裝mysql 。

三、mysql安裝
在hive中mysql作為hive元數據存儲引擎，下載linux環境下的mysql安裝包，并安裝，hive的數據存儲分為兩部分，一部分是基礎數據存儲在hadoop分布式文件系統hdfs中，另一部分是元數據及hive表，數據庫結構存儲在關系型數據庫中，如mysql等

上一篇: 農業大數據應用經典案例
下一篇: hive數據同步工具Sqoop的使用

hive的使用場景及其原理 來源：未知 時間：2018-21-25 瀏覽次數：323次

hive的使用場景及其原理
來源：未知　時間：2018-21-25　瀏覽次數：323次