<style id="az4i9"></style>

首頁技術(shù)文章正文

Hive和Hadoop協(xié)作執(zhí)行任務的工作原理是什么？

更新時間:2022-06-02 來源:黑馬程序員瀏覽量:

Hive是基于Hadoop的一個數(shù)據(jù)倉庫工具，主要用來對數(shù)據(jù)進行抽取、轉(zhuǎn)換、加載操作。HiveQL可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)表，允許熟悉SQL的用戶查詢數(shù)據(jù)，也允許熟悉MapReduce的開發(fā)者開發(fā)自定義的mapper和reducer來處理內(nèi)建的mapper和 reducer無法完成的復雜的分析工作，相對于Java代碼編寫的MapReduce來說，Hive的優(yōu)勢更加明顯。Hive利用Hadoop的HDFS存儲數(shù)據(jù)，利用Hadoop的MapReduce執(zhí)行查詢。

Hadoop的MapReduce執(zhí)行查詢的工作原理

Hive和Hadoop協(xié)作執(zhí)行任務的工作原理

(1) 用戶通過用戶接口向Driver提交executeQuery。

(2) Driver向Compiler發(fā)送獲取計劃的請求。

(3) Compiler根據(jù)用戶提交的executeQuery去MetaStore獲取需要的元數(shù)據(jù)信息。

(4) MetaStore向Compiler發(fā)送元數(shù)據(jù)信息。

(5) Compiler得到元數(shù)據(jù)信息，并向Driver發(fā)送計劃。

(6) Driver 向EXECUTION ENGINE提交executePlan。

(7) 用戶接口向Driver發(fā)起獲取結(jié)果集(fetchResults)的請求。

(8）Driver向EXECUTION ENGINE發(fā)起獲取結(jié)果集的請求。

(9）EXECUTION ENGINE向Driver發(fā)送結(jié)果集，Driver獲取到結(jié)果集后返回用戶接口。

上一篇：Python大數(shù)據(jù)培訓：basemap怎么安裝 下一篇：Python培訓：繪制甘特圖

最新資訊

有哪些頁面置換算法?
2024-05-22
如何解決Redis的并發(fā)競爭Key問題?
2024-05-22
varchar和char的使用場景?
2024-05-22
協(xié)程為何比線程還快?
2024-05-17
TIME_WAIT過多是因為什么?
2024-05-17
range和xrange的區(qū)別是什么?
2024-05-17

相關(guān)閱讀

分享到：

javaee

python大數(shù)據(jù)

web

ui

cloud

test

c

netmarket

pm

Linux

movies

robot

uids

AI

jdbc

選擇校區(qū)

北京校區(qū)

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

申請試聽名額

熱門課程推薦

更多>>

首頁|校區(qū)分布|師資力量|關(guān)于我們|報名流程

常見問題|技術(shù)資訊

江蘇傳智播客教育科技股份有限公司版權(quán)所有
Copyright 2006-2023, All Rights Reserved

在線咨詢我要報名

和我們在線交談！

<rp id="sst4i"></rp>