<mark id="16666"></mark>

<span id="16666"><form id="16666"><address id="16666"></address></form></span>

首頁Python+大數(shù)據(jù)技術(shù)文章正文

Spark中為什么要區(qū)分寬窄依賴？

更新時(shí)間:2023年05月12日17時(shí)55分來源:傳智教育瀏覽次數(shù):

好口碑IT培訓(xùn)

窄依賴：Spark可以對(duì)窄依賴進(jìn)行優(yōu)化：合并操作，形成pipeline(管道)，同一個(gè)管道中的各個(gè)操作可以由同一個(gè)線程執(zhí)行完，且如果有一個(gè)分區(qū)數(shù)據(jù)丟失，只需要從父RDD的對(duì)應(yīng)個(gè)分區(qū)重新計(jì)算即可，不需要重新計(jì)算整個(gè)任務(wù)，提高容錯(cuò)。

寬依賴：Spark可以根據(jù)寬依賴進(jìn)行state階段劃分，同一個(gè)stage階段中的都是窄依賴，可以對(duì)該階段內(nèi)的窄依賴優(yōu)化

什么是寬依賴什么是窄依賴

寬依賴有shuffle，子RDD的一個(gè)分區(qū)會(huì)依賴于父RDD的多個(gè)分區(qū)--錯(cuò)誤，父RDD的一個(gè)分區(qū)會(huì)被子RDD的多個(gè)分區(qū)所依賴--正確。

窄依賴:沒有shuffle，子RDD的一個(gè)分區(qū)只會(huì)依賴于父RDD的1個(gè)分區(qū)--錯(cuò)誤，父RDD的一個(gè)分區(qū)只會(huì)被子RDD的1個(gè)分區(qū)所依賴--正確。

寬窄依賴

總結(jié):

窄依賴: 并行化+容錯(cuò)

寬依賴: 進(jìn)行階段劃分(shuffle后的階段需要等待shuffle前的階段計(jì)算完才能執(zhí)行)。

上一篇：大數(shù)據(jù)好學(xué)嗎？什么是大數(shù)據(jù)？ 下一篇：TiDB核心特性：水平擴(kuò)展和高可用

最新資訊

相關(guān)閱讀

0 分享到：

javaee

python

web

design

cloud

test

c

netmarket

pm

Linux

movies

robot

uids

Python

jdbc

北京校區(qū)

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

申請(qǐng)?jiān)嚶犆~

熱門課程推薦

更多>>

首頁|校區(qū)分布|師資力量|關(guān)于我們|報(bào)名流程

常見問題|技術(shù)資訊

江蘇傳智播客教育科技股份有限公司版權(quán)所有
Copyright 2006-2023, All Rights Reserved

在線咨詢我要報(bào)名

和我們?cè)诰€交談！

<p id="61661"><tfoot id="61661"></tfoot></p>

<span id="61661"></span>

<ul id="61661"></ul>