教育行業(yè)A股IPO第一股(股票代碼 003032)

全國(guó)咨詢(xún)/投訴熱線(xiàn):400-618-4000

Spark的框架模塊和運(yùn)行模式是什么?

更新時(shí)間:2022年01月05日16時(shí)54分 來(lái)源:傳智教育 瀏覽次數(shù):

整個(gè)Spark 框架模塊包含:Spark Core、 Spark SQL、 Spark Streaming、 Spark GraphX、 Spark MLlib,而后四項(xiàng)的能力都是建立在核心引擎之上。

Sparkd的框架模塊和運(yùn)行模式

Spark Core:Spark的核心,Spark核心功能均由Spark Core模塊提供,是Spark運(yùn)行的基礎(chǔ)。Spark Core以RDD為數(shù)據(jù)抽象,提供Python、Java、Scala、R語(yǔ)言的API,可以編程進(jìn)行海量離線(xiàn)數(shù)據(jù)批處理計(jì)算。

SparkSQL:基于SparkCore之上,提供結(jié)構(gòu)化數(shù)據(jù)的處理模塊。SparkSQL支持以SQL語(yǔ)言對(duì)數(shù)據(jù)進(jìn)處理,SparkSQL本身針對(duì)離線(xiàn)計(jì)算場(chǎng)景。同時(shí)基于SparkSQL,Spark提供了StructuredStreaming模塊,可以以SparkSQL為基礎(chǔ),進(jìn)行數(shù)據(jù)的流式計(jì)算。

SparkStreaming:以SparkCore為基礎(chǔ),提供數(shù)據(jù)的流式計(jì)算功能。

MLlib:以SparkCore為基礎(chǔ),進(jìn)行機(jī)器學(xué)習(xí)計(jì)算,內(nèi)置了大量的機(jī)器學(xué)習(xí)庫(kù)和API算法等。方便用戶(hù)以分布式計(jì)算的模式進(jìn)行機(jī)器學(xué)習(xí)計(jì)算。

GraphX:以SparkCore為基礎(chǔ),進(jìn)行圖計(jì)算,提供了大量的圖計(jì)算API,方便用于以分布式計(jì)算模式進(jìn)行圖計(jì)算。


Spark提供多種運(yùn)行模式,包括:

  • 本地模式(單機(jī))

本地模式就是以一個(gè)獨(dú)立的進(jìn)程,通過(guò)其內(nèi)部的多個(gè)線(xiàn)程來(lái)模擬整個(gè)Spark運(yùn)行時(shí)環(huán)境

  • Standalone模式(集群)

Spark中的各個(gè)角色以獨(dú)立進(jìn)程的形式存在,并組成Spark集群環(huán)境

  • Hadoop YARN模式(集群)

Spark中的各個(gè)角色運(yùn)行在YARN的容器內(nèi)部,并組成Spark集群環(huán)境

  • Kubernetes模式(容器集群)

Spark中的各個(gè)角色運(yùn)行在Kubernetes的容器內(nèi)部,并組成Spark集群環(huán)境

  • 云服務(wù)模式(運(yùn)行在云平臺(tái)上)
Spark運(yùn)行模式








猜你喜歡:

什么是Spark SQL?Spark SQL簡(jiǎn)介

SparkStreaming連接Kafka兩種方式

SparkMllib如何解決回歸問(wèn)題?

Spark的應(yīng)用場(chǎng)景有哪些?

傳智教育Python+大數(shù)據(jù)開(kāi)發(fā)培訓(xùn)

0 分享到:
和我們?cè)诰€(xiàn)交談!