Hive CLI是Hive的交互工具,下面演示幾種CLI調(diào)動(dòng)Hive功能的一些命令。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-08-06 |傳智教育 |Hive,Hive命令,Hive操作
完成了Hadoop集群安裝和測(cè)試之后,顯示構(gòu)建的Hadoop集群能夠正常運(yùn)行。接下來(lái),就通過(guò)Hadoop經(jīng)典案例——單詞統(tǒng)計(jì),來(lái)演示Hadoop集群的簡(jiǎn)單使用。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-08-06 |傳智教育 |Hadoop集群經(jīng)典單詞統(tǒng)計(jì)案例
如果Hadoop集群中部署了Hive服務(wù),并且在Sqoop服務(wù)的sqoop-env.sh文件中配置了Hive的安裝路徑,那么也可以通過(guò)Sqoop工具將MySQL表數(shù)據(jù)導(dǎo)入Hive表中。將MySQL表數(shù)據(jù)導(dǎo)入到Hive文件系統(tǒng)中,具體指令示例如下。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-08-06 |傳智教育 |MySQL表數(shù)據(jù)導(dǎo)入Hive
Pandas執(zhí)行算術(shù)運(yùn)算時(shí),會(huì)先按照索引進(jìn)行對(duì)齊,對(duì)齊以后再進(jìn)行相應(yīng)的運(yùn)算,沒(méi)有對(duì)齊的位置會(huì)用NaN進(jìn)行補(bǔ)齊。其中,Series是按行索引對(duì)齊的,DataFrame是按行索引、列索引對(duì)齊的。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-30 |傳智教育 |Panda,算術(shù)運(yùn)算和數(shù)據(jù)對(duì)齊
在Jupyter Notebook的主界面中,單擊 “Anaconda Projects” 進(jìn)入該目錄下,繼續(xù)單擊右上方的“New”按鈕,打開(kāi)如圖1所示的下拉列表。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-30 |傳智教育 |Notebook功能和操作界面介紹, Jupyter
數(shù)據(jù)倉(cāng)庫(kù)標(biāo)準(zhǔn)上可以分為四層:ODS(臨時(shí)存儲(chǔ)層)、PDW(數(shù)據(jù)倉(cāng)庫(kù)層)、MID(數(shù)據(jù)集市層)、APP(應(yīng)用層)。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-28 |傳智教育 |數(shù)據(jù)倉(cāng)庫(kù)標(biāo)準(zhǔn)分層
這里我們采用的是京東的數(shù)據(jù)倉(cāng)庫(kù)分層模式,是根據(jù)標(biāo)準(zhǔn)的模型演化而來(lái)。將數(shù)據(jù)倉(cāng)庫(kù)分為4層,BDM作為緩沖數(shù)據(jù),F(xiàn)DM作為基礎(chǔ)數(shù)據(jù)層,接下來(lái)對(duì)他們做詳細(xì)介紹。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-28 |傳智教育 |數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)倉(cāng)庫(kù)實(shí)際分層
Sqoop工具操作簡(jiǎn)單,它提供了一系列的工具指令,來(lái)進(jìn)行數(shù)據(jù)的導(dǎo)入、導(dǎo)出操作等。使用Sqoop解壓包中bin目錄下的“sqoop help”指令可以查看Sqoop支持的所有工具指令,具體效果如圖1所示。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-26 |傳智教育 |Sqoop,sqoop指令
北京校區(qū)