教育行業(yè)A股IPO第一股(股票代碼 003032)

全國(guó)咨詢(xún)/投訴熱線:400-618-4000

時(shí)間序列分析:降采樣

更新時(shí)間:2022年12月09日10時(shí)34分 來(lái)源:傳智教育 瀏覽次數(shù):

好口碑IT培訓(xùn)

  降采樣時(shí)間顆粒會(huì)變大,比如原來(lái)是按天統(tǒng)計(jì)的數(shù)據(jù),現(xiàn)在要變成按周統(tǒng)計(jì)。降采樣時(shí)數(shù)據(jù)量是減少的,為了避免有些時(shí)間戳對(duì)應(yīng)的數(shù)據(jù)閑置,可以利用內(nèi)置方法(比如sum、mean等)聚合數(shù)據(jù)。

  在金融領(lǐng)域中,股票數(shù)據(jù)比較常見(jiàn)的是OHLC重采樣,包括開(kāi)盤(pán)價(jià)(open)、最高價(jià)(high)、最低價(jià)(low)和收盤(pán)價(jià)(close)。為此,Pandas中專(zhuān)門(mén)提供了一個(gè)ohlc()方法,示例代碼如下。

In [46]: date_index=pd.date_range('2018/06/01', periods=30)
         shares_data=np.random.rand(30)
         time_ser=pd.Series(shares_data,index=date_index)
         time_ser
Out[46]:
2018-06-01    0.217872
2018-06-02    0.392067
2018-06-03    0.127837
2018-06-05    0.078589
...省略N行...
2018-06-25    0.468722
2018-06-26    0.266006
2018-06-27    0.630626
2018-06-28    0.690746
2018-06-29    0.840611
2018-06-30    0.969173
Freq:D,  dtype: float64
In [47]: time_ser.resample('7D').ohlc() # OHLC重采樣
Out[47]:

2018-06-01  0.207359  0.817076  0.207359  0.817076
2018-06-08  0.348861  0.917179  0.243257  0.744128
2018-06-15  0.698345  0.698345  0.240547  0.418569
2018-06-22  0.203373  0.891738  0.111924  0.344488
2018-06-29  0.935986  0.935986  0.920508  0.920508

  上述示例輸出了2018年6月份每周的開(kāi)盤(pán)價(jià)、最高價(jià)、最低價(jià)、收盤(pán)價(jià)。注意,這些股票數(shù)據(jù)都是隨機(jī)數(shù),只供大家學(xué)習(xí)使用,并不是真實(shí)的數(shù)據(jù)。

  重采樣就相當(dāng)于另外一種形式的分組操作,它會(huì)按照日期將時(shí)間序列進(jìn)行分組,之后對(duì)每個(gè)分組應(yīng)用聚合方法得出一個(gè)結(jié)果,同樣實(shí)現(xiàn)了對(duì)時(shí)間序列數(shù)據(jù)降采樣的效果,示例代碼如下。

In [48]: # 通過(guò)groupby技術(shù)實(shí)現(xiàn)降采樣
         time_ser.groupby(lambda X: x.week).mean()
Out[48]:
22    0.358104
23    0.366116
24    0.486968
25    0.484954
26    0.664579
dtype: float64

0 分享到:
和我們?cè)诰€交談!