教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

數(shù)據(jù)分析工具Pandas:常用的統(tǒng)計(jì)計(jì)算

更新時(shí)間:2022年11月02日15時(shí)11分 來源:傳智教育 瀏覽次數(shù):

好口碑IT培訓(xùn)

  Pandas為我們提供了非常多的描述性統(tǒng)計(jì)分析的指標(biāo)方法,比如總和、均值、最小值、最大值等。接下來,筆者來羅列一些常用的描述性統(tǒng)計(jì)方法,以及它們的具體說明。

  1.sum:計(jì)算和

  2.mean:計(jì)算平均值

  3.median:獲取中位數(shù)

  4.max、min:獲取最大值和最小值

  5.idxmax、idxmin:獲取最大和最小索引值

  6.count:計(jì)算非NaN值的個(gè)數(shù)

  7.head:獲取前N個(gè)值

  8.var:樣本值的方差

  9.std:樣本值的標(biāo)準(zhǔn)差

  10.skew:樣本值的偏度(三階矩)

  11.kurt:樣本值的峰度(四階矩)

  12.cumsum:樣本值的累計(jì)和。

  13.cummin、cummax:樣本值的累積最小值和累積最大值。

  14.cumpord:樣本值的累計(jì)積。

  15.describe:對Series和DataFrame列計(jì)算匯總統(tǒng)計(jì)。

  下面通過一些示例來演示上述部分方法的使用。例如,創(chuàng)建一個(gè)3行4列的DataFrame對象,它的列索引為“a、b、c、d”,具體代碼如下。

In [59]: df_obj = pd.DataFrame(np.arange(12).reshape(3, 4),
                               columns=['a', 'b', 'c', 'd'])
         df_obj
Out[59]:
   a  b   c   d
0  0  1   2   3
1  4  5   6   7
2  8  9   10  11

  然后,讓DataFrame對象依次調(diào)用sum()、max()和min()方法,分別執(zhí)行求和、求最大值和最小值的運(yùn)算,具體代碼如下。

In [60]: df_obj.sum()      #計(jì)算每列的和
Out[60]:
a    12
b    15
c    18
d    21
dtype: int64
In [61]: df_obj.max()      # 獲取每列的最大值
Out[61]:
a     8
b     9
c    10
d    11
dtype: int32
In [62]: df_obj.min(axis=1)   # 沿著橫向軸,獲取每行的最小值
Out[62]:
0    0
1    4
2    8
dtype: int32

  通過結(jié)果可以看出,DataFrame默認(rèn)優(yōu)先以縱向軸進(jìn)行計(jì)算,除非在調(diào)用這些統(tǒng)計(jì)方法時(shí),顯式地指明沿著橫向軸方向,即aixs=1,才會(huì)對每行的數(shù)據(jù)進(jìn)行計(jì)算。

0 分享到:
和我們在線交談!