1.數據獲取
一切工作的開始。
1.1數據初始化
pandas 有兩種數據結構,DataFrame和Numpy。爲什麼要單獨創造新的數據結構呢?python自身的數據結構不好用嗎?新數據結構有什麼優勢呢?答案是:新的數據結構好用得飛起,
這兩種結構可以進行矩陣運算,這就意味着一些數學矩陣的處理可以被快速地完成,以及快速地進行查詢並賦值。
DataFrame:
一種基於numpy的數據格式,可以同時存儲和展示多個維度的數據,具體張下面這樣。
import pandas as pd
import numpy as np
date_range('20130101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(df)
A | B | C | D | |
---|---|---|---|---|
2013-01-01 | 0.703378 | -0.959575 | -1.613057 | -0.114338 |
2013-01-02 | -0.343408 | -0.379881 | -0.735925 | 2.524115 |
2013-01-03 | 2.536322 | -0.441642 | -0.514564 | -1.198413 |
2013-01-04 | -1.072813 | 0.571710 | -1.226546 | -1.505016 |
2013-01-05 | -0.389734 | 1.211053 | -1.325043 | -0.724410 |
2013-01-06 | -0.326073 | -0.152085 | 0.129887 | -0.766101 |
Numpy: