dataFrame
一個簡單的dataFrame如下:
列索引
DataFrame的列索引可以直接獲取數據:
兩種方式:
行索引
loc
可以獲取多行數據,但是無法使用切片操作獲取數據。
單行數據獲取
使用切片操作會出現錯誤。
iloc
多行數據獲取
二維索引
單行數據
多行數據
一點思考
這裏的true,我們可以得到這種 複製操作是一種賦值操作,被賦值變量所指向的地址一致。
dataFrame的刪除和添加
列和行的刪除同樣存在區別。
列添加
列的刪除
行添加和刪除
行添加和刪除同上區別。
行的刪除用到是 drop函數
但是我們發現drop函數之後,test所指向的dataFrame並沒有改變,說明這個函數的新開了一塊內存存儲數據。
dataFrame 操作
print(test[0:2]) #取前兩行數據
print(len(test )) #求出一共多少行
print(test.columns.size) #求出一共多少列
print(test.columns) #列索引名稱
print(test.index) #行索引名稱
print(data[data>2] ) #表示選取數據集中大於0的數據
print(data[data.x>5]) #表示選取數據集中x這一列大於5的所有的行
a1=test.copy()
print(a1[a1['y'].isin(['6','10'])]) #表顯示滿足條件:列y中的值包含'6','10'的所有行。
print(test.mean()) #默認對每一列的數據求平均值;若加上參數a.mean(1)則對每一行求平均值;
print(test['x'].value_counts()) #統計某一列x中各個值出現的次數:
print(test.describe()) #對每一列數據進行統計,包括計數,均值,std,各個分位數等。