07 ，df 列操作，行操作：增，刪，改，查，計算，列過濾

原創

2020-07-05 00:42

1 ，列操作，查：data[“Age”]

代碼：

if __name__ == '__main__':
    # 全列顯示 ：
    pd.set_option('display.max_columns', None)
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    df_age = data["Age"]
    print(df_age)
==============================================
0      22.0
1      38.0
2      26.0

2 ，列操作，計算：res = df_age * 2

目的：字段 * 2
代碼：

if __name__ == '__main__':
    # 全列顯示 ：
    pd.set_option('display.max_columns', None)
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    df_age = data["Age"]
    res = df_age * 2
    print(df_age)
    print(res)
==============================================
0      22.0
1      38.0
2      26.0
....
==================
0       44.0
1       76.0
2       52.0
...

3 ，列操作：增 data[“double_age”] = res

目的：將 double_age 列新增到原數據中
代碼：

if __name__ == '__main__':
    # 全列顯示 ：
    pd.set_option('display.max_columns', None)
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    df_age = data["Age"]
    res = df_age * 2
    data["double_age"] = res
    print(data.head(3))
=========================================
 Age   double_age  ....
22.0         44.0
38.0         76.0
26.0         52.0
....

4 ，列操作，刪除列：data.drop([“PassengerId”],axis=1)

代碼：

if __name__ == '__main__':
    # 全列顯示 ：
    # pd.set_option('display.max_columns', None)
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    print(data.head(5))
    res = data.drop(["PassengerId","Survived"],axis=1)
    print(res.head(5))
==================================================
   PassengerId  Survived  Pclass  ...     Fare Cabin  Embarked
0            1         0       3  ...   7.2500   NaN         S
1            2         1       1  ...  71.2833   C85         C
2            3         1       3  ...   7.9250   NaN         S
3            4         1       1  ...  53.1000  C123         S
4            5         0       3  ...   8.0500   NaN         S
[5 rows x 12 columns]
   Pclass                                               Name  ... Cabin  Embarked
0       3                            Braund, Mr. Owen Harris  ...   NaN         S
1       1  Cumings, Mrs. John Bradley (Florence Briggs Th...  ...   C85         C
2       3                             Heikkinen, Miss. Laina  ...   NaN         S
3       1       Futrelle, Mrs. Jacques Heath (Lily May Peel)  ...  C123         S
4       3                           Allen, Mr. William Henry  ...   NaN         S
[5 rows x 10 columns]

5 ，列操作，改列名：data.rename(…)

精華代碼：

data.rename(columns={"PassengerId":"PassengerIdOMG"},inplace=True)

目的：
1 ，將 PassengerId 列名修改爲 PassengerIdOMG
代碼：

if __name__ == '__main__':
    # 全列顯示 ：
    # pd.set_option('display.max_columns', None)
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    print(data.head(5))
    data.rename(columns={"PassengerId":"PassengerIdOMG"},inplace=True)
    print(data.head(5))
===========================================
   PassengerId  Survived  Pclass  ...     Fare Cabin  Embarked
0            1         0       3  ...   7.2500   NaN         S
1            2         1       1  ...  71.2833   C85         C
2            3         1       3  ...   7.9250   NaN         S
3            4         1       1  ...  53.1000  C123         S
4            5         0       3  ...   8.0500   NaN         S
[5 rows x 12 columns]
   PassengerIdOMG  Survived  Pclass  ...     Fare Cabin  Embarked
0               1         0       3  ...   7.2500   NaN         S
1               2         1       1  ...  71.2833   C85         C
2               3         1       3  ...   7.9250   NaN         S
3               4         1       1  ...  53.1000  C123         S
4               5         0       3  ...   8.0500   NaN         S
[5 rows x 12 columns]

6 ，行操作，查 1 行： data.loc[0]

代碼：

if __name__ == '__main__':
    # 全列顯示 ：
    # pd.set_option('display.max_columns', None)
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    res = data.loc[0]
    print(data.head(3))
    print(res)
========================================================================
   PassengerId  Survived  Pclass  ...     Fare Cabin  Embarked
0            1         0       3  ...   7.2500   NaN         S
1            2         1       1  ...  71.2833   C85         C
2            3         1       3  ...   7.9250   NaN         S
[3 rows x 12 columns]
==========================================
PassengerId                          1
Survived                             0
Pclass                               3
Name           Braund, Mr. Owen Harris
Sex                               male
Age                                 22
SibSp                                1
Parch                                0
Ticket                       A/5 21171
Fare                              7.25
Cabin                              NaN
Embarked                             S
Name: 0, dtype: object

7 ，行操作，計算： res01 = res * 2

代碼：乘 2

if __name__ == '__main__':
    # 全列顯示 ：
    # pd.set_option('display.max_columns', None)
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    res = data.loc[0]
    res01 = res * 2
    print(res)
    print(res01)
================================
PassengerId                          1
Survived                             0
Pclass                               3
Name           Braund, Mr. Owen Harris
Sex                               male
Age                                 22
SibSp                                1
Parch                                0
Ticket                       A/5 21171
Fare                              7.25
Cabin                              NaN
Embarked                             S
Name: 0, dtype: object
==================================================================
PassengerId                                                 2
Survived                                                    0
Pclass                                                      6
Name           Braund, Mr. Owen HarrisBraund, Mr. Owen Harris
Sex                                                  malemale
Age                                                        44
SibSp                                                       2
Parch                                                       0
Ticket                                     A/5 21171A/5 21171
Fare                                                     14.5
Cabin                                                     NaN
Embarked                                                   SS
Name: 0, dtype: object

8 ，行操作，增： data.append(res01, ignore_index=True)

目的：
1 ，將最後一行 * 2
2 ，再添加回去，成爲新的最後一行
代碼：

if __name__ == '__main__':
    # 全列顯示 ：
    # pd.set_option('display.max_columns', None)
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    res = data.loc[890]
    # 將數據 * 2
    res01 = res * 2
    # 將數據加入到 data 中
    data = data.append(res01, ignore_index=True)
    print(data.tail(3))
==============================================
     PassengerId  Survived  Pclass  ...   Fare Cabin  Embarked
889          890         1       1  ...  30.00  C148         C
890          891         0       3  ...   7.75   NaN         Q
891         1782         0       6  ...  15.50   NaN        QQ

9 ，行操作，刪： res02 = res01.drop(2)

目的：利用索引刪除指定行
代碼：

if __name__ == '__main__':
    # 全列顯示 ：
    # pd.set_option('display.max_columns', None)
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    res = data.loc[890]
    # 將數據 * 2
    res01 = res * 2
    # 將數據加入到 data 中
    data = data.append(res01, ignore_index=True)
    res01 = data.tail(3)
    print(res01)
    res01.reset_index(inplace=True,drop=True)
    print(res01)
    # 刪除第三行 ( 索引爲 2 的那行 )
    res02 = res01.drop(2)
    print(res02)
===================================================
889          890         1       1  ...  30.00  C148         C
890          891         0       3  ...   7.75   NaN         Q
891         1782         0       6  ...  15.50   NaN        QQ
[3 rows x 12 columns]
   PassengerId  Survived  Pclass  ...   Fare Cabin  Embarked
0          890         1       1  ...  30.00  C148         C
1          891         0       3  ...   7.75   NaN         Q
2         1782         0       6  ...  15.50   NaN        QQ
[3 rows x 12 columns]
   PassengerId  Survived  Pclass  ...   Fare Cabin  Embarked
0          890         1       1  ...  30.00  C148         C
1          891         0       3  ...   7.75   NaN         Q
[2 rows x 12 columns]

10 ，過濾列： res01[res01[“Age”]%2==0]

目的：留下年齡爲偶數的數
思想： True 留下，False 剔除
代碼：

if __name__ == '__main__':
    # 讀文件 csv
    data = pd.read_csv("titanic_train.csv")
    # 年齡字段 ：
    df_age = data["Age"].to_frame()
    # 清除空值
    res01 = df_age.dropna()
    # 留下偶數
    res02 = res01[res01["Age"]%2==0]
    print(res02)
==============================
      Age
0    22.0
1    38.0
2    26.0

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

07 ，df 列操作，行操作：增，刪，改，查，計算，列過濾

1 ，列操作，查：data[“Age”]

2 ，列操作，計算：res = df_age * 2

3 ，列操作：增 data[“double_age”] = res

4 ，列操作，刪除列：data.drop([“PassengerId”],axis=1)

5 ，列操作，改列名：data.rename(…)

6 ，行操作，查 1 行： data.loc[0]

7 ，行操作，計算： res01 = res * 2

8 ，行操作，增： data.append(res01, ignore_index=True)

9 ，行操作，刪： res02 = res01.drop(2)

10 ，過濾列： res01[res01[“Age”]%2==0]

杭州的 IT 崩盤了麼？

開源高性能結構化日誌模塊NanoLog

Python 潮流週刊#55：分享 9 個高質量的技術類信息源！

Azure Virtual Network (22) 多訂閱使用Azure DNS解析問題 Windows Azure Platform 系列文章目錄

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

13 ，np 常用函數：範圍內取 n 個值

01 ，seaborn 基本設置：5種風格，刻度線，圖位置，子圖風格，文字大小，線寬

04 ，plt 設置：x-y 範圍，座標點，外邊框，plt 與 ax 的區別，推薦 ax ：

08 ，散點圖( x-y ) scatter ：

05 ，子圖：多個 ax 進行畫圖，fig.add_subplot

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

07 ，df 列操作，行操作 ： 增，刪，改，查，計算，列過濾

1 ，列操作，查 ：data[“Age”]

2 ，列操作，計算 ：res = df_age * 2

3 ，列操作 ： 增 data[“double_age”] = res

4 ，列操作，刪除列 ：data.drop([“PassengerId”],axis=1)

5 ，列操作，改列名 ：data.rename(…)

6 ，行操作，查 1 行 ： data.loc[0]

7 ，行操作，計算 ： res01 = res * 2

8 ，行操作，增 ： data.append(res01, ignore_index=True)

9 ，行操作，刪 ： res02 = res01.drop(2)

10 ，過濾列 ： res01[res01[“Age”]%2==0]

07 ，df 列操作，行操作：增，刪，改，查，計算，列過濾

1 ，列操作，查：data[“Age”]

2 ，列操作，計算：res = df_age * 2

3 ，列操作：增 data[“double_age”] = res

4 ，列操作，刪除列：data.drop([“PassengerId”],axis=1)

5 ，列操作，改列名：data.rename(…)

6 ，行操作，查 1 行： data.loc[0]

7 ，行操作，計算： res01 = res * 2

8 ，行操作，增： data.append(res01, ignore_index=True)

9 ，行操作，刪： res02 = res01.drop(2)

10 ，過濾列： res01[res01[“Age”]%2==0]