立即學習:https://edu.csdn.net/course/play/6861/326758?utm_source=blogtoedu
pandas 模塊
1、掌握外部數據的讀取
2、如何快速的認知數據的概覽信息
3、數據子集的篩選與清洗
4、數據的彙總處理
5、數據的合併與連接
1、數據讀取 文本文件、電子表格、數據庫數據讀取
1.1、pd.read_csv(filepath or buffer,sep=',',header='infer',names==None,usecols=None,skiprows=None,skipfooter=None,converters=None,encoding=None)
filepath_or_buffer:指txt文件或者csv文件所在的具體路徑。
sep:指定原數據集忠個字段之間的分隔符,默認爲逗號‘,’
header:是否需要將原數據集忠的第一行作爲表頭,默認第一行用作地段名稱沒有表頭 header爲None。
id name age #表頭 (字段 字段 字段)
2 liujie 12 #變量
names:如果原始數據集中沒有字段,可以通過該參數在數據讀取的時候給數據框添加具體的表頭。
usecols:指定需要讀取原始數據集中的哪些變量名。
skiprows:數據讀取時,指定需要跳過的原始數據集開始的首行數。
skipfooter:數據讀取時,指定需要跳轉過原數據末尾的行數
converters:用於數據類型的轉換。(以字典形式指定)
ecoding:如果文件中包含中文,有時需要指定字符編碼。