Python數據分析實戰【第三章】2.21-Pandas數據讀取【python】

【課程2.22】 數據讀取

核心:read_table, read_csv, read_excel

1.讀取普通分隔數據:read_table


# 可以讀取txt,csv
import os
os.chdir('C:/Users/Hjx/Desktop/')

data1 = pd.read_table('data1.txt', delimiter=',',header = 0, index_col=1)
print(data1)
# delimiter:用於拆分的字符,也可以用sep:sep = ','
# header:用做列名的序號,默認爲0(第一行)
# index_col:指定某列爲行索引,否則自動索引0, 1, .....

# read_table主要用於讀取簡單的數據,txt/csv
----------------------------------------------------------------------
     va1  va3  va4
va2               
2      1    3    4
3      2    4    5
4      3    5    6
5      4    6    7

2.讀取csv數據:read_csv

# 先熟悉一下excel怎麼導出csv

data2 = pd.read_csv('data2.csv',engine = 'python')
print(data2.head())
# engine:使用的分析引擎。可以選擇C或者是python。C引擎快但是Python引擎功能更加完備。
# encoding:指定字符集類型,即編碼,通常指定爲'utf-8'

# 大多數情況先將excel導出csv,再讀取
----------------------------------------------------------------------

3.讀取excel數據:read_excel

data3 = pd.read_excel('地市級黨委書記數據庫(2000-10).xlsx',sheetname='中國人民共和國地市級黨委書記數據庫(2000-10)',header=0)
print(data3)
# io :文件路徑。
# sheetname:返回多表使用sheetname=[0,1],若sheetname=None是返回全表 → ① int/string 返回的是dataframe ②而none和list返回的是dict
# header:指定列名行,默認0,即取第一行
# index_col:指定列爲索引列,也可以使用u”strings”
----------------------------------------------------------------------
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章