本文介紹了Python I/O操作,包括文件讀取,文件寫入等操作。也是Python系列教程的最後一篇(共8篇)。
系列文章
【Python 基礎】一文補齊Python基礎知識
【趣學Python:B站四大惡人】一文掌握列表、元組、字典、集合
【Python進階】一文掌握Python函數用法
【Python進階】Python面向對象之類與對象詳解
【Python進階】Python面向對象之裝飾器與封裝
【Python進階】Python面向對象之繼承和多態詳解
【Python進階】Python異常處理和模塊
【Python進階】Python文件(I/O)操作詳解
文章目錄
1. 文件
1.1 打開文件
使用 open()
函數來打開一個文件
open(file, mode='r', buffering=-1, encoding_=None,
errors=None, newline=None, closefd=True, opener=None)
主要參數說明:
file
:要打開的文件的名字(路徑);mode
:是一個可選參數,用於指定打開文件的模式。默認狀態爲'r'
,表示只讀。返回值
:返回一個對象,這個對象就代表了當前打開的文件;
注意:
- 如果目標文件和當前文件在同一級目錄下,則直接使用文件名即可;
file_name = 'demo.txt'
file_obj = open(file_name)
- 在windows系統使用路徑時,可以使用
/
來代替\
,或者可以使用\\
來代替\
。因爲\
在Python中是轉義字符; - 也可以使用原始字符串;
file_name = 'hello\\demo.txt'
file_name = r'hello\demo.txt'
file_obj = open(file_name)
- 表示路徑,可以使用
..
來返回一級目錄;
file_name = '../hello/demo.txt'
file_obj = open(file_name)
- 如果目標文件距離當前文件比較遠,此時可以使用絕對路徑。絕對路徑應該從磁盤的根目錄開始書寫;
file_name = r'C:\demo.txt'
file_obj = open(file_name)
print(file_obj)
1.2 關閉文件
# 打開文件
file_name = 'demo.txt'
file_obj = open(file_name)
- 讀取文件
當我們獲取了文件對象以後,所有的對文件的操作都應該通過對象來進行。
read()
方法,用來讀取文件中的內容,它會將內容全部保存爲一個字符串返回。
content = file_obj.read()
- 關閉文件
close()
方法關閉文件;
file_obj.close()
爲避免文件打開,忘記關閉佔用系統內存的情況,可以使用 with...as...
結構;
在with語句中可以直接使用file_obj來做文件操作
文件只能在 with
中使用,一旦with結束則文件會自動 close()
file_name = 'demo.txt'
try:
with open(file_name) as file_obj :
# 此時這個文件只能在with中使用,一旦with結束則文件會自動close()
print(file_obj.read())
except FileNotFoundError:
print(f'{file_name} 文件不存在~~')
1.3 文件的簡單讀取
1.3.1 基本用法
調用 open()
來打開一個文件,可以將文件分成兩種類型:
- 純文本文件(使用utf-8等編碼編寫的文本文件);
- 二進制文件(圖片、mp3、ppt等這些文件);
open()
打開文件時,默認是以文本文件的形式打開的,但是 open()
默認的編碼爲 None
,所以處理文本文件時,必須要指定文件的編碼。指定編碼之後就可以讀取中文文本文件了。
with open(file_name, encoding='utf-8') as file_obj:
1.3.2 大文件讀取
如果直接調用 read()
它會將文本文件的所有內容全部都讀取出來。如果要讀取的文件較大的話,會一次性將文件的內容加載到內存中,容易導致內存泄漏,所以對於較大的文件,不要直接調用 read()
。
那麼如何解決?查看一下幫助:
file_name = r'C:\demo.txt'
try:
with open(file_name, encoding='utf-8') as file_obj:
help(file_obj.read)
except FileNotFoundError:
print(f'{file_name}文件不存在!')
輸出:
Help on built-in function read:
read(size=-1, /) method of _io.TextIOWrapper instance
Read at most n characters from stream.
Read from underlying buffer until we have n characters or we hit EOF.
If n is negative or omitted, read until EOF.
有輸出信息可知:read()
可以接收一個 size
作爲參數,該參數用來指定要讀取的字符的數量,默認值爲 -1
,它會讀取文件中的所有字符。我們可以爲 size
指定一個值,這樣 read()
會讀取指定數量的字符,每一次讀取都從上次讀取到位置開始讀取,如果字符的數量小於 size
,則會讀取剩餘所有的;如果已經讀取到了文件的最後了,則會返回“空串”。
注意:文本中的換行字符也會被計數!
file_name = r'D:\AliyunEDU\Part6-Python\03 函數 面向對象 異常處理\demo2.txt'
try:
with open(file_name, encoding='utf-8') as file_obj:
#help(file_obj.read)
content = file_obj.read(-1)
print(f'文本內容爲:\n\n{content}\n') # f-字符串格式化
print(f'文本長度爲:{len(content)}')
except FileNotFoundError:
print(f'{file_name}文件不存在!')
輸出:
文本內容爲:
鋤禾日當午
汗滴禾下土
誰知盤中餐
粒粒皆辛苦
文本長度爲:23
# 前三句各一個換行(回車)
大文件讀取:
# 讀取大文件的方式
file_name = 'demo.txt'
try:
with open(file_name, encoding='utf-8') as file_obj:
# 定義一個變量,來保存文件的內容
file_content = ''
# 定義一個變量,來指定每次讀取的大小
chunk = 100
# 創建一個循環來讀取文件內容
while True:
# 讀取chunk大小的內容
content = file_obj.read(chunk)
# 設置循環終止條件
# 檢查是否讀取到了內容
if not content: # content讀取完畢會返回空字符串,空字符串爲False,取反爲True
# 內容讀取完畢,退出循環
break
# 查看讀取內容
file_content += content
except FileNotFoundError :
print(f'{file_name} 這個文件不存在!')
print(file_content)
分塊讀取,提高大文件讀取效率。
1.3.3 readline()
readline()
方法可以用來讀取一行內容;
with open(file_name , encoding='utf-8') as file_obj:
# 讀取一行內容
print(file_obj.readline(), end='')
readlines()
方法用於一行一行的讀取內容,它會一次性將讀取到的內容封裝到一個列表中返回;
import pprint
import os
file_name = 'demo.txt'
with open(file_name , encoding='utf-8') as file_obj:
# readline()方法可以用來讀取一行內容
# print(file_obj.readline())
# print(file_obj.readline(),end='')
# readlines()方法用於一行一行的讀取內容
# r = file_obj.readlines()
# pprint.pprint(r[0])
for t in file_obj:
print(t)
1.4 文件寫入
open()
打開文件時必須要指定打開文件所要做的操作(讀、寫、追加);如果不指定操作類型,則默認是讀取文件, 而讀取文件時是不能向文件中寫入的。
讀取模式說明:
t
:表示讀取文本文件;b
:表示讀取二進制文件;
open()
文件讀取參數說明如下:
r
:表示只讀的;rt
功能一樣;rb
:讀取二進制文件;w
:表示是可寫的,使用w
來寫入文件時,如果文件不存在會創建文件,如果文件存在則會截斷文件,截斷文件指刪除原來文件中的所有內容;wt
功能一樣;a
:表示追加內容,如果文件不存在會創建文件,如果文件存在則會向文件中追加內容;x
:用來新建文件,如果文件不存在則創建,存在則報錯;+
:爲操作符增加功能;r+
:即可讀又可寫,文件不存在會報錯;'r+b'
打開文件而不會被截斷;w+
:a+
:
write()
方法向文件中寫入內容,如果操作的是一個文本文件的話,則 write()
需要傳遞一個字符串作爲參數,該方法會可以分多次向文件中寫入內容,寫入完成以後,該方法會返回寫入的字符的個數。
file_name = 'demo.txt'
# with open(file_name , 'w' , encoding='utf-8') as file_obj:
# with open(file_name , 'r+' , encoding='utf-8') as file_obj:
with open(file_name , 'x' , encoding='utf-8') as file_obj:
file_obj.write('aaa\n')
file_obj.write('bbb\n')
file_obj.write('ccc\n')
r = file_obj.write(str(123)+'123123\n')
r = file_obj.write('今天天氣真不錯')
print(r)
- 讀取文本文件時,size是以字符爲單位的;
- 讀取二進制文件時,size是以字節爲單位;
file_name = '敢問路在何方.flac'
with open(file_name , 'rb') as file_obj:
# print(file_obj.read(100))
# 將讀取到的內容寫出來
# 定義一個新的文件
new_name = 'aa.flac'
with open(new_name , 'wb') as new_obj:
# 定義每次讀取的大小
chunk = 1024 * 100
while True :
# 從已有的對象中讀取數據
content = file_obj.read(chunk)
# 內容讀取完畢,終止循環
if not content :
break
# 將讀取到的數據寫入到新對象中
new_obj.write(content)
1.5 seek()和tell()
seek()
可以修改當前讀取的位置;此時如果再用read()
方法,會從修改的位置之後繼續讀取;
seek()需要兩個參數
- 第一個 是要切換到的位置
- 第二個 計算位置方式
可選值:
1)0
:從頭計算,默認值;
2)1
:從當前位置計算;file_obj.seek(70,1)
;
3)2
:從最後位置開始計算;file_obj.seek(-10,2)
,讀取文件最後10個數據;
tell()
方法用來查看當前讀取的位置;
print('當前讀取到了 -->',file_obj.tell())
完整示例:
with open('demo2.txt','rt' , encoding='utf-8') as file_obj:
# print(file_obj.read(100))
# print(file_obj.read(30))
# seek() 可以修改當前讀取的位置
file_obj.seek(9)
print(file_obj.read())
# tell() 方法用來查看當前讀取的位置
print('當前讀取到了 -->',file_obj.tell())
1.6 其他文件操作
os.listdir()
獲取指定目錄的目錄結構,需要一個路徑作爲參數,會獲取到該路徑下的目錄結構,默認路徑爲.
當前目錄,該方法會返回一個列表,目錄中的每一個文件(夾)的名字都是列表中的一個元素。
os.listdir()
和os.listdir('.')
功能是一樣的;os.listdir('..')
返回當前文件目錄上一級三維文件目錄下的文件;
os.chdir()
切換當前所在的目錄,作用相當於cd
(os.chdir('c:/')
);- 創建目錄:
os.mkdir("a")
,在當前目錄下創建一個名字爲 aaa 的目錄; - 刪除目錄:
os.rmdir('abc')
; - 刪除文件:
os.remove('aa.txt')
; os.rename('舊名字','新名字')
可以對一個文件進行重命名,也可以用來移動一個文件:
1)os.rename('aa.txt','bb.txt')
;實現文件重命名;
2)os.rename('bb.txt','c:/users/34123/desktop/bb.txt')
;蔣文佳移動到桌面;
此處只列出了一些常用的文件操作,如果在開發過程中有其他的需求,可以查閱官方文檔。