Python文件(I/O)操作詳解

本文介紹了Python I/O操作,包括文件讀取,文件寫入等操作。也是Python系列教程的最後一篇(共8篇)。


系列文章

【Python 基礎】一文補齊Python基礎知識
【趣學Python:B站四大惡人】一文掌握列表、元組、字典、集合
【Python進階】一文掌握Python函數用法
【Python進階】Python面向對象之類與對象詳解
【Python進階】Python面向對象之裝飾器與封裝
【Python進階】Python面向對象之繼承和多態詳解
【Python進階】Python異常處理和模塊
【Python進階】Python文件(I/O)操作詳解



👉Python內置函數官方文檔


1. 文件

1.1 打開文件

使用 open() 函數來打開一個文件

open(file, mode='r', buffering=-1, encoding_=None, 
	 errors=None, newline=None, closefd=True, opener=None)

主要參數說明:

  • file:要打開的文件的名字(路徑);
  • mode :是一個可選參數,用於指定打開文件的模式。默認狀態爲 'r',表示只讀。
  • 返回值:返回一個對象,這個對象就代表了當前打開的文件;

注意:

  1. 如果目標文件和當前文件在同一級目錄下,則直接使用文件名即可;
file_name = 'demo.txt'
file_obj = open(file_name) 
  1. 在windows系統使用路徑時,可以使用 / 來代替 \,或者可以使用 \\ 來代替 \。因爲 \ 在Python中是轉義字符;
  2. 也可以使用原始字符串;
file_name = 'hello\\demo.txt'
file_name = r'hello\demo.txt'
file_obj = open(file_name) 
  1. 表示路徑,可以使用 .. 來返回一級目錄;
file_name = '../hello/demo.txt'
file_obj = open(file_name) 
  1. 如果目標文件距離當前文件比較遠,此時可以使用絕對路徑。絕對路徑應該從磁盤的根目錄開始書寫;
file_name = r'C:\demo.txt'
file_obj = open(file_name) 
print(file_obj)

1.2 關閉文件

# 打開文件
file_name = 'demo.txt'
file_obj = open(file_name)
  1. 讀取文件
    當我們獲取了文件對象以後,所有的對文件的操作都應該通過對象來進行。
    read() 方法,用來讀取文件中的內容,它會將內容全部保存爲一個字符串返回。
content = file_obj.read()
  1. 關閉文件
    close() 方法關閉文件;
file_obj.close()

爲避免文件打開,忘記關閉佔用系統內存的情況,可以使用 with...as... 結構;
在with語句中可以直接使用file_obj來做文件操作
文件只能在 with 中使用,一旦with結束則文件會自動 close()

file_name = 'demo.txt'

try:
    with open(file_name) as file_obj :
    	# 此時這個文件只能在with中使用,一旦with結束則文件會自動close()
        print(file_obj.read())
except FileNotFoundError:
    print(f'{file_name} 文件不存在~~')

1.3 文件的簡單讀取

1.3.1 基本用法

調用 open() 來打開一個文件,可以將文件分成兩種類型:

  • 純文本文件(使用utf-8等編碼編寫的文本文件);
  • 二進制文件(圖片、mp3、ppt等這些文件);

open() 打開文件時,默認是以文本文件的形式打開的,但是 open() 默認的編碼爲 None ,所以處理文本文件時,必須要指定文件的編碼。指定編碼之後就可以讀取中文文本文件了。

with open(file_name, encoding='utf-8') as file_obj:

1.3.2 大文件讀取

如果直接調用 read() 它會將文本文件的所有內容全部都讀取出來。如果要讀取的文件較大的話,會一次性將文件的內容加載到內存中,容易導致內存泄漏,所以對於較大的文件,不要直接調用 read()

那麼如何解決?查看一下幫助:

file_name = r'C:\demo.txt'
try:
    with open(file_name, encoding='utf-8') as file_obj:
        help(file_obj.read)

except FileNotFoundError:
    print(f'{file_name}文件不存在!')

輸出:

Help on built-in function read:

read(size=-1, /) method of _io.TextIOWrapper instance
    Read at most n characters from stream.
    
    Read from underlying buffer until we have n characters or we hit EOF.
    If n is negative or omitted, read until EOF.

有輸出信息可知:read() 可以接收一個 size 作爲參數,該參數用來指定要讀取的字符的數量,默認值爲 -1,它會讀取文件中的所有字符。我們可以爲 size 指定一個值,這樣 read() 會讀取指定數量的字符,每一次讀取都從上次讀取到位置開始讀取,如果字符的數量小於 size,則會讀取剩餘所有的;如果已經讀取到了文件的最後了,則會返回“空串”。

注意:文本中的換行字符也會被計數!

file_name = r'D:\AliyunEDU\Part6-Python\03 函數 面向對象 異常處理\demo2.txt'
try:
    with open(file_name, encoding='utf-8') as file_obj:
        #help(file_obj.read)
        content = file_obj.read(-1)
        print(f'文本內容爲:\n\n{content}\n') # f-字符串格式化
        print(f'文本長度爲:{len(content)}')

except FileNotFoundError:
    print(f'{file_name}文件不存在!')

輸出:

文本內容爲:

鋤禾日當午
汗滴禾下土
誰知盤中餐
粒粒皆辛苦

文本長度爲:23
# 前三句各一個換行(回車)

大文件讀取:

# 讀取大文件的方式
file_name = 'demo.txt'

try:
    with open(file_name, encoding='utf-8') as file_obj:
        # 定義一個變量,來保存文件的內容
        file_content = ''
        # 定義一個變量,來指定每次讀取的大小
        chunk = 100
        # 創建一個循環來讀取文件內容
        while True:
            # 讀取chunk大小的內容
            content = file_obj.read(chunk)
			
			# 設置循環終止條件
            # 檢查是否讀取到了內容
            if not content: # content讀取完畢會返回空字符串,空字符串爲False,取反爲True
                # 內容讀取完畢,退出循環
                break

            # 查看讀取內容
            file_content += content

except FileNotFoundError :
    print(f'{file_name} 這個文件不存在!')

print(file_content)

分塊讀取,提高大文件讀取效率。


1.3.3 readline()

readline() 方法可以用來讀取一行內容;

with open(file_name , encoding='utf-8') as file_obj:
    # 讀取一行內容
    print(file_obj.readline(), end='')

readlines() 方法用於一行一行的讀取內容,它會一次性將讀取到的內容封裝到一個列表中返回;

import pprint
import os
file_name = 'demo.txt'

with open(file_name , encoding='utf-8') as file_obj:
    # readline()方法可以用來讀取一行內容
    # print(file_obj.readline())
    # print(file_obj.readline(),end='')
    
    # readlines()方法用於一行一行的讀取內容
    # r = file_obj.readlines()
    # pprint.pprint(r[0])

    for t in file_obj:
        print(t)

1.4 文件寫入

open() 打開文件時必須要指定打開文件所要做的操作(讀、寫、追加);如果不指定操作類型,則默認是讀取文件, 而讀取文件時是不能向文件中寫入的。
讀取模式說明:

  • t:表示讀取文本文件;
  • b:表示讀取二進制文件;

open() 文件讀取參數說明如下:

  • r:表示只讀的;rt 功能一樣;
  • rb:讀取二進制文件;
  • w :表示是可寫的,使用 w 來寫入文件時,如果文件不存在會創建文件,如果文件存在則會截斷文件,截斷文件指刪除原來文件中的所有內容wt 功能一樣;
  • a :表示追加內容,如果文件不存在會創建文件,如果文件存在則會向文件中追加內容;
  • x :用來新建文件,如果文件不存在則創建,存在則報錯;
  • + :爲操作符增加功能;
  • r+ :即可讀又可寫,文件不存在會報錯;'r+b'打開文件而不會被截斷;
  • w+
  • a+

write() 方法向文件中寫入內容,如果操作的是一個文本文件的話,則 write() 需要傳遞一個字符串作爲參數,該方法會可以分多次向文件中寫入內容,寫入完成以後,該方法會返回寫入的字符的個數。

file_name = 'demo.txt'
# with open(file_name , 'w' , encoding='utf-8') as file_obj:
# with open(file_name , 'r+' , encoding='utf-8') as file_obj:
with open(file_name , 'x' , encoding='utf-8') as file_obj:
    file_obj.write('aaa\n')
    file_obj.write('bbb\n')
    file_obj.write('ccc\n')
    r = file_obj.write(str(123)+'123123\n')
    r = file_obj.write('今天天氣真不錯')
    print(r)

  • 讀取文本文件時,size是以字符爲單位的;
  • 讀取二進制文件時,size是以字節爲單位;
file_name = '敢問路在何方.flac'

with open(file_name , 'rb') as file_obj:
    # print(file_obj.read(100))

    # 將讀取到的內容寫出來
    # 定義一個新的文件
    new_name = 'aa.flac'

    with open(new_name , 'wb') as new_obj:

        # 定義每次讀取的大小
        chunk = 1024 * 100

        while True :
            # 從已有的對象中讀取數據
            content = file_obj.read(chunk)

            # 內容讀取完畢,終止循環
            if not content :
                break

            # 將讀取到的數據寫入到新對象中
            new_obj.write(content)

1.5 seek()和tell()

seek() 可以修改當前讀取的位置;此時如果再用read()方法,會從修改的位置之後繼續讀取;
seek()需要兩個參數

  • 第一個 是要切換到的位置
  • 第二個 計算位置方式
    可選值:
    1)0 :從頭計算,默認值;
    2)1 :從當前位置計算;file_obj.seek(70,1)
    3)2 :從最後位置開始計算;file_obj.seek(-10,2),讀取文件最後10個數據;

tell()方法用來查看當前讀取的位置;

print('當前讀取到了 -->',file_obj.tell())

完整示例:

with open('demo2.txt','rt' , encoding='utf-8') as file_obj:
    # print(file_obj.read(100))
    # print(file_obj.read(30))

    # seek() 可以修改當前讀取的位置
    file_obj.seek(9)
    print(file_obj.read())

    # tell() 方法用來查看當前讀取的位置
    print('當前讀取到了 -->',file_obj.tell())

1.6 其他文件操作

  1. os.listdir() 獲取指定目錄的目錄結構,需要一個路徑作爲參數,會獲取到該路徑下的目錄結構,默認路徑爲 . 當前目錄,該方法會返回一個列表,目錄中的每一個文件(夾)的名字都是列表中的一個元素。
  • os.listdir()os.listdir('.') 功能是一樣的;
  • os.listdir('..') 返回當前文件目錄上一級三維文件目錄下的文件;
  1. os.chdir() 切換當前所在的目錄,作用相當於 cdos.chdir('c:/'));
  2. 創建目錄:os.mkdir("a") ,在當前目錄下創建一個名字爲 aaa 的目錄;
  3. 刪除目錄:os.rmdir('abc')
  4. 刪除文件:os.remove('aa.txt')
  5. os.rename('舊名字','新名字') 可以對一個文件進行重命名,也可以用來移動一個文件:
    1)os.rename('aa.txt','bb.txt');實現文件重命名;
    2)os.rename('bb.txt','c:/users/34123/desktop/bb.txt');蔣文佳移動到桌面;

此處只列出了一些常用的文件操作,如果在開發過程中有其他的需求,可以查閱官方文檔。


參考:https://edu.aliyun.com/course/1782


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章