C語言入門(二十四)文件操作基本常識

文件操作基本常識 

前言:

由於程序中經常有大量對文件的輸入輸出操作,它經常構成了程序的主要部分,因而C語言提供了很多輸入輸出的函數,它們分別用於兩種類型文件輸入輸出系統:即由ANSI標準定義的緩衝文件(也稱標準文件(流)輸入輸出(I/O)系統);另一類是ANSI標準中沒有定義的非緩衝文件(也稱非標準文件(流)輸入輸出(I/O)系統)。

我們已經熟悉了通過鍵盤和顯示器進行輸入輸出的一些函數,如scanf(),printf()等等,這些通過控制檯(鍵盤、顯示器等)進行I/O的操作,可以看作標準文件輸入輸出系統的一些特例,實際上在標準輸入輸出系統中的一些函數,有關文件的參數(文件結構指針或稱流指針),只要用標準設備的流指針代替,這些標準輸入輸出函數即成爲控制檯I/O函數。在任何程序執行時,C系統都定義了5個標準設備文件可供使用。自動打開的5個標準設備文件的文件結構指針(在標準I/O系統中)和文件代號將有一個規定值:
設備 標準文件I/O系統中的流指針名 非標準文件……

鍵盤(標準輸入) stdin 0
顯示器(標準輸出) stdout 1
顯示器(標準錯誤) stderr 2
串行口(標準輔助) stdoux 3
打印機(標準打印) stdprn 4

這樣,不論在標準文件系統還是非標準文件系統中,文件結構只要用上述的流指針或文件代號代替,則這些函數也均適用於控制檯設備。


一、文本流和二進制流
在C中引入了流(stream)的概念。它將數據的輸入輸出看作是數據的流入和流出,這樣不管是磁盤文件或者是物理設備(打印機、顯示器、鍵盤等),都可看作一種流的源和目的,視他們爲同一種東西,而不管其具體的物理結構,即對他們的操作,就是數據的流入和流出。這種把數據的輸入輸出操作對象,抽象化爲一種流,而不管它的具體結構的方法很有利於編程,而涉及流的輸出操作函數可用於各種對象,與其具體的實體無關,即具有通用性。
在C中流可分爲兩大類,即文本流(text stream)和二進制流(binary stream)。所謂文本流是指在流中流動的數據是以字符形式出現。在文本流中,'\n'被換成回車CR和換行LF的代碼0DH和0AH。而當輸出時,則0DH和0AH本換成'\n'。
二進制流是指流動的是二進制數字序列,若流中有字符,則用一個字節的二進制ASCII碼錶示,若是數字,則用一個字節的二進制數表示。在流入流出時,對\n符號不進行變換。例如2001這個數,在文本流中用其ASCII碼錶示爲:
'2' '0' '0' '1'
| | | |
50 48 48 49

共佔4字節。而在二進制流中則表示爲:00000111 11010001 用十六進制就是07D1。只佔兩字節。
由此看出,二進制流比文本流節省空間,且不用進行對\n的轉換,這樣可以大大加快流的速度,提高效率。因而,對於含有大量數字信息的數字流,可以採用二進制流的方式;對於含有大量字符信息的流,則採用文本流的方式。


二、流和文件
在C語言中流就是一種文件形式,它實際上就表示一個文件或設備(從廣義上講,設備也是一種文件)。把流當作文件總覺得不習慣,因而有人稱這種和流等同的文件爲流式文件,流的輸入輸出也稱爲文件的輸入輸出操作。當流到磁盤而成爲文件時,意味着要啓動磁盤寫入操作,這樣流入一個字符(文本流)或流入一個字節(二進制流)均要啓動磁盤操作,將大大降低傳輸效率(磁盤是慢速設備),且降低磁盤的使用壽命。爲此,C語言在輸入輸出的使用使用了緩衝技術,即在內存爲輸入的磁盤文件開闢了一個緩衝區(缺省爲512字節),當流到該緩衝區裝滿後,再啓動磁盤一次,將緩衝區內容裝到磁盤文件中去。讀取文件也是類似。
在C語言中將此種文件輸入輸出操作稱爲標準輸入輸出,或稱流式輸入輸出(因這種輸入輸出操作是ANSI C推薦的標準)。還有一種是不帶緩衝文件輸入輸出,稱爲非標準文件輸入輸出或低級輸入輸出,它將由DOS直接管理。關於這兩種輸入輸出文件系統下節將會介紹。


三、文件FILE的數據結構
typedef struct
{
short level;
unsigned flags;
char fd;
unsigned char hold;
short bsize;
unsigned char *buffer;
unsigned char *curp;
unsigned istemp;
short token;
}FILE;
這是Turbo C中使用的定義(在stdio.h文件中),不同的C編譯器,可能使用不同的定義,但基本含義變化不會太大。
flags: 是一個10位的標誌字,其具體含義如下:
位 代表符號 含義
0 _F_READ 讀
1 _F_WRIT 寫
2 _F_BUF 由fclose釋放緩衝區
3 _F_LBUF 行緩衝
4 _F_ERR 出錯標誌
5 _F_EOF EOF文件尾標誌
6 _F_BIN 二進制方式
7 _F_IN 在進行輸入
8 _F_OUT 在進行輸出
9 _F_TERM 文件是一個終端



其他各字段內容以及flags字段內各位所的功能,請參照其他一些資料。這裏不多說了,它目前並不是我們要求的內容。
應該注意,不要把文件指針和FILE結構指針混爲一談,它們代表兩個不同的地址。文件指針指出了對文件當前讀寫的數據位置,而FILE結構指針是指出了打開文件所對應的FILE結構在內存中的地址,這個指針它實際本身也包含了文件指針的信息。流指針中的各字段是供C語言內部使用的,用戶不應該存取它的任何字段。
發佈了101 篇原創文章 · 獲贊 540 · 訪問量 74萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章