Linux的inode及軟連接和硬鏈接的理解


Linux的inode的理解

轉自http://www.cnblogs.com/itech/archive/2012/05/15/2502284.html


一、inode是什麼?

    理解inode,要從文件儲存說起。

    文件儲存在硬盤上,硬盤的最小存儲單位叫做"扇區"(Sector)。每個扇區儲存512字節(相當於0.5KB)。

    操作系統讀取硬盤的時候,不會一個個扇區地讀取,這樣效率太低,而是一次性連續讀取多個扇區,即一次性讀取一個"塊"(block)。這種由多個扇區組成的"塊",是文件存取的最小單位。"塊"的大小,最常見的是4KB,即連續八個 sector組成一個 block。

    文件數據都儲存在"塊"中,那麼很顯然,我們還必須找到一個地方儲存文件的元信息,比如文件的創建者、文件的創建日期、文件的大小等等。這種儲存文件元信息的區域就叫做inode,中文譯名爲"索引節點"。


二、inode的內容

    inode包含文件的元信息,具體來說有以下內容:

  * 文件的字節數

  * 文件擁有者的User ID

  * 文件的Group ID

  * 文件的讀、寫、執行權限

  * 文件的時間戳,共有三個:ctime指inode上一次變動的時間,mtime指文件內容上一次變動的時間,atime指文件上一次打開的時間。
  * 鏈接數,即有多少文件名指向這個inode

  * 文件數據block的位置


    可以用stat命令,查看某個文件的inode信息:

stat example.txt

        總之,除了文件名以外的所有文件信息,都存在inode之中。至於爲什麼沒有文件名,下文會有詳細解釋。


三、inode的大小

    inode也會消耗硬盤空間,所以硬盤格式化的時候,操作系統自動將硬盤分成兩個區域。一個是數據區,存放文件數據;另一個是inode區(inode table),存放inode所包含的信息。

    每個inode節點的大小,一般是128字節或256字節。inode節點的總數,在格式化時就給定,一般是每1KB或每2KB就設置一個inode。假定在一塊1GB的硬盤中,每個inode節點的大小爲128字節,每1KB就設置一個inode,那麼inode table的大小就會達到128MB,佔整塊硬盤的12.8%。

    查看每個硬盤分區的inode總數和已經使用的數量,可以使用df命令。

df -i

       查看每個inode節點的大小,可以用如下命令:

sudo dumpe2fs -h /dev/hda | grep "Inode size"


       由於每個文件都必須有一個inode,因此有可能發生inode已經用光,但是硬盤還未存滿的情況。這時,就無法在硬盤上創建新文件。


四、inode號碼

    每個inode都有一個號碼,操作系統用inode號碼來識別不同的文件。

    這裏值得重複一遍,Unix/Linux系統內部不使用文件名,而使用inode號碼來識別文件。對於系統來說,文件名只是inode號碼便於識別的別稱或者綽號。表面上,用戶通過文件名,打開文件。實際上,系統內部這個過程分成三步:首先,系統找到這個文件名對應的inode號碼;其次,通過inode號碼,獲取inode信息;最後,根據inode信息,找到文件數據所在的block,讀出數據。

    使用ls -i命令,可以看到文件名對應的inode號碼:

ls -i example.txt


五、目錄文件

    Unix/Linux系統中,目錄(directory)也是一種文件。打開目錄,實際上就是打開目錄文件。

    目錄文件的結構非常簡單,就是一系列目錄項(dirent)的列表。每個目錄項,由兩部分組成:所包含文件的文件名,以及該文件名對應的inode號碼。

    ls命令只列出目錄文件中的所有文件名:

ls /etc

       ls -i命令列出整個目錄文件,即文件名和inode號碼:

ls -i /etc

       如果要查看文件的詳細信息,就必須根據inode號碼,訪問inode節點,讀取信息。ls -l命令列出文件的詳細信息。

ls -l /etc


六、硬鏈接

    一般情況下,文件名和inode號碼是"一一對應"關係,每個inode號碼對應一個文件名。但是,Unix/Linux系統允許,多個文件名指向同一個inode號碼。這意味着,可以用不同的文件名訪問同樣的內容;對文件內容進行修改,會影響到所有文件名;但是,刪除一個文件名,不影響另一個文件名的訪問。這種情況就被稱爲"硬鏈接"(hard link)。

    ln命令可以創建硬鏈接:

ln 源文件 目標文件

    運行上面這條命令以後,源文件與目標文件的inode號碼相同,都指向同一個inode。inode信息中有一項叫做"鏈接數",記錄指向該inode的文件名總數,這時就會增加1。反過來,刪除一個文件名,就會使得inode節點中的"鏈接數"減1。當這個值減到0,表明沒有文件名指向這個inode,系統就會回收這個inode號碼,以及其所對應block區域。

    這裏順便說一下目錄文件的"鏈接數"。創建目錄時,默認會生成兩個目錄項:"."和".."。前者的inode號碼就是當前目錄的inode號碼,等同於當前目錄的"硬鏈接";後者的inode號碼就是當前目錄的父目錄的inode號碼,等同於父目錄的"硬鏈接"。所以,任何一個目錄的"硬鏈接"總數,總是等於2加上它的子目錄總數(含隱藏目錄),這裏的2是父目錄對其的“硬鏈接”和當前目錄下的".硬鏈接“。


七、軟鏈接

    除了硬鏈接以外,還有一種特殊情況。文件A和文件B的inode號碼雖然不一樣,但是文件A的內容是文件B的路徑。讀取文件A時,系統會自動將訪問者導向文件B。因此,無論打開哪一個文件,最終讀取的都是文件B。這時,文件A就稱爲文件B的"軟鏈接"(soft link)或者"符號鏈接(symbolic link)。

    這意味着,文件A依賴於文件B而存在,如果刪除了文件B,打開文件A就會報錯:"No such file or directory"。這是軟鏈接與硬鏈接最大的不同:文件A指向文件B的文件名,而不是文件B的inode號碼,文件B的inode"鏈接數"不會因此發生變化。

ln -s命令可以創建軟鏈接。

ln -s 源文文件或目錄 目標文件或目錄


八、inode的特殊作用

    由於inode號碼與文件名分離,這種機制導致了一些Unix/Linux系統特有的現象。

  1. 有時,文件名包含特殊字符,無法正常刪除。這時,直接刪除inode節點,就能起到刪除文件的作用。

  2. 移動文件或重命名文件,只是改變文件名,不影響inode號碼。

  3. 打開一個文件以後,系統就以inode號碼來識別這個文件,不再考慮文件名。因此,通常來說,系統無法從inode號碼得知文件名。

      第3點使得軟件更新變得簡單,可以在不關閉軟件的情況下進行更新,不需要重啓。因爲系統通過inode號碼,識別運行中的文件,不通過文件名。更新的時候,新版文件以同樣的文件名,生成一個新的inode,不會影響到運行中的文件。等到下一次運行這個軟件的時候,文件名就自動指向新版文件,舊版文件的inode則被回收。


九 實際問題

    在一臺配置較低的Linux服務器(內存、硬盤比較小)的/data分區內創建文件時,系統提示磁盤空間不足,用df -h命令查看了一下磁盤使用情況,發現/data分區只使用了66%,還有12G的剩餘空間,按理說不會出現這種問題。 後來用df -i查看了一下/data分區的索引節點(inode),發現已經用滿(IUsed=100%),導致系統無法創建新目錄和文件。 

查找原因:

  /data/cache目錄中存在數量非常多的小字節緩存文件,佔用的Block不多,但是佔用了大量的inode。 

解決方案:
  1、刪除/data/cache目錄中的部分文件,釋放出/data分區的一部分inode。
  2、用軟連接將空閒分區/opt中的newcache目錄連接到/data/cache,使用/opt分區的inode來緩解/data分區inode不足的問題:

  ln -s /opt/newcache /data/cache 


理解 Linux 的硬鏈接與軟鏈接

從 inode 瞭解 Linux 文件系統

參考:http://www.ibm.com/developerworks/cn/linux/l-cn-hardandsymb-links/index.html

下面是部分摘錄,方便大家查看。


硬鏈接與軟鏈接的聯繫與區別

我們知道文件都有文件名與數據,這在 Linux 上被分成兩個部分:用戶數據 (user data) 與元數據 (metadata)。用戶數據,即文件數據塊 (data block),數據塊是記錄文件真實內容的地方;而元數據則是文件的附加屬性,如文件大小、創建時間、所有者等信息。在 Linux 中,元數據中的 inode 號(inode 是文件元數據的一部分但其並不包含文件名,inode 號即索引節點號)纔是文件的唯一標識而非文件名。文件名僅是爲了方便人們的記憶和使用,系統或程序通過 inode 號尋找正確的文件數據塊。圖 1.展示了程序通過文件名獲取文件內容的過程。

221553hpptppek2sdmjsvw.jpg 

圖 1. 通過文件名打開文件

爲解決文件的共享使用,Linux 系統引入了兩種鏈接:硬鏈接 (hard link) 與軟鏈接(又稱符號鏈接,即 soft link 或 symbolic link)。鏈接爲 Linux 系統解決了文件的共享使用,還帶來了隱藏文件路徑、增加權限安全及節省存儲等好處。若一個 inode 號對應多個文件名,則稱這些文件爲硬鏈接。換言之,硬鏈接就是同一個文件使用了多個別名(見 圖 2.hard link 就是 file 的一個別名,他們有共同的 inode)。硬鏈接可由命令 link 或 ln 創建。

由於硬鏈接是有着相同 inode 號僅文件名不同的文件,因此硬鏈接存在以下幾點特性:
文件有相同的 inode 及 data block;
只能對已存在的文件進行創建;
不能交叉文件系統進行硬鏈接的創建;
不能對目錄進行創建,只可對文件創建;
刪除一個硬鏈接文件並不影響其他有相同 inode 號的文件。


硬鏈接爲什麼不能對目錄創建

硬鏈接不能對目錄創建是受限於文件系統的設計。現 Linux 文件系統中的目錄均隱藏了兩個個特殊的目錄:當前目錄(.)與父目錄(..)。查看這兩個特殊目錄的 inode 號可知其實這兩目錄就是兩個硬鏈接。若系統允許對目錄創建硬鏈接,則會產生目錄環。


軟鏈接的特點

軟鏈接與硬鏈接不同,若文件用戶數據塊中存放的內容是另一文件的路徑名的指向,則該文件就是軟連接。軟鏈接就是一個普通文件,只是數據塊內容有點特殊。軟鏈接有着自己的 inode 號以及用戶數據塊(見 圖 2.)。因此軟鏈接的創建與使用沒有類似硬鏈接的諸多限制:
軟鏈接有自己的文件屬性及權限等;
可對不存在的文件或目錄創建軟鏈接;
軟鏈接可交叉文件系統;
軟鏈接可對文件或目錄創建;
創建軟鏈接時,鏈接計數 i_nlink 不會增加;
刪除軟鏈接並不影響被指向的文件,但若被指向的原文件被刪除,則相關軟連接被稱爲死鏈接(即 dangling link,若被指向路徑文件被重新創建,死鏈接可恢復爲正常的軟鏈接)。

221449hxyknbn3y69nnhyn.jpg 

圖 2. 軟鏈接的訪問

當然軟鏈接的用戶數據也可以是另一個軟鏈接的路徑,其解析過程是遞歸的。
但需注意:軟鏈接創建時原文件的路徑指向使用絕對路徑較好。
使用相對路徑創建的軟鏈接被移動後該軟鏈接文件將成爲一個死鏈接。


Linux 文件系統中的 inode

       在 Linux 中,索引節點結構存在於系統內存及磁盤,其可區分成 VFS inode 與實際文件系統的 inode。VFS inode 作爲實際文件系統中 inode 的抽象,定義了結構體 inode 與其相關的操作 inode_operations(見內核源碼 include/linux/fs.h)。


VFS 中的 inode 與 inode_operations 結構體
                                
struct inode { 
    ... 
    const struct inode_operations   *i_op; // 索引節點操作
    unsigned long           i_ino;      // 索引節點號
    atomic_t                i_count;    // 引用計數器
    unsigned int            i_nlink;    // 硬鏈接數目
    ... 


struct inode_operations { 
    ... 
    int (*create) (struct inode *,struct dentry *,int, struct nameidata *); 
    int (*link) (struct dentry *,struct inode *,struct dentry *); 
    int (*unlink) (struct inode *,struct dentry *); 
    int (*symlink) (struct inode *,struct dentry *,const char *); 
    int (*mkdir) (struct inode *,struct dentry *,int); 
    int (*rmdir) (struct inode *,struct dentry *); 
    ... 



文件系統 ext4 中的 inode
                                
struct ext4_inode { 
    ... 
    __le32  i_atime;        // 文件內容最後一次訪問時間
    __le32  i_ctime;        // inode 修改時間
    __le32  i_mtime;        // 文件內容最後一次修改時間
    __le16  i_links_count;  // 硬鏈接計數
    __le32  i_blocks_lo;    // Block 計數
    __le32  i_block[EXT4_N_BLOCKS];  // 指向具體的 block 
    ... 
}; 



使用命令find 查找軟鏈接與硬鏈接:
                                
// 查找在路徑 /home 下的文件 data.txt 的軟鏈接
# find /home -lname data.txt 
/home/harris/debug/test2/a 

// 查看路徑 /home 有相同 inode 的所有硬鏈接
# find /home -samefile /home/harris/debug/test3/old.file 
/home/harris/debug/test3/hard.link 
/home/harris/debug/test3/old.file 

# find /home -inum 660650 
/home/harris/debug/test3/hard.link 
/home/harris/debug/test3/old.file 

// 列出路徑 /home/harris/debug/ 下的所有軟鏈接文件
# find /home/harris/debug/ -type l -ls 
656662 0 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 /home/harris/debug/test2/b -> a
656627 0 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 /home/harris/debug/test2/a -> 
data.txt
789467 0 lrwxrwxrwx 1 root root 8 Sep 1 18:00 /home/harris/debug/test/soft.link -> 
old.file 
789496    0 lrwxrwxrwx   1 root     root            7 Sep  1 18:01 
/home/harris/debug/test/soft.link.dir -> old.dir 


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章