Linux中ext詳解

本文轉自:http://misujun.blog.51cto.com/2595192/883949


ext2與ext3

Linux ext2/ext3文件系統使用索引節點來記錄文件信息,作用像windows的文件分配表。索引節點是一個結構,它包含了一個文件的長度、創建及修改時間、權限、所屬關係、磁盤中的位置等信息。一個文件系統維護了一個索引節點的數組,每個文件或目錄都與索引節點數組中的唯一一個元素對應。系統給每個索引節點分配了一個號碼,也就是該節點在數組中的索引號,稱爲索引節點號。 linux文件系統將文件索引節點號和文件名同時保存在目錄中。所以,目錄只是將文件的名稱和它的索引節點號結合在一起的一張表,目錄中每一對文件名稱和索引節點號稱爲一個連接。 對於一個文件來說有唯一的索引節點號與之對應,對於一個索引節點號,卻可以有多個文件名與之對應。因此,在磁盤上的同一個文件可以通過不同的路徑去訪問它。 
Linux之前缺省情況下使用的文件系統爲Ext2,ext2文件系統的確高效穩定。但是,隨着Linux系統在關鍵業務中的應用,Linux文件系統的弱點也漸漸顯露出來了:其中系統缺省使用的ext2文件系統是非日誌文件系統。這在關鍵行業的應用是一個致命的弱點。本文向各位介紹Linux下使用ext3日誌文件系統應用。 
Ext3文件系統是直接從Ext2文件系統發展而來,目前ext3文件系統已經非常穩定可靠。它完全兼容ext2文件系統。用戶可以平滑地過渡到一個日誌功能健全的文件系統中來。這實際上了也是ext3日誌文件系統初始設計的初衷。

Ext3日誌文件系統的特點 
1、高可用性 
系統使用了ext3文件系統後,即使在非正常關機後,系統也不需要檢查文件系統。宕機發生後,恢復ext3文件系統的時間只要數十秒鐘。 
2、數據的完整性: 
ext3文件系統能夠極大地提高文件系統的完整性,避免了意外宕機對文件系統的破壞。在保證數據完整性方面,ext3文件系統有2種模式可供選擇。其中之一就是“同時保持文件系統及數據的一致性”模式。採用這種方式,你永遠不再會看到由於非正常關機而存儲在磁盤上的垃圾文件。 
3、文件系統的速度: 
儘管使用ext3文件系統時,有時在存儲數據時可能要多次寫數據,但是,從總體上看來,ext3比ext2的性能還要好一些。這是因爲ext3的日誌功能對磁盤的驅動器讀寫頭進行了優化。所以,文件系統的讀寫性能較之Ext2文件系統並來說,性能並沒有降低。 
4、數據轉換 
  由ext2文件系統轉換成ext3文件系統非常容易,只要簡單地鍵入兩條命令即可完成整個轉換過程,用戶不用花時間備份、恢復、格式化分區等。用一個ext3文件系統提供的小工具tune2fs,它可以將ext2文件系統輕鬆轉換爲ext3日誌文件系統。另外,ext3文件系統可以不經任何更改,而直接加載成爲ext2文件系統。 
5、多種日誌模式 
  Ext3有多種日誌模式,一種工作模式是對所有的文件數據及metadata(定義文件系統中數據的數據,即數據的數據)進行日誌記錄(data=journal模式);另一種工作模式則是隻對metadata記錄日誌,而不對數據進行日誌記錄,也即所謂data=ordered或者data=writeback模式。系統管理人員可以根據系統的實際工作要求,在系統的工作速度與文件數據的一致性之間作出選擇。

實際使用Ext3文件系統 
創建新的ext3文件系統,例如要把磁盤上的hda8分區格式化ext3文件系統,並將日誌記錄在/dev/hda1分區,那麼操作過程如下: 
[root@stationxx root]# mke2fs -j /dev/hda8 
mke2fs 1.24a (02-Sep-2001) 
Filesystem label= 
OS type: Linux 
Block size=1024 (log=0) 
.. .. .. 
Creating journal (8192 blocks): done 
Writing superblocks and filesystem accounting information: done 
This filesystem will be automatically checked every 30 mounts or 
180 days, whichever comes first. Use tune2fs -c or -i to override. 
在創建新的文件系統時,可以看到,ext3文件系統執行自動檢測的時間爲180天或每第31次被mount時,實際上這個參數可以根據需要隨意調節。

以下將新的文件系統mount到主分區/data目錄下: 
[root@stionxx root]# mount -t ext3 /dev/hda8 /data 
說明:以上將已格式化爲ext3文件系統的/dev/hda8分區加載到/data目錄下。 
ext3 基於ext2 的代碼,它的磁盤格式和 ext2 的相同;這意味着,一個乾淨卸裝的 ext3 文件系統可以作爲 ext2 文件系統重新掛裝。Ext3文件系統仍然能被加載成ext2文件系統來使用,你可以把一個文件系統在ext3和ext2自由切換。這時在ext2文件系統上的ext3日誌文件仍然存在,只是ext2不能認出日誌而已。

以轉換文件系統爲例,將ext2文件系統轉換爲ext3文件系統,命令如下: 
[root@stationxx root]# tune2fs -j /dev/hda9 
tune2fs 1.24a (02-Sep-2001) 
Creating journal inode: done 
This filesystem will be automatically checked every 31 mounts or 
180 days, whichever comes first. Use tune2fs -c or -i to override. 
這樣,原來的ext2文件系統就轉換成了ext3文件系統。注意將ext2文件系統轉換爲ext3文件系統時,不必要將分區缷載下來轉換。 
轉換完成後,不要忘記將/etc/fstab文件中所對應分區的文件系統由原來的ext2更改爲ext3。

ext3日誌的存放位置 
可以將日誌放置在另外一個存儲設備上,例如存放到分區/dev/hda8。例如要在/dev/hda8上創建一個ext3文件系統,並將日誌存放在外部設備/dev/hda2上,則運行以下命令: 
[root @stationxx root]#mke2fs -J device=/dev/hda8 /dev/hda2 
ext3文件系統修復 
新的e2fsprogs中的e2fsck支持ext3文件系統。當一個ext3文件系統被破壞時,先卸載該設備,在用e2fsck修復: 
[root @stationxx root] # umount /dev/hda8 
[root @stationxx root] #e2fsck -fy /dev/hda8

ext3的優點 
爲什麼你需要從ext2遷移到ext3呢?以下有四個主要原因:可用性、數據完整性、速度、易於遷移。 
1、可用性 
在非正常當機後(停電、系統崩潰),只有在通過e2fsck進行一致性校驗後,ext2文件系統才能被裝載使用。運行e2fsck的時間主要取決於 ext2文件系統的大小。校驗稍大一些的文件系統(幾十GB)需要很長時間。如果文件系統上的文件數量多,校驗的時間則更長。校驗幾百個GB的文件系統可能需要一個小時或更長。這極大地限制了可用性。相比之下,除非發生硬件故障,即使非正常關機,ext3也不需要文件系統校驗。這是因爲數據是以文件系統始終保持一致方式寫入磁盤的。在非正常關機後,恢復ext3文件系統的時間不依賴於文件系統的大小或文件數量,而依賴於維護一致性所需“日誌”的大小。使用缺省日誌設置,恢復時間僅需一秒(依賴於硬件速度)。 
2、數據完整性 
使用ext3文件系統,在非正常關機時,數據完整性能得到可靠的保障。你可以選擇數據保護的類型和級別。你可以選擇保證文件系統一致,但是允許文件系統上的數據在非正常關機時受損;這是可以在某些狀況下提高一些速度(但非所有狀況)。你也可以選擇保持數據的可靠性與文件系統一致;這意味着在當機後,你不會在新近寫入的文件中看到任何數據垃圾。這個保持數據的可靠性與文件系統一致的安全的選擇是缺省設置。 
3、速度 
儘管ext3寫入數據的次數多於ext2,但是ext3常常快於ext2(高數據流)。這是因爲ext3的日誌功能優化硬盤磁頭的轉動。你可以從3種日誌模式中選擇1種來優化速度,有選擇地犧牲一些數據完整性。 
4、易於遷移 
你可以不重新格式化硬盤,並且很方便的從ext2遷移至ext3而享受可靠的日誌文件系統的好處。對,不需要做長時間的、枯燥的、有可能失誤的“備份-重新格式化-恢復”操作,就可以體驗ext3的優點。有兩種遷移的方法: 
· 如果你升級你的系統,Red Hat Linux安裝程序會協助遷移。需要你做的工作 就是爲每一個文件系統按一下選擇按鈕。 
· 使用tune2fs程序可以爲現存的ext2文件系統增加日誌功能。如果文件系統在轉換的過程已經被裝載了(mount),那麼在root目錄下會出現文件”.journal”;如果文件系統沒有被裝載,那麼文件系統中不會出現該文件。轉換文件系統,只需要運行tune2fs –j /dev/hda1(或者你要轉換的文件系統所在的任何設備名稱),同時把文件/etc/fstab中的ext2修改爲ext3。如果你要轉換自己的根文件系統,你必須使用initrd引導啓動。參照mkinitrd的手冊描述運行程序,同時確認自己的LILO或GRUB配置中裝載了initrd(如果沒有成功,系統仍然能啓動,但是根文件系統會以ext2形式裝載,而不是ext3,你可以使用命令cat /proc/mounts 來確認這一點。)詳情可參看tune2fs命令的man page在線手冊(執行man tune2fs)。

總而言之,ext3日誌文件系統是目前linux系統由ext2文件系統過度到日誌文件系統最爲簡單的一種選擇,實現方式也最爲簡潔。由於是直接從ext2文件系統發展而來,系統由ext2文件系統過渡到ext3日誌文件系統升級過程平滑,可以最大限度地保證系統數據的安全性。目前linux系統要使用日誌文件系統,最保險的方式就是選擇ext3文件系統。

最新的ext4 
Linux kernel 自 2.6.28 開始正式支持新的文件系統 Ext4。 Ext4 是 Ext3 的改進版,修改了 Ext3 中部分重要的數據結構,而不僅僅像 Ext3 對 Ext2 那樣,只是增加了一個日誌功能而已。Ext4 可以提供更佳的性能和可靠性,還有更爲豐富的功能:

1. 與 Ext3 兼容。 執行若干條命令,就能從 Ext3 在線遷移到 Ext4,而無須重新格式化磁盤或重新安裝系統。原有 Ext3 數據結構照樣保留,Ext4 作用於新數據,當然,整個文件系統因此也就獲得了 Ext4 所支持的更大容量。 
2. 更大的文件系統和更大的文件。 較之 Ext3 目前所支持的最大 16TB 文件系統和最大 2TB 文件,Ext4 分別支持 1EB(1,048,576TB, 1EB=1024PB, 1PB=1024TB)的文件系統,以及 16TB 的文件。 
3. 無限數量的子目錄。 Ext3 目前只支持 32,000 個子目錄,而 Ext4 支持無限數量的子目錄。 
4. Extents。 Ext3 採用間接塊映射,當操作大文件時,效率極其低下。比如一個 100MB 大小的文件,在 Ext3 中要建立 25,600 個數據塊(每個數據塊大小爲 4KB)的映射表。而 Ext4 引入了現代文件系統中流行的 extents 概念,每個 extent 爲一組連續的數據塊,上述文件則表示爲“該文件數據保存在接下來的 25,600 個數據塊中”,提高了不少效率。 
5. 多塊分配。 當寫入數據到 Ext3 文件系統中時,Ext3 的數據塊分配器每次只能分配一個 4KB 的塊,寫一個 100MB 文件就要調用 25,600 次數據塊分配器,而 Ext4 的多塊分配器“multiblock allocator”(mballoc) 支持一次調用分配多個數據塊。 
6. 延遲分配。 Ext3 的數據塊分配策略是儘快分配,而 Ext4 和其它現代文件操作系統的策略是儘可能地延遲分配,直到文件在 cache 中寫完纔開始分配數據塊並寫入磁盤,這樣就能優化整個文件的數據塊分配,與前兩種特性搭配起來可以顯著提升性能。 
7. 快速 fsck。 以前執行 fsck 第一步就會很慢,因爲它要檢查所有的 inode,現在 Ext4 給每個組的 inode 表中都添加了一份未使用 inode 的列表,今後 fsck Ext4 文件系統就可以跳過它們而只去檢查那些在用的 inode 了。 
8. 日誌校驗。 日誌是最常用的部分,也極易導致磁盤硬件故障,而從損壞的日誌中恢復數據會導致更多的數據損壞。Ext4 的日誌校驗功能可以很方便地判斷日誌數據是否損壞,而且它將 Ext3 的兩階段日誌機制合併成一個階段,在增加安全性的同時提高了性能。 
9. “無日誌”(No Journaling)模式。 日誌總歸有一些開銷,Ext4 允許關閉日誌,以便某些有特殊需求的用戶可以藉此提升性能。 
10. 在線碎片整理。 儘管延遲分配、多塊分配和 extents 能有效減少文件系統碎片,但碎片還是不可避免會產生。Ext4 支持在線碎片整理,並將提供 e4defrag 工具進行個別文件或整個文件系統的碎片整理。 
11. inode 相關特性。 Ext4 支持更大的 inode,較之 Ext3 默認的 inode 大小 128 字節,Ext4 爲了在 inode 中容納更多的擴展屬性(如納秒時間戳或 inode 版本),默認 inode 大小爲 256 字節。Ext4 還支持快速擴展屬性(fast extended attributes)和 inode 保留(inodes reservation)。 
12. 持久預分配(Persistent preallocation)。 P2P 軟件爲了保證下載文件有足夠的空間存放,常常會預先創建一個與所下載文件大小相同的空文件,以免未來的數小時或數天之內磁盤空間不足導致下載失敗。 Ext4 在文件系統層面實現了持久預分配並提供相應的 API(libc 中的 posix_fallocate()),比應用軟件自己實現更有效率。 
13. 默認啓用 barrier。 磁盤上配有內部緩存,以便重新調整批量數據的寫操作順序,優化寫入性能,因此文件系統必須在日誌數據寫入磁盤之後才能寫 commit 記錄,若 commit 記錄寫入在先,而日誌有可能損壞,那麼就會影響數據完整性。Ext4 默認啓用 barrier,只有當 barrier 之前的數據全部寫入磁盤,才能寫 barrier 之後的數據。(可通過 "mount -o barrier=0" 命令禁用該特性。)

發佈了17 篇原創文章 · 獲贊 16 · 訪問量 5萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章