LINUX下多路徑(multi-path)介紹及使用

一、什麼是多路徑
普通的電腦主機都是一個硬盤掛接到一個總線上,這裏是一對一的關係。而到了有光纖組成的SAN環境,或者由iSCSI組成的IPSAN環境,由於主機和存儲通過了光纖交換機或者多塊網卡及IP來連接,這樣的話,就構成了多對多的關係。也就是說,主機到存儲可以有多條路徑可以選擇。主機到存儲之間的IO由多條路徑可以選擇。每個主機到所對應的存儲可以經過幾條不同的路徑,如果是同時使用的話,I/O流量如何分配?其中一條路徑壞掉了,如何處理?還有在操作系統的角度來看,每條路徑,操作系統會認爲是一個實際存在的物理盤,但實際上只是通向同一個物理盤的不同路徑而已,這樣是在使用的時候,就給用戶帶來了困惑。多路徑軟件就是爲了解決上面的問題應運而生的。
多路徑的主要功能就是和存儲設備一起配合實現如下功能: 
1.故障的切換和恢復 
2.IO流量的負載均衡 
3.磁盤的虛擬化 
由於多路徑軟件是需要和存儲在一起配合使用的,不同的廠商基於不同的操作系統,都提供了不同的版本。並且有的廠商,軟件和硬件也不是一起賣的,如果要使用多路徑軟件的話,可能還需要向廠商購買license才行。比如EMC公司基於linux下的多路徑軟件,就需要單獨的購買license。好在, RedHat和Suse的2.6的內核中都自帶了免費的多路徑軟件包,並且可以免費使用,同時也是一個比較通用的包,可以支持大多數存儲廠商的設備,即使是一些不是出名的廠商,通過對配置文件進行稍作修改,也是可以支持並運行的很好的。
 
 
二、Linux下multipath介紹,需要以下工具包:
在CentOS 5中,最小安裝系統時multipath已經被安裝,查看multipath是否安裝如下:
p_w_picpath
1、device-mapper-multipath:即multipath-tools。主要提供multipathd和multipath等工具和 multipath.conf等配置文件。這些工具通過device mapper的ioctr的接口創建和配置multipath設備(調用device-mapper的用戶空間庫。創建的多路徑設備會在/dev /mapper中)。

2、 device-mapper:主要包括兩大部分:內核部分和用戶部分。內核部分主要由device mapper核心(dm.ko)和一些target driver(md-multipath.ko)。核心完成設備的映射,而target根據映射關係和自身特點具體處理從mappered device 下來的i/o。同時,在覈心部分,提供了一個接口,用戶通過ioctr可和內核部分通信,以指導內核驅動的行爲,比如如何創建mappered device,這些divece的屬性等。linux device mapper的用戶空間部分主要包括device-mapper這個包。其中包括dmsetup工具和一些幫助創建和配置mappered device的庫。這些庫主要抽象,封裝了與ioctr通信的接口,以便方便創建和配置mappered device。multipath-tool的程序中就需要調用這些庫。 
 
3、dm-multipath.ko和dm.ko:dm.ko是device mapper驅動。它是實現multipath的基礎。dm-multipath其實是dm的一個target驅動。 
 
4、scsi_id: 包含在udev程序包中,可以在multipath.conf中配置該程序來獲取scsi設備的序號。通過序號,便可以判斷多個路徑對應了同一設備。這個是多路徑實現的關鍵。scsi_id是通過sg驅動,向設備發送EVPD page80或page83 的inquery命令來查詢scsi設備的標識。但一些設備並不支持EVPD 的inquery命令,所以他們無法被用來生成multipath設備。但可以改寫scsi_id,爲不能提供scsi設備標識的設備虛擬一個標識符,並輸出到標準輸出。multipath程序在創建multipath設備時,會調用scsi_id,從其標準輸出中獲得該設備的scsi id。在改寫時,需要修改scsi_id程序的返回值爲0。因爲在multipath程序中,會檢查該直來確定scsi id是否已經成功得到。 
 
三、multipath在CentOS 5中的基本配置過程: 
1、安裝和加載多路徑軟件包 
# yum –y install device-mapper device-mapper-multipath
# chkconfig –level 2345 multipathd on #設置成開機自啓動multipathd
# lsmod |grep dm_multipath #來檢查安裝是否正常
p_w_picpath 
如果模塊沒有加載成功請使用下列命初始化DM,或重啓系統 
---Use the following commands to initialize and start DM for the first time: 
# modprobe dm-multipath 
# modprobe dm-round-robin 
# service multipathd start 
# multipath –v2

2、配置multipath:
Multipath的配置文件是/etc/multipath.conf , 如需要multipath正常工作只需要如下配置即可:(如果需要更加詳細的配置,請看本文後續的介紹)
blacklist {
devnode "^sda"
}
defaults {
user_friendly_names yes
path_grouping_policy multibus
failback immediate
no_path_retry fail
}
# vi /etc/multipath.conf
p_w_picpath
 
3、multipath基本操作命令 
# /etc/init.d/multipathd start #開啓mulitipath服務 
# multipath -F #刪除現有路徑 
# multipath -v2 #格式化路徑 
# multipath -ll #查看多路徑
p_w_picpath
如果配置正確的話就會在/dev/mapper/目錄下多出mpath0、mpath1等之類設備。
p_w_picpath
用fdisk -l命令可以看到多路徑軟件創建的磁盤,如下圖中的/dev/dm-[0-3]
p_w_picpath
 
4、multipath磁盤的基本操作 
要對多路徑軟件生成的磁盤進行操作直接操作/dev/mapper/目錄下的磁盤就行.
在對多路徑軟件生成的磁盤進行分區之前最好運行一下pvcreate命令:
# pvcreate /dev/mapper/mpath0
# fdisk /dev/mapper/mpath0
p_w_picpath
用fdisk對多路徑軟件生成的磁盤進行分區保存時會有一個報錯,此報錯不用理會。
fdisk對多路徑軟件生成的磁盤進行分區之後,所生成的磁盤分區並沒有馬上添加到/dev/目錄下,此時我們要重啓IPSAN或者FCSAN的驅動,如果是用iscsi-initiator來連接IPSAN的重啓ISCSI服務就可以發現所生成的磁盤分區了
# service iscsi restart
# ls -l /dev/mapper/
p_w_picpath
如上圖中的mpath0p1和mpath1p1就是我們對multipath磁盤進行的分區
# mkfs.ext3 /dev/mapper/mpath0p1 #對mpath1p1分區格式化成ext3文件系統
# mount /dev/mapper/mpath0p1 /ipsan/ #掛載mpath1p1分區
p_w_picpath
 
 
 
四、multipath的高有配置
以上都是用multipath的默認配置來完成multipath的配置,比如映射設備的名稱,multipath負載均衡的方法都是默認設置。那有沒有按照我們自己定義的方法來配置multipath呢,當可以。
1、multipath.conf文件的配置
接下來的工作就是要編輯/etc/multipath.conf的配置文件
multipath.conf主要包括blacklist、multipaths、devices三部份的配置
 
blacklist配置
blacklist {
devnode "^sda"
}
Multipaths部分配置multipaths和devices兩部份的配置。
multipaths {
multipath {
wwid **************** #此值multipath -v3可以看到
alias iscsi-dm0 #映射後的別名,可以隨便取
path_grouping_policy multibus #路徑組策略
path_checker tur #決定路徑狀態的方法
path_selector "round-robin 0" #選擇那條路徑進行下一個IO操作的方法
}
Devices部分配置
devices {
device {
vendor "iSCSI-Enterprise" #廠商名稱
product "Virtual disk" #產品型號
path_grouping_policy multibus #默認的路徑組策略
getuid_callout "/sbin/scsi_id -g -u -s /block/%n" #獲得唯一設備號使用的默認程序
prio_callout      "/sbin/acs_prio_alua %d" #獲取有限級數值使用的默認程序
path_checker readsector0 #決定路徑狀態的方法
path_selector "round-robin 0" #選擇那條路徑進行下一個IO操作的方法
failback        immediate #故障恢復的模式
   no_path_retry      queue #在disable queue之前系統嘗試使用失效路徑的次數的數值
  rr_min_io       100 #在當前的用戶組中,在切換到另外一條路徑之前的IO請求的數目
}
}
如下是一個完整的配置文件
blacklist {
devnode "^sda"
}
defaults {
user_friendly_names no
}
multipaths {
multipath {
wwid 14945540000000000a67854c6270b4359c66c272e2f356321
alias iscsi-dm0
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
multipath {
wwid 14945540000000000dcca2eda91d70b81edbcfce2357f99ee
alias iscsi-dm1
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
multipath {
wwid 1494554000000000020f763489c165561101813333957ed96
alias iscsi-dm2
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
multipath {
wwid 14945540000000000919ca813020a195422ba3663e1f03cc3
alias iscsi-dm3
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
}
devices {
device {
vendor "iSCSI-Enterprise"
product "Virtual disk"
path_grouping_policy multibus
getuid_callout "/sbin/scsi_id -g -u -s /block/%n"
path_checker readsector0
path_selector "round-robin 0"
}
}
獲取wwid的方法:
(1)默認情況下,將使用 /var/lib/multipath/bindings 內的配置設定具體每個多路徑設備名,如果在/etc/multipath.conf中有設定各wwid 別名,別名會覆蓋此設定。
p_w_picpath
(2)# multipath -v3命令查找
p_w_picpath
 
2、負載均衡測試
使用dd命令來對設備進行寫操作,並同時通過iostat來查看I/0狀態,命令及輸出如下: 
# dd if=/dev/zero of=/dev/mapper/iscsi-dm1p1 
開啓另外一個終端用以下命令查看IO情況
# iostat 10 10
p_w_picpath
通過上述輸出,我們看到,在對/dev/mapper/iscsi-dm1p1讀寫時,實際上是通過對/dev/md-1包含的當前active的所有設備,即/dev/sde1,/dev/shl這2條路徑來完成對實際的LUN的寫過程。
 
 
3、路徑切換測試
首先,我們拔掉服務器上一根網線,經過不到10秒,我們看到:MPIO成功地從上述“失敗”的路徑/dev/sel切換到了另外一條路徑/dev/sdh1上

 

本文出處:http://rootking.blog.51cto.com/2619611/476212

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章