淺析 Linux 初始化 init 系統,第 3 部分: Systemd

劉 明, 軟件工程師, 上海交通大學通信與電子工程系

Systemd 的簡介和特點

Systemd Linux 系統中最新的初始化系統(init),它主要的設計目標是克服 sysvinit 固有的缺點,提高系統的啓動速度。systemd ubuntu upstart 是競爭對手,預計會取代 UpStart,實際上在作者寫作本文時,已經有消息稱 Ubuntu 也將採用 systemd 作爲其標準的系統初始化系統。

Systemd 的很多概念來源於蘋果 Mac OS 操作系統上的 launchd,不過 launchd 專用於蘋果系統,因此長期未能獲得應有的廣泛關注。Systemd 借鑑了很多 launchd 的思想,它的重要特性如下:

SysVinit LSB init scripts 兼容

Systemd 是一個"新來的"Linux 上的很多應用程序並沒有來得及爲它做相應的改變。和 UpStart 一樣,systemd 引入了新的配置方式,對應用程序的開發也有一些新的要求。如果 systemd 想替代目前正在運行的初始化系統,就必須和現有程序兼容。任何一個 Linux 發行版都很難爲了採用 systemd 而在短時間內將所有的服務代碼都修改一遍。

Systemd 提供了和 Sysvinit 以及 LSB initscripts 兼容的特性。系統中已經存在的服務和進程無需修改。這降低了系統向 systemd 遷移的成本,使得 systemd 替換現有初始化系統成爲可能。

更快的啓動速度

Systemd 提供了比 UpStart 更激進的並行啓動能力,採用了 socket / D-Bus activation 等技術啓動服務。一個顯而易見的結果就是:更快的啓動速度。

爲了減少系統啓動時間,systemd 的目標是:

·        儘可能啓動更少的進程

·        儘可能將更多進程並行啓動

同樣地,UpStart 也試圖實現這兩個目標。UpStart 採用事件驅動機制,服務可以暫不啓動,當需要的時候才通過事件觸發其啓動,這符合第一個設計目標;此外,不相干的服務可以並行啓動,這也實現了第二個目標。

下面的圖形演示了 UpStart 相對於 SysVInit 在併發啓動這個方面的改進:

spacer.gifimage003.jpg

 1. UpStart  SysVinit 的改進

假設有 7 個不同的啓動項目,比如 JobAJob B 等等。在 SysVInit 中,每一個啓動項目都由一個獨立的腳本負責,它們由 sysVinit 順序地,串行地調用。因此總的啓動時間爲 T1+T2+T3+T4+T5+T6+T7。其中一些任務有依賴關係,比如 A,B,C,D

Job E F 卻和 A,B,C,D 無關。這種情況下,UpStart 能夠併發地運行任務{EF(A,B,C,D)},使得總的啓動時間減少爲 T1+T2+T3

這無疑增加了系統啓動的並行性,從而提高了系統啓動速度。但是在 UpStart 中,有依賴關係的服務還是必須先後啓動。比如任務 A,B,(C,D)因爲存在依賴關係,所以在這個局部,還是串行執行。

讓我們例舉一些例子, Avahi 服務需要 D-Bus 提供的功能,因此 Avahi 的啓動依賴於 D-BusUpStart 中,Avahi 必須等到 D-Bus 啓動就緒之後纔開始啓動。類似的,livirtd X11 都需要 HAL 服務先啓動,而所有這些服務都需要 syslog 服務記錄日誌,因此它們都必須等待 syslog 服務先啓動起來。然而 httpd 和他們都沒有關係,因此 httpd 可以和 Avahi 等服務併發啓動。

Systemd 能夠更進一步提高併發性,即便對於那些 UpStart 認爲存在相互依賴而必須串行的服務,比如 Avahi D-Bus 也可以併發啓動。從而實現如下圖所示的併發啓動過程:

image005.jpg

 2. systemd 的併發啓動

所有的任務都同時併發執行,總的啓動時間被進一步降低爲 T1

可見 systemd UpStart 更進一步提高了並行啓動能力,極大地加速了系統啓動時間。

systemd 提供按需啓動能力

sysvinit 系統初始化的時候,它會將所有可能用到的後臺服務進程全部啓動運行。並且系統必須等待所有的服務都啓動就緒之後,才允許用戶登錄。這種做法有兩個缺點:首先是啓動時間過長;其次是系統資源浪費。

某些服務很可能在很長一段時間內,甚至整個服務器運行期間都沒有被使用過。比如 CUPS,打印服務在多數服務器上很少被真正使用到。您可能沒有想到,在很多服務器上 SSHD 也是很少被真正訪問到的。花費在啓動這些服務上的時間是不必要的;同樣,花費在這些服務上的系統資源也是一種浪費。

Systemd 可以提供按需啓動的能力,只有在某個服務被真正請求的時候才啓動它。當該服務結束,systemd 可以關閉它,等待下次需要時再次啓動它。

Systemd 採用 Linux Cgroup 特性跟蹤和管理進程的生命週期

init 系統的一個重要職責就是負責跟蹤和管理服務進程的生命週期。它不僅可以啓動一個服務,也必須也能夠停止服務。這看上去沒有什麼特別的,然而在真正用代碼實現的時候,您或許會發現停止服務比一開始想的要困難。

服務進程一般都會作爲精靈進程(daemon)在後臺運行,爲此服務程序有時候會派生(fork)兩次。在 UpStart 中,需要在配置文件中正確地配置 expect 小節。這樣 UpStart 通過對 fork 系統調用進行計數,從而獲知真正的精靈進程的 PID 號。比如圖 3 所示的例子:


image007.jpg

 3. 找到正確 pid

如果 UpStart 找錯了,將 p1`作爲服務進程的 Pid,那麼停止服務的時候,UpStart 會試圖殺死 p1`進程,而真正的 p1``進程則繼續執行。換句話說該服務就失去控制了。

還有更加特殊的情況。比如,一個 CGI 程序會派生兩次,從而脫離了和 Apache 的父子關係。當 Apache 進程被停止後,該 CGI 程序還在繼續運行。而我們希望服務停止後,所有由它所啓動的相關進程也被停止。

爲了處理這類問題,UpStart 通過 strace 來跟蹤 forkexit 等系統調用,但是這種方法很笨拙,且缺乏可擴展性。systemd 則利用了 Linux 內核的特性即 CGroup 來完成跟蹤的任務。當停止服務時,通過查詢 CGroupsystemd 可以確保找到所有的相關進程,從而乾淨地停止服務。

CGroup 已經出現了很久,它主要用來實現系統資源配額管理。CGroup 提供了類似文件系統的接口,使用方便。當進程創建子進程時,子進程會繼承父進程的 CGroup。因此無論服務如何啓動新的子進程,所有的這些相關進程都會屬於同一個 CGroupsystemd 只需要簡單地遍歷指定的 CGroup 即可正確地找到所有的相關進程,將它們一一停止即可。

啓動掛載點和自動掛載的管理

傳統的 Linux 系統中,用戶可以用/etc/fstab 文件來維護固定的文件系統掛載點。這些掛載點在系統啓動過程中被自動掛載,一旦啓動過程結束,這些掛載點就會確保存在。這些掛載點都是對系統運行至關重要的文件系統,比如 HOME 目錄。和 sysvinit 一樣,Systemd 管理這些掛載點,以便能夠在系統啓動時自動掛載它們。Systemd 還兼容/etc/fstab 文件,您可以繼續使用該文件管理掛載點。

有時候用戶還需要動態掛載點,比如打算訪問 DVD 內容時,才臨時執行掛載以便訪問其中的內容,而不訪問光盤時該掛載點被取消(umount),以便節約資源。傳統地,人們依賴 autofs 服務來實現這種功能。

Systemd 內建了自動掛載服務,無需另外安裝 autofs 服務,可以直接使用 systemd 提供的自動掛載管理能力來實現 autofs 的功能。

實現事務性依賴關係管理

系統啓動過程是由很多的獨立工作共同組成的,這些工作之間可能存在依賴關係,比如掛載一個 NFS 文件系統必須依賴網絡能夠正常工作。Systemd 雖然能夠最大限度地併發執行很多有依賴關係的工作,但是類似"掛載 NFS""啓動網絡"這樣的工作還是存在天生的先後依賴關係,無法併發執行。對於這些任務,systemd 維護一個"事務一致性"的概念,保證所有相關的服務都可以正常啓動而不會出現互相依賴,以至於死鎖的情況。

能夠對系統進行快照和恢復

systemd 支持按需啓動,因此係統的運行狀態是動態變化的,人們無法準確地知道系統當前運行了哪些服務。Systemd 快照提供了一種將當前系統運行狀態保存並恢復的能力。

比如系統當前正運行服務 A B,可以用 systemd 命令行對當前系統運行狀況創建快照。然後將進程 A 停止,或者做其他的任意的對系統的改變,比如啓動新的進程 C。在這些改變之後,運行 systemd 的快照恢復命令,就可立即將系統恢復到快照時刻的狀態,即只有服務 AB 在運行。一個可能的應用場景是調試:比如服務器出現一些異常,爲了調試用戶將當前狀態保存爲快照,然後可以進行任意的操作,比如停止服務等等。等調試結束,恢復快照即可。

這個快照功能目前在 systemd 中並不完善,似乎開發人員也沒有特別關注它,因此有報告指出它還存在一些使用上的問題,使用時尚需慎重。

日誌服務

systemd 自帶日誌服務 journald,該日誌服務的設計初衷是克服現有的 syslog 服務的缺點。比如:

·        syslog 不安全,消息的內容無法驗證。每一個本地進程都可以聲稱自己是 Apache PID 4711,而 syslog 也就相信並保存到磁盤上。

·        數據沒有嚴格的格式,非常隨意。自動化的日誌分析器需要分析人類語言字符串來識別消息。一方面此類分析困難低效;此外日誌格式的變化會導致分析代碼需要更新甚至重寫。

Systemd Journal 用二進制格式保存所有日誌信息,用戶使用 journalctl 命令來查看日誌信息。無需自己編寫複雜脆弱的字符串分析處理程序。

Systemd Journal 的優點如下:

·        簡單性:代碼少,依賴少,抽象開銷最小。

·        零維護:日誌是除錯和監控系統的核心功能,因此它自己不能再產生問題。舉例說,自動管理磁盤空間,避免由於日誌的不斷產生而將磁盤空間耗盡。

·        移植性:日誌文件應該在所有類型的 Linux 系統上可用,無論它使用的何種 CPU 或者字節序。

·        性能:添加和瀏覽日誌非常快。

·        最小資源佔用:日誌數據文件需要較小。

·        統一化:各種不同的日誌存儲技術應該統一起來,將所有的可記錄事件保存在同一個數據存儲中。所以日誌內容的全局上下文都會被保存並且可供日後查詢。例如一條固件記錄後通常會跟隨一條內核記錄,最終還會有一條用戶態記錄。重要的是當保存到硬盤上時這三者之間的關係不會丟失。Syslog 將不同的信息保存到不同的文件中,分析的時候很難確定哪些條目是相關的。

·        擴展性:日誌的適用範圍很廣,從嵌入式設備到超級計算機集羣都可以滿足需求。

·        安全性:日誌文件是可以驗證的,讓無法檢測的修改不再可能。


Systemd 的基本概念

單元的概念

系統初始化需要做的事情非常多。需要啓動後臺服務,比如啓動 SSHD 服務;需要做配置工作,比如掛載文件系統。這個過程中的每一步都被 systemd 抽象爲一個配置單元,即 unit。可以認爲一個服務是一個配置單元;一個掛載點是一個配置單元;一個交換分區的配置是一個配置單元;等等。systemd 將配置單元歸納爲以下一些不同的類型。然而,systemd 正在快速發展,新功能不斷增加。所以配置單元類型可能在不久的將來繼續增加。

·        service :代表一個後臺服務進程,比如 mysqld。這是最常用的一類。

·        socket :此類配置單元封裝系統和互聯網中的一個套接字。當下,systemd 支持流式、數據報和連續包的 AF_INETAF_INET6AF_UNIX socket 。每一個套接字配置單元都有一個相應的服務配置單元。相應的服務在第一個"連接"進入套接字時就會啓動(例如:nscd.socket 在有新連接後便啓動 nscd.service)

·        device :此類配置單元封裝一個存在於 Linux 設備樹中的設備。每一個使用 udev 規則標記的設備都將會在 systemd 中作爲一個設備配置單元出現。

·        mount :此類配置單元封裝文件系統結構層次中的一個掛載點。Systemd 將對這個掛載點進行監控和管理。比如可以在啓動時自動將其掛載;可以在某些條件下自動卸載。Systemd 會將/etc/fstab 中的條目都轉換爲掛載點,並在開機時處理。

·        automount :此類配置單元封裝系統結構層次中的一個自掛載點。每一個自掛載配置單元對應一個掛載配置單元,當該自動掛載點被訪問時,systemd 執行掛載點中定義的掛載行爲。

·        swap: 和掛載配置單元類似,交換配置單元用來管理交換分區。用戶可以用交換配置單元來定義系統中的交換分區,可以讓這些交換分區在啓動時被激活。

·        target :此類配置單元爲其他配置單元進行邏輯分組。它們本身實際上並不做什麼,只是引用其他配置單元而已。這樣便可以對配置單元做一個統一的控制。這樣就可以實現大家都已經非常熟悉的運行級別概念。比如想讓系統進入圖形化模式,需要運行許多服務和配置命令,這些操作都由一個個的配置單元表示,將所有這些配置單元組合爲一個目標(target),就表示需要將這些配置單元全部執行一遍以便進入目標所代表的系統運行狀態。 (例如:multi-user.target 相當於在傳統使用 SysV 的系統中運行級別 5)

·        timer:定時器配置單元用來定時觸發用戶定義的操作,這類配置單元取代了 atdcrond 等傳統的定時服務。

·        snapshot :與 target 配置單元相似,快照是一組配置單元。它保存了系統當前的運行狀態。

每個配置單元都有一個對應的配置文件,系統管理員的任務就是編寫和維護這些不同的配置文件,比如一個 MySQL 服務對應一個 mysql.service 文件。這種配置文件的語法非常簡單,用戶不需要再編寫和維護複雜的系統 5 腳本了。

依賴關係

雖然 systemd 將大量的啓動工作解除了依賴,使得它們可以併發啓動。但還是存在有些任務,它們之間存在天生的依賴,不能用"套接字激活"(socket activation)D-Bus activation autofs 三大方法來解除依賴(三大方法詳情見後續描述)。比如:掛載必須等待掛載點在文件系統中被創建;掛載也必須等待相應的物理設備就緒。爲了解決這類依賴問題,systemd 的配置單元之間可以彼此定義依賴關係。

Systemd 用配置單元定義文件中的關鍵字來描述配置單元之間的依賴關係。比如:unit A 依賴 unit B,可以在 unit B 的定義中用"require A"來表示。這樣 systemd 就會保證先啓動 A 再啓動 B

Systemd 事務

Systemd 能保證事務完整性。Systemd 的事務概念和數據庫中的有所不同,主要是爲了保證多個依賴的配置單元之間沒有環形引用。比如 unit ABC,假如它們的依賴關係爲:


image009.jpg

 4. Unit 的循環依賴

存在循環依賴,那麼 systemd 將無法啓動任意一個服務。此時 systemd 將會嘗試解決這個問題,因爲配置單元之間的依賴關係有兩種:required 是強依賴;want 則是弱依賴,systemd 將去掉 wants 關鍵字指定的依賴看看是否能打破循環。如果無法修復,systemd 會報錯。

Systemd 能夠自動檢測和修復這類配置錯誤,極大地減輕了管理員的排錯負擔。

Target 和運行級別

systemd 用目標(target)替代了運行級別的概念,提供了更大的靈活性,如您可以繼承一個已有的目標,並添加其它服務,來創建自己的目標。下表列舉了 systemd 下的目標和常見 runlevel 的對應關係:

1. Sysvinit 運行級別和 systemd 目標的對應表

Sysvinit 運行級別

Systemd 目標

備註

0

runlevel0.target, poweroff.target

關閉系統。

1, s, single

runlevel1.target, rescue.target

單用戶模式。

2, 4

runlevel2.target, runlevel4.target, multi-user.target

用戶定義/域特定運行級別。默認等同於 3

3

runlevel3.target, multi-user.target

多用戶,非圖形化。用戶可以通過多個控制檯或網絡登錄。

5

runlevel5.target, graphical.target

多用戶,圖形化。通常爲所有運行級別 3 的服務外加圖形化登錄。

6

runlevel6.target, reboot.target

重啓

emergency

emergency.target

緊急 Shell


Systemd 的併發啓動原理

如前所述,在 Systemd 中,所有的服務都併發啓動,比如 AvahiD-BuslivirtdX11HAL 可以同時啓動。乍一看,這似乎有點兒問題,比如 Avahi 需要 syslog 的服務,Avahi syslog 同時啓動,假設 Avahi 的啓動比較快,所以 syslog 還沒有準備好,可是 Avahi 又需要記錄日誌,這豈不是會出現問題?

Systemd 的開發人員仔細研究了服務之間相互依賴的本質問題,發現所謂依賴可以分爲三個具體的類型,而每一個類型實際上都可以通過相應的技術解除依賴關係。

併發啓動原理之一:解決 socket 依賴

絕大多數的服務依賴是套接字依賴。比如服務 A 通過一個套接字端口 S1 提供自己的服務,其他的服務如果需要服務 A,則需要連接 S1。因此如果服務 A 尚未啓動,S1 就不存在,其他的服務就會得到啓動錯誤。所以傳統地,人們需要先啓動服務 A,等待它進入就緒狀態,再啓動其他需要它的服務。Systemd 認爲,只要我們預先把 S1 建立好,那麼其他所有的服務就可以同時啓動而無需等待服務 A 來創建 S1 了。如果服務 A 尚未啓動,那麼其他進程向 S1 發送的服務請求實際上會被 Linux 操作系統緩存,其他進程會在這個請求的地方等待。一旦服務 A 啓動就緒,就可以立即處理緩存的請求,一切都開始正常運行。

那麼服務如何使用由 init 進程創建的套接字呢?

Linux 操作系統有一個特性,當進程調用 fork 或者 exec 創建子進程之後,所有在父進程中被打開的文件句柄 (file descriptor) 都被子進程所繼承。套接字也是一種文件句柄,進程 A 可以創建一個套接字,此後當進程 A 調用 exec 啓動一個新的子進程時,只要確保該套接字的 close_on_exec 標誌位被清空,那麼新的子進程就可以繼承這個套接字。子進程看到的套接字和父進程創建的套接字是同一個系統套接字,就彷彿這個套接字是子進程自己創建的一樣,沒有任何區別。

這個特性以前被一個叫做 inetd 的系統服務所利用。Inetd 進程會負責監控一些常用套接字端口,比如 Telnet,當該端口有連接請求時,inetd 才啓動 telnetd 進程,並把有連接的套接字傳遞給新的 telnetd 進程進行處理。這樣,當系統沒有 telnet 客戶端連接時,就不需要啓動 telnetd 進程。Inetd 可以代理很多的網絡服務,這樣就可以節約很多的系統負載和內存資源,只有當有真正的連接請求時才啓動相應服務,並把套接字傳遞給相應的服務進程。

inetd 類似,systemd 是所有其他進程的父進程,它可以先建立所有需要的套接字,然後在調用 exec 的時候將該套接字傳遞給新的服務進程,而新進程直接使用該套接字進行服務即可。

併發啓動原理之二:解決 D-Bus 依賴

D-Bus desktop-bus 的簡稱,是一個低延遲、低開銷、高可用性的進程間通信機制。它越來越多地用於應用程序之間通信,也用於應用程序和操作系統內核之間的通信。很多現代的服務進程都使用D-Bus 取代套接字作爲進程間通信機制,對外提供服務。比如簡化 Linux 網絡配置的 NetworkManager 服務就使用 D-Bus 和其他的應用程序或者服務進行交互:郵件客戶端軟件 evolution 可以通過 D-Bus NetworkManager 服務獲取網絡狀態的改變,以便做出相應的處理。

D-Bus 支持所謂"bus activation"功能。如果服務 A 需要使用服務 B D-Bus 服務,而服務 B 並沒有運行,則 D-Bus 可以在服務 A 請求服務 B D-Bus 時自動啓動服務 B。而服務 A 發出的請求會被 D-Bus 緩存,服務 A 會等待服務 B 啓動就緒。利用這個特性,依賴 D-Bus 的服務就可以實現並行啓動。

併發啓動原理之三:解決文件系統依賴

系統啓動過程中,文件系統相關的活動是最耗時的,比如掛載文件系統,對文件系統進行磁盤檢查(fsck),磁盤配額檢查等都是非常耗時的操作。在等待這些工作完成的同時,系統處於空閒狀態。那些想使用文件系統的服務似乎必須等待文件系統初始化完成纔可以啓動。但是 systemd 發現這種依賴也是可以避免的。

Systemd 參考了 autofs 的設計思路,使得依賴文件系統的服務和文件系統本身初始化兩者可以併發工作。autofs 可以監測到某個文件系統掛載點真正被訪問到的時候才觸發掛載操作,這是通過內核 automounter 模塊的支持而實現的。比如一個 open()系統調用作用在"/misc/cd/file1"的時候,/misc/cd 尚未執行掛載操作,此時 open()調用被掛起等待,Linux 內核通知 autofsautofs 執行掛載。這時候,控制權返回給 open()系統調用,並正常打開文件。

Systemd 集成了 autofs 的實現,對於系統中的掛載點,比如/home,當系統啓動的時候,systemd 爲其創建一個臨時的自動掛載點。在這個時刻/home 真正的掛載設備尚未啓動好,真正的掛載操作還沒有執行,文件系統檢測也還沒有完成。可是那些依賴該目錄的進程已經可以併發啓動,他們的 open()操作被內建在 systemd 中的 autofs 捕獲,將該 open()調用掛起(可中斷睡眠狀態)。然後等待真正的掛載操作完成,文件系統檢測也完成後,systemd 將該自動掛載點替換爲真正的掛載點,並讓 open()調用返回。由此,實現了那些依賴於文件系統的服務和文件系統本身同時併發啓動。

當然對於"/"根目錄的依賴實際上一定還是要串行執行,因爲 systemd 自己也存放在/之下,必須等待系統根目錄掛載檢查好。

不過對於類似/home 等掛載點,這種併發可以提高系統的啓動速度,尤其是當/home 是遠程的 NFS 節點,或者是加密盤等,需要耗費較長的時間纔可以準備就緒的情況下,因爲併發啓動,這段時間內,系統並不是完全無事可做,而是可以利用這段空餘時間做更多的啓動進程的事情,總的來說就縮短了系統啓動時間。


Systemd 的使用

下面針對技術人員的不同角色來簡單地介紹一下 systemd 的使用。本文只打算給出簡單的描述,讓您對 systemd 的使用有一個大概的理解。具體的細節內容太多,即無法在一篇短文內寫全,本人也沒有那麼強大的能力。還需要讀者自己去進一步查閱 systemd 的文檔。

系統軟件開發人員

開發人員需要了解 systemd 的更多細節。比如您打算開發一個新的系統服務,就必須瞭解如何讓這個服務能夠被 systemd 管理。這需要您注意以下這些要點:

·        後臺服務進程代碼不需要執行兩次派生來實現後臺精靈進程,只需要實現服務本身的主循環即可。

·        不要調用 setsid(),交給 systemd 處理。

·        不再需要維護 pid 文件。

·        Systemd 提供了日誌功能,服務進程只需要輸出到 stderr 即可,無需使用 syslog

·        處理信號 SIGTERM,這個信號的唯一正確作用就是停止當前服務,不要做其他的事情。

·        SIGHUP 信號的作用是重啓服務。

·        需要套接字的服務,不要自己創建套接字,讓 systemd 傳入套接字。

·        使用 sd_notify()函數通知 systemd 服務自己的狀態改變。一般地,當服務初始化結束,進入服務就緒狀態時,可以調用它。

Unit 文件的編寫

對於開發者來說,工作量最大的部分應該是編寫配置單元文件,定義所需要的單元。

舉例來說,開發人員開發了一個新的服務程序,比如 httpd,就需要爲其編寫一個配置單元文件以便該服務可以被 systemd 管理,類似 UpStart 的工作配置文件。在該文件中定義服務啓動的命令行語法,以及和其他服務的依賴關係等。

此外我們之前已經瞭解到,systemd 的功能繁多,不僅用來管理服務,還可以管理掛載點,定義定時任務等。這些工作都是由編輯相應的配置單元文件完成的。我在這裏給出幾個配置單元文件的例子。

下面是 SSH 服務的配置單元文件,服務配置單元文件以.service 爲文件名後綴。

 #cat /etc/system/system/sshd.service

 [Unit]

 Description=OpenSSH server daemon

 [Service]

 EnvironmentFile=/etc/sysconfig/sshd

 ExecStartPre=/usr/sbin/sshd-keygen

 ExecStart=/usrsbin/sshd –D $OPTIONS

 ExecReload=/bin/kill –HUP $MAINPID

 KillMode=process

 Restart=on-failure

 RestartSec=42s

 [Install]

 WantedBy=multi-user.target

文件分爲三個小節。第一個是[Unit]部分,這裏僅僅有一個描述信息。第二部分是 Service 定義,其中,ExecStartPre 定義啓動服務之前應該運行的命令;ExecStart 定義啓動服務的具體命令行語法。第三部分是[Install]WangtedBy 表明這個服務是在多用戶模式下所需要的。

那我們就來看下 multi-user.target 吧:

 #cat multi-user.target

 [Unit]

 Description=Multi-User System

 Documentation=man.systemd.special(7)

 Requires=basic.target

 Conflicts=rescue.service rescure.target

 After=basic.target rescue.service rescue.target

 AllowIsolate=yes

 [Install]

 Alias=default.target

第一部分中的 Requires 定義表明 multi-user.target 啓動的時候 basic.target 也必須被啓動;另外 basic.target 停止的時候,multi-user.target 也必須停止。如果您接着查看 basic.target 文件,會發現它又指定了 sysinit.target 等其他的單元必須隨之啓動。同樣 sysinit.target 也會包含其他的單元。採用這樣的層層鏈接的結構,最終所有需要支持多用戶模式的組件服務都會被初始化啓動好。

[Install]小節中有 Alias 定義,即定義本單元的別名,這樣在運行 systemctl 的時候就可以使用這個別名來引用本單元。這裏的別名是 default.target,比 multi-user.target 要簡單一些。

此外在/etc/systemd/system 目錄下還可以看到諸如*.wants 的目錄,放在該目錄下的配置單元文件等同於在[Unit]小節中的 wants 關鍵字,即本單元啓動時,還需要啓動這些單元。比如您可以簡單地把您自己寫的 foo.service 文件放入 multi-user.target.wants 目錄下,這樣每次都會被默認啓動了。

最後,讓我們來看看 sys-kernel-debug.mout 文件,這個文件定義了一個文件掛載點:

#cat sys-kernel-debug.mount

[Unit]

Description=Debug File Syste

DefaultDependencies=no

ConditionPathExists=/sys/kernel/debug

Before=sysinit.target

[Mount]

What=debugfs

Where=/sys/kernel/debug

Type=debugfs

這個配置單元文件定義了一個掛載點。掛載配置單元文件有一個[Mount]配置小節,裏面配置了 WhatWhere Type 三個數據項。這都是掛載命令所必須的,例子中的配置等同於下面這個掛載命令:

mount –t debugfs /sys/kernel/debugdebugfs

配置單元文件的編寫需要很多的學習,必須參考 systemd 附帶的 man 等文檔進行深入學習。希望通過上面幾個小例子,大家已經瞭解配置單元文件的作用和一般寫法了。

系統管理員

systemd 的主要命令行工具是 systemctl

多數管理員應該都已經非常熟悉系統服務和 init 系統的管理,比如 servicechkconfig 以及 telinit 命令的使用。systemd 也完成同樣的管理任務,只是命令工具 systemctl 的語法有所不同而已,因此用表格來對比 systemctl 和傳統的系統管理命令會非常清晰。

2. Systemd 命令和 sysvinit 命令的對照表

Sysvinit 命令

Systemd 命令

備註

service foo start

systemctl start foo.service

用來啓動一個服務 (並不會重啓現有的)

service foo stop

systemctl stop foo.service

用來停止一個服務 (並不會重啓現有的)

service foo restart

systemctl restart foo.service

用來停止並啓動一個服務。

service foo reload

systemctl reload foo.service

當支持時,重新裝載配置文件而不中斷等待操作。

service foo condrestart

systemctl condrestart foo.service

如果服務正在運行那麼重啓它。

service foo status

systemctl status foo.service

彙報服務是否正在運行。

ls /etc/rc.d/init.d/

systemctl list-unit-files --type=service

用來列出可以啓動或停止的服務列表。

chkconfig foo on

systemctl enable foo.service

在下次啓動時或滿足其他觸發條件時設置服務爲啓用

chkconfig foo off

systemctl disable foo.service

在下次啓動時或滿足其他觸發條件時設置服務爲禁用

chkconfig foo

systemctl is-enabled foo.service

用來檢查一個服務在當前環境下被配置爲啓用還是禁用。

chkconfig –list

systemctl list-unit-files --type=service

輸出在各個運行級別下服務的啓用和禁用情況

chkconfig foo –list

ls /etc/systemd/system/*.wants/foo.service

用來列出該服務在哪些運行級別下啓用和禁用。

chkconfig foo –add

systemctl daemon-reload

當您創建新服務文件或者變更設置時使用。

telinit 3

systemctl isolate multi-user.target (OR systemctl  isolate runlevel3.target OR telinit 3)

改變至多用戶運行級別。

除了表 2 列出的常見用法,系統管理員還需要了解其他一些系統配置和管理任務的改變。

首先我們瞭解 systemd 如何處理電源管理,命令如下表所示:

3systemd 電源管理命令

命令

操作

systemctl reboot

重啓機器

systemctl poweroff

關機

systemctl suspend

待機

systemctl hibernate

休眠

systemctl hybrid-sleep

混合休眠模式(同時休眠到硬盤並待機)

關機不是每個登錄用戶在任何情況下都可以執行的,一般只有管理員纔可以關機。正常情況下系統不應該允許 SSH 遠程登錄的用戶執行關機命令。否則其他用戶正在工作,一個用戶把系統關了就不好了。爲了解決這個問題,傳統的 Linux 系統使用 ConsoleKit 跟蹤用戶登錄情況,並決定是否賦予其關機的權限。現在 ConsoleKit 已經被 systemd logind 所替代。

logind 不是 pid-1 init 進程。它的作用和 UpStart session init 類似,但功能要豐富很多,它能夠管理幾乎所有用戶會話(session)相關的事情。logind 不僅是 ConsoleKit 的替代,它可以:

·        維護,跟蹤會話和用戶登錄情況。如上所述,爲了決定關機命令是否可行,系統需要了解當前用戶登錄情況,如果用戶從 SSH 登錄,不允許其執行關機命令;如果普通用戶從本地登錄,且該用戶是系統中的唯一會話,則允許其執行關機命令;這些判斷都需要 logind 維護所有的用戶會話和登錄情況。

·        Logind 也負責統計用戶會話是否長時間沒有操作,可以執行休眠/關機等相應操作。

·        爲用戶會話的所有進程創建 CGroup。這不僅方便統計所有用戶會話的相關進程,也可以實現會話級別的系統資源控制。

·        負責電源管理的組合鍵處理,比如用戶按下電源鍵,將系統切換至睡眠狀態。

·        多席位(multi-seat) 管理。如今的電腦,即便一臺筆記本電腦,也完全可以提供多人同時使用的計算能力。多席位就是一臺電腦主機管理多個外設,比如兩個屏幕和兩個鼠標/鍵盤。席位一使用屏幕 1 和鍵盤 1;席位二使用屏幕 2 和鍵盤 2,但他們都共享一臺主機。用戶會話可以自由在多個席位之間切換。或者當插入新的鍵盤,屏幕等物理外設時,自動啓動 gdm 用戶登錄界面等。所有這些都是多席位管理的內容。ConsoleKit 始終沒有實現這個功能,systemd logind 能夠支持多席位。

以上描述的這些管理功能僅僅是 systemd 的部分功能,除此之外,systemd 還負責系統其他的管理配置,比如配置網絡,Locale 管理,管理系統內核模塊加載等,完整地描述它們已經超出了本人的能力。


systemd 小結

在不才作者看來,作爲系統初始化系統,systemd 的最大特點有兩個:

·        令人驚奇的激進的併發啓動能力,極大地提高了系統啓動速度;

·         CGroup 統計跟蹤子進程,乾淨可靠。

此外,和其前任不同的地方在於,systemd 已經不僅僅是一個初始化系統了。

Systemd 出色地替代了 sysvinit 的所有功能,但它並未就此自滿。因爲 init 進程是系統所有進程的父進程這樣的特殊性,systemd 非常適合提供曾經由其他服務提供的功能,比如定時任務 (以前由 crond 完成) ;會話管理 (以前由 ConsoleKit/PolKit 等管理) 。僅僅從本文皮毛一樣的介紹來看,Systemd 已經管得很多了,可它還在不斷髮展。它將逐漸成爲一個多功能的系統環境,能夠處理非常多的系統管理任務,有人甚至將它看作一個操作系統。

好的一點是,這非常有助於標準化 Linux 的管理!從前,不同的 Linux 發行版各行其事,使用不同方法管理系統,從來也不會互相妥協。比如如何將系統進入休眠狀態,不同的系統有不同的解決方案,即便是同一個 Linux 系統,也存在不同的方法,比如一個有趣的討論:如何讓ubuntu 統休眠,可以使用底層的/sys/power/state 接口,也可以使用諸如 pm-utility 等高層接口。存在這麼多種不同的方法做一件事情對像我這樣的普通用戶而言可不是件有趣的事情。systemd 提供統一的電源管理命令接口,這件事情的意義就類似全世界的人都說統一的語言,我們再也不需要學習外語了,多麼美好!

如果所有的 Linux 發行版都採納了 systemd,那麼系統管理任務便可以很大程度上實現標準化。此外 systemd 有個很棒的承諾:接口保持穩定,不會再輕易改動。對於軟件開發人員來說,這是多麼體貼又讓人感動的承諾啊!


結束語

本系列文章從古老卻簡明穩定的 sysvinit 說起,接着簡要描述了 UpStart 帶來的清新改變,最後看到了充滿野心和活力的新生代 systemd 系統逐漸統治 Linux 的各個版本。就好像在看我們這個世界,一代人老去,新的一代帶着橫掃一切的氣概登上舞臺,還沒有喊出他們最有力的口號,更猛的一代已經把聚光燈和所有的目光帶走。Systemd 之後也許還有更新的 init 系統出現吧,讓我們繼續期待。。。

 

本文來源:IBM developerWorks 中國

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章