Android FrameWork - 開機啓動 Init 進程

相關文章鏈接:
1. Android FrameWork - 學習啓動篇
2. Android FrameWork - 開機啓動 Init 進程

相關源碼文件:

/system/core/init/Init.cpp
/system/core/rootdir/init.rc
/system/core/init/init_parser.cpp
/system/core/init/builtins.cpp
/system/core/init/signal_handler.cpp

操作系統本身也是一個程序,只是這個程序是用來管理我們 App 應用程序的。不知大家是否瞭解計算機的啓動過程?當然不瞭解也沒關係這裏並不影響。如果大家想要了解操作系統的基本原理,可以去聽聽國內外的一些公開課,推薦清華大學的《計算機操作系統》公開課。Android 系統雖然也是基於 Linux 系統的,但是由於 Android 屬於移動設備,並沒有像 PC 那樣的 BIOS 程序。 取而代之的是 BootLoader (系統啓動加載器)。 它類似於 BIOS,在系統加載前,用以初始化硬件設備,建立內存空間的映像圖,爲最終調用系統內核準備好環境。 在 Android 裏沒有硬盤,而是 ROM,它類似於硬盤存放操作系統,用戶程序等。 ROM 跟硬盤一樣也會劃分爲不同的區域,用於放置不同的程序。當 Linux 內核啓動後會初始化各種軟硬件環境,加載驅動程序,掛載根文件系統,Linux 內核加載的準備完畢後就開始加載一些特定的程序(進程)了。第一個加載的就是 init 進程,我們就從這裏開始分析,至於之前的過程大家感興趣可以自行研究下,作爲一個 App 應用開發者不瞭解也沒關係。

Init 進程

我們應該都知道不管是 Java 還是 C/C++ 去運行某一個程序(進程)都是 XXX.xxx 的 main 方法作爲入口,相信有很多大佬都跟我一樣,App 開發做久了漸漸就忘記了還有個 main 方法。因此我們找到 /system/core/init/Init.cpp 的 main() 方法:

int main(int argc, char** argv) {
    ...
    // 初始化 signal handler
    signal_handler_init();
    // 解析 init.rc 腳本文件
    init_parse_config_file("/init.rc"); 
    // 將解析腳本中對應的操作添加到 action_queue 隊列中
    action_for_each_trigger("early-init", action_add_queue_tail);
    // Queue an action that waits for coldboot done so we know ueventd has set up all of /dev...
    queue_builtin_action(wait_for_coldboot_done_action, "wait_for_coldboot_done");
    // ... so that we can start queuing up actions that require stuff from /dev.
    queue_builtin_action(mix_hwrng_into_linux_rng_action, "mix_hwrng_into_linux_rng");
    queue_builtin_action(keychord_init_action, "keychord_init");
    queue_builtin_action(console_init_action, "console_init");
    
    ...
    // 這裏是個死循環
    while (true) {
        if (!waiting_for_exec) {
            // 執行命令
            execute_one_command();
            restart_processes();
        }
        ...
    }
    return 0;
}

main 方法裏面有 148 行代碼(不包括子函數代碼)具體分爲四個步驟:1.創建目錄,掛載分區,2.解析啓動腳本,3.啓動解析的服務,4.守護解析的服務。init.rc 文件是 Android 系統的重要配置文件,位於 /system/core/rootdir/init.rc

// 導入其它的一些腳本
import /init.environ.rc
import /init.usb.rc
// 當前硬件版本的腳本
import /init.${ro.hardware}.rc
import /init.${ro.zygote}.rc
import /init.trace.rc

on early-init
...
on init
...
// 服務 服務名稱 執行文件路徑 執行參數
// 有幾個重要的服務
service zygote /system/bin/app_process64 -Xzygote /system/bin --zygote --start-system-server
service servicemanager /system/bin/servicemanager
service surfaceflinger /system/bin/surfaceflinger
service media /system/bin/mediaserver
service installd /system/bin/installd

上面主要分爲有 import 導入、on 命令和 service 服務,最主要的幾個服務有 zygote、servicemanager、surfaceflinger 、media 、installd (後面還會分析到),接着往下看是如何解析的:

int init_parse_config_file(const char* path) {
    INFO("Parsing %s...\n", path);
    Timer t;
    std::string data;
    if (!read_file(path, &data)) {
        return -1;
    }

    data.push_back('\n'); // TODO: fix parse_config.
    // 解析
    parse_config(path, data);
    dump_parser_state();

    NOTICE("(Parsing %s took %.2fs.)\n", path, t.duration());
    return 0;
}

static void parse_config(const char *fn, const std::string& data)
{
    struct listnode import_list;
    struct listnode *node;
    
    for (;;) {
        // next_token 內部實現是一個字符一個字符去解析
        // 0:T_EOF 文件結尾
        // \n: T_NEWLINE
        switch (next_token(&state)) {
        case T_EOF:
            // 文件結尾,跳轉到 parser_done
            state.parse_line(&state, 0, 0);
            goto parser_done;
        // 如果是新的一行,就認爲是一個新的命令
        case T_NEWLINE:
            state.line++;
            if (nargs) {
                // 不同的命令選擇不同的結構體
                int kw = lookup_keyword(args[0]);
                if (kw_is(kw, SECTION)) {
                    // 是一個 Section
                    state.parse_line(&state, 0, 0);
                    // 解析三種 Section:parse_service、parse_action、parse_import
                    parse_new_section(&state, kw, nargs, args);
                } else {
                    // 普通命令
                    state.parse_line(&state, nargs, args);
                }
                nargs = 0;
            }
            break;
        case T_TEXT:
            if (nargs < INIT_PARSER_MAXARGS) {
                args[nargs++] = state.text;
            }
            break;
        }
    }

parser_done:
    // 循環解析 import 
    list_for_each(node, &import_list) {
         struct import *import = node_to_item(node, struct import, list);
         int ret;

         ret = init_parse_config_file(import->filename);
         if (ret)
             ERROR("could not import file '%s' from '%s'\n",
                   import->filename, fn);
    }
}

接下來看下是如何執行的,這裏我們主要了解服務是如何啓動的:

void execute_one_command() {
    Timer t;

    char cmd_str[256] = "";
    char name_str[256] = "";

    if (!cur_action || !cur_command || is_last_command(cur_action, cur_command)) {
        cur_action = action_remove_queue_head();
        cur_command = NULL;
        if (!cur_action) {
            return;
        }

        build_triggers_string(name_str, sizeof(name_str), cur_action);

        INFO("processing action %p (%s)\n", cur_action, name_str);
        cur_command = get_first_command(cur_action);
    } else {
        cur_command = get_next_command(cur_action, cur_command);
    }

    if (!cur_command) {
        return;
    }
    // 服務的 func 跳轉到 service_for_each_class
    int result = cur_command->func(cur_command->nargs, cur_command->args);
    ...
}

int do_class_start(int nargs, char **args)
{
   /* Starting a class does not start services
   * which are explicitly disabled.  They must
   * be started individually.
   */
    service_for_each_class(args[1], service_start_if_not_disabled);
    return 0;
}

void service_for_each_class(const char *classname,void (*func)(struct service *svc))
{
    struct listnode *node;
    struct service *svc;
    list_for_each(node, &service_list) {
        svc = node_to_item(node, struct service, slist);
        // 如果名字是一致的執行 func ,這是一個回調函數也就是 service_start_if_not_disabled
        if (!strcmp(svc->classname, classname)) {
            func(svc);
        }
    }
}

static void service_start_if_not_disabled(struct service *svc)
{
    if (!(svc->flags & SVC_DISABLED)) {
        service_start(svc, NULL);
    } else {
        svc->flags |= SVC_DISABLED_START;
    }
}

void service_start(struct service *svc, const char *dynamic_args)
{
    ...
    // fork 創建了一個子進程
    pid_t pid = fork();
    if (pid == 0) {
        // 代表子進程,子進程會繼承父進程的所有資源,可簡單理解爲讀時共享寫事複製
        ...
        // exc 函數族,這些都是 linux 基礎知識
        execve(svc->args[0], (char**) arg_ptrs, (char**) ENV);
    }
}

最後再來看下 init 進程是如何守護子進程的:

void signal_handler_init() {
    // Create a signalling mechanism for SIGCHLD.
    int s[2];
    // 創建 socket pair 用於通信
    if (socketpair(AF_UNIX, SOCK_STREAM | SOCK_NONBLOCK | SOCK_CLOEXEC, 0, s) == -1) {
        ERROR("socketpair failed: %s\n", strerror(errno));
        exit(1);
    }
    // 當捕獲信號SIGCHLD,則寫入signal_write_fd
    signal_write_fd = s[0];
    signal_read_fd = s[1];

    // Write to signal_write_fd if we catch SIGCHLD.
    struct sigaction act;
    memset(&act, 0, sizeof(act));
    act.sa_handler = SIGCHLD_handler;
    act.sa_flags = SA_NOCLDSTOP;
    // SA_NOCLDSTOP 使 init 進程只有在其子進程終止時纔會受到 SIGCHLD 信號
    sigaction(SIGCHLD, &act, 0);
    // 進入 waitpid 來處理子進程是否退出的情況
    reap_any_outstanding_children();
    // 調用 epoll_ctl 方法來註冊 epoll 的回調函數
    register_epoll_handler(signal_read_fd, handle_signal);
}

//讀取數據
static void handle_signal() {
    // Clear outstanding requests.
    char buf[32];
    // 讀取 signal_read_fd 中的數據,並放入 buf,這裏讀出並沒有什麼實際作用,只是用於阻塞等待
    read(signal_read_fd, buf, sizeof(buf));
    reap_any_outstanding_children();
}

//寫入數據
static void SIGCHLD_handler(int) {
    // 向signal_write_fd寫入1 
    if (TEMP_FAILURE_RETRY(write(signal_write_fd, "1", 1)) == -1) {
        ERROR("write(signal_write_fd) failed: %s\n", strerror(errno));
    }
}

static void reap_any_outstanding_children() {
    while (wait_for_one_process()) { }
}

static bool wait_for_one_process() {
    int status;
    //等待任意子進程,如果子進程沒有退出則返回 0,否則則返回該子進程 pid。
    pid_t pid = TEMP_FAILURE_RETRY(waitpid(-1, &status, WNOHANG));
    if (pid == 0) {
        return false;
    } else if (pid == -1) {
        return false;
    }
    //根據 pid 查找到相應的 service
    service* svc = service_find_by_pid(pid);

    //當 flags 爲 RESTART,且不是 ONESHOT 時, kill 進程組內所有的子進程或子線程
    if (!(svc->flags & SVC_ONESHOT) || (svc->flags & SVC_RESTART)) {
        kill(-pid, SIGKILL);
    }

    //移除當前服務 svc 中的所有創建過的 socket
    for (socketinfo* si = svc->sockets; si; si = si->next) {
        char tmp[128];
        snprintf(tmp, sizeof(tmp), ANDROID_SOCKET_DIR"/%s", si->name);
        unlink(tmp);
    }

    //當 flags 爲 EXEC 時,釋放相應的服務
    if (svc->flags & SVC_EXEC) {
        waiting_for_exec = false;
        list_remove(&svc->slist);
        free(svc->name);
        free(svc);
        return true;
    }
    ...

    // 對於 ONESHOT 服務,使其進入 disabled 狀態
    if ((svc->flags & SVC_ONESHOT) && !(svc->flags & SVC_RESTART)) {
        svc->flags |= SVC_DISABLED;
    }
    // 禁用和重置的服務,都不再自動重啓
    if (svc->flags & (SVC_DISABLED | SVC_RESET))  {
        svc->NotifyStateChange("stopped"); //設置相應的service狀態爲stopped
        return true;
    }

    // 執行當前 service 中所有 onrestar t命令,這個就是重啓了
    struct listnode* node;
    list_for_each(node, &svc->onrestart.commands) {
        command* cmd = node_to_item(node, struct command, clist);
        cmd->func(cmd->nargs, cmd->args);
    }
    // 設置相應的 service 狀態爲 restarting
    svc->NotifyStateChange("restarting");
    return true;
}

至此 init 進程已全部分析完畢,有四個步驟:1. 創建目錄,掛載分區,2. 解析啓動腳本,3. 啓動解析的服務,4. 守護解析的服務。最需要注意的是 init 創建了 zygote(創建 App 應用的服務)、servicemanager (client 與 service 通信管理的服務)、surfaceflinger(顯示渲染服務) 和 media(多媒體服務) 等 service 進程。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章