android启动--深入理解init进程

jopen 12年前

init是一个进程,它是linux系统中用户空间的第一个进程,其进程PID是1,父进程为linux
系统内核的0号进程。所以其被赋予很多极其重要的职责,linux内核初始化完成后就开始执行它。


代码路径:\system\core\init\init.c


下面就分析一下先吧,只分析重点的函数功能:
int main(int argc, char **argv)
{
   // 1、设置子进程退出的信号处理函数:sigchld_handler
     act.sa_handler = sigchld_handler;
     act.sa_flags = SA_NOCLDSTOP;
     act.sa_mask = 0;
     act.sa_restorer = NULL;
     sigaction(SIGCHLD, &act, 0);

     // 2、创建文件夹,并挂载设备
     mkdir("/dev", 0755);
     mkdir("/proc", 0755);
    ....
    
     // 3、重定向标准输入输出错误到 /dev/null
     open_devnull_stdio();
    
     // 4、解析 init.rc 脚本
     parse_config_file("/init.rc");


// 5、解析机器相关的配置文件,一般相关的放在init.rc中利用service action调过去
snprintf(tmp, sizeof(tmp), "/init.%s.rc", hardware);
     parse_config_file(tmp);


// 6、建立 uevent,用于与linux kernel交互的socket
device_fd = device_init();

// 7、初始化及加载属性相关资源,这里利用ashmem共享,属于整个系统的资源
property_init();

// 8、执行 on init 、early-boot 及 boot 片段动作,这些定义于 init.rc 中
     / execute all the boot actions to get us started /
     action_for_each_trigger("init", action_add_queue_tail);
     drain_action_queue();
    
     / execute all the boot actions to get us started /
     action_for_each_trigger("early-boot", action_add_queue_tail);
     action_for_each_trigger("boot", action_add_queue_tail);

   // 9、这里定义的init进程需要关注的四个方面事情  
ufds[0].fd = device_fd;
     ufds[0].events = POLLIN;   // Uevent事件
     ufds[1].fd = property_set_fd;
     ufds[1].events = POLLIN;   // 属性事件
     ufds[2].fd = signal_recv_fd;
     ufds[2].events = POLLIN;   // 子进程事件
     fd_count = 3;


   ufds[3].fd = keychord_fd;
     ufds[3].events = POLLIN;  // keychord热键事件
     fd_count++;

// ok, 下面就是init进程的处理循环
for(;;) {
// I、执行init.rc 脚本中的动作
         drain_action_queue();
        
         // II、执行标志为SVC_RESTARTING的进程,利用fork+execve启动新的进程
         restart_processes();


// III、调用poll轮询上述的四个事件
         nr = poll(ufds, fd_count, timeout);
         if (nr <= 0)
             continue;


// IV、依次处理各个事件
         if (ufds[2].revents == POLLIN) {
             / we got a SIGCHLD - reap and restart as needed /
             read(signal_recv_fd, tmp, sizeof(tmp));
             while (!wait_for_one_process(0))
                 ;
             continue;
        }


         if (ufds[0].revents == POLLIN)
             handle_device_fd(device_fd);


         if (ufds[1].revents == POLLIN)
             handle_property_set_fd(property_set_fd);
         if (ufds[3].revents == POLLIN)
             handle_keychord(keychord_fd);
...
}

return 0;
}


这里我们重点关注一下service的解析过程:


这里以启动 zygote 为例讲解一下:
service zygote /system/bin/app_process -Xzygote /system/bin --zygote --start-system-server
    socket zygote stream 666   //创建一个stream流式套接字
    onrestart write /sys/android_power/request_state wake
    onrestart write /sys/power/state on
    onrestart restart media


服务名称: zygote
进程路径: /system/bin/app_process
进程启动参数:-Xzygote /system/bin --zygote --start-system-server

解析入口函数:parse_new_section

void parse_new_section(struct parse_state state, int kw,
                       int nargs, char **args)
{
    switch(kw) {
    case K_service:
        state->context = parse_service(state, nargs, args);
        if (state->context) {
            state->parse_line = parse_line_service;
            return;
        }
        break;
...
}


--> 其中所有的解析的service放在如下双链表结构中
struct service {
    /
list of all services /
    struct listnode slist;


    const char
name;
    const char classname; //所属class名字,默认为"default"


    unsigned flags;
    pid_t pid;


    struct socketinfo
sockets;
    struct svcenvinfo envvars;


    struct action onrestart;  /
Actions to execute on restart. /
    ...
};


static void
parse_service(struct parse_state state, int nargs, char **args)
{
    struct service
svc;

    svc = service_find_by_name(args[1]);

    svc->name = args[1];
    svc->classname = "default";
    memcpy(svc->args, args + 2, sizeof(char) nargs);
    svc->args[nargs] = 0;
    svc->nargs = nargs;
    svc->onrestart.name = "onrestart";
    list_init(&svc->onrestart.commands);


    // 加入到全局 service_list 链表中
    list_add_tail(&service_list, &svc->slist);
    return svc;
}


然后执行点都使用 list_for_each(node, &service_list) 循环遍历所有服务及执行动作


service 启动:


在解析 init.rc 脚本中 
class_start default 
这个class_start 是一个COMMAND,其对应的函数是 do_class_start ,注意类似的COMMAND也一样
加上前缀 do_xxx 即函数名称: ex: mount 对应于 do_mount 
代码:/system/core/init/builtins.c


do_class_start()
-->service_start_if_not_disabled()
--> service_start(svc, NULL);


void service_start(struct service svc, const char dynamic_args)
{
    // 已经运行则直接返回
    if (svc->flags & SVC_RUNNING) {
        return;
    }
    
    NOTICE("starting '%s'\n", svc->name);
    pid = fork();  //创建子进程 
    if(pid == 0){
     // 运行于子进程中
    
     // 准备好执行环境
     add_environment(ei->name, ei->value);
    create_socket(si->name,
                         !strcmp(si->type, "dgram") ? 
                         SOCK_DGRAM : SOCK_STREAM,
                         si->perm, si->uid, si->gid);    
    
     // 开始执行具体的进程
     execve(svc->args[0], (char) arg_ptrs, (char) ENV);
    }


    svc->time_started = gettime();
    svc->pid = pid;
    svc->flags |= SVC_RUNNING;


    notify_service_state(svc->name, "running");
}


onrestart 用于重启使用,这就是最开始那个 sigchld_handler 函数:


static void sigchld_handler(int s)
{
    write(signal_fd, &s, 1); // 写数据
}

读取数据处理:
在 init 进程的main函数中处理:
    if (ufds[2].revents == POLLIN) {
        / we got a SIGCHLD - reap and restart as needed /
        read(signal_recv_fd, tmp, sizeof(tmp));
        while (!wait_for_one_process(0))
            ;
        continue;
    }

-->
static int wait_for_one_process(int block)
{
    while ( (pid = waitpid(-1, &status, block ? 0 : WNOHANG)) == -1 && errno == EINTR );


// 如果zygote 死则整个系统崩溃
    if (!(svc->flags & SVC_ONESHOT)) {
        kill(-pid, SIGKILL);
        NOTICE("process '%s' killing any children in process group\n", svc->name);
    }

//超时及重启次数系统重启进入recovery模式
    if (svc->flags & SVC_CRITICAL) {
        if (svc->time_crashed + CRITICAL_CRASH_WINDOW >= now) {
            if (++svc->nr_crashed > CRITICAL_CRASH_THRESHOLD) {
                ERROR("critical process '%s' exited %d times in %d minutes; "
                      "rebooting into recovery mode\n", svc->name,
                      CRITICAL_CRASH_THRESHOLD, CRITICAL_CRASH_WINDOW / 60);
                sync();
                __reboot(LINUX_REBOOT_MAGIC1, LINUX_REBOOT_MAGIC2,
                         LINUX_REBOOT_CMD_RESTART2, "recovery");
                return 0;
            }
        }
...
</span>

}