Linux内核4.14版本:ARM64的内核启动过程(⼆)——
start_kernel
⽬录
start_kernel ⾥⾯调⽤了⼤量的函数,每⼀个函数都是⼀个庞⼤的知识点,如果想要学习Linux 内核,那么这些函数就需要去详细的研究。本篇⽂章只是简单介绍 Linux内核启动流程,因此不会去讲太多关于 Linux 内核的知识。 start_kernel 函数最后调⽤了 rest_init。
asmlinkage __visible void __init start_kernel(void)
{
char *command_line;
char *after_dashes;
set_task_stack_end_magic(&init_task);/* 设置任务栈结束魔术数,
*⽤于栈溢出检测
*/
smp_setup_processor_id(); /* 跟 SMP 有关(多核处理器),设置处理器 ID。
* 有很多资料说 ARM 架构下此函数为空函数,那是因
* 为他们⽤的⽼版本 Linux,⽽那时候 ARM 还没有多
* 核处理器。
*/
debug_objects_early_init(); /* 做⼀些和 debug 有关的初始化 */
cgroup_init_early(); /* cgroup 初始化, cgroup ⽤于控制 Linux 系统资源*/
local_irq_disable(); //关闭当前CUP中断
early_boot_irqs_disabled = true;
/*
* Interrupts are still disabled. Do necessary setups, then
* enable them.
*/
boot_cpu_init(); /* 跟 CPU 有关的初始化 */
page_address_init(); /* 页地址相关的初始化 */
pr_notice("%s", linux_banner); /* 打印 Linux 版本号、编译时间等信息 */
setup_arch(&command_line); /* 架构相关的初始化,此函数会解析传递进来的
* ATAGS 或者设备树(DTB)⽂件。会根据设备树⾥⾯
* 的 model 和 compatible 这两个属性值来查
* Linux 是否⽀持这个单板。此函数也会获取设备树
* 中 chosen 节点下的 bootargs 属性值来得到命令
* ⾏参数,也就是 uboot 中的 bootargs 环境变量的
* 值,获取到的命令⾏参数会保存到
*command_line 中。
*/
/*
* Set up the the initial canary and entropy after arch
* and after adding latent and command line entropy.
*/
add_latent_entropy();
add_device_randomness(command_line, strlen(command_line));
boot_init_stack_canary(); /* 栈溢出检测初始化 */
mm_init_cpumask(&init_mm); /* 看名字,应该是和内存有关的初始化 */
setup_command_line(command_line); /* 好像是存储命令⾏参数 */
setup_nr_cpu_ids(); /* 如果只是 SMP(多核 CPU)的话,此函数⽤于获取
* CPU 核⼼数量, CPU 数量保存在变量
* nr_cpu_ids 中。
*/
setup_per_cpu_areas(); /* 在 SMP 系统中有⽤,设置每个 CPU 的 per-cpu 数据 */
smp_prepare_boot_cpu(); /* arch-specific boot-cpu hooks */
boot_cpu_hotplug_init();
build_all_zonelists(NULL); /* 建⽴系统内存页区(zone)链表 */
page_alloc_init(); /* 处理⽤于热插拔 CPU 的页 */
/
* 打印命令⾏信息 */
pr_notice("Kernel command line: %s\n", boot_command_line);
/* parameters may set static keys */
jump_label_init();
parse_early_param(); /* 解析命令⾏中的 console 参数 */
after_dashes = parse_args("Booting kernel",
static_command_line, __start___param,
__stop___param - __start___param,
-1, -1, NULL, &unknown_bootoption);
if (!IS_ERR_OR_NULL(after_dashes))
parse_args("Setting init args", after_dashes, NULL, 0, -1, -1,
NULL, set_init_arg);
/*
* These use large bootmem allocations and must precede
* kmem_cache_init()
*/ // 内存相关的初始化
setup_log_buf(0); /* 设置 log 使⽤的缓冲区*/
pidhash_init(); /* 构建 PID 哈希表, Linux 中每个进程都有⼀个 ID,
* 这个 ID 叫做 PID。通过构建哈希表可以快速搜索进程
* 信息结构体。
*/
vfs_caches_init_early(); /* 预先初始化 vfs(虚拟⽂件系统)的⽬录项和
* 索引节点缓存
*/
sort_main_extable(); /* 定义内核异常列表 */
trap_init(); /* 完成对系统保留中断向量的初始化 */
mm_init(); /* 内存管理初始化 */
ftrace_init();
/* trace_printk can be enabled here */
early_trace_init();
/*
* Set up the scheduler prior starting any interrupts (such as the
* timer interrupt). Full topology setup happens at smp_init()
* time - but meanwhile we still have a functioning scheduler.
*/
sched_init(); /* 初始化调度器,主要是初始化⼀些结构体 */
/*
* Disable preemption - early bootup scheduling is extremely
* fragile until we cpu_idle() for the first time.
*/
preempt_disable(); /* 关闭优先级抢占 */
if (WARN(!irqs_disabled(), /* 检查中断是否关闭,如果没有的话就关闭中断 */ "Interrupts were enabled *very* early, fixing it\n"))
local_irq_disable();
radix_tree_init(); /* 基数树相关数据结构初始化 */
/*
* Allow workqueue creation and work item queueing/cancelling
* early. Work item execution depends on kthreads and starts after
* workqueue_init().
*/
workqueue_init_early();
rcu_init(); /* 初始化 RCU, RCU 全称为 Read Copy Update(读-拷贝修改) */
/* Trace events are available after this */
trace_init(); /* 跟踪调试相关初始化 */
linux下的sleep函数context_tracking_init();
/* init some links before init_ISA_irqs() */
early_irq_init(); /* 初始中断相关初始化,主要是注册 irq_desc 结构体变
* 量,因为 Linux 内核使⽤ irq_desc 来描述⼀个中断。
*/
init_IRQ(); /* 中断初始化 */
tick_init(); /* tick 初始化 */
rcu_init_nohz();
init_timers(); /* 初始化定时器 */
hrtimers_init(); /* 初始化⾼精度定时器 */
softirq_init(); /* 软中断初始化 */
timekeeping_init();
time_init(); /* 初始化系统时间 */
sched_clock_postinit();
printk_safe_init();
perf_event_init();
profile_init();
call_function_init();
WARN(!irqs_disabled(), "Interrupts were enabled early\n");
early_boot_irqs_disabled = false;
local_irq_enable(); /* 使能中断 */
kmem_cache_init_late(); /* slab 初始化, slab 是 Linux 内存分配器 */
/*
* HACK ALERT! This is early. We're enabling the console before
* we've done PCI setups etc, and console_init() must be aware of
* this. But we do want output early, in case something goes wrong.
*/
console_init(); /* 初始化控制台,之前 printk 打印的信息都存放
* 缓冲区中,并没有打印出来。只有调⽤此函数
* 初始化控制台以后才能在控制台上打印信息。
*/
if (panic_later)
panic("Too many boot %s vars at `%s'", panic_later,
panic_param);
lockdep_info(); /* 如果定义了宏 CONFIG_LOCKDEP,那么此函数打印⼀些信息。 */
/
*
* Need to run this when irqs are enabled, because it wants
* to self-test [hard/soft]-irqs on/off lock inversion bugs
* too:
*/
locking_selftest(); /* 锁⾃测 */
/*
* This needs to be called before any devices perform DMA
* operations that might use the SWIOTLB bounce buffers. It will
* mark the bounce buffers as decrypted so that their usage will
* not cause "plain-text" data to be decrypted when accessed.
*/
mem_encrypt_init();
#ifdef CONFIG_BLK_DEV_INITRD
if (initrd_start && !initrd_below_start_ok &&
page_to_pfn(virt_to_page((void *)initrd_start)) < min_low_pfn) {
pr_crit("initrd overwritten (0x%08lx < 0x%08lx) - disabling it.\n",
page_to_pfn(virt_to_page((void *)initrd_start)),
min_low_pfn);
initrd_start = 0;
}
#endif
kmemleak_init(); /* kmemleak 初始化, kmemleak ⽤于检查内存泄漏 */
debug_objects_mem_init();
debug_objects_mem_init();
setup_per_cpu_pageset();
numa_policy_init();
if (late_time_init)
late_time_init();
calibrate_delay(); /* 测定 BogoMIPS 值,可以通过 BogoMIPS 来判断 CPU 的性能 * BogoMIPS 设置越⼤,说明 CPU 性能越好。
*/
pidmap_init(); /* PID 位图初始化 */
anon_vma_init(); /* ⽣成 anon_vma slab 缓存 */
acpi_early_init();
#ifdef CONFIG_X86
if (efi_enabled(EFI_RUNTIME_SERVICES))
efi_enter_virtual_mode();
#endif
thread_stack_cache_init();
cred_init(); /* 为对象的每个⽤于赋予资格(凭证) */
fork_init(); /* 初始化⼀些结构体以使⽤ fork 函数 */
proc_caches_init(); /* 给各种资源管理结构分配缓存 */
buffer_init(); /* 初始化缓冲缓存 */
key_init(); /* 初始化密钥 */
security_init(); /* 安全相关初始化 */
dbg_late_init();
vfs_caches_init(); /* 为 VFS 创建缓存 */
pagecache_init();
signals_init(); /* 初始化信号 */
proc_root_init();
nsfs_init();
cpuset_init(); /* 初始化 cpuset, cpuset 是将 CPU 和内存资源以逻辑性
* 和层次性集成的⼀种机制,是 cgroup 使⽤的⼦系统之⼀
*/
cgroup_init(); /* 初始化 cgroup */
taskstats_init_early(); /* 进程状态初始化 */
delayacct_init();
check_bugs(); /* 检查写缓冲⼀致性 */
acpi_subsystem_init();
arch_post_acpi_subsys_init();
sfi_init_late();
if (efi_enabled(EFI_RUNTIME_SERVICES)) {
efi_free_boot_services();
}
/* Do the rest non-__init'ed, we're now alive */
rest_init(); /* rest_init 函数 */
prevent_tail_call_optimization();
}
1. rest_init
rest_init 函数定义在⽂件 init/main.c 中,函数内容如下:
static noinline void __ref rest_init(void)
{
struct task_struct *tsk;
int pid;
rcu_scheduler_starting(); /* 启动 RCU 锁调度器 */
/*
* We need to spawn init first so that it obtains pid 1, however
* the init task will end up wanting to create kthreads, which, if
* we schedule it before we create kthreadd, will OOPS.
*/
pid = kernel_thread(kernel_init, NULL, CLONE_FS);
/*
* Pin init on the boot CPU. Task migration is not properly working
* until sched_init_smp() has been run. It will set the allowed
* CPUs for init to the non isolated CPUs.
*/
rcu_read_lock();
tsk = find_task_by_pid_ns(pid, &init_pid_ns);
set_cpus_allowed_ptr(tsk, cpumask_of(smp_processor_id()));
rcu_read_unlock();
numa_default_policy();
pid = kernel_thread(kthreadd, NULL, CLONE_FS | CLONE_FILES);
rcu_read_lock();
kthreadd_task = find_task_by_pid_ns(pid, &init_pid_ns);
rcu_read_unlock();
/*
* Enable might_sleep() and smp_processor_id() checks.
* They cannot be enabled earlier because with CONFIG_PRREMPT=y
* kernel_thread() would trigger might_sleep() splats. With
* CONFIG_PREEMPT_VOLUNTARY=y the init task might have scheduled
* already, but it's stuck on the kthreadd_done completion.
*/
system_state = SYSTEM_SCHEDULING;
complete(&kthreadd_done);
/*
* The boot idle thread must execute schedule()
* at least once to get things moving:
*/
schedule_preempt_disabled();
/* Call into cpu_idle with preempt disabled */
cpu_startup_entry(CPUHP_ONLINE);
}
在第六⾏,通过调⽤函数rcu_scheduler_starting,来启动 RCU 锁调度器。
第⼗⼆⾏,调⽤函数 kernel_thread 创建 kernel_init 线程,也就是⼤名⿍⿍的 init 内核进程。init 进程的 PID 为 1。 init 进程⼀开始是内核进程(也就是运⾏在内核态),后⾯ init 进程会在根⽂件系统中查名为“init”这个程序,这个“init”程序处于⽤户态,通过运⾏这个“init”程序, init 进程就会实现从内核态到⽤户态的转变。
第⼆⼗四⾏,调⽤函数 kernel_thread 创建 kthreadd 内核进程,此内核进程的 PID 为 2。kthreadd进程负责所有内核进程的调度和管理。
第四⼗六⾏,调⽤函数cpu_startup_entry 来进⼊ idle 进程, cpu_startup_entry 会调⽤cpu_idle_loop, cpu_idle_loop 是个while 循环,也就是 idle 进程代码。 idle 进程的 PID 为 0, idle进程叫做空闲进程,如果学过 FreeRTOS 或者 UCOS 的话应该听说过空闲任务。 idle 空闲进程就和空闲任务⼀样,当 CPU 没有事情做的时候就在 idle 空闲进程⾥⾯“瞎逛游”,反正就是给CPU 点事做。当其他进程要⼯作的时候就会抢占 idle 进程,从⽽夺取 CPU 使⽤权。其实⼤家应该可以看到 idle 进程并没有使⽤ kernel_thread 或者 fork 函数来创建,因为它是有主进程演变⽽来的。
在 Linux 终端中输⼊ps -A就可以打印出当前系统中的所有进程,其中就能看到 init 进程和kthreadd 进程。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论