郑重声明:未经本人允许,不得用于商业或非商业的转载和使用,如有需要请联系:yrj1978@hotmail.com
引子
为什么要写这个笔记:
1,这本书的中文版翻译了太垃圾,没法阅读。阅读英文原版,可以很好的理解作者的思路。作此笔记备忘
2,一直以来学习LINUXkernel的知识缺乏系统化,借对这本书的学习,系统化的学习一下LINUXkernel。
3,自己一直在做一个toosmall,toosimple的单进程,特权模式,64bit保护模式的称不上OS的OS,已经做完了bootloader,构思kernel的实现的时候,困惑在内存管理的实现上,阅读这本书,希望能有利于自己的OS的编写。4,克服惰性,多读书,希望一天能阅读5页,争取半年内阅读完这本原版700多页的巨著。
不足:
我不可能完全理解LINUX内存管理的精髓,肯定有很多地方理解错误。希望大家能够指正,以便提高,谢谢。
学习方法:
可能您第一次阅读的时候很多地方都不理解,不用担心。那您可能需要阅读一些文件系统的知识。
或者阅读全部笔记后,再回头阅读,有些地方您就理解了。
言归正传:
一、概要
可用工具
CodeViz:生成代码调用关系图的工具,这个工具我现在还没有去使用,有兴趣的可以自己试试去建立调用关系图。
http://www.csn.ul.ie/ ̄mel/projects/codeviz/
Linuxcrossreference(LXR):以web的方式阅读和查LINUX内核
源代码的工具。这个工具安装相当麻烦,我建议直接到它的直接读代码。
http://lxr.linux.no/linux+v2.6.24/
模块
LINUX内存管理代码模块主要分为4个部分:
1.Outofmemory代码在mm/oom_kill.c貌似用于杀进程的时候对内存的操作
2.虚拟内存的分配代码在mm/vmalloc.c
3.物理内存页面分配代码在mm/page_alloc.cVMA(virtualmemoryaddresses)的创建和进程内的内存区域的管理
4.这些模块,贯穿与其他kernel代码之中,形成更复杂的系统模块,如页面替换策略,buffer的输入输出等
中间插段广告
Linux文化T恤,淘宝销售,有兴趣的可以购买。
淘宝店面地址:
http://list.taobao.com/browse/search_auction.htm?user=b0ccaa7bfdc57fdec4594501767832b6&commend=all
继续
二、物理内存
从硬件角度看内存系统,有2种主流的体系结构,不一致的内存访问系统(NUMA),我不知道什么系统在用这样模式,这种系统将内存系统分割成2块区域(BANK),一块是专门给CPU去访
问,一块是给外围设备板卡的DMA去访问。另外一种体系结构,是一致的内存访问系统(UMA),PC都是用的这种结
于CPU和其他外围设备访问的内存在一块内存条上,没有任何不同。
linux内核设计与实现 pdfLINUX内核需要支持这2种体系结构。它引入了一个概念称为node,一个node对应一个bank,对于UMA体系的,系统中只有一个node。在LINUX中引入一个数据结构structpglist_data,来描述一个node,定义在
include/linux/mmzone.h文件中。(这个结构被typedefpg_data_t)
对于NUMA系统来讲,整个系统的内存由一个node_data的pg_data_t指针数组来管理。(因为可能有多个node)对于PC这样的UMA系统,使用struct
pglist_datacontig_page_data,作为系统唯一的node管理所有的内存区域。(UMA系统中中只有一个node)
每个node又被分成多个zone,它们各自描述在内存中的范围。zone由structzone_struct数据结构来描述。zone的类型由zone_t表示,有ZONE_DMA,
ZONE_NORMAL,ZONE_HIGHMEM这三种类型。它们之间的用途是不一样的,ZONE_DMA类型的内存区域在物理内存的低端,主要是ISA设备只能用低端的地址做DMA操作。ZONE_NORMAL类型的内存区域直接被内核映射到线性地址空间上面的区域(lineaddressspace),以后的章节将详细描述。ZONE_HIGHMEM将保留给系统使用。
在PC系统中,内存区域类型如下分布:
ZONE_DMA0-16MB
ZONE_NORMAL16MB-896MB
ZONE_HIGHMEM896MB-物理内存结束
大多数kernel的操作只使用ZONE_NORMAL区域,
系统内存由很多固定大小的内存块组成的,这样的内存块称作为页(PAGE),x86体系结构中,page的大小为4096个字节。每个物理的页由一个structpage的数据结构对象来描述。页的数据结构对象都保存在mem_map全局数组中。从载入内核的低地址内存区域的后面内存区域,也就是ZONE_NORMAL开始的地方的内存的页的数据结构对象,都保存在这个
全局数组中。
因为ZONE_NORMAL区域的内存空间也是有限的,所以LINUX也支持Highmemory的访问,这个下面章节会描述,这个章节,将主要描述node,zone,page及它们之
间的关联。
Nodes
表示node的数据结构为pg_data_t,也就是structpglist_data,这个结构定义在<linux/mmzone.h>中:
typedefstructpglist_data{
structzonenode_zones[MAX_NR_ZONES];
structzonelistnode_zonelists[MAX_ZONELISTS];
intnr_zones;
structpage*node_mem_map;
structbootmem_data*bdata;
unsignedlongnode_start_pfn;
unsignedlongnode_present_pages;/*totalnumberofphysicalpages*/
unsignedlongnode_spanned_pages;/*totalsizeofphysicalpage
range,includingholes*/intnode_id;
wait_queue_head_tkswapd_wait;
structtask_struct*kswapd;
intkswapd_max_order;
}pg_data_t;
node_zones:分别为ZONE_DMA,ZONE_NORMAL,ZONE_HIGHMEM
node_zonelists:分配内存操作时的区域顺序,当调用free_area_ini
t_core()时,由mm/page_alloc.c文件中的build_zonelists()函数设置。
nr_zones:node中的zone的数量,1到3个之间。并不是所有的node都有3个zone的,比如有些就没有ZONE_DMA区域。
node_mem_map:node中的第一个page,它可以指向mem_map中的任何一个page。bdata:这个仅用于boot的内存分配,下面再描述
node_start_pfn:pfn是pageframenumber的缩写。这个成员是用于表示node中的开始那个page在物理内存中的位置的。
2.4以前的版本,用物理地址来表示的,后来由于硬件的发展,物理内存很可能大于32bit所表示
4G的内存地址,所以改为以页为单位表示。
node_present_pages:node中的真正可以使用的page数量
node_spanned_pages:node中所有存在的Page的数量,包括可用的,也包括被后面讲到的mem_map所占用的,dma所占用的区域的。(做了修正)
英文原版是这么描述的:"nodespannedpages"isthetotalareathatisaddressedbythenode,including
anyholesthatmayexist.可能是包括hold的node可以访问的区域的数量吧。node_id:node的NODEID,从0开始
kswapd_wait:node的等待队列
对于单一node的系统,contig_page_data是系统唯一的node数据结构对象。Zone
每个zone都由一个structzone数据结构对象描述。zone对象里面保存着内存使用状态信息,如page使用统计,未使用的内存区域,互斥访问的锁(LOCKS)等。structzone在<linux/mmzone.h>中定义(把不关心的NUMA和memory
hotplug相关的成员给省略掉了):
structzone{
unsignedlongfree_pages;
unsignedlongpages_min,pages_low,pages_high;
unsignedlonglowmem_reserve[MAX_NR_ZONES];
structper_cpu_pagesetpageset[NR_CPUS];
spinlock_tlock;
structfree_areafree_area[MAX_ORDER];
ZONE_PADDING(_pad1_)//用于字节对齐
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论