免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1008 | 回复: 0
打印 上一主题 下一主题

Linux 内核剖析 历史和体系结构分析 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-04-30 09:18 |只看该作者 |倒序浏览
Linux 内核剖析 历史和体系结构分析  


CNET中国·PChome.net·转载
  作者:  
责编:宝良  时间:2007-09-12  标签:
Linux




由于本文的目标是对
[color="#000099"]Linux
内核进行介绍并探索其体系结构和主要组件,因此首先回顾一下
[color="#000099"]Linux
的简短历史,然后从较高的层次审视
[color="#000099"]Linux
内核的体系结构,最后介绍它的主要子系统。
[color="#000099"]Linux
内核具有超过 600 万行的代码,因此本文不可能进行完整的介绍。请使用指向其他内容的链接进一步学习。
[color="#000099"]Linux
的简短历史


[color="#000099"]Linux
还是 GNU/
[color="#000099"]Linux

您可能已经注意到
[color="#000099"]Linux
作为一个
[color="#000099"]操作系统
来说,有时会称为 “
[color="#000099"]Linux
”,有时却称为 “GNU/
[color="#000099"]Linux
”。这背后的原因在于
[color="#000099"]Linux
实际上是
[color="#000099"]操作系统
内核。使这个
[color="#000099"]操作系统
变得非常有用的大量应用程序是 GNU 软件。例如,窗口系统、编译器、各种 shell、开发工具、编辑器、实用工具以及内核之外的其他应用程序,其中很多都是 GNU 软件。由于这个原因,很多人都认为 “GNU/
[color="#000099"]Linux
” 更适合作为
[color="#000099"]操作系统
的名字,而 “
[color="#000099"]Linux
” 则适合作为内核的名字。
尽管
[color="#000099"]Linux
绝对是最流行的开源
[color="#000099"]操作系统
,但是相对于其他
[color="#000099"]操作系统
的漫长历史来说,
[color="#000099"]Linux
的历史非常短暂。在计算机出现早期,程序员是使用硬件语言在裸硬件上进行开发的。缺少
[color="#000099"]操作系统
就意味着在某个时间只有一个应用程序(和一个用户)可以使用这些庞大而又昂贵的设备。早期的
[color="#000099"]操作系统
是在 20 世纪 50 年代开发的,用来提供简单的开发体验。包括为
IBM
701 开发的 General Motors Operating System(GMOS)和 North American Aviation 为 IBM 709 开发的 FORTRAN Monitor System(FMS)。
在 20 世纪 60 年代,MIT(Massachusetts Institute of Technology)和一些公司为
GE-645 开发了一个名为 Multics(Multiplexed Information and Computing
Service)的实验性的
[color="#000099"]操作系统
。这个
[color="#000099"]操作系统
的开发者之一 AT&T 后来退出了 Multics,并在 1970 年开发了自己的名为 Unics 的
[color="#000099"]操作系统
。与这个
[color="#000099"]操作系统
一同诞生的是 C 语言,C 语言就是为此而开发的,然后它们使用 C 语言对
[color="#000099"]操作系统
进行了重写,使
[color="#000099"]操作系统
开发具有可移植性。
二十年后,Andrew Tanenbaum 创建了一个微内核版本的 UNIX®,名为 MINIX(代表 minimal UNIX),它可以在小型的个人计算机上运行。这个开源
[color="#000099"]操作系统
在 20 世纪 90 年代激发了 Linus Torvalds 开发
[color="#000099"]Linux
的灵感(请参看图 1 所示)。
图 1. 主要
[color="#000099"]Linux
内核发行版简史



[color="#000099"]Linux
快速从一个个人项目进化成为一个全球数千人参与的开发项目。对于
[color="#000099"]Linux
来说,最为重要的决策之一是采用 GPL(GNU General Public License)。在 GPL 保护之下,
[color="#000099"]Linux
内核可以防止商业使用,并且它还从 GNU 项目(Richard Stallman 开发,其源代码要比
[color="#000099"]Linux
内核大得多)的用户空间开发受益。这允许使用一些非常有用的应用程序,例如 GCC(GNU Compiler Collection)和各种 shell 支持。



[color="#000099"]Linux
内核简介
现在让我们从一个比较高的高度来审视一下 GNU/
[color="#000099"]Linux

[color="#000099"]操作系统
的体系结构。您可以从两个层次上来考虑
[color="#000099"]操作系统
,如图 2 所示。
图 2. GNU/
[color="#000099"]Linux

[color="#000099"]操作系统
的基本体系结构




系统调用接口(SCI)的方法
实际上,体系结构可能并不像图 2 所示的一样清晰。例如,处理系统调用(从用户空间切换到内核空间)的机制可能在各个体系结构上都不相同。提供了对虚拟化指令支持的新型 x86 中央处理单元(
CPU
)在这方面要比使用传统 int 80h 方法的老式 x86 处理器更加高效。
最上面是用户(或应用程序)空间。这是用户应用程序执行的地方。用户空间之下是内核空间,
[color="#000099"]Linux
内核正是位于这里。
GNU C Library
(glibc)也在这里。它提供了连接内核的系统调用接口,还提供了在用户空间应用程序和内核之间进行转换的机制。这点非常重要,因为内核和用户空间的应
用程序使用的是不同的保护地址空间。每个用户空间的进程都使用自己的虚拟地址空间,而内核则占用单独的地址空间。 更多信息,请参看
[color="#996699"]参考资料
一节中的链接。
[color="#000099"]Linux
内核可以进一步划分成 3 层。最上面是系统调用接口,它实现了一些基本的功能,例如 read 和 write。系统调用接口之下是内核代码,可以更精确地定义为独立于体系结构的内核代码。这些代码是
[color="#000099"]Linux
所支持的所有处理器体系结构所通用的。在这些代码之下是依赖于体系结构的代码,构成了通常称为 BSP(Board Support Package)的部分。这些代码用作给定体系结构的处理器和特定于平台的代码。



[color="#000099"]Linux
内核的属性
在讨论大型而复杂的系统的体系结构时,可以从很多角度来审视系统。体系结构分析的一个目标是提供一种方法更好地理解源代码,这正是本文的目的。
[color="#000099"]Linux
内核实现了很多重要的体系结构属性。在或高或低的层次上,内核被划分为多个子系统。
[color="#000099"]Linux
也可以看作是一个整体,因为它会将所有这些基本服务都集成到内核中。这与微内核的体系结构不同,后者会提供一些基本的服务,例如通信、I/O、内存和进程管理,更具体的服务都是插入到微内核层中的。每种内核都有自己的优点,不过这里并不对此进行讨论。
随着时间的流逝,
[color="#000099"]Linux
内核在内存和 CPU 使用方面具有较高的效率,并且非常稳定。但是对于
[color="#000099"]Linux
来说,最为有趣的是在这种大小和复杂性的前提下,依然具有良好的可移植性。
[color="#000099"]Linux
编译后可在大量处理器和具有不同体系结构约束和需求的平台上运行。一个例子是
[color="#000099"]Linux
可以在一个具有内存管理单元(MMU)的处理器上运行,也可以在那些不提供 MMU 的处理器上运行。
[color="#000099"]Linux
内核的 uClinux 移植提供了对非 MMU 的支持。更详细信息请参看
[color="#996699"]参考资料
一节的内容。



[color="#000099"]Linux
内核的主要子系统
现在使用图 3 中的分类说明
[color="#000099"]Linux
内核的主要组件。
图 3.
[color="#000099"]Linux
内核的一个体系结构透视图



系统调用接口
SCI
层提供了某些机制执行从用户空间到内核的函数调用。正如前面讨论的一样,这个接口依赖于体系结构,甚至在相同的处理器家族内也是如此。SCI
实际上是一个非常有用的函数调用多路复用和多路分解服务。在 ./linux/kernel 中您可以找到 SCI 的实现,并在
./linux/arch 中找到依赖于体系结构的部分。有关这个组件的更详细信息可以在
[color="#996699"]参考资料
一节中找到。
进程管理



内核是什么?

[color="#996699"]图 3
所示,内核实际上仅仅是一个资源管理器。不管被管理的资源是进程、内存还是硬件设备,内核负责管理并裁定多个竞争用户对资源的访问(既包括内核空间也包括用户空间)。
进程管理的重点是进程的执行。在内核中,这些进程称为线程,代表了单独的处理器虚拟化(线程代码、数据、堆栈和 CPU 寄存器)。在用户空间,通常使用进程 这个术语,不过
[color="#000099"]Linux
实现并没有区分这两个概念(进程和线程)。内核通过 SCI 提供了一个应用程序编程接口(API)来创建一个新进程(fork、exec 或
Portable Operating System Interface [POSIX]
函数),停止进程(kill、exit),并在它们之间进行通信和同步(signal 或者 POSIX 机制)。
进程管理还包括处理活动进程之间共享 CPU 的需求。内核实现了一种新型的调度算法,不管有多少个线程在竞争
CPU,这种算法都可以在固定时间内进行操作。这种算法就称为 O(1)
调度程序,这个名字就表示它调度多个线程所使用的时间和调度一个线程所使用的时间是相同的。 O(1)
调度程序也可以支持多处理器(称为对称多处理器或 SMP)。您可以在 ./linux/kernel 中找到进程管理的源代码,在
./linux/arch 中可以找到依赖于体系结构的源代码。在
[color="#996699"]参考资料
一节中可以了解有关这个算法的更多内容。
内存管理
内核所管理的另外一个重要资源是内存。为了提高效率,如果由硬件管理虚拟内存,内存是按照所谓的内存页 方式进行管理的(对于大部分体系结构来说都是 4KB)。
[color="#000099"]Linux
包括了管理可用内存的方式,以及物理和虚拟映射所使用的硬件机制。
不过内存管理要管理的可不止 4KB 缓冲区。
[color="#000099"]Linux
提供了对 4KB 缓冲区的抽象,例如 slab 分配器。这种内存管理模式使用 4KB 缓冲区为基数,然后从中分配结构,并跟踪内存页使用情况,比如哪些内存页是满的,哪些页面没有完全使用,哪些页面为空。这样就允许该模式根据系统需要来动态调整内存使用。
为了支持多个用户使用内存,有时会出现可用内存被消耗光的情况。由于这个原因,页面可以移出内存并放入磁盘中。这个过程称为交换,因为页面会被从内存交换到
硬盘
上。内存管理的源代码可以在 ./linux/mm 中找到。
虚拟文件系统
虚拟文件系统(VFS)是
[color="#000099"]Linux
内核中非常有用的一个方面,因为它为文件系统提供了一个通用的接口抽象。VFS 在 SCI 和内核所支持的文件系统之间提供了一个交换层(请参看图 4)。
图 4. VFS 在用户和文件系统之间提供了一个交换层


在 VFS 上面,是对诸如 open、close、read 和 write 之类的函数的一个通用 API 抽象。在 VFS
下面是文件系统抽象,它定义了上层函数的实现方式。它们是给定文件系统(超过 50 个)的插件。文件系统的源代码可以在 ./linux/fs
中找到。
文件系统层之下是缓冲区缓存,它为文件系统层提供了一个通用函数集(与具体文件系统无关)。这个缓存层通过将数据保留一段时间(或者随即预先读取数据以便在需要是就可用)优化了对物理设备的访问。缓冲区缓存之下是设备驱动程序,它实现了特定物理设备的接口。
网络堆栈
网络堆栈在设计上遵循模拟协议本身的分层体系结构。回想一下,Internet Protocol (IP) 是传输协议(通常称为传输控制协议或 TCP)下面的核心网络层协议。TCP 上面是 socket 层,它是通过 SCI 进行调用的。
socket 层是网络子系统的标准 API,它为各种网络协议提供了一个用户接口。从原始帧访问到 IP 协议数据单元(PDU),再到
TCP 和 User Datagram Protocol (UDP),socket
层提供了一种标准化的方法来管理连接,并在各个终点之间移动数据。内核中网络源代码可以在 ./linux/net 中找到。
设备驱动程序
[color="#000099"]Linux
内核中有大量代码都在设备驱动程序中,它们能够运转特定的硬件设备。
[color="#000099"]Linux
源码树提供了一个驱动程序子目录,这个目录又进一步划分为各种支持设备,例如 Bluetooth、I2C、serial 等。设备驱动程序的代码可以在 ./linux/drivers 中找到。
依赖体系结构的代码
尽管
[color="#000099"]Linux
很大程度上独立于所运行的体系结构,但是有些元素则必须考虑体系结构才能正常操作并实现更高效率。./linux/arch
子目录定义了内核源代码中依赖于体系结构的部分,其中包含了各种特定于体系结构的子目录(共同组成了 BSP)。对于一个典型的桌面系统来说,使用的是
i386
目录。每个体系结构子目录都包含了很多其他子目录,每个子目录都关注内核中的一个特定方面,例如引导、内核、内存管理等。这些依赖体系结构的代码可以在
./linux/arch 中找到
               
               
               

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u1/45394/showart_652645.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP