免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1181 | 回复: 0

[实践] 最近看vfs部分,写了个笔记, 大家看看.(更新了mount 文件系 统部分) [复制链接]

论坛徽章:
168
申猴
日期:2013-10-09 10:10:16天秤座
日期:2013-10-10 15:28:08天蝎座
日期:2014-07-17 14:02:54丑牛
日期:2014-07-17 14:03:04处女座
日期:2014-07-17 14:03:12双子座
日期:2014-07-17 14:03:21天秤座
日期:2014-07-17 14:03:29酉鸡
日期:2014-07-17 14:03:39金牛座
日期:2014-07-21 10:37:54水瓶座
日期:2014-07-22 16:56:09巳蛇
日期:2014-07-23 11:48:03天蝎座
日期:2014-07-31 10:16:36
发表于 2019-07-26 16:45 |显示全部楼层


最近看vfs部分,写了个笔记, 大家看看.(更新了mount 文件系 统部分)  原作者:xpl

mount 文件系统

主要数据结构:

struct namespace {
        atomic_t                count;                /* 引用技术 */
        struct vfsmount *        root;        /* 根目录的 vfsmount */
        struct list_head        list;        /* 所有已经mount的 文件系统的 list */
        struct rw_semaphore        sem;        /* 读写信号量 */
};



struct vfsmount
{
        struct list_head mnt_hash;                /* 用于散列表的list */
        struct vfsmount *mnt_parent;        /* 指向父文件系统的 vfsmount */
        struct dentry *mnt_mountpoint;        /* mountpoint 的 dentry */
        struct dentry *mnt_root;                /* mount的文件系统的根目录的 dentry */
        struct super_block *mnt_sb;                /* 指向该文件系统的 superblock */
        struct list_head mnt_mounts;        /* 所有mount到该文件系统的 vfsmount 的 list */
        struct list_head mnt_child;                /* 子文件系统的 list  */
        atomic_t mnt_count;                                /* 引用计数 */
        int mnt_flags;                                        /* mount 的 flag */
        int mnt_expiry_mark;                        /* 到期标志 */
        char *mnt_devname;                                /* mount设备的名称 比如: /dev/dsk/hda1 */
        struct list_head mnt_list;                /* 在namespace上的vfsmount的 list */
        struct list_head mnt_fslink;        
        struct namespace *mnt_namespace; /* 指向mount文件系统的进程的 namespace */
};

struct nameidata {
        struct dentry        *dentry;                /* 目录的dentry */
        struct vfsmount *mnt;                        /* 目录所在的文件系统的 vfsmount */
        struct qstr        last;                                /* 在LOOKUP_PARENT 标志被设置时使用,存储路径中最后一个分量 */
        unsigned int        flags;                        /* 查找的 flags */
        int                last_type;                                /* 在LOOKUP_PARENT 标志被设置时使用,存储路径名的最后一个分量的类型,值见下面的enum */
        unsigned        depth;                                /* 符号链接的嵌套深度 */
        char *saved_names[MAX_NESTED_LINKS + 1];        /* 存储嵌套的符号链接所关联的路径名数组, 通过depth作为下标来索引 */

        /* Intent data */
        union {
                struct open_intent open;
        } intent;
};

/*
* Type of the last component on LOOKUP_PARENT
*/
enum {LAST_NORM, LAST_ROOT, LAST_DOT, LAST_DOTDOT, LAST_BIND};        /* nameidata 的 last_type 的值 */

/*
* The bitmask for a lookup event:
*  - follow links at the end
*  - require a directory
*  - ending slashes ok even for nonexistent files
*  - internal "there are more path compnents" flag
*  - locked when lookup done with dcache_lock held
*  - dentry cache is untrusted; force a real lookup
*/
#define LOOKUP_FOLLOW                 1
#define LOOKUP_DIRECTORY         2
#define LOOKUP_CONTINUE                 4
#define LOOKUP_PARENT                16
#define LOOKUP_NOALT                32
#define LOOKUP_REVAL                64
/*
* Intent data
*/
#define LOOKUP_OPEN                (0x0100)
#define LOOKUP_CREATE                (0x0200)
#define LOOKUP_ACCESS                (0x0400)



/*
* "quick string" -- eases parameter passing, but more importantly
* saves "metadata" about the string (ie length and the hash).
*
* hash comes first so it snuggles against d_parent in the
* dentry.
*/
struct qstr {
        unsigned int hash;                        /* hash值 */
        unsigned int len;                        /* 路径中分量名称的长度 */
        const unsigned char *name;        /* 路径中分量名称的字符串地址 */
};


--------------------------------------------------------------------------

需要补习的内容:

对于一个文件(在Linux下所有都是文件,包括目录等等) ,如何判断该文件 是不是目录,或者是不是符号链接, 是通过inode :

如果是目录,则一定有 inode->i_op->lookup 方法, 即 inode->i_op->lookup 一定不是NULL

如果是符号链接, 则一定有 inode->i_op->follow_link 方法,即 inode->i_op->follow_link 一定不是NULL




--------------------------------------------------------------------------

对于每一个 mount 的文件系统,都由一个 vfsmount 实例来表示。

对于每一个进程,都有自己的 namespace , 这可以理解为这个进程的地盘。
在这里,所有的文件系统都要挂上来统一管理, 如下所示: 1.gif
  图(1)


同时,对于所有的vfsmount,都存在于 一个hash table中,他们通过一个 hash 数组组织在一起:
2.gif

对于mount的文件系统,会有在一个文件系统上 mount 另外一个文件系统的情况,这种情况,可以称原文件系统为 父vfsmount, 对于mount上的文件系统,称之位子文件系统。
他们的关系如下:
3.gif
  图(3)

                                                               

下面我以一个例子来说明:
例如我们要mount一个设备 /dev/hdb1 到 /home/xpl 目录下
我们假设 /home/xpl 就是当前进程的根文件系统中的目录(即 home 和 xpl 都没有mount任何文件系统),

我们mount的时候,传入的参数有三个: 要mount的设备( /dev/hdb1 ) , 设备的文件系统 ( ext2 之类的), mount到什么目录 ( /home/xpl )

首先,我们要根据要mount的目录的路径名( 我们传入的只是路径名称的字符串),来找到mount的目录 disk 的dentry (即 mountpoint )
这个查找过程如下所示:
1. 首先确定查找路径的起始目录,要么是根目录,要么是当前目录。
        如果是根目录,则根目录的 dentry 和 vfsmount 的信息在: current->fs->root 和 current->fs->rootmnt
        如果是当前目录,则当前目录的 dentry 和 vfsmount 的信息在:current->fs->pwd 和 current->fs->pwdmnt
2. 然后,从路径的起始目录开始逐级的往下找。
        对于我们的例子,我们首先要查找根目录下的 home 目录( 就是要找到 home 目录的 dentry 和 vfsmount 对象)
        1) 首先在 hashtable 中查找,就是在上面的图(2)中的链表中找。
        2) 如果这个目录没有在 hashtable 中,则需要到磁盘上(我们假设根文件系统是在一个磁盘上,如果不是,就是去根文件系统对应的存储介质中查找)去查找
                        这通过调用 根目录的 inode 的 lookup 方法来查找。
                        通过根目录的 dentry->d_inode 得到根目录的inode,然后调用 inode->i_ops->lookup 方法,将要查找目录的名称作为参数传递进去。

3. 找到了第一个目录,下面的过程就是简单的递归了,最后,找到 目录 xpl 的 dentry 和 vfsmount

找到了要 mount 的目录,下面就开始实际的mount过程
mount的过程就是把设备的文件系统加入到 vfs 框架中
1. 首先,要mount一个新的设备,需要创建一个新的 super block。
        这通过要mount的文件系统的 file_system_type, 调用其 get_sb 方法来创建一个新的 super block

2. 对于任何一个 mount 的文件系统,都要有一个 vfsmount, 创建这个vfsmount, 并设置好其属性(就是 vfsmount 中的各个成员)

3. 将创建好的 vfsmount 加入到系统中。

整个过程如下所示:
4.gif
从这张图可以看到,三个目录:  "/", "home" 和 "xpl" 的dentry
我们新mount的设备为/dev/hdb1, 新创建了一个super_block 和 一个 vfsmount (new)
新的super_block 在创建的时候已经加入到整个 vfs 的架构中(可参看前面的 super block 一节)
对于新的vfsmount:
        其mountpoint为 目录 "xpl" 的dentry,
        其mnt_root 是设备hdb1上的根目录的 dentry
        其父 vfsmount 就是原文件系统中的那个 vfsmount
        
同时,我们将新的这个vfsmount加入到了进程的namespace中。

至此,我们已经完成了整个mount的过程。

另外,对于Linux,可以将多个文件系统 mount 到同一个目录上,这样的话, 新 mount 的文件系统会覆盖原来mount的文件系统。
比如我们再把一个 "/dve/hdb2" 的设备 mount 到 "/home/xpl"  目录下,
这样,如果我们访问 "/home/xpl" 的时候,就会访问到 "/dev/hdb2"
当新mount的文件系统被 unmount 之后,原来被覆盖的文件系统就会再次显露出来了。

这个过程的之所以是这样的,是因为在路径查找的时候,如果发现要查找的目录上mount了 文件系统(其dentry的d_mounted 不为0),会切换文件系统。
比如我们上面的例子,当路径查找 "/home/xpl" 的时候,当查找到根文件系统的目录 "xpl" 的dentry时,发现有一个文件系统已经mount到这个目录上,就会切换文件系统,进而找到 "/dev/hdb1" 的根目录的 dentry
这样,路径查找"/home/xpl" 返回的时候,返回的是 "/dve/hdb1" 根目录的 dentry

这样,在我们 mount 第二个文件系统 "/dev/hdb2" 的时候,其mountpoint 就是 "/dev/hdb1" 的根目录的 dentry。
这个过程如下图所示:

5.gif
以此类推,如果在该目录上再mount一个新的文件系统,基本逻辑是相同的。
因此在路径查找过程中,每查找到一个新的目录,都要对该目录的d_mounted 进行判断,看是否在该目录上mount的了文件系统,如果是,则要切换文件系统(切换查找过程中的 dentry 和 vfsmount)
这个过程是要递归的,即如果一个路径上mount了多个文件系统(如上面的例子),要递归到最后一个mount的文件系统(其dentry 的 d_mounted 为0)为止。



对于路径查找,我们补充说明一下两种特殊的情况:

一、路径中的 "." 和 ".."
        对于 "." ,很明显,就是当前目录,不需要额外的处理,简单跳过即可
         例如: /home/./xpl 当查找到 "." 的时候,还是 home 目录,因而 "." 的 dentry 和vfsmount 还是 目录 home的 dentry 和 vfsmount
        对于 "..", 这个需要跳到上一级目录,在这里,要注意:
        1. 如果发现已经没法向上了,就不再向上,而保持当前的路径。比如:"/../" ,已经是根目录了,返回的结果仍然是根目录。
        2. 如果发现当前的 dentry 是当前文件系统的根目录,并且该文件系统是mount到其他文件系统上的,这个时候就要反溯文件系统,要切换到原来mount的文件系统后,再向上一级目录。这个反溯过程也是要递归的。
                比如我们上面的例子中:"/home/xpl" 先mount了一个 hdb1 的文件系统,然后又mount 了一个 hdb2 的文件系统。
                在执行".." 查找的时候:
                        1)我们发现当前的目录是hdb2 的根目录(vfsmount->mnt_root),并且mount到了hdb1上(vfsmount != vfsmount->parent),这个时候我们就要先切换到 hdb1 的文件系统中, 此时vfsmount 换为hdb1 的vfsmount, dentry换成 hdb2的mountpoint。
                        2) 接下来要递归上面的文件系统切换,我们发现 当前的dentry 是hdb1文件系统的根目录,并且mount到了别的文件系统上,这个时候就要继续切换。
                        3) 当所有的递归完成以后,我们得到了根文件系统的 xpl目录的dentry,然后再执行向上的操作(".."),最后得到 "/home"

        
二、路径中的符号链接
        如果路径中有符号链接,我们要跟随符号链接的路径。其实这个过程只是一个简单的递归。
        在路径查找中,我们得到一个dentry后,要判断这个dentry是否是一个符号链接。通过判断 dentry->d_inode->i_op->follow_link 是否是NULL,即是否有follow_link方法来判断是不是符号链接。
        如果是符号链接的话,我们需要通过这个inode的follow_link 来获得链接的路径。
        例如有这么一个符号链接: /home/xpl/link -> /mnt/disk
        我们会获得到其链接的路径  "/mnt/disk", 接下来就是继续解析链接的路径名,即查找 "/mnt/disk", 这个查找过程和普通的查找是一样的,递归下去,最终找到需要的目标。

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2019中国系统架构师大会

【数字转型 架构演进】SACC2019中国系统架构师大会,8.5折限时优惠重磅来袭!
2019年10月31日~11月2日第11届中国系统架构师大会(SACC2019)将在北京隆重召开。四大主线并行的演讲模式,1个主会场、20个技术专场、超千人参与的会议规模,100+来自互联网、金融、制造业、电商等领域的嘉宾阵容,将为广大参会者提供一场最具价值的技术交流盛会。

限时8.5折扣期:2019年9月30日前


----------------------------------------

大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP