• 硬链接及软连接引出的inode


    inode定义

    inode是linux系统中用作数据索引的标识符。简单来说,inode指示了一个文件的基本信息,如inode编号、修改时间、文件的位置等。

    如同一本书的目录,会直接告诉你想看的章节是在第几页。不同的是,书是以页为单位的,而Linux文件存取是以“块”为单位的。

    找寻文件

    操作系统在读取硬盘的时候,会一次性读取一个“块”(一个“块”的大小往往是4KB,包含了连续8个扇区,每个扇区存储512个字节)。而inode就告诉了文件位于哪个“块”,于是系统就会从这个“块”开始读取内容,我们就可以看到文件的内容。

    每个文件都有对应的inode,存储着这个文件的基本信息。Linux系统不使用文件名,而使用inode号来识别文件。对于使用者,我们是通过文件名寻找、打开文件;对于系统,是通过以下三步找到的:

    1. 系统找到这个文件名对应的inode号
    2. 通过inode号,获取inode信息
    3. 根据inode信息,找到文件数据所在的block,读取内容

    inode内容

    inode 包含了文件的以下基本信息:

    • 文件的字节数
    • node 编号
    • 文件拥有者的 Uid
    • 文件所属group的 Gid
    • 文件的读、写、执行权限
    • 文件的时间戳,共有三个:
      • change:inode 上一次变动的时间
      • modify:文件内容上一次变动的时间
      • access:文件上一次打开的时间
    • 链接数,即有多少文件名指向这个inode
    • 文件数据 block 的位置

    我们可以使用 stat 命令查看文件的inode信息,如:

    $ stat v0.1.0.zip 
      File: ‘v0.1.0.zip’
      Size: 94267       Blocks: 192        IO Block: 4096   regular file
    Device: 811h/2065d  Inode: 5659765     Links: 1
    Access: (0640/-rw-r-----)  Uid: ( 3457/mart_bda)   Gid: ( 3457/mart_bda)
    Access: 2018-06-12 14:22:18.434027485 +0800
    Modify: 2018-06-12 14:18:00.840994081 +0800
    Change: 2018-06-12 14:18:00.840994081 +0800
     Birth: -
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    也可以在 ls 后加上 -i 直接获取inode编号:

    $ ls -i v0.1.0.zip 
    5659765 v0.1.0.zip
    
    • 1
    • 2

    inode大小

    inode存储了文件的基本信息,虽然信息很少,但是也会占用空间。
    硬盘格式化的时候,操作系统自动将硬盘分为两个区域:

    • 数据区:存放文件内容
    • inode 区:存放 inode 包含的信息,也叫作 inode table

    每个 inode 节点的大小,一般是 128 字节或 256 字节。inode节点的总数,在硬盘格式化时就固定了。一般,数据区每1KB或2KB,inode区就会增加一个 inode。

    假如在一块 1GB 的硬盘中,每个 inode 节点的大小为 128 字节,那么 inode 表的大小就会达到 128 MB,占整块硬盘的 12.8%。既然 inode 节点总数是有限的,那么分区的节点数就有用完的时候,一旦 inode 用完,即使磁盘空间还有剩余,也不能再存放任何数据,因为需要保证每个文件必须有一个 inode。

    查看每个硬盘分区的 inode 或者磁盘容量的使用情况,可以使用 df 命令加上参数 -i 或者 -h,如:

    文件-h, --human-readable 使用人类可读的格式(预设值是不加这个选项的...)

    文件-H, --si 很像 -h, 但是用 1000 为单位而不是用 1024

    文件-i, --inodes 列出 inode 资讯,不列出已使用 block

    $ df -i
    Filesystem        Inodes   IUsed     IFree IUse% Mounted on
    /dev/sda5      275436544  801853 274634691    1% /
    devtmpfs         8192960     524   8192436    1% /dev
    tmpfs            8195307       4   8195303    1% /dev/shm
    tmpfs            8195307     765   8194542    1% /run
    tmpfs            8195307      13   8195294    1% /sys/fs/cgroup
    /dev/sda2         204800     342    204458    1% /boot
    /dev/sdb1       11443200 3329257   8113943   30% /data0
    tmpfs            8195307       1   8195306    1% /run/user/0
    tmpfs            8195307       1   8195306    1% /run/user/3457
    $ df -h
    Filesystem      Size  Used Avail Use% Mounted on
    /dev/sda5       263G  134G  130G  51% /
    devtmpfs         32G     0   32G   0% /dev
    tmpfs            32G   12K   32G   1% /dev/shm
    tmpfs            32G  394M   31G   2% /run
    tmpfs            32G     0   32G   0% /sys/fs/cgroup
    /dev/sda2       197M  139M   58M  71% /boot
    /dev/sdb1        11T  5.2T  5.2T  51% /data0
    tmpfs           6.3G     0  6.3G   0% /run/user/0
    tmpfs           6.3G     0  6.3G   0% /run/user/3457
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22

    关于 df -h -i 的区别,可以参考 Linux df命令

    文件操作对 inode 的影响

    要理解文件的操作对 inode 的影响,先要理解目录的原理。目录对外表现是一个容器,存放着子文件和子目录,实际上在系统内部,目录本身也是一个文件,目录文件的内容即是该目录下的文件名与 inode 号的映射表(即一个个的目录项)。

    因此,linux访问一个文件时,要先查询到上一级目录,根据目录内容查找到文件对应的 inode号,然后读取对应的 block。

    cp 命令

    系统内部会执行以下操作:

    1. 分配一个未被使用的 inode 号,在 inode 表中新添一个项目。如果是覆盖复制,则 inode号不变,沿用之前同名文件的 inode 号。

    2. 在目录中新建一个目录项,并指向步骤 1 中的 inode。

    3. 把数据复制到 block 中。

    rm 命令

    系统内部会执行以下操作:

    1. 减少待删除文件名所对应的 inode 的链接数量,如果链接数变为0,则释放 inode,同时数据块放到可用空间中(对外表现为数据已删除,因为随时可以覆盖。如果没有覆盖,数据还可以恢复;一旦覆盖了,那么删除的数据无法恢复。)。

    2. 删除目录中的目录项。

    mv 命令

    如果目标文件和源文件属于同一个文件系统:

    1. 在目标文件的目录中新建目录项
    2. 删除源文件的目录中的目录项
    3. 目标文件名会指向源文件名的 inode。因此该操作对 inode 没有影响(除了时间戳),对数据的位置也没有影响,不移动任何数据。

    如果目标文件和源文件属于不同文件系统:

    1. 相当于 cp + rm。

    ln 命令

    硬链接

    一般情况下,文件名和 inode 号是一一对应,但是也有可能多个文件名指向同一个inode号,即硬链接。

    • 硬链接可以实现用不同的文件名访问同一个文件;
    • 对文件内容修改,会影响到所有的文件名;
    • 但是,删除一个文件名,不影响其他文件名的访问。

    3XH3E6.png

    举个栗子

    创建硬链接的命令:

    ln [source file] [new file]
    
    • 1

    如:

    $ ll -h -i
    total 479M
    5659849 -rw-r----- 1 mart_bda mart_bda 479M Jun 13 10:57 test_file
    $ ln test_file test_file_hardlink
    $ ll -i -h
    total 957M
    5659849 -rw-r----- 2 mart_bda mart_bda 479M Jun 13 10:57 test_file
    5659849 -rw-r----- 2 mart_bda mart_bda 479M Jun 13 10:57 test_file_hardlink
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    这样,两个文件的 inode 号均为 5659849。

    具体查看两个文件的 inode 内容:

    $ stat test_file
      File: ‘test_file’
      Size: 501577774   Blocks: 979656     IO Block: 4096   regular file
    Device: 811h/2065d  Inode: 5659849     Links: 2
    Access: (0640/-rw-r-----)  Uid: ( 3457/mart_bda)   Gid: ( 3457/mart_bda)
    Access: 2018-06-13 10:57:13.961409755 +0800
    Modify: 2018-06-13 10:57:14.931383436 +0800
    Change: 2018-06-13 10:58:11.382851699 +0800
     Birth: -
    $ stat test_file_hardlink 
      File: ‘test_file_hardlink’
      Size: 501577774   Blocks: 979656     IO Block: 4096   regular file
    Device: 811h/2065d  Inode: 5659849     Links: 2
    Access: (0640/-rw-r-----)  Uid: ( 3457/mart_bda)   Gid: ( 3457/mart_bda)
    Access: 2018-06-13 10:57:13.961409755 +0800
    Modify: 2018-06-13 10:57:14.931383436 +0800
    Change: 2018-06-13 10:58:11.382851699 +0800
     Birth: -
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    可以看到,两个文件的 inode 内容完全相同,且 Links 变成了 2修改任何一个文件名的内容,另一个文件名的内容也会同时改变,因为访问的就是硬盘中的同一块数据。

    如果再将 test_file_hardlink 删掉,会使得 Links 变回 1。当这个值减到 0 时,说明没有文件名指向这个 inode,系统就会回收这个号码,以及所对应的 block 区域。

    另外,对于目录的链接数,创建一个目录时,默认会生成两个目录项:. 和 .. 前者的 inode 号就是当前目录的 inode 号,等同于当前目录的硬链接;后者的 inode 号是父目录的 inode 号,等同于父目录的硬链接

    因此,任何一个目录的硬链接总数,总是等于 2 加上它的子目录总数(含隐藏目录,且除去. 和 ..)。

    软链接

    软链接也可以通过不同的文件名访问同一块数据,但是与硬链接不同的是,两个文件名的 inode 是不一样的

    那如何访问同一块区域呢?

    比如文件 A 是文件 B 的软连接,那么文件 A 的内容存放的是文件 B 的路径名(可以通过这个找到文件 B 的目录项)。因此访问 A 时,会读取文件 B 的路径,进而读取文件 B 的内容。这样,对外表现来看,文件 A 和文件 B 的内容就相同了。类似于 windows 系统下的快捷方式

    3XHG4O.png

    举个栗子

    建立软链接的命令:

    ln -s [source file] [new file]
    
    • 1

    如:

    $ ll
    total 489824
    -rw-r----- 1 mart_bda mart_bda 501577774 Jun 13 11:21 test_file
    $ ln -s test_file test_file_soft
    $ ll -h -i
    total 479M
    5659853 -rw-r----- 1 mart_bda mart_bda 479M Jun 13 11:21 test_file
    5659854 lrwxrwxrwx 1 mart_bda mart_bda    9 Jun 13 11:22 test_file_soft -> test_file
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    如果是对文件夹简历软链接,则为:

    ln -s /tmp/test_directory ./
    
    • 1

    会自动地在当前目录建立一个文件夹 test_directory ,并指向 /tmp/test_directory

    • 两个文件的 inode 号是不同的。
    • 既然文件 A 是依赖文件 B 存在的,那么如果删除了文件 B,打开文件 A 就会报错:No such file or directory;
    • 如果删除了文件 A,则对文件 B 的打开无影响,因为只是删除了“快捷方式”而已。
    • 软连接的建立,不会影响到文件 B 的 inode 的任何信息,包括 Links。

    硬链接和软链接的不同

    1. 本质不同:硬链接是指向同一个文件,软链接指向的不是同一个文件。
    2. 删除时:硬链接不受影响,软链接失效
    3. 创建链接时:创建硬链接链接数加1,创建软链接连接数不变
    4. 是否可以跨分区:硬链接不可以跨分区,软链接可以跨分区
    5. 目录是否可以创建链接:硬链接不可以对目录创建,软链接可以对目录创建
    6. 硬链接的inode号相同,软链接inode号不同

    硬链接和软链接的占用空间分析

    硬链接不占用磁盘空间,软链接占用的空间只是存储路径所占用的极小空间。

    ll –h 或者 ls –h这命令进行统计文件总大小的时候并不是从磁盘进行统计的,而是根据文件属性中的大小叠加得来的。而硬链接的文件属性中的大小就是就是inode号对应的数据块的大小,所以total中进行统计就把各个文件属性中的大小加起来作为总和,这种统计是不标准,也不具有代表性的,

    真正的查看某个文件夹占用磁盘空间大小命令是:du –h 这个命令是从磁盘上进行统计,不会被文件的属性中大小影响,所以更准确

  • 相关阅读:
    【计算机毕业设计】22.毕业设计选题系统ssm源码
    “华远新能源”:光伏产业链发展持续向好
    Zerotier免费的虚拟局域网
    LeetCode-车队
    Java配置42-配置redis高可用(sentinel监控)
    记录git的一些操作命令
    给电热水器瘦个身,让它好看更好用,云米电热水器Air2 Mini体验
    让测试人头疼的这几件“小事”
    JVM调优必备理论知识-GC Collector-三色标记
    @DateTimeFormat和@JsonFormat
  • 原文地址:https://blog.csdn.net/guodong54/article/details/127868797