• Linux文件IO操作函数概述


    文件概述

    Linux中,一切皆文件。文件为操作系统服务和设备提供了一个简单而一致的接口。这意味着程序完全可以像使用文件那样使用磁盘文件、串行口、打印机和其他设备。

    也就是说,大多数情况下,你只需要使用5个函数: open、close、read、write和ioctl。 例外的情况: 目录的读写,网络连接等特殊文件

     

    目录

    文件通常由两部分组成: 内容 + 属性,即管理信息,包括文件的创建修改日期和访问权限等。属性均保存在 inode 节点中。inode - "索引节点",储存文件的元信息,比如

    文件的创建者、文件的创建日期、文件的长度和文件在磁盘上存放的位置等等。每个inode都有一个号码,操作系统用inode号码来识别不同的文件。ls -i  查看inode 号。

     目录是用于保存其他文件的节点号和名字的文件,每个数据项为指向文件节点的链接。如下图:

    当文件链接数变为零,意味文件删除,磁盘空间变成可用空间。

     

    文件和设备

    三个重要的设备文件:

    /dev/console - 系统控制台。  

    /dev/tty - 访问不同的物理设备。   

    /dev/null - 空设备,向所有写这个设备的输出都将被丢弃。

     

    设备驱动程序:

    操作系统的核心部分,即内核,是由一组设备驱动程序组成。他们是一组对系统硬件进行控制的底层接口,为了向用户提供一个一致的接口,其封装了所有与硬件相关的特性。

    硬件特有功能可通过ioctl(用于I/O控制)系统调用来提供。

     /dev 目录下的设备文件都可以被打开、读、写和关闭。

    1)open : 打开文件或设备。

    2)read : 从打开的文件或设备里读数据。

    3)write: 向文件或设备写数据。

    4)close: 关闭文件或设备。

    5) ioctl:  把控制信息传递给设备驱动程序,每个驱动都由自己的一组 ioctl 命令。

     

     

    库函数

    针对输入输出操作直接使用底层系统调用效率非常低,原因由如下两点。

    1)使用系统调用会影响系统性能。  

    2)硬件会对底层系统调用一次所读写的数据块大小做限制。磁盘:至少一个扇区512

    字节,磁带,一次 10K

     库函数给设备和磁盘文件提供了更高层的接口,即标准函数库。使用它你可以高效读写任意长度的数据块,库函数则在数据满足条件后再安排系统调用。这样极大降低了开销。

     注:库函数的文档一般放在手册的第三页,每个库函数有其对应的头文件。

     

    底层文件访问

    运行中的程序称为进程,每个进程都有与之关联的文件描述符。

     

    文件描述符 - 一些小值整数,通过他们访问打开的文件或设备。开始运行会有三个文件描述符:

    1)0:   标准输入   STDIN_FILENO

    2)1:   标准输出   STDOUT_FILENO

    3)2:   标准错误   STDERR_FILENO

     

    文件描述符的变化范围是:0~OPEN_MAX-1 (可通过ulmit -a 查看)

     

    write系统调用

    作用:把缓冲区buf 的前count 个字节写入与文件描述符 fd 相关联的文件中。

    #include <unistd.h>
    size_t write(int fd,const void *buf, size_t count);

    描述符出错,文件达到进程限制最大值或设备驱动程序对数据块 长度比较敏感,该返回值可能会小于count,这并不是一个错误。 0 表示未写入数据; -1 表示出错,错误代号在全局变量 errno里。

    #include <stdio.h>
    #include <unistd.h>
    #include <stdlib.h>
    #include <string.h>
    
    int main()
    {
          const char * output = "Hello World
    ";
          const char * errstr = "A Write error has occurred on file descriptior !
    ";
          if(write(1,output,strlen(output))!=strlen(output));
                 write(2,errstr,strlen(errstr));
          exit(0);    
    }     

     

    read系统调用

    作用:作用:从与文件描述符 fd 相关联的文件中读取前count 个字节到缓冲区buf 中。

    #include <unistd.h>
    size_t write(int fd,const void *buf, size_t count);

    它返回实际读入的字节数,这可能会小于请求的字节数。 0 表示未读入任何数据,已到达了文件尾部。 -1 表示出错,错误代号在全局变量 errno里。

    #include <unistd.h>
    #include <stdlib.h>
    
    int main()
    {
         char buffer[128];
         int nread = read(0,buffer,128);
         if(nread == -1)
              write(2,"A read error has occurred
    ",26);
          if(write(1,buffer,nread)!= nread)
              write(2,"A write error has occurred
    ",27);
         
    }

     

     

    open系统调用

    作用:创建一个新的文件描述符(文件或设备)。

    #include <sys/types.h>
    #include <sys/stat.h>
    #include <fcntl.h>
    
    int open(const char *pathname, int flags);
    int open(const char *pathname, int flags, mode_t mode);

    open 建立一条到文件或设备的访问路径。成功后可获得供 read、write和其他系统调用使用的唯一的文件描述符。此文件描述符进程唯一;如果两个程序打开同一个文件,那么,他们分别得到不同的文件描述符,并可以单独对文件进行独立的操作。我们可以通过文件锁(O_EXCL或FCNTL)功能来解决这个问题。

    参数说明:

    pathname - 指示准备打开的文件或设备的名字;

    flags    - 用于指定打开文件所采取的动作;

    mode    - 用于指定创建文件的权限,O_CREATE 才使用。

    flags 参数通过必需文件访问模式 与 其他可选模式相结合的方式来指定。 首先必须指定如下文件访问模式之一:

    模     式

    说    明

    O_RDONLY

    以只读方式打开

    O_WRONLY

    以只写方式打开

    O_RDWR

    以读写方式打开

    可选模式组合:

    1) O_APPEND: 把写入数据最佳在文件的末尾。

    2) O_TRUNC:  打开文件时把文件长度设置为零,丢弃已有的内容。

    3) O_CREAT:   如果需要,就按参数mode 中给出的访问模式创建文件。

    4) O_EXCL:   与O_CREAT一起使用,确保创建文件的 原子操作。如果文件存在,创建 将失败

     

    访问权限的初始:

    单个权限设置     : S_I  R或W或X    USR或GRP或OTH

    读写执行全权限 : S_I RWX             U或G或O

    如: S_IRUSR    读权限  文件属性

       S_IRWXO   读写执行  其他用户 

    最终权限生成还和进程设置的umask权限掩码有关,执行umask命令或者函数 可以改变权限。   

    新文件描述符总使用未用文件描述符的最小值。如果一个文件符被关闭再次调用open ,其马上会被重用。

     !Posix 规定了一个 creat 调用:  等同于  O_CREAT|O_WRONLY|O_TRUNC 

     

    close系统调用

    作用:终止文件描述符fd 和对应文件(文件或设备)的关联。文件描述符被释放并能够重新使用。close 调用成功返回0,出错返回 -1。

    #include <unistd.h>
    int close(int fd);

    返回值: 检查 close 调用的返回值很重要。可以检测某些写操作错误!

     

    ioctl系统调用

    ioctl提供了一个用于控制设备及其描述行为和配置底层的服务的接口。终端文件描述符、套接字都可以定义他们的ioctl,具体需要参考特定设备的手册。

    #include <sys/ioctl.h>
    
    int ioctl(int d, int request, ...);

     

    dup和dup2的系统调用

    作用:提供了一种复制文件描述符的方法,是我们通过两个或者更多不同的描述符来访问同一个文件,主要用于多个进程间进行管道通信。

    #include <unistd.h>
    
           int dup(int oldfd);
           int dup2(int oldfd, int newfd);

    lseek系统调用

    作用:

    作用:lseek 对文件描述符 fd 的读写指针进行设置。也就是说,设置文件的下一个读写位置。可根据绝对位置和相对位置(当前位置或文件尾部)进行设置。

    #include <sys/types.h>
    #include <unistd.h>
    
    off_t lseek(int fd, off_t offset, int whence);

    offset 参数用来指定位置,而whence 参数定义该偏移值的用法。Whence 可取值如下:

     

    1)SEEK_SET:     offset 是一个绝对位置。

    2)SEEK_CUR:    offset 是相对于当前位置的一个相对位置。

    3)SEEK_END:    offset 是相对于文件尾的一个相对位置。

     lseek 返回从文件头到文件指针被设置处的字节偏移值,失败时返回-1.

    fstat、stat和lstat系统调用

    作用:获取文件的状态信息,该信息将会写入一个buf中,buf的地址会以参数的形式传递给fstat

    #include <sys/types.h>
           #include <sys/stat.h>
           #include <unistd.h>
    
           int stat(const char *path, struct stat *buf);
           int fstat(int fd, struct stat *buf);
           int lstat(const char *path, struct stat *buf);

    stat 和 lstat 均通过文件名查询状态信息,当文件名是符号链接时,lstat返回的时符号链接本身的信息,而stat 返回的时改链接指向的文件的信息。

    struct stat {                                             
                   dev_t     st_dev;     /* ID of device containing file */    
                   ino_t     st_ino;     /* inode number */               
                   mode_t    st_mode;    /* protection */                
                   nlink_t   st_nlink;   /* number of hard links */           
                   uid_t     st_uid;     /* user ID of owner */             
                   gid_t     st_gid;     /* group ID of owner */            
                   dev_t     st_rdev;    /* device ID (if special file) */    
                   off_t     st_size;    /* total size, in bytes */           
                   blksize_t st_blksize; /* blocksize for filesystem I/O */      
                   blkcnt_t  st_blocks;  /* number of 512B blocks allocated */
                   time_t    st_atime;   /* time of last access */           
                   time_t    st_mtime;   /* time of last modification */     
                   time_t    st_ctime;   /* time of last status change */     
               }; 

    这里要特别提到的是,以上 st_mode 标志有一系列相关的宏,定义见 sys/stat.h 中

    ,可用来测试文件类型,如:

    错误处理

    许多系统调用和函数都会因为各种各样的原因失败。他们失败时设置外部变量errno 来知名失败原因。许多不同函数库都把这个变量用做报告错误的标准方法。

    注意: 程序必须在函数报告出错 之后立刻检查errno 变量,因为它可能马上就被下一个函数调用所覆盖,即使下一个函数没有出错,也可能会覆盖这个变量。

    常用错误代码的取值和含义如下:

    l   EPERM:     操作不允许

    l   ENOENT:   文件或目录不存在。

    l   EINTR:     系统调用被中断。

    l   EAGAIN:    重试,下次有可能成功!

    l   EBADF:     文件描述符失效或本身无效

    l   EIO:        I/O错误。

    l   EBUSY:     设备或资源忙。

    l   EEXIST:     文件存在。

    l   EINVL:      无效参数。

    l   EMFILE:     打开的文件过多。

    l   ENODEV:    设备不存在。

    l   EISDIR:      是一个目录。

    l  ENOTDIR:     不是一个目录。

     

    两个有效函数可报告出现的错误: strerror  和 perror。

     

    strerror 函数

      作用:把错误代号映射成一个字符串,该字符串对发生的错误类型进行说明。

     

    #include <string.h>                                                     
       char *strerror(int errnum);                                                
       int strerror_r(int errnum, char *buf, size_t buflen);

    perror函数

      作用:perror 函数也把errno 变量中报告的当前错误映射成一个字符串,并把它输出到标准错误输出流。

     

    perror(“test”);                                                            

    结果:

    Test: Too many open files     

             

  • 相关阅读:
    mysql-sql中变量的使用
    group by 几种不同情况下的聚合运算
    idea中git撤回commit内容
    mysql按照指定的顺序排序(order by case when)
    根据字段的不同值进行升序和降序排序
    索引
    idea 新建git分支并提交
    idea 编辑区浏览器图标
    idea 首字母小写的时候没有相关提示
    Excel—分组然后取每组中对应时间列值最大的或者最小的
  • 原文地址:https://www.cnblogs.com/wangkeqin/p/9226825.html
Copyright © 2020-2023  润新知