Linux文件IO操作函数概述

Linux文件IO操作函数概述
文件概述

Linux中，一切皆文件。文件为操作系统服务和设备提供了一个简单而一致的接口。这意味着程序完全可以像使用文件那样使用磁盘文件、串行口、打印机和其他设备。

也就是说，大多数情况下，你只需要使用5个函数： open、close、read、write和ioctl。例外的情况：目录的读写，网络连接等特殊文件

目录

文件通常由两部分组成：内容 + 属性,即管理信息，包括文件的创建修改日期和访问权限等。属性均保存在 inode 节点中。inode - "索引节点",储存文件的元信息，比如

文件的创建者、文件的创建日期、文件的长度和文件在磁盘上存放的位置等等。每个inode都有一个号码，操作系统用inode号码来识别不同的文件。ls -i 查看inode 号。

目录是用于保存其他文件的节点号和名字的文件，每个数据项为指向文件节点的链接。如下图：

当文件链接数变为零，意味文件删除，磁盘空间变成可用空间。

文件和设备

三个重要的设备文件：

/dev/console - 系统控制台。

/dev/tty - 访问不同的物理设备。

/dev/null - 空设备，向所有写这个设备的输出都将被丢弃。

设备驱动程序：

操作系统的核心部分，即内核，是由一组设备驱动程序组成。他们是一组对系统硬件进行控制的底层接口，为了向用户提供一个一致的接口，其封装了所有与硬件相关的特性。

硬件特有功能可通过ioctl(用于I/O控制)系统调用来提供。

/dev 目录下的设备文件都可以被打开、读、写和关闭。

1）open : 打开文件或设备。

2）read : 从打开的文件或设备里读数据。

3）write: 向文件或设备写数据。

4）close: 关闭文件或设备。

5） ioctl: 把控制信息传递给设备驱动程序,每个驱动都由自己的一组 ioctl 命令。

库函数

针对输入输出操作直接使用底层系统调用效率非常低，原因由如下两点。

1）使用系统调用会影响系统性能。

2）硬件会对底层系统调用一次所读写的数据块大小做限制。磁盘：至少一个扇区512

字节，磁带，一次 10K

库函数给设备和磁盘文件提供了更高层的接口，即标准函数库。使用它你可以高效读写任意长度的数据块,库函数则在数据满足条件后再安排系统调用。这样极大降低了开销。

注：库函数的文档一般放在手册的第三页，每个库函数有其对应的头文件。

底层文件访问

运行中的程序称为进程，每个进程都有与之关联的文件描述符。

文件描述符－一些小值整数，通过他们访问打开的文件或设备。开始运行会有三个文件描述符：

1）0:   标准输入   STDIN_FILENO

2）1:   标准输出   STDOUT_FILENO

3）2:   标准错误   STDERR_FILENO

文件描述符的变化范围是：0~OPEN_MAX-1 (可通过ulmit -a 查看)

write系统调用

作用：把缓冲区buf 的前count 个字节写入与文件描述符 fd 相关联的文件中。
```
#include <unistd.h>
size_t write(int fd,const void *buf, size_t count);
```
描述符出错，文件达到进程限制最大值或设备驱动程序对数据块长度比较敏感，该返回值可能会小于count,这并不是一个错误。 0 表示未写入数据； -1 表示出错，错误代号在全局变量 errno里。
```
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>

int main()
{
      const char * output = "Hello World
";
      const char * errstr = "A Write error has occurred on file descriptior !
";
      if(write(1,output,strlen(output))!=strlen(output));
             write(2,errstr,strlen(errstr));
      exit(0);    
}     
```
read系统调用

作用：作用：从与文件描述符 fd 相关联的文件中读取前count 个字节到缓冲区buf 中。
```
#include <unistd.h>
size_t write(int fd,const void *buf, size_t count);
```
它返回实际读入的字节数，这可能会小于请求的字节数。 0 表示未读入任何数据，已到达了文件尾部。 -1 表示出错，错误代号在全局变量 errno里。
```
#include <unistd.h>
#include <stdlib.h>

int main()
{
     char buffer[128];
     int nread = read(0,buffer,128);
     if(nread == -1)
          write(2,"A read error has occurred
",26);
      if(write(1,buffer,nread)!= nread)
          write(2,"A write error has occurred
",27);
     
}
```
open系统调用

作用：创建一个新的文件描述符（文件或设备）。
```
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);
```
open 建立一条到文件或设备的访问路径。成功后可获得供 read、write和其他系统调用使用的唯一的文件描述符。此文件描述符进程唯一；如果两个程序打开同一个文件，那么，他们分别得到不同的文件描述符，并可以单独对文件进行独立的操作。我们可以通过文件锁(O_EXCL或FCNTL)功能来解决这个问题。

参数说明：

pathname - 指示准备打开的文件或设备的名字;

flags    - 用于指定打开文件所采取的动作;

mode    - 用于指定创建文件的权限，O_CREATE 才使用。

flags 参数通过必需文件访问模式与其他可选模式相结合的方式来指定。首先必须指定如下文件访问模式之一：

模     式

说    明

O_RDONLY

以只读方式打开

O_WRONLY

以只写方式打开

O_RDWR

以读写方式打开

可选模式组合：

1） O_APPEND: 把写入数据最佳在文件的末尾。

2） O_TRUNC: 打开文件时把文件长度设置为零，丢弃已有的内容。

3） O_CREAT:   如果需要，就按参数mode 中给出的访问模式创建文件。

4） O_EXCL:   与O_CREAT一起使用，确保创建文件的原子操作。如果文件存在，创建将失败

访问权限的初始：

单个权限设置： S_I R或W或X USR或GRP或OTH

读写执行全权限： S_I RWX U或G或O

如： S_IRUSR 读权限文件属性

　　 S_IRWXO 读写执行其他用户

最终权限生成还和进程设置的umask权限掩码有关，执行umask命令或者函数可以改变权限。

新文件描述符总使用未用文件描述符的最小值。如果一个文件符被关闭再次调用open ,其马上会被重用。

！Posix 规定了一个 creat 调用：等同于 O_CREAT|O_WRONLY|O_TRUNC

close系统调用

作用：终止文件描述符fd 和对应文件(文件或设备)的关联。文件描述符被释放并能够重新使用。close 调用成功返回0，出错返回 -1。
```
#include <unistd.h>
int close(int fd);
```
返回值：检查 close 调用的返回值很重要。可以检测某些写操作错误!

ioctl系统调用

ioctl提供了一个用于控制设备及其描述行为和配置底层的服务的接口。终端文件描述符、套接字都可以定义他们的ioctl，具体需要参考特定设备的手册。
```
#include <sys/ioctl.h>

int ioctl(int d, int request, ...);
```
dup和dup2的系统调用

作用：提供了一种复制文件描述符的方法，是我们通过两个或者更多不同的描述符来访问同一个文件，主要用于多个进程间进行管道通信。
```
#include <unistd.h>

       int dup(int oldfd);
       int dup2(int oldfd, int newfd);
```
lseek系统调用

作用：

作用：lseek 对文件描述符 fd 的读写指针进行设置。也就是说，设置文件的下一个读写位置。可根据绝对位置和相对位置(当前位置或文件尾部)进行设置。
```
#include <sys/types.h>
#include <unistd.h>

off_t lseek(int fd, off_t offset, int whence);
```
offset 参数用来指定位置，而whence 参数定义该偏移值的用法。Whence 可取值如下：

1）SEEK_SET:     offset 是一个绝对位置。

2）SEEK_CUR:    offset 是相对于当前位置的一个相对位置。

3）SEEK_END:    offset 是相对于文件尾的一个相对位置。

lseek 返回从文件头到文件指针被设置处的字节偏移值，失败时返回-1.

fstat、stat和lstat系统调用

作用：获取文件的状态信息，该信息将会写入一个buf中，buf的地址会以参数的形式传递给fstat
```
#include <sys/types.h>
       #include <sys/stat.h>
       #include <unistd.h>

       int stat(const char *path, struct stat *buf);
       int fstat(int fd, struct stat *buf);
       int lstat(const char *path, struct stat *buf);
```
stat 和 lstat 均通过文件名查询状态信息，当文件名是符号链接时，lstat返回的时符号链接本身的信息，而stat 返回的时改链接指向的文件的信息。
```
struct stat {                                             
               dev_t     st_dev;     /* ID of device containing file */    
               ino_t     st_ino;     /* inode number */               
               mode_t    st_mode;    /* protection */                
               nlink_t   st_nlink;   /* number of hard links */           
               uid_t     st_uid;     /* user ID of owner */             
               gid_t     st_gid;     /* group ID of owner */            
               dev_t     st_rdev;    /* device ID (if special file) */    
               off_t     st_size;    /* total size, in bytes */           
               blksize_t st_blksize; /* blocksize for filesystem I/O */      
               blkcnt_t  st_blocks;  /* number of 512B blocks allocated */
               time_t    st_atime;   /* time of last access */           
               time_t    st_mtime;   /* time of last modification */     
               time_t    st_ctime;   /* time of last status change */     
           }; 
```
这里要特别提到的是,以上 st_mode 标志有一系列相关的宏,定义见 sys/stat.h 中

，可用来测试文件类型，如：

错误处理

许多系统调用和函数都会因为各种各样的原因失败。他们失败时设置外部变量errno 来知名失败原因。许多不同函数库都把这个变量用做报告错误的标准方法。

注意：程序必须在函数报告出错之后立刻检查errno 变量，因为它可能马上就被下一个函数调用所覆盖，即使下一个函数没有出错，也可能会覆盖这个变量。

常用错误代码的取值和含义如下：

l EPERM:     操作不允许

l ENOENT: 文件或目录不存在。

l EINTR:     系统调用被中断。

l EAGAIN:    重试，下次有可能成功！

l EBADF:     文件描述符失效或本身无效

l EIO:        I/O错误。

l EBUSY:     设备或资源忙。

l EEXIST:     文件存在。

l EINVL:      无效参数。

l EMFILE:     打开的文件过多。

l ENODEV:    设备不存在。

l EISDIR:      是一个目录。

l ENOTDIR:     不是一个目录。

两个有效函数可报告出现的错误: strerror 和 perror。

strerror 函数

作用：把错误代号映射成一个字符串，该字符串对发生的错误类型进行说明。
```
#include <string.h>                                                     
   char *strerror(int errnum);                                                
   int strerror_r(int errnum, char *buf, size_t buflen);
```
perror函数

作用：perror 函数也把errno 变量中报告的当前错误映射成一个字符串，并把它输出到标准错误输出流。

perror(“test”);

结果：

Test: Too many open files
相关阅读:
mysql-sql中变量的使用
 group by 几种不同情况下的聚合运算
 idea中git撤回commit内容
 mysql按照指定的顺序排序（order by case when）
根据字段的不同值进行升序和降序排序
 索引
 idea 新建git分支并提交
 idea 编辑区浏览器图标
 idea 首字母小写的时候没有相关提示
 Excel—分组然后取每组中对应时间列值最大的或者最小的
原文地址：https://www.cnblogs.com/wangkeqin/p/9226825.html

模式	说明
O_RDONLY	以只读方式打开
O_WRONLY	以只写方式打开
O_RDWR	以读写方式打开