• Linux 文件操作——系统调用和标准I/O库


    一、什么是文件

    在讲述文件操作之前,我们首先要知道什么是文件。看到这个问题你可能会感觉到可笑,因为对于用过计算机的人来说,文件是最简单不过的概念了,例如一个文本是一个文件,一个work文档是一个文件等。但是在Linux中,文件的概念还远不止于这些,在Linux中,一切(或几乎一切)都是文件。文件包括很多的内容,例如:大家知道的普通文件是文件,目录也是一个文件,设备也是一个文件,管道也是一个文件等等。对于目录、设备这些的操作也可以完全等同于对纯文本文件的操作,这也是Linux非常成功的特性之一吧。

    二、系统调用

    1、文件描述符
    文件描述符是一些小数值,你可以通过它们访问的打开的文件设备,而有多少文件描述符可用取决于系统的配置情况。但是当一个程序开始运行时,它一般会有3个已经打开的文件描述符,就是
    0:标准输入
    1:标准输出
    2:标准错误
    那些数学(即0、1、2)就是文件描述符,因为在Linux上一切都是文件,所以标准输入(stdin),标准输出(stdout)和标准错误(stderr)也可看作文件来对待。

    2、系统调用常用函数

    A、open系统调用

    open函数的原型为:
    int open(const char *path, int oflags);
    int open(const char *path, int oflags, mode_t mode);

    path,是包括路径的完整文件名,oflags是文件访问模式(即是什么方式打开文件,只读、只写还是可读并可写等),mode用于设定文件的访问权限。具体的可选参数,可以自己查看手册页,这里不一一详述。

    open建立了一条到文件或设备的访问路径,如果调用成功,返回一个可以被read、write等其他系统调用的函数使用的文件描述符,而且这个文件描述是唯一的,不与任何其他运行中的进程共享,在失败时返回-1,并设置全局变量errno来指明失明的原因。

    B、write系统调用

    write函数的原型为:
    size_t write(int fildes, const void *buf, size_t nbytes);

    write的作用是把缓冲区buf的前nbytes个字节写入到文件描述符fildes关联的文件中,返回实际写入的字节数。返回0表示没有写入任何数据,返回-1表示调用中出现了错误,错误代码保存在errno中。

    注:fildes一定要是在open调用中返回的创建的文件描述符,或者是0、1、2等标准输入、输出或标准错误。

    C、read系统调用

    read函数的原型为:
    size_t read(int fildes, void *buf, size_t nbytes);

    read系统调用的作用是从与文件描述符相关的文件里读入nbytes个字节的数据,并把它们放到数据区buf中,返回读入的字节数,失败时返回-1。

    D、close系统调用

    close调用的函数原型为:
    int close(int fildes);

    close函数的作用是终于文件描述符fildes一其对应的文件之间的关联。


    E、例子

    说了这么多,我就给出一个完整的例子吧,就是从一个数据文件(里面有1M个‘0’字符)逐个复制到别一个文件。文件名为copy_system.c,代码如下:
     
    #include <unistd.h>
    #include <sys/stat.h>
    #include <fcntl.h>
    #include <stdlib.h>
    
    int main()
    {
    	char c = '';
    	int in = -1, out = -1;
    	
    	//以只读方式打开数据文件
        in = open("Data.txt", O_RDONLY);
        //以只写方式创建文件,如果文件不存在就创建一个新的文件
        //文件属主具有读和写的权限
    	out = open("copy_system.out.txt", O_WRONLY|O_CREAT, S_IRUSR|S_IWUSR);
    	while(read(in, &c, 1) == 1)//读一个字节的数据
    		write(out, &c, 1);//写一个字节的数据
    
        //关闭文件描述符
        close(in);
        close(out);
        return 0;
    }


    三、标准I/O库
    有过C编程经历的人都会知道stdio头文件,它就是C语言的标准IO库,在标准IO库中,与底层文件描述符相对应的是流,它被实现为指向结构FILE的指针。IO库的函数有很多,为了与前面的内容对应,这里还是只讲与前面四个函数相对应的函数,其他的函数,你可以查一查手册页。

    A、fopen库函数

    fopen库函数的原型为:
    FILE* fopen(const char *filename, const char *mode);

    它与底层系统调用open类似,成功时返回一个非空指针。失败时返回NULL。

    B、fread库函数

    fread库函数的原型为:
    size_t fread(void *ptr, size_t size, size_t nitems, FILE *stream);

    它与底层调用read相似,其作用是从stream读取nitems个长度为size的数据到ptr所指向的缓冲区中。返回值是成功读到缓冲区中的记录个数。

    注:stream为用fopen函数返回的文件结构指针。

    C、fwrite库函数

    fwrite库函数的原型:
    size_t fwrite(const void *ptr, size_t size, size_t nitems, FILE *stream);

    它与底层调用write相似,其作用是从ptr指向的缓冲区中读取nitems个长度为size到数据,并把它们写到stream所对应的文件中。

    D、fclose库函数

    fclose库函数的原型为:
    int fclose(FILE *stream);

    它与系统调用close相似,其作用是关闭指定的文件流stream。

    例子
    同样地,下面是前一个例子的另一个实现版本,它实现的功能与先前的例子一样,不过使用的是标准I/O库,而不是系统调用,文件名为copy_stdio.c代码如下:
     
    #include <stdio.h>
    #include <stdlib.h>
    
    int main()
    {
    	int c = 0;
    	FILE *pfin = NULL;
    	FILE *pfout = NULL;
    
    	//以只读方式打开数据文件
        pfin = fopen("Data.txt", "r");
        //以只写方式打开复制的新文件
    	pfout = fopen("copy_stdio.out.txt", "w");
    	
    	while(fread(&c, sizeof(char), 1, pfin))//读数据
    		fwrite(&c, sizeof(char), 1, pfout);//写数据
        //关闭文件流
    	fclose(pfin);
    	fclose(pfout);
    	return 0;
    }

     

    当然这里你也可以用其他的库函数来完成工作,如:用fgetc代替fread,用fputc代替fwrite等。

    四、文件描述符和文件流的关系
    每个文件流都对应一个底层文件描述符,你可以把底层输入输出操作与高层文件流操作混合使用,但是一般不要这样做,因为数据缓冲的后果难以预料。我们可以通过调用fileno函数(原型为:int fileno(FILE *stream))来确定文件流使用的底层文件描述符,它返回指向文件流的文件描述符。相反地,你可以通过调用函数fdopen(原型为FILE* fdopen(int fildes, const char* mode))来在一个已经打开的文件描述符上创建一个新的文件流,mode参数与fopen函数的完全一样,同时它必须符合该文件在最初打开时所设定的访问模式。

    但是在Linux下的编程,系统调用用得比较多一些,因为很多时候系统调用能提供更多的灵活性和更加强大的功能,有些操作是一定要使用系统调用,例如,创建文件读写锁时就一定要使用系统调用。

    五、系统调用与标准I/O的性能比较
    就拿本例子中的代码来比较,两个例子编译后生成的可执行文件的文件名分别为:copy_system.exe和copy_stdio.exe,在Linux下用time命令来测试其运行时间如下:


    从测试结果可以看出,系统调用的效率比库函数要低很多。为什么呢?

    因为使用系统调用会影响系统的性能。与函数调用相比,系统调用时,Linux必须从运行用户代码切换到执行内核代码,然后再返回用户代码,所以系统调用的开销要比普通函数调用大一些。然而也是有办法减少这种开销的,就是在程序中尽量减少系统调用的的次数,并且让每次系统调用完成尽量多的工作。

    而库函数为什么做同样的事情效率却会高这么多呢?这是因为库函数在数据满足数据块长度(或buffer长度)要求时才安排执行底层系统调用,从而减少了系统调用的次数,也让每次的系统调用做了尽量多的事情,所以效率就比较高。

    六、提高系统调用的简单方法举例
    用回每一个例子(coy_system.c)的代码,略加修改就能提高我们的效率,例如一次读1024个字节,修改后保存文件名为copy_system2.c,代码如下:

     
    #include <unistd.h>
    #include <sys/stat.h>
    #include <fcntl.h>
    #include <stdlib.h>
    
    int main()
    {
    	char buff[1024];
    	int in = -1, out = -1;
    	int nread = 0;
    
    	in = open("Data.txt", O_RDONLY);
    	out = open("copy_system2.out.txt", O_WRONLY|O_CREAT, S_IRUSR|S_IWUSR);
        //一次读写1024个字节
    	while((nread = read(in, buff, sizeof(buff))) > 0)
    		write(out, buff, nread);
    
    	close(in);
    	close(out);
    	return 0;
    }
    


    生成的可执行文件为copy_system2.exe,使用time命令查看其执行时间,如下:


    比较下可以看出,其性能改善了一个数量级,其效率甚至比用库函数一个一个字符复制来来得高效,至少在我的机子上是这样。

  • 相关阅读:
    json学习系列(1)-使用json所要用到的jar包下载
    Java 时间架构图
    时间纪元与时区介绍
    HTML5 Canvas 绘制库存变化折线
    HTML5 Canvas 笛卡尔坐标系转换尝试
    像孩童一样欣喜的看着自己的成长
    《老炮儿》结尾貌似历史上的一幕
    很多人还在守着金饭碗要饭
    还是用文本编辑器编程让人愉悦
    Node.js 网页爬虫再进阶,cheerio助力
  • 原文地址:https://www.cnblogs.com/pangblog/p/3268596.html
Copyright © 2020-2023  润新知