第七章文件操作/第八章使用系统调用进行文件操作笔记汇总
文件是Linux中的一个重要概念。在Linux中,一切(几乎一切)都是文件。简单的说,C中基本的的printf()函数,scanf()函数,其实都属于文件操作。
对于文件操作,虽然都是通过函数调用的方式实现,却还是能分为两类:系统调用和库函数。
笔记内容将先介绍Linux中文件的概念,系统调用和库函数的概念 ,然后具体的讨论两种方式下的文件操作。
笔记主要内容如下:
文件操作级别
Linux中的文件
文件访问-库函数
文件访问-系统调用
库函数
标准 I/O 库
其他.文件操作级别
文件操作分为五个级别,按照从低到高的顺序排列如下。
(1)硬件级别:硬件级别的文件操作包括:
- fdisk: 将硬盘、U盘或SDC盘分区。
- mkfs: 格式化磁盘分区,为系统做好准备。
- fsck:检查和维修系统。
碎片整理:压缩文件系统中的文件。
其中大多数是针对系统的实用程序。普通用户可能永远都不需要它们,但是它们是创建和维护系统不可缺少的工具。
(2)操作系统内核中的文件系统函数:每个操作系统内核均可为基本文件操作提供支持。
kumount(),kumount()
(mount/umount file systems)
kmkdir(),krmdir()
(make/remove directory)
kchair(),kgetCwd()
(change directory,get CWD pathname)
klink(),kunlink()
(hard link/unlink files)
kchmod(),kchown(),kutime() (change r|w|x permissions,owner,time)
kcreat(),kopen()
(create/open file for R,W,RW,APPEND)
kread(),kwrite() (read/write opened files)
klseek(),kclose()
(Lseek/close file descriptors)
keymlink(),kreadlink ()
(create/read symbolic 1ink files)
kstat(),kfstat(),klatat() (get file status/information)
kopendir(),kreaddir()
(open/read directories)
(3)系统调用:用户模式程序使用系统调用来访问内核函数。
#include <stdlib.h>
#include <stdio.h>
#include <fcntl.h>
#include <sys/types.h>
#include <unistd.h>
int main(int argc, char *argv[])
{
int fd, n;
char buf[1024];
if (fd = open(argv[1], O_RDONLY) <0)
exit(1);
int k = lseek(fd, 1024, SEEK_SET);
n = read(fd, buf, 1024);
close(fd);
printf("%d
", n);
return 0;
}
(4)I/O库函数:系统调用可让用户读1写多个数据块,这些数据块只是一系列字节。
FILE mode I/O: fopen(), fread(), fwrite(), fseek(), fclose(),fflush()
char mode I/o: gete(), getchar(), ugetc(), putc(), putchar()
line mode I/O: gets(), fgets(), putc(), puts(), fputs()
formatted I/O: scanf(), fscanf(), sscanf(), printf(), fprintf(), sprintf()
1.Linux中的文件
1.1概念
按照普通的定义,文件不过是一堆数据,在往下说,就是存储器中的0101。。。而我们这里讨论的文件有了更广的定义。对于Linux中的文件,我的理解是:
Linux中的文件具有的特点是:可通过操作系统或者程序对外提供信息,也能对内输入信息,可以被创建,删除。
Linux中,文件有特别重要的意义,他们为操作系统和设备提供了一个简单而统一的接口。在Linux中,几乎一切都可以看做是文件 。
这就意味着,普通程序完全可以像使用文件(普通定义)那样使用磁盘文件、串行口、打印机和其他设备。
硬件设备在linux操作系统中也被表示为文件。例如,可以通过如下命令把cd-rom驱动器挂载为一个文件,
#mount -t iso9660 /dev/hdc /mnt/cdrom
#cd /mnt/rom
然后,就能像访问普通文件那样在cd-rom目录中漫游。
1.2操作
和操作一般意义上的文件一样,Linux中对文件的操作只需要五个基本的函数:
open、close、read、write和ioctl
通过调用这几个函数就能对Linux中的文件进行读、写等操作。不过,这种操作又分为系统调用和库函数调用。简单的说,系统调用是最直接的方式,
库函数调用最终也是通过系统调用实现的。可认为库函数调用是对系统调出于效率考虑而做出的优化。
库函数调用和系统调用的区别和联系请参看:Linux系统调用和库函数调用的区别
我们用很少的函数就可以对文件和设备进行访问和控制。这些函数就是所谓的系统调用,由操作系统直接提供,他们是通向操作系统本身的接口。
操作系统的核心部分,既内核,其实就是一组设备驱动程序。这是一些对硬件进行控制的接口。
2.文件访问-系统调用
通过系统调用来访问文件是最直接的方式。系统调用函数直接作用于操作系统内核的设备驱动程序从而实现文件访问。
2.1 文件描述符
在系统中需要处理的文件(读、写操作)需要一个标识,以便在其它地方能识别出这个文件,于是就产生了文件描述符。文件描述符是一些小值整数,简单的说就是
一个文件ID用于在系统中唯一的标识文件。文件描述符的总数也就是系统可以打开文件的最多个数,这取决于系统的配置情况。
当开始运行程序时,也就是系统开始运行时,它一般会有三个已经打开的文件描述符。他们是:
0:标准输入
1:标准输出
2:标准错误
其它文件的文件描述符,在调用文件打开函数open时返回。这就是说,每个设备对应着一个文件描述符。文件描述符由操作系统分配,每次分配最小的。
2.2 write系统调用
write,就是把缓冲区的数据写入文件中。注意,这里的文件时广泛意义的文件,比如写入磁盘、写入打印机等等。
Linux 中write()的函数原型:
size_t write(int fildes, const void *buf, size_t nbytes);
参数说明:
fildes:文件描述符,标识了要写入的目标文件。例如:fildes的值为1,就像标准输出写数据,也就是在显示屏上显示数据;如果为 2 ,则想标注错误写数据。
*buf:待写入的文件,是一个字符串指针。
nbytes:要写入的字符数。
函数返回值:size_t 返回成功写入文件的字符数。需要指出的是,write可能会报告说他写入的字节比你所要求的少。这并不一定是个错误。在程序中,你需要检查
error已发现错误,然后再次调用write写入剩余的数据。
请看下面的例子:
#include<unistd.h>
#include<stdlib.h>
int main()
{
if(write(1,"here is tzy's test
",18)!=18)
write(2,"some wrong",26);
exit(0);
}
运行结果:
这个程序只在标准输出上显示一条消息。
2.3 read系统调用
系统调用read是从文件中读出数据。要读取的文件用文件描述符标识,数据读入一个事先定义好的缓冲区。他返回实际读入的字节数。
Linux中read的函数原型:
size_t read(int fildes, void *buf, size_t nbytes);
参数说明:
fildes:文件描述符,标识要读取的文件。如果为0,则从标准输入读数据。类似于scanf()的功能。
*buf:缓冲区,用来存储读入的数据。
nbytes:要读取的字符数。
返回值:size_t返回成功读取的字符数,它可能会小于请求的字节数。
#include<unistd.h>
#include<stdlib.h>
int main()
{
char buf[20];
int n_read;
n_read=read(0,buf,128);
if(n_read==-1)
write(2,"a read error
",26);
if(write(1,buf,n_read)!=n_read)
write(2,"a write error
",27);
exit(0);
}
运行结果:
2.3 open系统调用
系统调用open的作用是打开一个文件,并返回这个文件的描述符。
简单地说,open建立了一条到文件或设备的访问路径。如果操作成功,它将返回一个文件描述符,read和write等系统调用使用该文件描述符对文件或
设备进行操作。这个文件描述符是唯一的,他不会和任何其他运行中的进程共享。如果两个程序同时打开一个文件,会得到两个不同的问价描述符。如果
同时对两个文件进行操作,他们各自操作,互补影响,彼此相互覆盖(后写入的覆盖先写入的)为了防止文件按读写冲突,可以使用文件锁的功能。这不是
本次重点,以后介绍。
Linux中open的函数原型有两个:
int open(const char *path, int oflags);
int open(const char *path, int oflags, mode_t mode );
参数说明:
path:准备打开的文件或设备名字。
oflags:指出要打开文件的访问模式。open调用必须指定如下所示的文件访问模式之一:
open调用哈可以在oflags参数中包括下列可选模式的组合(用”按位或“操作):
- O_APPEDN: 把写入数据追加在文件的末尾。
- O_TRUNC: 把文件长度设为零,丢弃以后的内容。
- O_CREAT: 如果需要,就按参数mode中给出的访问模式创建文件。
- O_EXCL: 与O_CREAT一起调用,确保调用者创建出文件。使用这个模式可防止两个程序同时创建一个文件,如果文件已经存在,open调用将失败。
关于其他可能出现的oflags值,请看考open的调用手册。
mode:
当使用哦、O_CREAT标志的open来创建文件时,我们必须使用三个参数格式的open调用。第三个参数mode 是几个标志按位OR后得到的。他们是:
- S_IRUSR: 读权限,文件属主。
- S_IWUSR:写权限,文件属主。
- S_ IXUSR:执行权限,文件属主。
- S_IRGRP:读权限,文件所属组。
- S_IWGRP:写权限,文件所属组。
请看下面例子:
open("myfile", O_CREAT, S_IRUSR|S_IXOTH);
他的作用是创建一个名为myfile 的文件,文件属主拥有读权限,其他用户拥有执行权限,且只有这些权限,代码如下:
#include<fcntl.h>
#include<sys/types.h>
#include<sys/stat.h>
int main()
{
open("tzy20191327",O_CREAT,S_IRUSR|S_IXOTH);
}
运行结果:
程序创建了一个名为“tzy20191327”的文件,文件属主有读权限,其他用户有执行权限,且只有这些权限。
2.4 close系统调用
close系统调用用于“关闭”一个文件,close调用终止一个文件描述符fildes以其文件之间的关联。文件描述符被释放,并能够重新使用。
close成功返回1,出错返回-1。
#Include<unistd.h>
int close(int fildes);
2.5 ioctl系统调用
ioctl提供了一个用于控制设备及其描述符行为和配置底层服务的接口。终端、文件描述符、甚至磁带机都可以又为他们定义的ioctl,具体细节可以参考特定设备的使用手册。
下面是ioctl 的函数原型
#include<unistd.h>
int ioctl(int fildes, int cmd,,,,,,);
ioctl对描述符fildes指定的对象执行cmd 参数中所给出的操作。
2.6 其他和文件管理有关的系统调用
还有许多其他的系统调用能对文件进行操作。
几个常用的如:lseek()对文件描述符fildes指定文件的读写指针进行设置,也就是说,它可以设置文件的下一个读写位置。
fstat,stat,lstat 是和文件描述符相关的函数操作。
dup,dup2系统调用。dup提供了复制文件描述符的方法,使我们能够通过两个或者更多个不同的文件描述符来访问同一个文件。这可以用于在文件的不同位置对数据进行读写。
stat 获取文件状态信息
open 打开一个文件进行读、写、追加
close 关闭打开的文件描述符
read 读取打开的文件描述符
write 写入打开的文件描述符
lseek 重新定位文件描述符的读/写偏移量
dup 将文件描述符复制到可用的最小描述编号中
dip2 将oldfd复制到newfd中,如果newfd一打开,先将其关闭
link 将新文件硬链接到旧文件
unlink 减少文件的链接数;如果链接数达到零,则删除文件
symlink 为文件创建一个符号链接
readlink 读取符号链接文件的内容
umask 设置文件创建掩码;文件权限为 (mask&~umasl)
3.库函数
在输入、输出操作中,直接使用系统调用效率会非常底。具体原因有二:
系统调用会影响系统性能。与函数调用相比,系统调用的开销大。因为在执行系统调用的时候,要切换到内核代码区执行,然后再返回用户代码。这必然就需要大量的时间开支。一种解决办法是:尽量减少系统调用的次数,让每次系统调用完成尽可能多的 任务。例如每次系统调用写入大量的字符而不是单个字符。
硬件会对系统调用一次能读写的数据块做一定的限制。例如,磁带机通常的写操作数据块长度是10k,如果缩写数据不是10k的整数倍,磁带机还是会以10k为单位绕磁带,这就在磁带上留下空隙。
为了提高文件访问操作的效率,并且使得文件操作变得更方便,Linux发行版提供了一系列的标准函数库。他们是一些由函数构成的集合,你可以在自己的程序方便的中使用它们,
去操作文件。提供输出缓冲功能的标准I/O库就是这样的例子。你可以高效的写任意长度的数据块,库函数则在需要的时候安排底层函数调用(系统调用),也就是说,库函数在用户和系统之间,增加了一个中间层。如下图所示:
4.标准I/O库
标准I/O库及其头文件<stdio.h>为底层I/O系统调用提供了一个通用的接口。这个库现在已经成为ANSI标准C的一部分,而前面所讲的系统调用却不是。
标准I/O库提供了许多复杂功能的函数,用于格式化输出和扫描输入,它还负责满足设备的缓冲需求。
在许多方面,使用标准I/O库和使用底层文件描述符类似。需要先打开一个文件,已建立一个文件访问路径(也就是系统调用中的文件描述符)
在标准I/O库中,与文件描述符对应的叫 流(stream),它被实现为指向结构FILE的指针。
在启动程序时,有三个文件流是自动打开的。他们是:
stdin: 标准输入 stdout: 标准输出 stderr: 标准错误输出
下面会介绍一些常用的I/O库函数:
4.1 fopen函数
fopen函数类似于系统调用中的open函数。和open一样,它返回文件的标识符,只是这里叫做流(stream),在库函数里实现为一个指向文件的指针。
如果需要对设备的行为进行明确的控制,最好使用底层系统调用,因为这可以避免使用库函数带来的一些非预期的副作用,如输入/输出缓冲。
函数原型:
#include<stdio.h>
FILE *fopen(const char *filename, const char *mode);
参数说明:
*filename:打开文件的文件名
*mode:打开的方式
- r 以只读方式打开文件,该文件必须存在。
- r+ 以可读写方式打开文件,该文件必须存在。
- rb+ 读写打开一个二进制文件,允许读数据。
- rw+ 读写打开一个文本文件,允许读和写。
- w 打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件
- w+ 打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。
fopen在成功是返回一个非空的FILE *指针。失败返回NULL
4.2 fread/fwrite函数
fread函数从文件流中读取数据,对应于系统调用中的read;fwrite函数从文件流中写数据,对应于系统调用中的write
函数原型:
#include<stdio.h>
size_t fread(void *ptr, size_t size, size_t nitems, FILE *stream);
参数说明:
*ptr 要读取数据的缓冲区,也就是要存放读取数据的地方。
size:指定每个数据记录的长度。
nitems: 计数,给出要传输的记录个数。
返回值:成功读取到数据缓冲区的记录个数,当到达文件尾时,他的返回值可能会消耗与nitems,甚至可以是0
size_t fwrite(const coid *ptr, size_t size , size_t nitimes, FILE *stream);
他从指定的数据缓冲区ptr中把数据写入文件流,返回成功写入的记录个数。
4.3 fclose函数
fclose函数关闭指定的文件流stream,这个操作会使所有未写出的数据都写出。因为stdio库函数会对数据进行缓冲,所有调用fclose函数是很重要的。
如果程序需要确保数据已经全部写出,就应该调用fclose函数。虽然程序正常结束时,也会自动的调用fclose函数,但这样就不能检测出调用fclose所产生的错误了。
函数原型如下:
#include<stdio,h>
int fclose(FILE *stream);
4.4 fflush函数
fflush函数的作用是把文件流中所有未写出的数据全部写出。 处于效率考虑,在使用库函数的时候会使用数据缓冲区,当缓冲区满的时候才进行写操作。使用fflush函数
可以将缓冲区的数据全部写出,而不关心缓冲区是否满。fclose的执行隐含调用了fflush函数,所以不必再fclose执行之前调用fflush。
函数原型:
#include<stdio.h>
int fflush(FILE *stream);