首页 > 学院 > 操作系统 > 正文

APUE学习笔记-文件I/O

2024-06-28 13:21:13
字体:
来源:转载
供稿:网友
APUE学习笔记-文件I/O

  这次回顾APUE中第三四章的内容,主要是文件I/O操作相关的接口函数。

  UNIX系统的文件I/O是不带缓冲的I/O,不带缓冲是指每个read和write都调用系统内核的一个系统调用。

1.文件描述符

  UNIX I/O的所有函数都是基于文件描述符来操作的。那什么是文件描述符呢?文件描述符是一个非负整数。当打开一个现有文件或创建一个新文件时,内核向进程返回一个文件描述符。该文件描述符fd是所有UNIX I/O函数的操作对象。UNIX系统把文件描述符0与进程标准输入关联,把文件描述符1与进程标准输出关联,把文件描述符2与标准错误关联。我们一般在程序中用STDINPUT_FILENO,STDOUTPUT_FILENO,STDERR_FILENO代替这几个文件描述符。文件描述符的范围是0~OPEN_MAX-1。

2.基本I/O函数

#include <fcntl.h>

int open(const char *path,int oflag,.../* mode_t mode */);  /* xx */

int openat(int fd,const char *path,int oflag,.../* mode_t mode */);

【成功返回文件描述符,出错返回-1】

  调用open函数打开一个文件,path是要打开或创建的文件的名字,oflag用来说明该函数的多个选项。对于openat函数,在UNIX这一系列I/O函数中有很多类似openat带at后缀的xxat函数,它们的功能与xx函数类似,只不过是xx函数是用文件的绝对路径名来调用,而xxat函数是用文件描述符加上相对路径名来调用,对xxat类函数来说,当path参数指向一个绝对路径名时,其参数fd也失效,此时xxat函数与xx函数相同。(再后面对于这种函数我会用xx注释说明,就不再列出xxat函数了)。

  open函数的oflag参数是用多个系统定义的常量做‘或’运算得出。首先是O_RDONLY,O_WRONLY,O_RDWR,O_EXEC,O_SEARCH(这五个常量中必须指定一个且只能指定一个)。剩下的我只列出几个我觉得用的频繁些的:O_APPEND,每次写时都追加到文件末尾;O_CREAT,若此文件不存在则创建,使用该选项时,函数第三个参数mode需指定文件访问权限;O_TRUNC,若文件存在,且是只写或读-写打开,则将文件长度截断为零。

#include <fcntl.h>

int creat(const char *path,mode_t mode);

【成功,返回以WRONLY打开的文件描述符;出错返回-1】

#include <unistd.h>

int close(int fd);【成功,返回0;出错返回-1】

注:当一个进程终止时,内核会自动关闭它打开的所有文件,因此很多程序都利用这一点不显式调用close关闭。

off_t lseek(int fd,off_t offset,int whence);【成功,返回文件新的偏移量;失败返回-1】

whence有三种值:SEEK_SET,此时文件偏移量设置为据文件开始初offset个字节处;SEEK_CUR,此时将文件偏移量设置为其当前值加offset;SEEK_END,此时文件偏移量设置为文件长度加offset。

ssize_t read(int fd,void *buf,size_t nbytes);【成功,返回读到字节数,若已到文件尾,返回零;出错返回-1】

从文件描述符所指文件读n字节到buf数组。ssize_t是带符号返回值int,size_t是unsigned int

ssize_t write(int fd,void *buf,size_t nbytes);【成功,返回已写字节数;出错返回-1】

从buf数组读n字节写入fd所指文件。对普通文件,写操作从文件当前偏移量出开始;对于文件打开时指定了O_APPEND位,每次写操作是在文件末尾。

3.文件共享

  UNIX支持在不同进程间共享打开文件。UNIX内核表示打开文件的数据结构如下所示(手机拍的凑合着看):

a.每个进程在进程表中都有一个记录项,记录项包含一张打开文件的文件描述符表,表中每一项关联文件描述符标志及一个指向文件表项的指针。

b.内核为所有打开文件维持一张文件表,每个表项包含文件状态标志,当前文件偏移量,v节点指针。

c.每个打开文件都有一个v节点结构。v节点包含了文件类型和对文件进行各种操作的函数指针。还包含了文件的i节点,i节点包含了文件的所有者,文件长度,指向文件实际数据块在磁盘上的指针等信息。

  两独立进程各自打开同一文件的示意图:

#include <unistd.h>

int dup(int fd);【成功,返回新文件描述符,出错返回-1】

复制现有文件描述符,返回的文件描述符是当前可用的文件描述符中最小的那个。

int fsync(int fd);

int fdatasync(int fd);

【成功,返回0,出错返回-1】

void sync(void);

sync只是将所修改的块缓冲区加入写队列,然后就返回,不等待写磁盘操作解数。

fsync只对文件描述符fd指定的文件有用,且要等写磁盘操作完成才返回。

fdatasync类似于fsync,只是fdatasync只影响文件数据部分。

#include <fcntl.h>

int fcntl(int fd,int cmd,.../* arg */);

该函数用于改变已打开文件的属性。fcntl的功能与cmd有关。

To be continued...


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表