使用 lseek
函数显式的为一个打开文件设置偏移量。
每个打开的文件都有一个与其关联的“当前文件偏移量”。它通常是个非负整数,用于度量从文件开始处计算的字节数。
读、写操作都从当前文件偏移量处开始,并使偏移量增加所读写的字节数。
#include <unistd.h> off_t lseek(int fd, off_t offset, int whence);
fd
:打开的文件的文件描述符whence
:必须是 SEEK_SET
、SEEK_CUR
、SEEK_END
三个常量之一offset
:
whence
是SEEK_SET
,则将该文件的偏移量设置为距离文件开始处 offset
个字节whence
是 SEEK_CUR
,则将该文件的偏移量设置为当前值加上 offset
个字节,offset
可正,可负whence
是 SEEK_END
,则将该文件的偏移量设置为文件长度加上 offset
个字节,offset
可正,可负一些关于 lseek
和文件偏移量的注意事项:
打开一个文件时,除非指定 O_APPEND
选项,否则系统默认将该偏移量设为0
如果文件描述符指定的是一个管道、FIFO、或者网络套接字,则无法设定当前文件偏移量,则 lseek
将返回 -1 ,并且将 errno
设置为 ESPIPE
。
对于普通文件,其当前文件偏移量必须是非负值。但是某些设备运行负的偏移量出现。因此比较 lseek
的结果时,不能根据它小于0 就认为出错。要根据是否等于 -1 来判断是否出错。
lseek
并不会引起任何 I/O 操作,lseek
仅仅将当前文件的偏移量记录在内核中。
当前文件偏移量可以大于文件的当前长度。此时对该文件的下一次写操作将加长该文件,并且在文件中构成一个空洞。空洞中的内容位于文件中但是没有被写过,其字节被读取时都被读为0
文件中的空洞并不要求在磁盘上占据存储区。具体处理方式与操作系统有关
调用 read
函数从打开文件中读取数据。
读操作从文件的当前偏移量开始,在成功返回之前,文件的当前偏移量会增加实际读到的字节数。
#include <unistd.h> ssize_t read(int fd, void *buf, size_t nbytes);
fd
:打开的文件的文件描述符buf
:存放读取内容的缓冲区的地址(由程序员手动分配)nbytes
:期望读到的字节数有多种情况可能导致实际读到的字节数少于期望读到的字节数:
FIFO
读时,若管道包含的字节少于所需的数量,则 read
只返回实际可用的字节数#include <unistd.h> ssize_t write(int fd, const void *buf, size_t nbytes);
fd
:打开的文件的文件描述符buf
:存放待写的数据内容的缓冲区的地址(由程序员手动分配)nbytes
:期望写入文件的字节数write
的返回值通常都是与 nbytes
相同。否则表示出错。
write
出错的一个常见原因是磁盘写满,或者超过了一个给定进行的文件长度限制
对于普通文件,写操作从文件的当前偏移量处开始。如果打开文件时指定了 O_APPEND
选项,则每次写操作之前,都会将文件偏移量设置在文件的当前结尾处。在一次成功写之后,该文件偏移量增加实际写的字节数。
下图显示了用 20 种不同的缓冲区长度,读 516,581,760 字节的文件所得到的结果:
此测试所用的文件系统是 Linux ext4 文件系统,其磁盘块长度为 4096 字节(4K)。
Why?
大多数文件系统为改善性能都采用某种预读(read ahead)技术。当检测到正进行顺序读取时,系统就试图读入比应用所要求的更多数据,并假想应用很快就会读这些数据。(利用了局部性原理)
UNIX 系统支持在不同进程间共享打开文件。
内核使用三种数据结构描述打开文件。它们之间的关系决定了一个进程与另一个进程在打开的文件之间的相互影响。
内核为每个进程分配一个进程表项(所有进程表项构成进程表),进程表中都有一个打开的文件描述符表。每个文件描述符占用一项,其内容为:
内核为每个打开的文件分配一个文件表项(所有的文件表项构成文件表)。每个文件表项的内容包括:
每个打开的文件或者设备都有一个 v 结点结构(v-node)。 v 结点结构的内容包括:
这些信息都是在打开文件时从磁盘读入内存的。如 i 结点包含了文件的所有者、文件长度、指向文件实际数据在磁盘上所在位置的指针等等。 v 结点结构和 i 结点结构实际上代表了文件的实体。
Linux 没有将相关数据结分为 i 节点和 v 节点,而是采用了一个与文件系统相关的 i 节点和个与文件系统无关的 i 节点。
一个进程打开多个文件:
两个进程打开同一个文件:
可能有多个文件描述符指向同一个文件表项。(dup、fork)
dup的情况:
fork的情况: