FILE 結構 ¶
FILE 介紹 ¶
FILE 在 Linux 系統的標準 IO 庫中是用於描述文件的結構,稱爲文件流。 FILE 結構在程序執行 fopen 等函數時會進行創建,並分配在堆中。我們常定義一個指向 FILE 結構的指針來接收這個返回值。
FILE 結構定義在 libio.h 中,如下所示
struct _IO_FILE {
int _flags; /* High-order word is _IO_MAGIC; rest is flags. */
#define _IO_file_flags _flags
/* The following pointers correspond to the C++ streambuf protocol. */
/* Note: Tk uses the _IO_read_ptr and _IO_read_end fields directly. */
char* _IO_read_ptr; /* Current read pointer */
char* _IO_read_end; /* End of get area. */
char* _IO_read_base; /* Start of putback+get area. */
char* _IO_write_base; /* Start of put area. */
char* _IO_write_ptr; /* Current put pointer. */
char* _IO_write_end; /* End of put area. */
char* _IO_buf_base; /* Start of reserve area. */
char* _IO_buf_end; /* End of reserve area. */
/* The following fields are used to support backing up and undo. */
char *_IO_save_base; /* Pointer to start of non-current get area. */
char *_IO_backup_base; /* Pointer to first valid character of backup area */
char *_IO_save_end; /* Pointer to end of non-current get area. */
struct _IO_marker *_markers;
struct _IO_FILE *_chain;
int _fileno;
#if 0
int _blksize;
#else
int _flags2;
#endif
_IO_off_t _old_offset; /* This used to be _offset but it's too small. */
#define __HAVE_COLUMN /* temporary */
/* 1+column number of pbase(); 0 is unknown. */
unsigned short _cur_column;
signed char _vtable_offset;
char _shortbuf[1];
/* char* _save_gptr; char* _save_egptr; */
_IO_lock_t *_lock;
#ifdef _IO_USE_OLD_IO_FILE
};
struct _IO_FILE_complete
{
struct _IO_FILE _file;
#endif
#if defined _G_IO_IO_FILE_VERSION && _G_IO_IO_FILE_VERSION == 0x20001
_IO_off64_t _offset;
# if defined _LIBC || defined _GLIBCPP_USE_WCHAR_T
/* Wide character stream stuff. */
struct _IO_codecvt *_codecvt;
struct _IO_wide_data *_wide_data;
struct _IO_FILE *_freeres_list;
void *_freeres_buf;
# else
void *__pad1;
void *__pad2;
void *__pad3;
void *__pad4;
size_t __pad5;
int _mode;
/* Make sure we don't get into trouble again. */
char _unused2[15 * sizeof (int) - 4 * sizeof (void *) - sizeof (size_t)];
#endif
};
進程中的 FILE 結構會通過_chain 域彼此連接形成一個鏈表,鏈表頭部用全局變量_IO_list_all 表示,通過這個值我們可以遍歷所有的 FILE 結構。
在標準 I/O 庫中,每個程序啓動時有三個文件流是自動打開的:stdin、stdout、stderr。因此在初始狀態下,_IO_list_all 指向了一個有這些文件流構成的鏈表,但是需要注意的是這三個文件流位於 libc.so 的數據段。而我們使用 fopen 創建的文件流是分配在堆內存上的。
我們可以在 libc.so 中找到 stdin\stdout\stderr 等符號,這些符號是指向 FILE 結構的指針,真正結構的符號是
_IO_2_1_stderr_
_IO_2_1_stdout_
_IO_2_1_stdin_
但是事實上_IO_FILE 結構外包裹着另一種結構_IO_FILE_plus,其中包含了一個重要的指針 vtable 指向了一系列函數指針。
在 libc2.23 版本下,32 位的 vtable 偏移爲 0x94,64 位偏移爲 0xd8
struct _IO_FILE_plus
{
_IO_FILE file;
IO_jump_t *vtable;
}
vtable 是 IO_jump_t 類型的指針,IO_jump_t 中保存了一些函數指針,在後面我們會看到在一系列標準 IO 函數中會調用這些函數指針
void * funcs[] = {
1 NULL, // "extra word"
2 NULL, // DUMMY
3 exit, // finish
4 NULL, // overflow
5 NULL, // underflow
6 NULL, // uflow
7 NULL, // pbackfail
8 NULL, // xsputn #printf
9 NULL, // xsgetn
10 NULL, // seekoff
11 NULL, // seekpos
12 NULL, // setbuf
13 NULL, // sync
14 NULL, // doallocate
15 NULL, // read
16 NULL, // write
17 NULL, // seek
18 pwn, // close
19 NULL, // stat
20 NULL, // showmanyc
21 NULL, // imbue
};
fread¶
fread 是標準 IO 庫函數,作用是從文件流中讀數據,函數原型如下
size_t fread ( void *buffer, size_t size, size_t count, FILE *stream) ;
-
buffer 存放讀取數據的緩衝區。
-
size:指定每個記錄的長度。
-
count: 指定記錄的個數。
-
stream:目標文件流。
-
返回值:返回讀取到數據緩衝區中的記錄個數
fread 的代碼位於 / libio/iofread.c 中,函數名爲_IO_fread,但真正的功能實現在子函數_IO_sgetn 中。
_IO_size_t
_IO_fread (buf, size, count, fp)
void *buf;
_IO_size_t size;
_IO_size_t count;
_IO_FILE *fp;
{
...
bytes_read = _IO_sgetn (fp, (char *) buf, bytes_requested);
...
}
在_IO_sgetn 函數中會調用_IO_XSGETN,而_IO_XSGETN 是_IO_FILE_plus.vtable 中的函數指針,在調用這個函數時會首先取出 vtable 中的指針然後再進行調用。
_IO_size_t
_IO_sgetn (fp, data, n)
_IO_FILE *fp;
void *data;
_IO_size_t n;
{
return _IO_XSGETN (fp, data, n);
}
在默認情況下函數指針是指向_IO_file_xsgetn 函數的,
if (fp->_IO_buf_base
&& want < (size_t) (fp->_IO_buf_end - fp->_IO_buf_base))
{
if (__underflow (fp) == EOF)
break;
continue;
}
fwrite¶
fwrite 同樣是標準 IO 庫函數,作用是向文件流寫入數據,函數原型如下
size_t fwrite(const void* buffer, size_t size, size_t count, FILE* stream);
-
buffer: 是一個指針,對 fwrite 來說,是要寫入數據的地址;
-
size: 要寫入內容的單字節數;
-
count: 要進行寫入 size 字節的數據項的個數;
-
stream: 目標文件指針;
-
返回值:實際寫入的數據項個數 count。
fwrite 的代碼位於 / libio/iofwrite.c 中,函數名爲_IO_fwrite。 在_IO_fwrite 中主要是調用_IO_XSPUTN 來實現寫入的功能。
根據前面對_IO_FILE_plus 的介紹,可知_IO_XSPUTN 位於_IO_FILE_plus 的 vtable 中,調用這個函數需要首先取出 vtable 中的指針,再跳過去進行調用。
written = _IO_sputn (fp, (const char *) buf, request);
在_IO_XSPUTN 對應的默認函數_IO_new_file_xsputn 中會調用同樣位於 vtable 中的_IO_OVERFLOW
/* Next flush the (full) buffer. */
if (_IO_OVERFLOW (f, EOF) == EOF)
_IO_OVERFLOW 默認對應的函數是_IO_new_file_overflow
if (ch == EOF)
return _IO_do_write (f, f->_IO_write_base,
f->_IO_write_ptr - f->_IO_write_base);
if (f->_IO_write_ptr == f->_IO_buf_end ) /* Buffer is really full */
if (_IO_do_flush (f) == EOF)
return EOF;
fopen¶
fopen 在標準 IO 庫中用於打開文件,函數原型如下
FILE *fopen(char *filename, *type);
-
filename: 目標文件的路徑
-
type: 打開方式的類型
-
返回值: 返回一個文件指針
在 fopen 內部會創建 FILE 結構並進行一些初始化操作,下面來看一下這個過程
首先在 fopen 對應的函數__fopen_internal 內部會調用 malloc 函數,分配 FILE 結構的空間。因此我們可以獲知 FILE 結構是存儲在堆上的
*new_f = (struct locked_FILE *) malloc (sizeof (struct locked_FILE));
之後會爲創建的 FILE 初始化 vtable,並調用_IO_file_init 進一步初始化操作
_IO_JUMPS (&new_f->fp) = &_IO_file_jumps;
_IO_file_init (&new_f->fp);
在_IO_file_init 函數的初始化操作中,會調用_IO_link_in 把新分配的 FILE 鏈入_IO_list_all 爲起始的 FILE 鏈表中
void
_IO_link_in (fp)
struct _IO_FILE_plus *fp;
{
if ((fp->file._flags & _IO_LINKED) == 0)
{
fp->file._flags |= _IO_LINKED;
fp->file._chain = (_IO_FILE *) _IO_list_all;
_IO_list_all = fp;
++_IO_list_all_stamp;
}
}
之後__fopen_internal 函數會調用_IO_file_fopen 函數打開目標文件,_IO_file_fopen 會根據用戶傳入的打開模式進行打開操作,總之最後會調用到系統接口 open 函數,這裏不再深入。
if (_IO_file_fopen ((_IO_FILE *) new_f, filename, mode, is32) != NULL)
return __fopen_maybe_mmap (&new_f->fp.file);
總結一下 fopen 的操作是
- 使用 malloc 分配 FILE 結構
- 設置 FILE 結構的 vtable
- 初始化分配的 FILE 結構
- 將初始化的 FILE 結構鏈入 FILE 結構鏈表中
- 調用系統調用打開文件
fclose¶
fclose 是標準 IO 庫中用於關閉已打開文件的函數,其作用與 fopen 相反。
int fclose(FILE *stream)
fclose 首先會調用_IO_unlink_it 將指定的 FILE 從_chain 鏈表中脫鏈
if (fp->_IO_file_flags & _IO_IS_FILEBUF)
_IO_un_link ((struct _IO_FILE_plus *) fp);
之後會調用_IO_file_close_it 函數,_IO_file_close_it 會調用系統接口 close 關閉文件
if (fp->_IO_file_flags & _IO_IS_FILEBUF)
status = _IO_file_close_it (fp);
最後調用 vtable 中的_IO_FINISH,其對應的是_IO_file_finish 函數,其中會調用 free 函數釋放之前分配的 FILE 結構
_IO_FINISH (fp);
printf/puts¶
printf 和 puts 是常用的輸出函數,在 printf 的參數是以'\n'結束的純字符串時,printf 會被優化爲 puts 函數並去除換行符。
puts 在源碼中實現的函數是_IO_puts,這個函數的操作與 fwrite 的流程大致相同,函數內部同樣會調用 vtable 中的_IO_sputn,結果會執行_IO_new_file_xsputn,最後會調用到系統接口 write 函數。
printf 的調用棧回溯如下,同樣是通過_IO_file_xsputn 實現
vfprintf+11
_IO_file_xsputn
_IO_file_overflow
funlockfile
_IO_file_write
write