Использует ли запись в С++ ofstream буфер?

Ниже приведены две программы, которые записывают 50 000 000 байтов в файл.

В первой программе, написанной на C, используется буфер, который после заполнения до произвольного значения записывается на диск, а затем повторяет этот процесс до тех пор, пока не будут записаны все 50 000 000 байтов. Я заметил, что по мере увеличения размера буфера программе потребовалось меньше времени для запуска. Например, в BUFFER_SIZE = 1 программа заняла ~ 88.0463 секунды, тогда как в BUFFER_SIZE = 1024 программа заняла ~ 1.7773 секунды. Лучшее время, которое я записал, было когда BUFFER_SIZE = 131072. Поскольку BUFFER_SIZE увеличилось выше этого, я заметил, что он начал набирать немного больше времени.

Вторая программа, написанная на С++, использует forstream для записи по одному байту за раз. К моему удивлению, программа заняла всего 1,87 секунды. Я ожидал, что это займет минуту или около того, как программа C с BUFFER_SIZE = 1. Очевидно, что С++ ofstream обрабатывает запись файлов по-другому, чем я думал. По моим данным, он довольно похож на файл C с BUFFER_SIZE = 512. Использует ли он какой-то закулисный буфер?

Вот программа C:

const int NVALUES = 50000000; //#values written to the file
const char FILENAME[] = "/tmp/myfile";
const int BUFFER_SIZE = 8192; //# bytes to fill in buffer before writing

main()
{
    int fd;  //File descriptor associated with output file
    int i;
    char writeval = '\0';
    char buffer[BUFFER_SIZE];

    //Open file for writing and associate it with the file descriptor
    //Create file if it does not exist; if it does exist truncate its size to 0
    fd = open(FILENAME, O_WRONLY|O_CREAT|O_TRUNC, S_IRUSR|S_IWUSR);

    for(i=0;i<NVALUES;i++)
    {
        //Package bytes into BUFFER_SIZE chunks 
                //and write a chunk once it is filled
        buffer[i%BUFFER_SIZE] = writeval;
        if((i%BUFFER_SIZE == BUFFER_SIZE-1 || i == NVALUES-1))
            write(fd, buffer, i%BUFFER_SIZE+1);

    }

    fsync(fd);

    close(fd);
}

Вот программа С++:

int main()
{
    ofstream ofs("/tmp/iofile2");
    int i;

    for(i=0; i<50000000; i++)
        ofs << '\0';

    ofs.flush();
    ofs.close();

    return 0;
}

Спасибо за ваше время.

Ответы

Ответ 1

Да, ostreams используют буфер потока, некоторый подкласс экземпляра шаблона basic_streambuf. Интерфейс basic_streambuf сконструирован таким образом, что реализация может выполнять буферизацию, если в этом есть преимущество.

Однако это проблема качества реализации. Реализации не требуются для этого, но любая компетентная реализация будет.

Вы можете прочитать все об этом в главе 27 стандарта ISO, хотя, возможно, более читаемым источником является стандартная библиотека С++: учебник и справочник (google поиск).

Ответ 2

Да, все потоковые операции буферизованы, хотя по умолчанию стандартный вывод, вывод и вывод ошибки не так, что взаимодействие с C IO менее удивительно.

Как уже упоминалось, существует базовый класс streambuf, который используется за кулисами. Он снабжен собственным буфером, размер которого является деталью реализации.

Вы можете проверить (экспериментально), насколько этот буфер используется с помощью streambuf::in_avail, считая, что входной поток потока и выходной поток устанавливаются с помощью тот же размер буфера...

Здесь вы можете сделать две другие операции, которые могут быть интересны:

вы можете изменить объект streambuf, используемый потоком, для переключения на пользовательскую версию
вы можете изменить буфер, используемый объектом streambuf

оба должны выполняться либо сразу после создания потока, либо после flush, чтобы некоторые данные не были потеряны...

Чтобы проиллюстрировать изменение буфера, проверьте streambuf::putsetbuf:

#include <fstream>
#include <vector>

int main () {
  std::vector<char> vec(512);

  std::fstream fs;
  fs.rdbuf()->pubsetbuf(&vec.front(), vec.size());

  // operations with file stream here.
  fs << "Hello, World!\n";

  // the stream is automatically closed when the scope ends, so fs.close() is optional
  // the stream is automatically flushed when it is closed, so fs.flush() is optional

  return 0;
}

Теперь вы можете повторить эксперименты, которые вы сделали на C, чтобы найти сладкое пятно:)

Ответ 3

Per this, ofstream имеет внутренний указатель filebuf, может быть прочитан через функцию rdbuf, которая указывает на streambuf, который является следующим:

streambuf объекты обычно связаны с одним конкретным символом последовательность, из которой они считывают и записывают данные через внутренний буфер памяти. Буфер представляет собой массив в памяти, который, как ожидается, синхронизироваться по мере необходимости с физическим содержимым ассоциированная последовательность символов.

Я выделил важные биты, кажется, что он использует буфер, но я не знаю или не узнал, что это за буфер.