Как написать настраиваемый поток ввода в С++

В настоящее время я изучаю С++ (Coming from Java), и я пытаюсь понять, как правильно использовать потоки ввода-вывода на С++.

Скажем, у меня есть класс Image, который содержит пиксели изображения, и я перегрузил оператор извлечения, чтобы прочитать изображение из потока:

istream& operator>>(istream& stream, Image& image)
{
    // Read the image data from the stream into the image
    return stream;
}

Итак, теперь я могу прочитать такое изображение:

Image image;
ifstream file("somepic.img");
file >> image;

Но теперь я хочу использовать один и тот же оператор извлечения для чтения данных изображения из пользовательского потока. Скажем, у меня есть файл, который содержит изображение в сжатой форме. Поэтому вместо использования ifstream я могу реализовать собственный поток ввода. По крайней мере, так, как я буду делать это на Java. В Java я бы написал пользовательский класс, расширяющий класс InputStream и реализующий метод int read(). Так что это довольно легко. И использование будет выглядеть так:

InputStream stream = new CompressedInputStream(new FileInputStream("somepic.imgz"));
image.read(stream);

Поэтому, используя тот же шаблон, возможно, я хочу сделать это в С++:

Image image;
ifstream file("somepic.imgz");
compressed_stream stream(file);
stream >> image;

Но, возможно, это неправильный путь, не знаю. Расширение класса istream выглядит довольно сложно, и после некоторого поиска я нашел несколько советов о расширении streambuf. Но этот example выглядит ужасно сложным для такой простой задачи.

Итак, какой лучший способ реализовать пользовательские потоки ввода/вывода (или streambufs?) в С++?

Решение

Некоторые люди предложили вообще не использовать iostreams и вместо этого использовать итераторы, boost или пользовательский интерфейс ввода-вывода. Это могут быть действительные альтернативы, но мой вопрос касался iostreams. В принятом ответе приведен пример кода ниже. Для упрощения чтения отсутствует разделение заголовка/кода, и импортируется все пространство имен std (я знаю, что это плохое в реальном коде).

В этом примере речь идет о чтении и записи изображений с вертикальным xor-кодированием. Формат довольно прост. Каждый байт представляет два пикселя (4 бит на пиксель). Каждая строка имеет xor'd с предыдущей строкой. Этот вид кодирования подготавливает изображение для сжатия (обычно это приводит к большому количеству 0-байтов, которые легче сжимать).

#include <cstring>
#include <fstream>

using namespace std;

/*** vxor_streambuf class ******************************************/

class vxor_streambuf: public streambuf
{
public:
    vxor_streambuf(streambuf *buffer, const int width) :
        buffer(buffer),
        size(width / 2)
    {
        previous_line = new char[size];
        memset(previous_line, 0, size);
        current_line = new char[size];
        setg(0, 0, 0);
        setp(current_line, current_line + size);
    }

    virtual ~vxor_streambuf()
    {
        sync();
        delete[] previous_line;
        delete[] current_line;
    }

    virtual streambuf::int_type underflow()
    {
        // Read line from original buffer
        streamsize read = buffer->sgetn(current_line, size);
        if (!read) return traits_type::eof();

        // Do vertical XOR decoding
        for (int i = 0; i < size; i += 1)
        {
            current_line[i] ^= previous_line[i];
            previous_line[i] = current_line[i];
        }

        setg(current_line, current_line, current_line + read);
        return traits_type::to_int_type(*gptr());
    }

    virtual streambuf::int_type overflow(streambuf::int_type value)
    {
        int write = pptr() - pbase();
        if (write)
        {
            // Do vertical XOR encoding
            for (int i = 0; i < size; i += 1)
            {
                char tmp = current_line[i];
                current_line[i] ^= previous_line[i];
                previous_line[i] = tmp;
            }

            // Write line to original buffer
            streamsize written = buffer->sputn(current_line, write);
            if (written != write) return traits_type::eof();
        }

        setp(current_line, current_line + size);
        if (!traits_type::eq_int_type(value, traits_type::eof())) sputc(value);
        return traits_type::not_eof(value);
    };

    virtual int sync()
    {
        streambuf::int_type result = this->overflow(traits_type::eof());
        buffer->pubsync();
        return traits_type::eq_int_type(result, traits_type::eof()) ? -1 : 0;
    }

private:
    streambuf *buffer;
    int size;
    char *previous_line;
    char *current_line;
};


/*** vxor_istream class ********************************************/

class vxor_istream: public istream
{
public:
    vxor_istream(istream &stream, const int width) :
        istream(new vxor_streambuf(stream.rdbuf(), width)) {}

    virtual ~vxor_istream()
    {
        delete rdbuf();
    }
};


/*** vxor_ostream class ********************************************/

class vxor_ostream: public ostream
{
public:
    vxor_ostream(ostream &stream, const int width) :
        ostream(new vxor_streambuf(stream.rdbuf(), width)) {}

    virtual ~vxor_ostream()
    {
        delete rdbuf();
    }
};


/*** Test main method **********************************************/

int main()
{
    // Read data
    ifstream infile("test.img");
    vxor_istream in(infile, 288);
    char data[144 * 128];
    in.read(data, 144 * 128);
    infile.close();

    // Write data
    ofstream outfile("test2.img");
    vxor_ostream out(outfile, 288);
    out.write(data, 144 * 128);
    out.flush();
    outfile.close();

    return 0;
}

Ответы

Ответ 1

Правильный способ создания нового потока в С++ состоит в выводе std::streambuf и переопределении операции underflow() для чтения и операций overflow() и sync() для записи. Для вашей цели вы создадите буфер потока фильтрования, который будет использовать другой буфер потока (и, возможно, поток, из которого буфер потока может быть извлечен с помощью rdbuf()) в качестве аргумента, и реализует свои собственные операции в терминах этого буфера потока.

Основной контур буфера потока будет примерно таким:

class compressbuf
    : public std::streambuf {
    std::streambuf* sbuf_;
    char*           buffer_;
    // context for the compression
public:
    compressbuf(std::streambuf* sbuf)
        : sbuf_(sbuf), buffer_(new char[1024]) {
        // initialize compression context
    }
    ~compressbuf() { delete[] this->buffer_; }
    int underflow() {
        if (this->gptr() == this->egptr()) {
            // decompress data into buffer_, obtaining its own input from
            // this->sbuf_; if necessary resize buffer
            // the next statement assumes "size" characters were produced (if
            // no more characters are available, size == 0.
            this->setg(this->buffer_, this->buffer_, this->buffer_ + size);
        }
        return this->gptr() == this->egptr()
             ? std::char_traits<char>::eof()
             : std::char_traits<char>::to_int_type(*this->gptr());
    }
};

Как выглядит underflow() точно зависит от используемой библиотеки сжатия. Большинство библиотек, которые я использовал, сохраняют внутренний буфер, который необходимо заполнить и который сохраняет байты, которые еще не используются. Как правило, довольно легко подключить декомпрессию к underflow().

После создания буфера потока вы можете просто инициализировать объект std::istream с помощью буфера потока:

std::ifstream fin("some.file");
compressbuf   sbuf(fin.rdbuf());
std::istream  in(&sbuf);

Если вы собираетесь часто использовать буфер потока, вы можете инкапсулировать конструкцию объекта в класс, например, icompressstream. Это немного сложно, потому что базовый класс std::ios является виртуальной базой и является фактическим местом, где хранится буфер потока. Для построения буфера потока перед передачей указателю на std::ios требуется переходить через несколько обручей: для этого требуется использование базового класса virtual. Вот как это выглядит примерно так:

struct compressstream_base {
    compressbuf sbuf_;
    compressstream_base(std::streambuf* sbuf): sbuf_(sbuf) {}
};
class icompressstream
    : virtual compressstream_base
    , public std::istream {
public:
    icompressstream(std::streambuf* sbuf)
        : compressstream_base(sbuf)
        , std::ios(&this->sbuf_)
        , std::istream(&this->sbuf_) {
    }
};

(я просто набрал этот код без простого способа проверить, что он достаточно правильный, пожалуйста, ожидайте опечатки, но общий подход должен работать, как описано)

Ответ 2

boost (который должен быть уже, если вы серьезно относитесь к С++), имеет целую библиотеку, предназначенную для расширения и настройки потоков ввода-вывода: boost.iostreams

В частности, он уже распаковывает потоки для нескольких популярных форматов (bzip2, gzlib, и zlib)

Как вы видели, расширение streambuf может быть связанной задачей, но библиотека упрощает писать собственный поток streambuf фильтрации, если вам это нужно.

Ответ 3

Не надо, если ты не хочешь умереть от ужасной смерти отвратительного дизайна. IOstreams являются худшим компонентом стандартной библиотеки - даже хуже, чем локали. Модель итератора гораздо более полезна, и вы можете конвертировать из потока в итератор с помощью istream_iterator.

Ответ 4

Я согласен с @DeadMG и не рекомендую использовать iostreams. Помимо плохого дизайна производительность часто хуже, чем у обычного старого ввода-вывода C-стиля. Я бы не придерживался конкретной библиотеки ввода-вывода, но вместо этого я бы создал интерфейс (абстрактный класс), который имеет все необходимые операции, например:

class Input {
 public:
  virtual void read(char *buffer, size_t size) = 0;
  // ...
};

Затем вы можете реализовать этот интерфейс для C I/O, iostreams, mmap или что-то еще.

Ответ 5

Возможно, это возможно, но я чувствую, что это не "правильное" использование этой функции на С++. Iostream → и < операторы предназначены для довольно простых операций, таких как writing "имя, улица, город, почтовый индекс" class Person, а не для разбора и загрузки изображений. Это гораздо лучше сделано с помощью stream:: read() - с помощью Image(astream);, и вы можете реализовать поток для сжатия, как описано Dietmar.

Ответ 6

Я думаю, что main(), приведенный в решении в вопросе, имеет небольшую, но важную ошибку. Ifstream и ofstream должны быть открыты в двоичном режиме:

int main()
{
    // Read data
    ifstream infile("test.img", ios::binary);
    ...

    // Write data
    ofstream outfile("test2.img", ios::binary);
    ...
}

Без этого я обнаружил, что чтение файла преждевременно закончилось в Windows

(Я бы добавил это как комментарий, но у меня еще нет 50 репутации)