Caffe: понимание ожидаемой структуры данных lmdb для blobs

Я пытаюсь понять, как данные интерпретируются в Caffe. Для этого я взглянул на Minst Tutorial Рассматривая определение входных данных:

Теперь я посмотрел mnist_train_lmdb и взял одну из записей (показано в шестнадцатеричном формате):

(Я добавил здесь разрывы строк, чтобы увидеть цифру "7".)

Теперь мой вопрос: , где описывается этот формат? Или иначе, если определено, что первые 36 байтов являются своего рода заголовком, а последние 8 байтов имеют некоторое соответствие ярлыков?

Как я могу построить собственные данные? Ни Blob Tutorial, ни Layers Definition не дают о необходимых форматах. Мое намерение - не использовать данные изображения, а временные ряды

Ответы

Ответ 1

Я понял, что буферы протокола должны входить в игру здесь. Поэтому я попытался десериализовать его против некоторых типов, определенных в caffe.proto.

Datum выглядит идеально:

{Caffe.Datum}
    Channels: 1
    Data: {byte[784]}
    Encoded: false
    FloatData: Count = 0
    Height: 28
    Label: 7
    Width: 28

Итак, ответ прост: Это сериализованное представление экземпляра типизированного набора данных, определенного для caffe.proto

Btw. поскольку английский не является моим родным языком, мне пришлось сначала понять, что "Datum" - это единственная форма "данных"

Когда дело доходит до использования ваших собственных данных, оно структурируется следующим образом:

Обычными параметрами blob для данных являются номер N x channel K x высота H x ширина W. Память Blob имеет большое значение в макете, поэтому последняя /самый правый размер изменяется быстрее всего. Например, значение по индексу (n, k, h, w) физически находится в индексе ((n * K + k) * H + h) * W + w.

Смотрите Blobs, Layers и Nets: анатомия модели Caffe для справки

Ответ 2

Я могу попытаться ответить на ваш второй вопрос. Поскольку Caffe принимает данные только в виде нескольких выбранных форматов, таких как lmdb, hdf5 и т.д., Лучше всего конвертировать (или генерировать - в случае синтетических данных) ваши данные в эти форматы. Следующие ссылки могут помочь вам в этом. Если у вас возникли проблемы с import hdf5 в Python, вы можете обратиться к этой странице.

Создание файла LMDB в Python

Запись файла HDF5 в Python

HDF5 больше примеров