Создание пользовательского слоя Caffe в python

После разбора многих ссылок на создание слоев Caffe в Python я все еще испытываю трудности с пониманием нескольких концепций. Может ли кто-нибудь прояснить их?

Прошу прощения, если эти вопросы слишком очевидны, я просто не смог найти хорошее руководство, чтобы понять их и просить о помощи здесь.

Ответы

Ответ 1

Вы задали здесь много вопросов, я дам вам несколько моментов и указаний, которые, я надеюсь, прояснят вам вопросы. Я не буду однозначно отвечать на все ваши вопросы.

Кажется, что вас больше всего смущает разница между блобом и уровнем ввода/вывода. На самом деле, большинство слоев имеют один кадр в качестве входных данных и один кадр в качестве вывода, но это не всегда так. Рассмотрим слой потерь: он имеет два входа: предсказания и метки наземной истины. Таким образом, в этом случае bottom представляет собой вектор длины 2 (!), Где bottom[0] является (4-D) блобом, представляющим предсказания, а bottom[1] является еще одним блобом с метками. Таким образом, при построении такого слоя вы должны убедиться, что у вас есть точно (жестко закодированные) 2 входных капли (см., Например, ExactNumBottomBlobs() в AccuracyLayer определение).

То же самое можно сказать и для top blobs: действительно, в большинстве случаев для каждого слоя есть один top, но это не всегда так (см., например, AccuracyLayer). Следовательно, top также является вектором 4-D blobs, по одному для каждого слоя top. В большинстве случаев в этом векторе будет один элемент, но иногда вы можете найти более одного.

Я считаю, что это охватывает ваши вопросы 1,3,4 и 6.

Как и в reshape() (Q.2), эта функция не вызывается при каждом переходе вперед, она вызывается только тогда, когда сеть настроена на распределение пространства для входов/выходов и параметров.
Иногда вам может потребоваться изменить размер ввода для вашей сети (например, для сетей обнаружения), тогда вам нужно вызвать reshape() для всех слоев сети для размещения нового размера ввода.

Что касается параметра propagate_down (Q.7): поскольку слой может иметь более одного bottom, вам, в принципе, потребуется передать градиент всем bottom во время backprop. Однако каково значение градиента для дна label слоя потерь? Бывают случаи, когда вы не хотите распространять все bottom s: для этого используется этот флаг. (здесь с уровнем потерь с тремя bottom, которые ожидают градиента для всех из них).

Для получения дополнительной информации см. этот "Python" уровень учебника.

Ответ 2

Почему это должно быть 2?

Этот конкретный смысл говорит об эвклидовом слое потерь. Потери евклидова - это средняя квадратическая ошибка между векторами 2. Следовательно, на входном блоке должно быть 2 вектора. Длина каждого вектора должна быть одинаковой, поскольку она является разницей по элементам. Вы можете увидеть эту проверку в методе изменить.

Спасибо.