Последовательность Tensorflow Sequence для последовательности с использованием API seq2seq (версия 1.1 и выше)

Я использую TensorFlow v: 1.1, и я хотел бы реализовать модель для последовательности, используя tf.contrib.seq2seq api. Однако мне трудно понять, как использовать все функции (BasicDecoder, Dynamic_decode, Helper, Training Helper...) для создания моей модели.

Вот моя настройка: я хотел бы "перевести" последовательность вектор-функций: (batch_size, encoder_max_seq_len, feature_dim) в последовательность разной длины (batch_size, decoder_max_len, 1).

У меня уже есть encoder, который является RNN с ячейкой LSTM, и я получаю его конечное состояние, которое я хотел бы передать декодеру в качестве начального ввода. У меня уже есть ячейка для моего декодера MultiRNNCell LSM. Не могли бы вы помочь мне построить последнюю часть, используя функции tf.contrib.seq2seq2 и dynamic_decode (пример кода или объяснений будет очень оценен)?

Ответы

Ответ 1

Уровень декодирования:

Декодирование состоит из двух частей из-за их различий во время training и inference:

Вход декодера на определенном временном шаге всегда поступает от выхода предыдущего временного шага. Но во время обучения выход фиксированныйк фактической цели (фактическая цель возвращается в качестве входного сигнала), и это показало, что она улучшает производительность.

Оба они обрабатываются с использованием методов из tf.contrib.seq2seq.

Основная функция для decoder: seq2seq.dynamic decoder(), которая выполняет динамическое декодирование:

tf.contrib.seq2seq.dynamic_decode(decoder,maximum_iterations)

В качестве входных данных используется экземпляр decoder и maximum_iterations=maximum seq length.

1.1 Пример decoder:

seq2seq.BasicDecoder(cell, helper, initial_state,output_layer)

Входы: cell (экземпляр RNNCell), helper (вспомогательный экземпляр), initial_state (начальное состояние декодера, которое должно быть выходным состоянием кодировщика) и output_layer (необязательный плотный слой в качестве выходов для прогнозирования)

1.2 Экземпляр RNNCell может быть rnn.MultiRNNCell().

1.3 Экземпляр helper - это тот, который отличается в training и inference. Во время training мы хотим, чтобы входы были поданы в декодер, а во время inference мы хотим, чтобы выход декодера в time-step (t) передавался в качестве входа в декодер в time step (t+1).

Для обучения: используется вспомогательная функция: seq2seq.TrainingHelper(inputs, sequence_length), который просто считывает входы.

Для вывода: мы вызываем вспомогательную функцию: seq2seq.GreedyEmbeddingHelper() or seqseq.SampleEmbeddingHelper(), который отличается тем, следует ли использовать argmax() or sampling(from a distribution) выходов и передает результат через слой внедрения, чтобы получить следующий вход.

Объединение: модель Seq2Seq

Получить состояние кодировщика из encoder layer и передать его в качестве initial_state в декодер.
Получите выходные данные decoder train и decoder inference с помощью seq2seq.dynamic_decoder(). Когда вы вызываете оба метода, убедитесь, что весы разделены. (Используйте variable_scope для повторного использования веса)
Затем тренируйте сеть, используя функцию потерь seq2seq.sequence_loss.

Ниже приведен пример кода здесь и здесь.