Как я могу реализовать пользовательский RNN (в частности, ESN) в Tensorflow?
Я пытаюсь определить свой собственный RNNCell (Echo State Network) в Tensorflow, согласно ниже определению.
x (t + 1) = tanh (Win * u (t) + W * x (t) + Wfb * y (t))
y (t) = Wout * z (t)
z (t) = [x (t), u (t)]
x - состояние, u вводится, y выводится. Win, W и Wfb не являются обучаемыми. Все веса случайным образом инициализируются, но W модифицируется следующим образом: "Установите определенный процент элементов W в 0, масштабируйте W, чтобы сохранить его спектральный радиус ниже 1,0
У меня есть этот код для генерации уравнения.
x = tf.Variable(tf.reshape(tf.zeros([N]), [-1, N]), trainable=False, name="state_vector")
W = tf.Variable(tf.random_normal([N, N], 0.0, 0.05), trainable=False)
# TODO: setup W according to the ESN paper
W_x = tf.matmul(x, W)
u = tf.placeholder("float", [None, K], name="input_vector")
W_in = tf.Variable(tf.random_normal([K, N], 0.0, 0.05), trainable=False)
W_in_u = tf.matmul(u, W_in)
z = tf.concat(1, [x, u])
W_out = tf.Variable(tf.random_normal([K + N, L], 0.0, 0.05))
y = tf.matmul(z, W_out)
W_fb = tf.Variable(tf.random_normal([L, N], 0.0, 0.05), trainable=False)
W_fb_y = tf.matmul(y, W_fb)
x_next = tf.tanh(W_in_u + W_x + W_fb_y)
y_ = tf.placeholder("float", [None, L], name="train_output")
Моя проблема в два раза. Сначала я не знаю, как реализовать это как суперкласс RNNCell. Во-вторых, я не знаю, как создать тензор W в соответствии с вышеприведенной спецификацией.
Любая помощь по любому из этих вопросов очень ценится. Может быть, я могу выяснить способ подготовки W, но я уверен, что, черт возьми, я не понимаю, как реализовать свой собственный RNN как суперкласс RNNCell.
Ответы
Ответ 1
Чтобы дать краткое описание:
Посмотрите в исходном коде TensorFlow в разделе python/ops/rnn_cell.py
, также посмотрите, как подкласс RNNCell. Это обычно так:
class MyRNNCell(RNNCell):
def __init__(...):
@property
def output_size(self):
...
@property
def state_size(self):
...
def __call__(self, input_, state, name=None):
... your per-step iteration here ...