Как использовать расширенные уровни активации в Keras?
Это мой код, который работает, если я использую другие уровни активации, такие как tanh:
model = Sequential()
act = keras.layers.advanced_activations.PReLU(init='zero', weights=None)
model.add(Dense(64, input_dim=14, init='uniform'))
model.add(Activation(act))
model.add(Dropout(0.15))
model.add(Dense(64, init='uniform'))
model.add(Activation('softplus'))
model.add(Dropout(0.15))
model.add(Dense(2, init='uniform'))
model.add(Activation('softmax'))
sgd = SGD(lr=0.1, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='binary_crossentropy', optimizer=sgd)
model.fit(X_train, y_train, nb_epoch=20, batch_size=16, show_accuracy=True, validation_split=0.2, verbose = 2)
В этом случае он не работает и говорит: "TypeError: объект" PReLU "не может быть вызван", и ошибка вызывается в строке model.compile. Почему это так? Все незавершенные функции активации работают. Однако ни одна из расширенных функций активации, включая эту, не работает.
Ответы
Ответ 1
Правильный способ использования расширенных активаций, таких как PReLU, - использовать его с помощью метода add()
и не обертывать его с помощью класса Activation
. Пример:
model = Sequential()
act = keras.layers.advanced_activations.PReLU(init='zero', weights=None)
model.add(Dense(64, input_dim=14, init='uniform'))
model.add(act)
Ответ 2
Если вы используете API Model
в Keras, вы можете напрямую вызвать функцию внутри Keras Layer
. Вот пример:
from keras.models import Model
from keras.layers import Dense, Input
# using prelu?
from keras.layers.advanced_activations import PReLU
# Model definition
# encoder
inp = Input(shape=(16,))
lay = Dense(64, kernel_initializer='uniform',activation=PReLU(),
name='encoder')(inp)
#decoder
out = Dense(2,kernel_initializer='uniform',activation=PReLU(),
name='decoder')(lay)
# build the model
model = Model(inputs=inp,outputs=out,name='cae')
Ответ 3
Для функционального API Keras я считаю, что правильный способ объединить Dense и PRelu (или любую другую расширенную активацию) - использовать его следующим образом:
focus_tns =focus_lr(enc_bidi_tns)
enc_dense_lr = k.layers.Dense(units=int(hidden_size))
enc_dense_tns = k.layers.PReLU()(enc_dense_lr(focus_tns))
dropout_lr = k.layers.Dropout(0.2)
dropout_tns = dropout_lr(enc_dense_tns)
enc_dense_lr2 = k.layers.Dense(units=int(hidden_size/4))
enc_dense_tns2 = k.layers.PReLU()(enc_dense_lr2(dropout_tns))
конечно, нужно параметризовать слои по задаче