Как использовать расширенные уровни активации в Keras?

Это мой код, который работает, если я использую другие уровни активации, такие как tanh:

model = Sequential()
act = keras.layers.advanced_activations.PReLU(init='zero', weights=None)
model.add(Dense(64, input_dim=14, init='uniform'))
model.add(Activation(act))
model.add(Dropout(0.15))
model.add(Dense(64, init='uniform'))
model.add(Activation('softplus'))
model.add(Dropout(0.15))
model.add(Dense(2, init='uniform'))
model.add(Activation('softmax'))

sgd = SGD(lr=0.1, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='binary_crossentropy', optimizer=sgd)
model.fit(X_train, y_train, nb_epoch=20, batch_size=16, show_accuracy=True, validation_split=0.2, verbose = 2)

В этом случае он не работает и говорит: "TypeError: объект" PReLU "не может быть вызван", и ошибка вызывается в строке model.compile. Почему это так? Все незавершенные функции активации работают. Однако ни одна из расширенных функций активации, включая эту, не работает.

Ответы

Ответ 1

Правильный способ использования расширенных активаций, таких как PReLU, - использовать его с помощью метода add() и не обертывать его с помощью класса Activation. Пример:

model = Sequential()
act = keras.layers.advanced_activations.PReLU(init='zero', weights=None)
model.add(Dense(64, input_dim=14, init='uniform'))
model.add(act)

Ответ 2

Если вы используете API Model в Keras, вы можете напрямую вызвать функцию внутри Keras Layer. Вот пример:

from keras.models import Model
from keras.layers import Dense, Input
# using prelu?
from keras.layers.advanced_activations import PReLU

# Model definition
# encoder
inp = Input(shape=(16,))
lay = Dense(64, kernel_initializer='uniform',activation=PReLU(),
            name='encoder')(inp)
#decoder
out = Dense(2,kernel_initializer='uniform',activation=PReLU(), 
            name='decoder')(lay)

# build the model
model = Model(inputs=inp,outputs=out,name='cae')

Ответ 3

Для функционального API Keras я считаю, что правильный способ объединить Dense и PRelu (или любую другую расширенную активацию) - использовать его следующим образом:

focus_tns =focus_lr(enc_bidi_tns)

enc_dense_lr = k.layers.Dense(units=int(hidden_size))
enc_dense_tns = k.layers.PReLU()(enc_dense_lr(focus_tns))

dropout_lr = k.layers.Dropout(0.2)
dropout_tns = dropout_lr(enc_dense_tns)

enc_dense_lr2 = k.layers.Dense(units=int(hidden_size/4))
enc_dense_tns2 = k.layers.PReLU()(enc_dense_lr2(dropout_tns)) 

конечно, нужно параметризовать слои по задаче