Добавьте предварительную обработку Tensorflow к существующей модели Keras (для использования в Tensorflow Serving)

Я хотел бы включить мою пользовательскую логику предварительной обработки в экспортированную модель Keras для использования в службе Tensorflow.

Моя предварительная обработка выполняет токенизацию строк и использует внешний словарь для преобразования каждого токена в индекс для ввода в слой Embedding:

Так как модель будет использоваться в Tensorflow Serving, я хочу включить всю логику предварительной обработки в саму модель (закодированную в экспортированном файле модели).

В: Как это сделать, используя только библиотеку Keras?

Я нашел данное руководство объясняет, как объединить Keras и Tensorflow. Но я все еще не уверен, как экспортировать все как одну модель.

Я знаю, что Tensorflow имеет встроенное разделение строк, file I/O и поиск словаря.

Логика предварительной обработки с использованием операций Tensorflow:

В: Как я могу использовать предварительные операции предварительной обработки Tensorflow и мои слои Keras вместе, чтобы как обучать, так и затем экспортировать модель как "черный ящик" для использования в службе Tensorflow?

Ответы

Ответ 1

Я понял это, поэтому я собираюсь ответить на свой вопрос здесь.

Здесь суть:

Сначала (в отдельном файле кода) я обучил модель, используя Keras, только с моими собственными функциями предварительной обработки, экспортировал файл весов модели Keras и словарь для токенов в индекс.

Затем я скопировал только архитектуру модели Keras, установил вход в качестве предварительно обработанного тензорного вывода, загрузил файл весов из ранее обученной модели Keras и заложил его между операциями предварительной обработки Tensorflow и экспортером Tensorflow.

Конечный продукт:

import tensorflow as tf
from keras import backend as K
from keras.models import Sequential, Embedding, LSTM, Dense
from tensorflow.contrib.session_bundle import exporter
from tensorflow.contrib.lookup import HashTable, TextFileInitializer

# Initialize Keras with Tensorflow session
sess = tf.Session()
K.set_session(sess)

# Token to index lookup dictionary
token_to_idx_path = '...'
token_to_idx_dict = HashTable(TextFileInitializer(token_to_idx_path, tf.string, 0, tf.int64, 1, delimiter='\t'), 0)

maxlen = ...

# Pre-processing sub-graph using Tensorflow operations
input = tf.placeholder(tf.string, name='input')
sparse_tokenized_input = tf.string_split(input)
tokenized_input = tf.sparse_tensor_to_dense(sparse_tokenized_input, default_value='')
token_idxs = token_to_idx_dict.lookup(tokenized_input)
token_idxs_padded = tf.pad(token_idxs, [[0,0],[0,maxlen]])
token_idxs_embedding = tf.slice(token_idxs_padded, [0,0], [-1,maxlen])

# Initialize Keras model
model = Sequential()
e = Embedding(max_features, 128, input_length=maxlen)
e.set_input(token_idxs_embedding)
model.add(e)
model.add(LSTM(128, activation='sigmoid'))
model.add(Dense(num_classes, activation='softmax'))

# Load weights from previously trained Keras model
weights_path = '...'
model.load_weights(weights_path)

K.set_learning_phase(0)

# Export model in Tensorflow format
# (Official tutorial: https://github.com/tensorflow/serving/blob/master/tensorflow_serving/g3doc/serving_basic.md)
saver = tf.train.Saver(sharded=True)
model_exporter = exporter.Exporter(saver)
signature = exporter.classification_signature(input_tensor=model.input, scores_tensor=model.output)
model_exporter.init(sess.graph.as_graph_def(), default_graph_signature=signature)
model_dir = '...'
model_version = 1
model_exporter.export(model_dir, tf.constant(model_version), sess)

# Input example
with sess.as_default():
    token_to_idx_dict.init.run()
    sess.run(model.output, feed_dict={input: ["this is a raw input example"]})

Ответ 2

Принятый ответ очень полезен, однако он использует устаревший API Keras, как упоминалось в @Qululu, и устаревший API обслуживания TF (Exporter), и он не показывает, как экспортировать модель, чтобы ее ввод был исходным заполнителем tf (по сравнению с Keras model.input, который является постпроцессингом). Ниже приводится версия, которая хорошо работает как TF v1.4 и Keras 2.1.2:

sess = tf.Session()
K.set_session(sess)

K._LEARNING_PHASE = tf.constant(0)
K.set_learning_phase(0)

max_features = 5000
max_lens = 500

dict_table = tf.contrib.lookup.HashTable(tf.contrib.lookup.TextFileInitializer("vocab.txt",tf.string, 0, tf.int64, TextFileIndex.LINE_NUMBER, vocab_size=max_features, delimiter=" "), 0)

x_input = tf.placeholder(tf.string, name='x_input', shape=(None,))
sparse_tokenized_input = tf.string_split(x_input)
tokenized_input = tf.sparse_tensor_to_dense(sparse_tokenized_input, default_value='')
token_idxs = dict_table.lookup(tokenized_input)
token_idxs_padded = tf.pad(token_idxs, [[0,0],[0, max_lens]])
token_idxs_embedding = tf.slice(token_idxs_padded, [0,0], [-1, max_lens])

model = Sequential()
model.add(InputLayer(input_tensor=token_idxs_embedding, input_shape=(None, max_lens)))

 ...REST OF MODEL...

model.load_weights("model.h5")

x_info = tf.saved_model.utils.build_tensor_info(x_input)
y_info = tf.saved_model.utils.build_tensor_info(model.output)

prediction_signature = tf.saved_model.signature_def_utils.build_signature_def(inputs={"text": x_info}, outputs={"prediction":y_info}, method_name=tf.saved_model.signature_constants.PREDICT_METHOD_NAME)

builder = saved_model_builder.SavedModelBuilder("/path/to/model")

legacy_init_op = tf.group(tf.tables_initializer(), name='legacy_init_op')

init_op = tf.group(tf.global_variables_initializer(), tf.local_variables_initializer())
sess.run(init_op)


# Add the meta_graph and the variables to the builder
builder.add_meta_graph_and_variables(
  sess, [tag_constants.SERVING],
  signature_def_map={
       signature_constants.DEFAULT_SERVING_SIGNATURE_DEF_KEY:
           prediction_signature,
  },
  legacy_init_op=legacy_init_op)

builder.save()

ОБНОВЛЕНИЕ Выполнение предварительной обработки для вывода с помощью Tensorflow является операцией ЦП и не выполняется эффективно, если модель развернута на сервере GPU. GPU действительно плохо работает, а пропускная способность очень низкая. Поэтому мы исключили это для эффективной предварительной обработки в клиентском процессе.