Как правильно управлять памятью и размером партии с помощью TensorFlow

Я использую TensorFlow для создания простой нейронной сети с обратной связью, и я использую пакеты с переменным размером. Я не использую GPU, у меня 8 ГБ оперативной памяти и работает на Python 3.5.2.

Моя проблема в том, что у меня есть несколько партий, которые слишком велики и генерируют типичную ошибку из памяти. Я понимаю, что это не проблема. Однако, если я использую Keras с TF-сервером, у меня нет этой проблемы. Я привел пример (с партиями с фиксированным размером), который иллюстрирует это.

Есть ли проблема с моей реализацией? Как я должен обрабатывать слишком большие партии?

Пример TensorFlow (память выхлопов)

Пример Keras (как-то обрабатывает размер партии)

Ответы

Ответ 1

Твой Y имеет неправильную форму, что может привести к тому, что tensorflow неправильно выводит форму тензоров (20000, 20000) вместо (20000, 6)), потребляя много памяти.

Y = np.reshape(Y, [n_observations, 1])

Таким образом, ваш заполнитель должен иметь ОДНУЮ форму:

net_input = tf.placeholder(tf.float32, shape=[None, n_input])
y_true = tf.placeholder(tf.float32, shape=[None, 1])

Ответ 2

Я думаю, что Keras переопределяет параметры конфигурации по умолчанию в TensorFlow. Ваш собственный код TensorFlow работает отлично с меньшими размерами партий (например, 10k, 15k) на графическом процессоре. Но с настройкой по умолчанию предполагается, что вам нужны преимущества графического процессора и проблема с OOM, потому что недостаточно памяти GPU.

Ваш пример TensorFlow отлично работает, когда вы меняете поведение по умолчанию на CPU (как вы указали в вопросе). Вот строки, которые я изменил, чтобы сделать это:

config = tf.ConfigProto(
    log_device_placement=True, allow_soft_placement=True
)
config.gpu_options.allow_growth = True


with tf.Session(config=config) as sess, \
        tf.device('cpu:0'):  # placeholders for input and target