TensorFlow: тензор Dst не инициализирован

Учебник MNIST For ML Beginners дает мне ошибку при запуске print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels})). Все остальное работает нормально.

Я просто переключился на более новую версию CUDA, так что, возможно, это имеет какое-то отношение к этому? Похоже, эта ошибка заключается в копировании тензора на графический процессор.

print(sess.run(accuracy, feed_dict={x: batch_xs, y_: batch_ys})) работает нормально. Это заставляет меня подозревать, что проблема в том, что я пытаюсь передать огромный тензор на графический процессор, и он не может его принять. Небольшие тензоры, такие как мини-барабан, отлично работают.

Я выяснил, насколько велики тензоры, чтобы вызвать эту проблему:

Ответы

Ответ 1

Для краткости это сообщение об ошибке генерируется, когда памяти недостаточно для обработки размера партии.

Расширение на Steven (пока я не могу оставлять комментарии), вот несколько трюков для мониторинга/управления использованием памяти в Tensorflow:

Чтобы отслеживать использование памяти во время прогонов, рассмотрите метаданные запуска ведения журнала. Затем вы можете увидеть использование памяти на node на вашем графике в Tensorboard. Дополнительную информацию см. на странице Страница информации о тензонах.
По умолчанию Tensorflow попытается выделить как можно больше памяти GPU. Вы можете изменить это с помощью параметров GPUConfig, чтобы Tensorflow выделял столько памяти, сколько необходимо. См. документация об этом. Там вы также найдете вариант, который позволит вам выделять определенную часть вашей памяти GPU (я иногда обнаружил, что это может быть сломан.).

Ответ 2

Имейте в виду, что ec2 g2.8xlarge имеет только 4 ГБ памяти gpu.
https://aws.amazon.com/ec2/instance-types/

У меня нет хорошего способа узнать, сколько пространства занимает модель, кроме запуска с размером партии 1, тогда вы можете вычесть, сколько пространства занимает одно изображение.

Оттуда вы можете определить максимальный размер партии. Это должно работать, но я думаю, что tensorflow выделяет память gpu, динамически подобную факелу, и в отличие от caffe, которая блокирует пространство max gpu, которое оно требует от get go. Поэтому вы, вероятно, захотите быть консервативными с максимальным размером партии.