Минимальная требуемая способность Cuda - 3,5
После установки TensorFlow и его зависимостей от экземпляра g2.2xlarge EC2 я попытался запустить пример MNIST с начальной страницы:
python tensorflow/models/image/mnist/convolutional.py
Но я получаю следующее предупреждение:
I tensorflow/core/common_runtime/gpu/gpu_device.cc:611] Ignoring gpu device
(device: 0, name: GRID K520, pci bus id: 0000:00:03.0) with Cuda compute
capability 3.0. The minimum required Cuda capability is 3.5.
Это жесткое требование? Любой шанс, что я мог бы прокомментировать эту проверку в вилке TensorFlow? Было бы неплохо иметь возможность обучать модели в AWS.
Ответы
Ответ 1
В настоящее время официально поддерживаются только графические процессоры с возможностью вычисления >= 3.5. Тем не менее, пользователь GitHub @infojunkie предложил патч, который позволяет использовать TensorFlow с графическим процессором с вычислительной способностью 3.0.
Официальное исправление находится в разработке. Между тем, ознакомьтесь с обсуждением проблемы GitHub для добавления этой поддержки.
Ответ 2
На официальной странице официальной страницы установки есть раздел, который поможет вам включить Cuda 3, но вам нужно создать Tensorflow из источника.
$ TF_UNOFFICIAL_SETTING=1 ./configure
# Same as the official settings above
WARNING: You are configuring unofficial settings in TensorFlow. Because some
external libraries are not backward compatible, these settings are largely
untested and unsupported.
Please specify a list of comma-separated Cuda compute capabilities you want to
build with. You can find the compute capability of your device at:
https://developer.nvidia.com/cuda-gpus.
Please note that each additional compute capability significantly increases
your build time and binary size. [Default is: "3.5,5.2"]: 3.0
Setting up Cuda include
Setting up Cuda lib64
Setting up Cuda bin
Setting up Cuda nvvm
Configuration finished
Ответ 3
Есть простой трюк. Вам даже не нужно создавать TF из источников.
В файле tensorflow\python\_pywrap_tensorflow.pyd
есть два вхождения регулярного выражения 3\.5.*5\.2
. Просто замените оба 3.5
на 3.0
.
Протестировано в Windows 10, Anaconda 4.2.13, Python 3.5.2, TensorFlow 0.12, CUDA 8, NVidia GTX 660m (CUDA cap. 3.0).