Ответ 1
Я бы порекомендовал использовать обучаемую начальную модель Google для распознавания образов. Пожалуйста, обратитесь к примеру "Как перенести начальный финальный слой для новых категорий" на веб-сайте tendorflow. Он находится в https://www.tensorflow.org/versions/r0.9/how_tos/image_retraining/index.html.
Использование обученной модели легко и может обеспечить разумную точность. Вы просто просто загружаете модель своим собственным набором данных. Последний класс классификации начала Google будет изменен, и мы будем тренировать только последний слой. Для нескольких тысяч изображений в нескольких категориях требуется только несколько часов, чтобы закончить обучение. Обратите внимание: для того, чтобы использовать этот пример, вам нужно построить shadoworflow из источника.
Я использую функцию обучения передаче и получаю очень хорошие результаты. Чтобы проиллюстрировать преимущества передачи обучения, я сравниваю "Передача обучения в обученном GoogleNet" с помощью "Построить и обучить 5-слойный Convnet с нуля". Задача классификации выполняется на 5000 изображений с 5 категориями.
См. этот простой пример: https://www.youtube.com/watch?v=QfNvhPx5Px8 (создайте классификатор изображений TensorFlow за 5 минут)