Как предсказать входное изображение с помощью обученной модели в Keras?
Я только начинаю с keras и машинного обучения вообще.
Я подготовил модель для классификации изображений из 2 классов и сохранил ее с помощью model.save()
. Вот код, который я использовал:
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K
# dimensions of our images.
img_width, img_height = 320, 240
train_data_dir = 'data/train'
validation_data_dir = 'data/validation'
nb_train_samples = 200 #total
nb_validation_samples = 10 # total
epochs = 6
batch_size = 10
if K.image_data_format() == 'channels_first':
input_shape = (3, img_width, img_height)
else:
input_shape = (img_width, img_height, 3)
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(1))
model.add(Activation('sigmoid'))
model.compile(loss='binary_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
# this is the augmentation configuration we will use for training
train_datagen = ImageDataGenerator(
rescale=1. / 255,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True)
# this is the augmentation configuration we will use for testing:
# only rescaling
test_datagen = ImageDataGenerator(rescale=1. / 255)
train_generator = train_datagen.flow_from_directory(
train_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode='binary')
validation_generator = test_datagen.flow_from_directory(
validation_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode='binary')
model.fit_generator(
train_generator,
steps_per_epoch=nb_train_samples // batch_size,
epochs=epochs,
validation_data=validation_generator,
validation_steps=5)
model.save('model.h5')
Он успешно тренировался с точностью 0,98, что довольно хорошо. Чтобы загрузить и протестировать эту модель на новых изображениях, я использовал приведенный ниже код:
from keras.models import load_model
import cv2
import numpy as np
model = load_model('model.h5')
model.compile(loss='binary_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
img = cv2.imread('test.jpg')
img = cv2.resize(img,(320,240))
img = np.reshape(img,[1,320,240,3])
classes = model.predict_classes(img)
print classes
Он выводит:
[[0]]
Почему бы ему не выдавать фактическое имя класса и почему [[0]]
?
Спасибо заранее.
Ответы
Ответ 1
Выводы kerasrealtc_classes (docs). Массив массива предсказаний классов. Который в вашем модельном случае является индексом нейрона высшей активации из вашего последнего (softmax) слоя. [[0]]
означает, что ваша модель предсказывает, что ваши тестовые данные относятся к классу 0. (Обычно вы будете передавать несколько изображений, и результат будет выглядеть как [[0], [1], [1], [0]]
)
Вы должны преобразовать вашу фактическую метку (например, 'cancer', 'not cancer'
) в двоичное кодирование (0
для "рак", 1
для "не рак") для двоичной классификации. Затем вы интерпретируете вывод вашей последовательности [[0]]
как имеющий метку класса 'cancer'
Ответ 2
Если кто-то все еще пытается делать прогнозы на изображениях, вот оптимизированный код для загрузки сохраненной модели и создания прогнозов:
# Modify 'test1.jpg' and 'test2.jpg' to the images you want to predict on
from keras.models import load_model
from keras.preprocessing import image
import numpy as np
# dimensions of our images
img_width, img_height = 320, 240
# load the model we saved
model = load_model('model.h5')
model.compile(loss='binary_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
# predicting images
img = image.load_img('test1.jpg', target_size=(img_width, img_height))
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
images = np.vstack([x])
classes = model.predict_classes(images, batch_size=10)
print classes
# predicting multiple images at once
img = image.load_img('test2.jpg', target_size=(img_width, img_height))
y = image.img_to_array(img)
y = np.expand_dims(y, axis=0)
# pass the list of multiple images np.vstack()
images = np.vstack([x, y])
classes = model.predict_classes(images, batch_size=10)
# print the classes, the images belong to
print classes
print classes[0]
print classes[0][0]
Ответ 3
Вы можете использовать model.predict()
чтобы предсказать класс отдельного изображения следующим образом [doc]:
# load_model_sample.py
from keras.models import load_model
from keras.preprocessing import image
import matplotlib.pyplot as plt
import numpy as np
import os
def load_image(img_path, show=False):
img = image.load_img(img_path, target_size=(150, 150))
img_tensor = image.img_to_array(img) # (height, width, channels)
img_tensor = np.expand_dims(img_tensor, axis=0) # (1, height, width, channels), add a dimension because the model expects this shape: (batch_size, height, width, channels)
img_tensor /= 255. # imshow expects values in the range [0, 1]
if show:
plt.imshow(img_tensor[0])
plt.axis('off')
plt.show()
return img_tensor
if __name__ == "__main__":
# load model
model = load_model("model_aug.h5")
# image path
img_path = '/media/data/dogscats/test1/3867.jpg' # dog
#img_path = '/media/data/dogscats/test1/19.jpg' # cat
# load a single image
new_image = load_image(img_path)
# check prediction
pred = model.predict(new_image)
В этом примере изображение загружается как numpy
массив с формой (1, height, width, channels)
. Затем мы загружаем его в модель и прогнозируем его класс, возвращаемый как реальное значение в диапазоне [0, 1] (двоичная классификация в этом примере).
Ответ 4
Это потому, что вы получаете числовое значение, связанное с классом. Например, если у вас есть два класса кошек и собак, Keras свяжет их числовые значения 0 и 1. Чтобы получить соответствие между вашими классами и связанным с ними числовым значением, вы можете использовать
>>> classes = train_generator.class_indices
>>> print(classes)
{'cats': 0, 'dogs': 1}
Теперь вы знаете соответствие между вашими классами и индексами. Так что теперь вы можете сделать это
if classes[0][0] == 1: prediction = 'dog' else: prediction = 'cat'
Ответ 5
Пересылка примера с помощью @ritiek, я тоже новичок в ML, возможно, такое форматирование поможет увидеть имя вместо номера класса.
images = np.vstack([x, y])
prediction = model.predict(images)
print(prediction)
i = 1
for things in prediction:
if(things == 0):
print('%d.It is cancer'%(i))
else:
print('%d.Not cancer'%(i))
i = i + 1
Ответ 6
От обученной модели, как я могу проверить другое изображение.
classes = model.predict_classes(images, batch_size=10)
classes = classes[0][0]
if classes == 0:
print('its a cat')
else:
print('its a dog')
В: Я новичок в искусственном интеллекте. Как мне проверить другой образ, а не кошку или собаку? Что если я наткнулся на zebra.jpg в моем тестовом наборе? Сверху код это даст как кот. Есть ли способ, которым я могу проверить или обучить мою модель? Заранее спасибо