Ответ 1
Как исправить ошибку
Есть две возможные причины возникновения этой ошибки:
- Имя файла написано с ошибкой.
- Файл изображения не находится в текущем рабочем каталоге.
Чтобы решить эту проблему, вы должны убедиться, что имя файла написано правильно (выполните проверку с учетом регистра на всякий случай) и файл изображения находится в текущем рабочем каталоге (здесь есть две опции: вы можете изменить текущий рабочий каталог в вашей IDE или укажите полный путь к файлу).
Средний цвет против доминирующего цвета
Затем, чтобы рассчитать "средний цвет", вы должны решить, что вы подразумеваете под этим. На изображении в градациях серого это просто среднее значение уровней серого по всему изображению, но в цветах нет такого понятия, как "среднее". Действительно, цвета обычно представлены через трехмерные векторы, в то время как уровни серого являются скалярами. Хорошо усреднять скаляры, но не имеет смысла усреднять векторы.
Разделение изображения на хроматические компоненты и получение среднего значения для каждого компонента - возможный путь. Однако такой подход может дать бессмысленный цвет. То, что вы действительно хотите, это доминирующий цвет, а не средний цвет.
Реализация
Позвольте пройти код медленно. Начнем с импорта необходимых модулей и чтения изображения:
import cv2
import numpy as np
from skimage import io
img = io.imread('/img/8290756f2f65c46a0d638f95cf573a2e.png')[:, :, :-1]
Затем мы можем вычислить среднее значение для каждого хроматического канала, следуя методу, аналогичному методу, предложенному @Ruan B.:
average = img.mean(axis=0).mean(axis=0)
Затем мы применяем кластеризацию k-средних для создания палитры с наиболее представительными цветами изображения (в этом игрушечном примере для n_colors
было установлено значение 5
).
pixels = np.float32(img.reshape(-1, 3))
n_colors = 5
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 200, .1)
flags = cv2.KMEANS_RANDOM_CENTERS
_, labels, palette = cv2.kmeans(pixels, n_colors, None, criteria, 10, flags)
_, counts = np.unique(labels, return_counts=True)
И, наконец, доминирующий цвет - это цвет палитры, который чаще всего встречается на квантованном изображении:
dominant = palette[np.argmax(counts)]
Сравнение результатов
Чтобы проиллюстрировать различия между обоими подходами, я использовал следующий пример изображения:
Полученные значения для среднего цвета, то есть цвета, составляющими которого являются средние значения трех хроматических каналов, и цвета, рассчитанного с помощью кластеризации k-средних, преобладающего цвета, довольно различны:
In [30]: average
Out[30]: array([91.63179156, 69.30190754, 58.11971896])
In [31]: dominant
Out[31]: array([179.3999 , 27.341282, 2.294441], dtype=float32)
Давайте посмотрим, как эти цвета выглядят, чтобы лучше понять различия между обоими подходами. В левой части рисунка ниже отображается средний цвет. Очевидно, что вычисленный средний цвет не правильно описывает содержание цвета исходного изображения. На самом деле в исходном изображении нет ни одного пикселя с таким цветом. Правая часть рисунка показывает пять наиболее представительных цветов, отсортированных сверху вниз в порядке убывания важности (частоты появления). Эта палитра дает понять, что доминирующим цветом является красный, что согласуется с тем фактом, что наибольшая область однородного цвета в исходном изображении соответствует красной части Lego.
Этот код используется для генерации рисунка выше:
import matplotlib.pyplot as plt
avg_patch = np.ones(shape=img.shape, dtype=np.uint8)*np.uint8(average)
indices = np.argsort(counts)[::-1]
freqs = np.cumsum(np.hstack([[0], counts[indices]/counts.sum()]))
rows = np.int_(img.shape[0]*freqs)
dom_patch = np.zeros(shape=img.shape, dtype=np.uint8)
for i in range(len(rows) - 1):
dom_patch[rows[i]:rows[i + 1], :, :] += np.uint8(palette[indices[i]])
fig, (ax0, ax1) = plt.subplots(1, 2, figsize=(12,6))
ax0.imshow(avg_patch)
ax0.set_title('Average color')
ax0.axis('off')
ax1.imshow(dom_patch)
ax1.set_title('Dominant colors')
ax1.axis('off')
plt.show(fig)
TL; DR ответ
Таким образом, несмотря на то, что вычисление среднего цвета - как предложено в @Ruan B. ответ - является технически правильным с математической точки зрения, полученный результат может неадекватно представлять цветовое содержание изображения. Более разумный подход заключается в определении доминирующего цвета посредством векторного квантования (кластеризации).