Извлечь ограничительную рамку и сохранить ее как изображение

Предположим, что у вас есть следующее изображение:

Теперь я хочу извлечь на отдельные изображения каждую из независимых букв, для этой задачи я восстановил контуры, а затем нарисовал ограничивающий прямоугольник, в этом случае для символа 'a':

После этого я хочу извлечь каждый из полей (в этом случае для буквы "a" ) и сохранить его в файле изображения.

Ответы

Ответ 1

Следующее даст вам одну букву

letter = im[y:y+h,x:x+w]

Ответ 2

Вот подход:

Преобразовать изображение в оттенки серого
Порог Оцу для получения двоичного изображения
Найти контуры
Итерация по контурам и извлечение ROI с использованием Numpy Slicing

После нахождения контуров мы используем cv2.boundingRect(), чтобы получить координаты ограничительного прямоangularьника для каждой буквы.

x,y,w,h = cv2.boundingRect(c)

Чтобы извлечь ROI, мы используем Numpy Slicing

ROI = image[y:y+h, x:x+w]

Поскольку у нас есть координаты ограничительного прямоangularьника, мы можем нарисовать зеленые ограничивающие рамки

cv2.rectangle(copy,(x,y),(x+w,y+h),(36,255,12),2)

Здесь обнаружены буквы

Здесь каждая сохраненная буква ROI

import cv2

image = cv2.imread('1.png')
copy = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray,0,255,cv2.THRESH_OTSU + cv2.THRESH_BINARY)[1]

cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

ROI_number = 0
for c in cnts:
    x,y,w,h = cv2.boundingRect(c)
    ROI = image[y:y+h, x:x+w]
    cv2.imwrite('ROI_{}.png'.format(ROI_number), ROI)
    cv2.rectangle(copy,(x,y),(x+w,y+h),(36,255,12),2)
    ROI_number += 1

cv2.imshow('thresh', thresh)
cv2.imshow('copy', copy)
cv2.waitKey()