Быстрый способ нарезать изображение на перекрывающиеся патчи и слить патчи к изображению

Попытка обрезать изображение в оттенках серого размером 100x100 в патчи размером 39x39, которые перекрываются, с шагом 1. Это означает, что следующий патч, который запускает один пиксель справа/или ниже, отличается от предыдущего патча в один дополнительный столбец/или ряд.

Грубая схема кода: сначала вычислите индексы для каждого патча, чтобы иметь возможность создавать 2D-массив патчей с изображения и иметь возможность создавать изображение из патчей:

"patches" - это 2D-массив с каждым столбцом, содержащим патч в векторной форме.

Эти исправления обрабатываются, каждый патч индивидуально, а затем снова объединяются вместе с изображением с предварительно вычисленными индексами.

По мере перекрытия патчей необходимо в конце умножить img на предварительно рассчитанные веса:

Мой код очень медленный, и скорость - это очень важная проблема, так как это должно быть сделано на ок. 10 ^ 8 патчей.

Функции get_indices_for_un_patchify и weights_unpatchify могут быть предварительно вычислены один раз, поэтому скорость - это всего лишь проблема для исправления и повторной проверки.

Я называю эти функции, например, со случайным изображением

Ответы

Ответ 1

Эффективный способ "патфицировать" массив, т.е. Получить массив окон в исходном массиве, - это создать представление с пользовательскими шагами, количество байтов для перехода к следующему элементу. Может быть полезно подумать о массиве numpy как (прославленном) фрагменте памяти, а затем шагами - способ сопоставления индексов по адресу памяти.

Например, в

a = np.arange(10).reshape(2, 5)

a.itemsize равно 4 (т.е. 4 байта или 32 бита для каждого элемента), а a.strides - (20, 4) (5 элементов, 1 элемент), так что a[1,2] ссылается на элемент, который равен 1*20 + 2*4 байта (или 1*5 + 2 элемента) после первого:

0 1 2 3 4
5 6 7 x x

Фактически, элементы помещаются в память один за другим, 0 1 2 3 4 5 6 7 xx но шаги позволяют нам индексировать его как 2D-массив.

Основываясь на этой концепции, мы можем переписать patchify следующим образом

def patchify(img, patch_shape):
    img = np.ascontiguousarray(img)  # won't make a copy if not needed
    X, Y = img.shape
    x, y = patch_shape
    shape = ((X-x+1), (Y-y+1), x, y) # number of patches, patch_shape
    # The right strides can be thought by:
    # 1) Thinking of 'img' as a chunk of memory in C order
    # 2) Asking how many items through that chunk of memory are needed when indices
    #    i,j,k,l are incremented by one
    strides = img.itemsize*np.array([Y, 1, Y, 1])
    return np.lib.stride_tricks.as_strided(img, shape=shape, strides=strides)

Эта функция возвращает представление img, поэтому память не выделяется и выполняется всего за несколько десятков микросекунд. Форма вывода не совсем то, что вы хотите, и на самом деле ее нужно скопировать, чтобы получить эту форму.

Нужно быть осторожным, имея дело с представлениями массива, которые намного больше, чем базовый массив, потому что операции могут инициировать копию, которая должна будет выделять много памяти. В вашем случае, поскольку массивы не слишком велики и не так много патчей, все должно быть хорошо.

Наконец, мы можем немного разбить массив патчей:

patches = patchify(img, (39,39))
contiguous_patches = np.ascontiguousarray(patches)
contiguous_patches.shape = (-1, 39**2)

Это не воспроизводит выходные данные вашей функции исправления, потому что вы разрабатываете исправления в порядке Fortran. Я рекомендую вам использовать это вместо этого

Это приводит к более естественному индексированию позже (т.е. Первый патч - патчи [0] вместо патчей [:, 0] для вашего решения).
Также проще в numpy использовать C-порядок везде, потому что вам нужно меньше набирать текст (вы избегаете таких вещей, как order = 'F', массивы создаются по заказу C по умолчанию...).

"Подсказки", если вы настаиваете: strides = img.itemsize * np.array([1, Y, Y, 1]), используйте .reshape(..., order='F') на contiguous_patches и, наконец, транспонируйте его .T