Свертка изображений в пространственной области

Я пытаюсь реплицировать результат этой ссылки, используя линейную свертку в пространственной области.

Сначала изображения преобразуются в 2d double массивы и затем свертываются. Изображение и ядро имеют одинаковый размер. Изображение дополняется до свертки и обрезается соответственно после свертки.

По сравнению со сверткой на основе FFT, выход является странным и неправильным.

Обратите внимание, что я получил следующий результат изображения Matlab, который соответствует моему выходу С# FFT:

^{Обновление-1: после комментария @Ben Voigt я изменил Rescale() чтобы заменить 255.0 на 1 и, следовательно, результат значительно улучшился.}^{Но, тем не менее, выход не соответствует выходу FFT (что является правильным).}

^{Обновление-2: После комментария @Cris Luengo, я заполнил изображение путем сшивания, а затем выполнил пространственную свертку.}^{Результатом стало следующее:}

^{Таким образом, результат хуже предыдущего.}^{Но это имеет сходство со вторым результатом связанного ответа, что означает, что круговая свертка не является решением.}

^{Обновление-3: я использовал функцию Sum() предложенную ответом @Cris Luengo.}^{Результатом является более совершенная версия **Update-1** :}

^{Но он по-прежнему не на 100% похож на версию FFT.}

^{Обновление-4: После комментария @Cris Luengo, я вычитал два результата, чтобы увидеть разницу:}

^{1. пространственная минусовая частотная область}^{2. частота минус пространственная область}

_{Похоже, разница существенна, что означает, что пространственная свертка выполняется неправильно.}

^{(Сообщите мне, если вам нужно больше исходного кода для просмотра.)}

Ответы

Ответ 1

Я нашел решение по этой ссылке. Основная идея заключалась в том, чтобы ввести offset и factor.

factor - сумма всех значений в ядре.
offset - произвольное значение для дальнейшего исправления вывода.

@Крис Luengo ответ также поднял действительную точку.

В данной ссылке указан следующий исходный код:

    private void SafeImageConvolution(Bitmap image, ConvMatrix fmat) 
    { 
        //Avoid division by 0 
        if (fmat.Factor == 0) 
            return; 

        Bitmap srcImage = (Bitmap)image.Clone(); 

        int x, y, filterx, filtery; 
        int s = fmat.Size / 2; 
        int r, g, b; 
        Color tempPix; 

        for (y = s; y < srcImage.Height - s; y++) 
        { 
            for (x = s; x < srcImage.Width - s; x++) 
            { 
                r = g = b = 0; 

                // Convolution 
                for (filtery = 0; filtery < fmat.Size; filtery++) 
                { 
                    for (filterx = 0; filterx < fmat.Size; filterx++) 
                    { 
                        tempPix = srcImage.GetPixel(x + filterx - s, y + filtery - s); 

                        r += fmat.Matrix[filtery, filterx] * tempPix.R; 
                        g += fmat.Matrix[filtery, filterx] * tempPix.G; 
                        b += fmat.Matrix[filtery, filterx] * tempPix.B; 
                    } 
                } 

                r = Math.Min(Math.Max((r / fmat.Factor) + fmat.Offset, 0), 255); 
                g = Math.Min(Math.Max((g / fmat.Factor) + fmat.Offset, 0), 255); 
                b = Math.Min(Math.Max((b / fmat.Factor) + fmat.Offset, 0), 255); 

                image.SetPixel(x, y, Color.FromArgb(r, g, b)); 
            } 
        } 
    }

Ответ 2

Ваш текущий результат больше похож на функцию автокорреляции, чем свертка Лены. Я думаю, проблема может быть в вашей функции Sum.

Если вы посмотрите на определение суммы свертки, вы увидите, что ядро (или изображение не имеет значения) зеркалировано:

sum_m( f[n-m] g[m] )

Для одной функции m появляется со знаком плюса, а для другого - знаком минус.

Вам нужно будет изменить функцию Sum чтобы прочитать изображение mask1 в правильном порядке:

static double Sum(double[,] paddedImage1, double[,] mask1, int startX, int startY)
{
    double sum = 0;

    int maskWidth = mask1.GetLength(0);
    int maskHeight = mask1.GetLength(1);

    for (int y = startY; y < (startY + maskHeight); y++)
    {
        for (int x = startX; x < (startX + maskWidth); x++)
        {
            double img = paddedImage1[x, y];
            double msk = mask1[maskWidth - x + startX - 1, maskHeight - y + startY - 1];
            sum = sum + (img * msk);
        }
    }

    return sum;
}

Другой вариант - передать зеркальную версию mask1 в эту функцию.