В формате OpenCV: эффективное различие-из-Гаусса

Я пытаюсь реализовать разница guassians (собака), для конкретного случая обнаружения края. Как следует из названия алгоритма, на самом деле это довольно просто:

Mat g1, g2, result;
Mat img = imread("test.png", CV_LOAD_IMAGE_COLOR); 
GaussianBlur(img, g1, Size(1,1), 0);
GaussianBlur(img, g2, Size(3,3), 0);
result = g1 - g2;

однако у меня такое чувство, что это можно сделать более эффективно. Возможно ли это сделать за меньшее количество проходов над данными?

вопрос здесь научил меня разделяемым фильтрам, но я слишком новичок в обработке изображений, чтобы поймите, как применять их в данном случае.

может ли кто-нибудь дать мне несколько советов о том, как можно оптимизировать это?

2 ответов


разделяемые фильтры работают так же, как обычные гауссовы фильтры. Разделяемые фильтры быстрее, чем обычные Гауссовы, когда размер изображения большой. Ядро фильтра может быть сформировано аналитически, и фильтр может быть разделен на два 1-мерных вектора, один горизонтальный и один вертикальный.

например..

считать фильтр

1 2 1
2 4 2
1 2 1

этот фильтр можно разделить на горизонтальный вектор (H) 1 2 1 и вертикальный вектор(V) 1 2 1. Теперь эти наборы из двух фильтров, применяемых к изображению. Вектор H применяется к горизонтальным пикселям и V к вертикальным пикселям. Затем результаты складываются вместе, чтобы получить размытие Гаусса. Я предоставляю функцию, которая делает разделяемое гауссово размытие. (Пожалуйста, не спрашивайте меня о комментариях, я слишком ленив :P)

Mat sepConv(Mat input, int radius)
{


Mat sep;
Mat dst,dst2;

int ksize = 2 *radius +1;
double sigma = radius / 2.575;

Mat gau = getGaussianKernel(ksize, sigma,CV_32FC1);

Mat newgau = Mat(gau.rows,1,gau.type());
gau.col(0).copyTo(newgau.col(0));


filter2D(input, dst2, -1, newgau);


filter2D(dst2.t(), dst, -1, newgau);


return dst.t();


}

еще один метод для улучшения расчета размытия Гаусса-использовать БПФ. Свертка на основе FFT намного быстрее, чем метод разделяемого ядра, если данные размер довольно большой.

быстрый поиск Google предоставил мне следующую функцию

Mat Conv2ByFFT(Mat A,Mat B)
{
Mat C;
// reallocate the output array if needed
C.create(abs(A.rows - B.rows)+1, abs(A.cols - B.cols)+1, A.type());
Size dftSize;
// compute the size of DFT transform
dftSize.width = getOptimalDFTSize(A.cols + B.cols - 1);
dftSize.height = getOptimalDFTSize(A.rows + B.rows - 1);

// allocate temporary buffers and initialize them with 0's
Mat tempA(dftSize, A.type(), Scalar::all(0));
Mat tempB(dftSize, B.type(), Scalar::all(0));

// copy A and B to the top-left corners of tempA and tempB, respectively
Mat roiA(tempA, Rect(0,0,A.cols,A.rows));
A.copyTo(roiA);
Mat roiB(tempB, Rect(0,0,B.cols,B.rows));
B.copyTo(roiB);

// now transform the padded A & B in-place;
// use "nonzeroRows" hint for faster processing
Mat Ax = computeDFT(tempA);
Mat Bx = computeDFT(tempB);

// multiply the spectrums;
// the function handles packed spectrum representations well
mulSpectrums(Ax, Bx, Ax,0,true);

// transform the product back from the frequency domain.
// Even though all the result rows will be non-zero,
// we need only the first C.rows of them, and thus we
// pass nonzeroRows == C.rows
//dft(Ax, Ax, DFT_INVERSE + DFT_SCALE, C.rows);

updateMag(Ax);
Mat Cx = updateResult(Ax);

//idft(tempA, tempA, DFT_SCALE, A.rows + B.rows - 1 );
// now copy the result back to C.
Cx(Rect(0, 0, C.cols, C.rows)).copyTo(C);
//C.convertTo(C, CV_8UC1);
// all the temporary buffers will be deallocated automatically
return C;

}

надеюсь, что это помогает. :)


Я знаю, что этот пост старый. Но вопрос интереснейших и может interrest будущих читателей. Насколько мне известно, фильтр DoG не отделим. Таким образом, осталось два решения: 1) вычислить обе свертки, вызвав функцию GaussianBlur () дважды, затем вычесть два изображения 2) Сделайте ядро, вычисляя разницу двух гауссовых ядер, затем сверните его с изображением.

о том, какое решение будет быстрее: Решение 2, похоже, быстрее на первый взгляд, потому что convolves изображение только один раз. Но это не включает сепарабольный фильтр. Напротив, первое решение включает в себя два разделяемых фильтра и может быть быстрее в конечном итоге. (Я не знаю, как оптимизирована функция OpenCV GaussianBlur () и использует ли она разделяемые фильтры или нет. Но это вполне вероятно.)

однако, если использовать метод FFT для свертки, второе решение, безусловно, быстрее. Если у кого-то есть какие-либо советы, чтобы добавить или хочет исправить меня, пожалуйста, сделайте.