Извлечение функций HoG с помощью OpenCV

Я пытаюсь извлечь функции с помощью API Hog OpenCV, однако я не могу найти API, который позволяет мне это сделать.

то, что я пытаюсь сделать, это извлечь функции с помощью HoG из всего моего набора данных (заданное количество положительных и отрицательных изображений), а затем обучить свой собственный SVM.

Я заглянул в кабана.cpp под OpenCV, и это не помогло. Все коды похоронены в сложностях и необходимости обслуживать различные аппаратные средства (например, IPP Intel)

мой вопрос:

  1. есть ли API из OpenCV, который я могу использовать для извлечения всех этих функций / дескрипторов для подачи в SVM ? Если есть, как я могу использовать его для обучения моей собственной SVM ?
  2. если нет, существуют ли какие-либо существующие библиотеки, которые могли бы выполнить то же самое ?

пока я фактически портирую существующую библиотеку (http://hogprocessing.altervista.org/) от обработки (Java) до C++, но это все еще очень медленно, с обнаружение занимает около 16 секунд

кто-нибудь еще успешно извлекает функции свиньи, как вы обошли его ? И у вас есть какие-нибудь открытые исходные коды, которые я мог бы использовать ?

спасибо заранее

4 ответов


вы можете использовать класс hog в opencv следующим образом

HOGDescriptor hog;
vector<float> ders;
vector<Point> locs;

эта функция вычисляет функции свиньи для вас

hog.compute(grayImg, ders, Size(32, 32), Size(0, 0), locs);

функции HOG вычисляются для grayImg хранящиеся в ders вектор в матрицу, которая может использоваться в дальнейшем для обучения.

Mat Hogfeat(ders.size(), 1, CV_32FC1);

for(int i=0;i<ders.size();i++)
    Hogfeat.at<float>(i,0)=ders.at(i);

теперь ваши функции HOG хранятся в Hogfeat matrix.

вы также можете установить размер окна, размер ячейки и размер блока с помощью элемента hog as следует:

hog.blockSize = 16;
hog.cellSize = 4;
hog.blockStride = 8;

// This is for comparing the HOG features of two images without using any SVM 
// (It is not an efficient way but useful when you want to compare only few or two images)
// Simple distance
// Consider you have two HOG feature vectors for two images Hogfeat1 and Hogfeat2 and those are same size.

double distance = 0;
for(int i = 0; i < Hogfeat.rows; i++)
    distance += abs(Hogfeat.at<float>(i, 0) - Hogfeat.at<float>(i, 0));

if (distance < Threshold)
    cout<<"Two images are of same class"<<endl;
else
    cout<<"Two images are of different class"<<endl;

надеюсь, что это полезно :)


Я также написал программу функции 2 hog по сравнению с помощью вышеуказанной статьи. И я применяю этот метод для проверки изменения региона ROI или нет. Пожалуйста, обратитесь к странице здесь. исходный код и простое введение


вот версия GPU, а также.

cv::Mat temp;
gpu::GpuMat gpu_img, descriptors;

cv::gpu::HOGDescriptor gpu_hog(win_size, Size(16, 16), Size(8, 8), Size(8, 8), 9,
                               cv::gpu::HOGDescriptor::DEFAULT_WIN_SIGMA, 0.2, gamma_corr,
                               cv::gpu::HOGDescriptor::DEFAULT_NLEVELS);
gpu_img.upload(img);
gpu_hog.getDescriptors(gpu_img, win_stride, descriptors, cv::gpu::HOGDescriptor::DESCR_FORMAT_ROW_BY_ROW);
            descriptors.download(temp);

OpenCV 3 предоставляет некоторые изменения в способе использования алгоритмов GPU (т. е. CUDA) пользователем, см. руководство по переходу-CUDA.

чтобы обновить ответ от user3398689 до OpenCV 3, вот обрезанный код:

#include <opencv2/core/cuda.hpp>
#include <opencv2/cudaimgproc.hpp>

[...]

/* Suppose you load an image in a cv::Mat variable called 'src' */

int img_width  = 320;
int img_height = 240;
int block_size = 16;
int bin_number = 9;

cv::Ptr<cv::cuda::HOG> cuda_hog = cuda::HOG::create(Size(img_width, img_height),
                                                    Size(block_size, block_size),
                                                    Size(block_size/2, block_size/2),
                                                    Size(block_size/2, block_size/2),
                                                    bin_number);

/* The following commands are optional: default values applies */
cuda_hog->setDescriptorFormat(cuda::HOG::DESCR_FORMAT_COL_BY_COL);
cuda_hog->setGammaCorrection(true);
cuda_hog->setWinStride(Size(img_width_, img_height_));

cv::cuda::GpuMat image;
cv::cuda::GpuMat descriptor;

image.upload(src);

/* May not apply to you */
/* CUDA HOG works with intensity (1 channel) or BGRA (4 channels) images */
/* The next function call convert a standard BGR image to BGRA using the GPU */
cv::cuda::GpuMat image_alpha;
cuda::cvtColor(image, image_alpha, COLOR_BGR2BGRA, 4);

cuda_hog->compute(image_alpha, descriptor);

cv::Mat dst;
image_alpha.download(dst);

затем вы можете использовать дескрипторы в переменной 'dst', как вы предпочитаете, например, как предложено G453.