Гистограмма обнаружения объекта ориентированных градиентов [закрыто]

боров популярен в человеческом обнаружении. Может ли он использоваться для обнаружения объектов, таких как чашка на изображении, например.

Мне жаль, что я не задаю вопрос программирования, но я хочу получить идею, если я могу использовать hog для извлечения объектов.

согласно моим исследованиям, у меня нет в течение нескольких дней, я чувствую, что да, но я не уверен.

1 ответов


да, боров (гистограмма ориентированных градиентов) может использоваться для обнаружения любых объектов, как для компьютера, изображение представляет собой кучу пикселей, и вы можете извлекать объекты независимо от их содержимого. Другой вопрос, однако, заключается в его эффективности.

свиней, просеять, и другие такие экстракторы функций-это методы, используемые для извлечения релевантной информации из изображения, чтобы описать его более значимым образом. Когда вы хотите обнаружить объект или человек на изображении с тысячами (и, возможно, миллионами) пикселей, неэффективно просто подавать вектор с миллионами чисел в алгоритм машинного обучения как

  1. это займет большое количество времени, чтобы завершить
  2. будет много шумной информации (фон, размытие, молнии и изменения вращения), которые мы не хотим считать важными

алгоритм HOG, в частности, создает гистограммы краевых ориентаций из некоторых патчей на изображения. Патч может исходить от объекта, человека, бессмысленного фона или чего-либо еще и является просто способом описания области с использованием информации края. Как упоминалось ранее, эта информация затем может использоваться для подачи алгоритма машинного обучения, такого как классические машины векторов поддержки, для обучения классификатора, способного отличать один тип объекта от другого.

причина борова имел так много успеха с обнаружения пешеходов, потому что человек может сильно различаться по цвету, одежде и другим факторам, но общие края пешехода остаются относительно постоянными, особенно вокруг области ног. Это не означает, что его нельзя использовать для обнаружения других типов объектов, но его успех может варьироваться в зависимости от конкретного приложения. бумага для свиней показывает подробно, как эти дескрипторы могут использоваться для классификации.

стоит отметить, что для нескольких приложений полученные результаты по борову можно значительно улучшить, используя пирамидальную схему. Это работает следующим образом: вместо извлечения одного вектора свиньи из изображения вы можете последовательно разделить изображение (или патч) на несколько подизображений, извлекая из каждого из этих меньших подразделений отдельный вектор свиньи. Затем процесс можно повторить. В конце концов, вы можете получить окончательный дескриптор, объединив все векторы HOG в один вектор, как показано в следующем изображение.

Pyramidal HOG

Это имеет то преимущество, что в больших масштабах функции HOG обеспечивают более глобальную информацию, в то время как в меньших масштабах (то есть в меньших подразделениях) они обеспечивают более мелкозернистую деталь. Недостатком является то, что вектор конечного дескриптора увеличивается, что требует больше времени для извлечения и обучения с использованием данного классификатора.

короче: Да, вы можете использовать их.