Обработка изображений: что такое окклюзии?
Я разрабатываю проект обработки изображений, и я сталкиваюсь со словом окклюзия во многих научных работах, что означают окклюзии в контексте обработки изображений? Словарь дает только общее определение. Можно ли описать их, используя изображение в качестве контекста?
4 ответов
окклюзия означает, что есть что-то, что вы хотите увидеть, но не можете из-за какого-то свойства настройки датчика или какого-то события. Точно, как это проявляется или как вы справляетесь с проблемой будет варьируются из-за проблемы под рукой.
примеры:
Если вы разрабатываете систему, которая отслеживает объекты (люди, автомобили, ...) затем происходит окклюзия, если объект, который вы отслеживаете, скрыт (закрыт) другим объектом. Как два люди, проходящие мимо друг друга, или автомобиль, который проезжает под мостом. Проблема в этом случае заключается в том, что вы делаете, когда объект исчезает и появляется снова.
Если вы используете камеры, тогда окклюзия-это области, где у вас нет никакой информации. Некоторые лазерные дальномеры работают, передавая лазерный луч на исследуемую поверхность, а затем имея настройку камеры, которая идентифицирует точку воздействия этого лазера на результирующее изображение. Что дает 3D-координаты этой точки. Однако, поскольку камера и лазер не обязательно выровнены, на исследуемой поверхности могут быть точки, которые камера может видеть, но лазер не может ударить (окклюзия). Проблема здесь скорее в настройке датчика.
то же самое может происходить в стерео если есть части сцены, которые видны только одной из двух камер. Очевидно, что никакие данные диапазона не могут быть собраны из этих точек.
есть возможно, больше примеров.
Если вы укажете свою проблему, тогда, возможно, мы сможем определить, что такое окклюзия в этом случае и какие проблемы она влечет за собой
проблема окклюзии является одной из основных причин, почему компьютерное зрение-это вообще плохо. В частности, это гораздо более проблематично в Объект Слежения. См. приведенные ниже цифры:
обратите внимание, как лицо Леди не совсем видно в рамках 0519
& 0835
в отличие от лица в кадре 0005
.
и вот еще одна картина, где лицо человека частично скрытый во всех трех периодах.
обратите внимание на изображение ниже, как отслеживание пары в красном и зеленом ограничивающем поле проиграл в среднем кадре из-за окклюзии (т. е. частично скрытый другим человеком перед ними), но правильно отслеживается в последнем кадре, когда они становятся (почти) полностью видимый.
изображение любезно предоставлено: Стэнфорд, USC
окклюзия-это та, которая блокирует наш взгляд. На изображении, показанном здесь, мы можем легко увидеть людей в первом ряду. Но вторая строка частично видна, а третья строка гораздо менее видна. Здесь мы говорим, что вторая строка частично закрыта первой строкой, а третья строка закрыта первой и второй строками. Мы видим такие окклюзии в классах (студенты сидят рядами), на перекрестках (автомобили ждут сигнала), в лесах (деревья и растения) и т.д. когда есть много объекты.
поскольку другие ответы хорошо объяснили окклюзию, я только добавлю к этому. В принципе, между нами и компьютерами существует семантический разрыв.
компьютер фактически видит каждое изображение как последовательность значений, обычно в диапазоне 0-255, для каждого цвета в RGB-изображении. Эти значения индексируются в виде (row, col) для каждой точки изображения. Поэтому, если объекты меняют свое положение w.r.t камера, где скрывается какой-то аспект объекта (позволяет руки человека не показано), компьютер будет видеть разные числа (или ребра или любые другие объекты), поэтому это изменится для алгоритма компьютера для обнаружения, распознавания или отслеживания объекта.