Представление и решение лабиринта заданного образа

каков наилучший способ представления и решения лабиринта с учетом изображения?

The cover image of The Scope Issue 134

учитывая изображение JPEG (как показано выше), каков наилучший способ прочитать его, проанализировать его в некоторой структуре данных и решить лабиринт? Мой первый инстинкт-прочитать изображение пиксель за пикселем и сохранить его в списке (массиве) булевых значений:True для белого пикселя и False для не-белого пикселя (цвета могут быть отброшены). Проблема с этим методом заключается в том, что изображение возможно, это не "идеальный пиксель". Под этим я просто подразумеваю, что если где-то на стене есть белый пиксель, он может создать непреднамеренный путь.

другой метод (который пришел ко мне после некоторого размышления) - преобразовать изображение в SVG-файл-это список путей, нарисованных на холсте. Таким образом, пути могут быть прочитаны в один и тот же список (логические значения), где True указывает путь или стены, False указание пространства, способного путешествовать. Проблема с этим методом возникает, если преобразование не является 100% точным и не полностью соединяет все стены, создавая зазоры.

также проблема с преобразованием в SVG заключается в том, что линии не "идеально" прямые. Это приводит к тому, что пути являются кубическими кривыми Безье. С помощью списка (массива) булевых значений, индексированных целыми числами, кривые не будут легко переноситься, и все точки, которые линия на кривой, должны быть вычислены, но не будут точно соответствовать индексам списка.

Я предполагаю, что в то время как один из этих методов может работать (хотя, вероятно, нет), что они прискорбно неэффективны, учитывая такой большой образ, и что существует лучший способ. Как это лучше всего (наиболее эффективно и/или с наименьшей сложностью) сделать? Есть ли лучший способ?

затем приходит решение лабиринта. Если я использую любой из первых двух методов, я по существу получу матрицу. Согласно ответ, хороший способ представить лабиринт использует дерево, и хороший способ решить он использует a* алгоритм. Как создать дерево из образа? Есть идеи?

TL; DR
Лучший способ разбора? В какую структуру данных? Как эта структура поможет / помешает решению?

обновление
Я пробовал свои силы в реализации того, что @Mikhail написал на Python, используя numpy, как рекомендовал @Thomas. Я чувствую, что алгоритм правильный, но он работает не так, как надеялся. (Код ниже.) формат PNG библиотека PyPNG.

import png, numpy, Queue, operator, itertools

def is_white(coord, image):
  """ Returns whether (x, y) is approx. a white pixel."""
  a = True
  for i in xrange(3):
    if not a: break
    a = image[coord[1]][coord[0] * 3 + i] > 240
  return a

def bfs(s, e, i, visited):
  """ Perform a breadth-first search. """
  frontier = Queue.Queue()
  while s != e:
    for d in [(-1, 0), (0, -1), (1, 0), (0, 1)]:
      np = tuple(map(operator.add, s, d))
      if is_white(np, i) and np not in visited:
        frontier.put(np)
    visited.append(s)
    s = frontier.get()
  return visited

def main():
  r = png.Reader(filename = "thescope-134.png")
  rows, cols, pixels, meta = r.asDirect()
  assert meta['planes'] == 3 # ensure the file is RGB
  image2d = numpy.vstack(itertools.imap(numpy.uint8, pixels))
  start, end = (402, 985), (398, 27)
  print bfs(start, end, image2d, [])

9 ответов


вот решение.

  1. преобразование изображения в оттенки серого (еще не двоичные), регулировка веса для цветов, так что окончательное изображение в оттенках серого примерно однородно. Вы можете сделать это, просто управляя ползунками в Photoshop в Image - > Adjustments - > Black & White.
  2. преобразование изображения в двоичный файл, установив соответствующий порог в Photoshop в Image - > настройки - > порог.
  3. убедитесь, что порог выбран правильно. Используйте инструмент "волшебная палочка" с 0 допуск, точечный образец, непрерывный, без сглаживания. Проверьте, что ребра, у которых разрывы выбора не являются ложными ребрами, введенными неправильным порогом. На самом деле, все внутренние точки этого лабиринта доступны с самого начала.
  4. добавить искусственные границы на лабиринт, чтобы убедиться, что виртуальный путешественник не будет ходить вокруг да около :)
  5. реализовать поиск в ширину (BFS) на вашем любимом языке и запустить его с самого начала. Я предпочитаю MATLAB для этого задача. Как уже упоминалось @Thomas, нет необходимости возиться с регулярным представлением графов. Вы можете работать с двоичному изображения напрямую.

вот код MATLAB для BFS:

function path = solve_maze(img_file)
  %% Init data
  img = imread(img_file);
  img = rgb2gray(img);
  maze = img > 0;
  start = [985 398];
  finish = [26 399];

  %% Init BFS
  n = numel(maze);
  Q = zeros(n, 2);
  M = zeros([size(maze) 2]);
  front = 0;
  back = 1;

  function push(p, d)
    q = p + d;
    if maze(q(1), q(2)) && M(q(1), q(2), 1) == 0
      front = front + 1;
      Q(front, :) = q;
      M(q(1), q(2), :) = reshape(p, [1 1 2]);
    end
  end

  push(start, [0 0]);

  d = [0 1; 0 -1; 1 0; -1 0];

  %% Run BFS
  while back <= front
    p = Q(back, :);
    back = back + 1;
    for i = 1:4
      push(p, d(i, :));
    end
  end

  %% Extracting path
  path = finish;
  while true
    q = path(end, :);
    p = reshape(M(q(1), q(2), :), 1, 2);
    path(end + 1, :) = p;
    if isequal(p, start) 
      break;
    end
  end
end

это действительно очень просто и стандартно, не должно быть трудностей при реализации этого в Python или что-то еще.

и вот ответ:

Enter image description here


это решение написано на Python. Спасибо Михаилу за указания по подготовке изображения.

анимированная ширина-первый поиск:

Animated version of BFS

Завершенный Лабиринт:

Completed Maze

#!/usr/bin/env python

import sys

from Queue import Queue
from PIL import Image

start = (400,984)
end = (398,25)

def iswhite(value):
    if value == (255,255,255):
        return True

def getadjacent(n):
    x,y = n
    return [(x-1,y),(x,y-1),(x+1,y),(x,y+1)]

def BFS(start, end, pixels):

    queue = Queue()
    queue.put([start]) # Wrapping the start tuple in a list

    while not queue.empty():

        path = queue.get() 
        pixel = path[-1]

        if pixel == end:
            return path

        for adjacent in getadjacent(pixel):
            x,y = adjacent
            if iswhite(pixels[x,y]):
                pixels[x,y] = (127,127,127) # see note
                new_path = list(path)
                new_path.append(adjacent)
                queue.put(new_path)

    print "Queue has been exhausted. No answer was found."


if __name__ == '__main__':

    # invoke: python mazesolver.py <mazefile> <outputfile>[.jpg|.png|etc.]
    base_img = Image.open(sys.argv[1])
    base_pixels = base_img.load()

    path = BFS(start, end, base_pixels)

    path_img = Image.open(sys.argv[1])
    path_pixels = path_img.load()

    for position in path:
        x,y = position
        path_pixels[x,y] = (255,0,0) # red

    path_img.save(sys.argv[2])

Примечание: знаки белой посетили пиксель серый. Это устраняет необходимость в списке посещенных, но для этого требуется вторая загрузка файла образа с диска перед рисованием пути (если вы этого не сделаете требуется составное изображение конечного пути и всех принятых путей).

пустой лабиринт я использовал.


Я попытался реализовать поиск A-Star для этой проблемы. Внимательно следил за реализацией Жозеф Керн для фреймворка и псевдокода алгоритма задано здесь:

def AStar(start, goal, neighbor_nodes, distance, cost_estimate):
    def reconstruct_path(came_from, current_node):
        path = []
        while current_node is not None:
            path.append(current_node)
            current_node = came_from[current_node]
        return list(reversed(path))

    g_score = {start: 0}
    f_score = {start: g_score[start] + cost_estimate(start, goal)}
    openset = {start}
    closedset = set()
    came_from = {start: None}

    while openset:
        current = min(openset, key=lambda x: f_score[x])
        if current == goal:
            return reconstruct_path(came_from, goal)
        openset.remove(current)
        closedset.add(current)
        for neighbor in neighbor_nodes(current):
            if neighbor in closedset:
                continue
            if neighbor not in openset:
                openset.add(neighbor)
            tentative_g_score = g_score[current] + distance(current, neighbor)
            if tentative_g_score >= g_score.get(neighbor, float('inf')):
                continue
            came_from[neighbor] = current
            g_score[neighbor] = tentative_g_score
            f_score[neighbor] = tentative_g_score + cost_estimate(neighbor, goal)
    return []

поскольку A-Star-это эвристический алгоритм поиска, вам нужно придумать функцию, которая оценивает оставшуюся стоимость (здесь: расстояние) до достижения цели. Если вы не согласны с неоптимальным решением, оно не должно завышать стоимость. Ля консервативный выбор здесь будет Манхэттен (или такси) расстояние поскольку это представляет собой прямолинейное расстояние между двумя точками на сетке для используемой окрестности фон Неймана. (Что, в данном случае, не завышают стоимость.)

это, однако, значительно занижает фактическую стоимость для данного лабиринта под рукой. Поэтому я добавил две другие метрики квадратичное евклидово расстояние и расстояние Манхэттен умножить на четыре сравнение. Однако они могут завышать фактическую стоимость и, следовательно, давать неоптимальные результаты.

вот код:

import sys
from PIL import Image

def is_blocked(p):
    x,y = p
    pixel = path_pixels[x,y]
    if any(c < 225 for c in pixel):
        return True
def von_neumann_neighbors(p):
    x, y = p
    neighbors = [(x-1, y), (x, y-1), (x+1, y), (x, y+1)]
    return [p for p in neighbors if not is_blocked(p)]
def manhattan(p1, p2):
    return abs(p1[0]-p2[0]) + abs(p1[1]-p2[1])
def squared_euclidean(p1, p2):
    return (p1[0]-p2[0])**2 + (p1[1]-p2[1])**2

start = (400, 984)
goal = (398, 25)

# invoke: python mazesolver.py <mazefile> <outputfile>[.jpg|.png|etc.]

path_img = Image.open(sys.argv[1])
path_pixels = path_img.load()

distance = manhattan
heuristic = manhattan

path = AStar(start, goal, von_neumann_neighbors, distance, heuristic)

for position in path:
    x,y = position
    path_pixels[x,y] = (255,0,0) # red

path_img.save(sys.argv[2])

вот некоторые изображения для визуализации результатов (вдохновленные тем, что опубликовано Жозеф Керн). Анимации показывают новый кадр каждый после 10000 итераций основного цикла while.

Поиск В Ширину:

Breadth-First Search

А-Звездочный Отель Manhattan Расстояние:

A-Star Manhattan Distance

A-Звездное Квадратное Евклидово Расстояние:

A-Star Squared Euclidean Distance

A-Star Манхэттен расстояние, умноженное на четыре:

A-Star Manhattan Distance multiplied by four

результаты показывают, что исследуемые области лабиринта значительно отличаются для используемых эвристик. Таким образом, квадратное евклидово расстояние даже создает другой (неоптимальный) путь, как и другие метрики.

относительно производительности алгоритма A-Star что касается времени выполнения до завершения, обратите внимание, что многие оценки функций расстояния и стоимости складываются по сравнению с поиском широты (BFS), который должен оценивать только "целеустремленность" каждой позиции кандидата. Независимо от того, перевешивает ли стоимость этих дополнительных оценок функций (A-Star) стоимость большего количества узлов для проверки (BFS) и особенно является ли производительность проблемой для вашего приложения вообще, это вопрос индивидуального восприятия и может конечно, обычно не отвечают.

штука can в целом можно сказать о том, может ли информированный алгоритм поиска (например, A-Star) быть лучшим выбором по сравнению с исчерпывающим поиском (например, BFS), является следующим. С числом измерений лабиринта, т. е. коэффициентом ветвления дерева поиска, недостаток исчерпывающего поиска (для исчерпывающего поиска) растет экспоненциально. С ростом сложности это становится все менее и менее осуществимым чтобы сделать это, и в какой-то момент Вы в значительной степени довольны любой путь результата, будь то (приблизительно) Оптимальный или нет.


Поиск дерева слишком много. Лабиринт по своей сути разделим вдоль пути(путей) решения.

(спасибо rainman002 от Reddit за то, что указал мне на это.)

из-за этого вы можете быстро использовать подключенные компоненты определить Соединенные разделы стены лабиринта. Это повторяется над пикселями дважды.

Если вы хотите превратить это в хорошую диаграмму пути (путей) решения, вы можете использовать двоичные операции с структурирование элементов для заполнения "тупиковых" путей для каждой подключенной области.

демо-код для MATLAB следует. Он может использовать настройку, чтобы лучше очистить результат, сделать его более обобщаемым и заставить его работать быстрее. (Когда это не 2:30 утра.)

% read in and invert the image
im = 255 - imread('maze.jpg');

% sharpen it to address small fuzzy channels
% threshold to binary 15%
% run connected components
result = bwlabel(im2bw(imfilter(im,fspecial('unsharp')),0.15));

% purge small components (e.g. letters)
for i = 1:max(reshape(result,1,1002*800))
    [count,~] = size(find(result==i));
    if count < 500
        result(result==i) = 0;
    end
end

% close dead-end channels
closed = zeros(1002,800);
for i = 1:max(reshape(result,1,1002*800))
    k = zeros(1002,800);
    k(result==i) = 1; k = imclose(k,strel('square',8));
    closed(k==1) = i;
end

% do output
out = 255 - im;
for x = 1:1002
    for y = 1:800
        if closed(x,y) == 0
            out(x,y,:) = 0;
        end
    end
end
imshow(out);

result of current code


использует очередь для порогового непрерывного заполнения. Толкает пиксель слева от входа в очередь,а затем запускает цикл. Если пиксель в очереди достаточно темный, он окрашен в светло-серый цвет (выше порога), и все соседи помещаются в очередь.

from PIL import Image
img = Image.open("/tmp/in.jpg")
(w,h) = img.size
scan = [(394,23)]
while(len(scan) > 0):
    (i,j) = scan.pop()
    (r,g,b) = img.getpixel((i,j))
    if(r*g*b < 9000000):
        img.putpixel((i,j),(210,210,210))
        for x in [i-1,i,i+1]:
            for y in [j-1,j,j+1]:
                scan.append((x,y))
img.save("/tmp/out.png")

решение коридор между серой стеной и покрашенной стеной. Обратите внимание, что этот лабиринт имеет несколько решений. Кроме того, это просто кажется, что работает.

Solution


вот, пожалуйста:лабиринт-решатель-python (GitHub)

enter image description here

Мне было весело играть с этим и продлить на Жозеф Керн'ы ответ. Чтобы не отвлекаться от этого; я просто сделал некоторые незначительные дополнения для тех, кто может быть заинтересован в игре с этим.

это решатель на основе python, который использует BFS для поиска кратчайшего пути. Мои основные дополнения в то время:

  1. изображение очищается перед поиском (т. е. преобразовать в чистый черный и белый)
  2. автоматическое создание GIF.
  3. автоматическое создание AVI.

как он стоит, начальная / конечная точки жестко закодированы для этого образца лабиринта, но я планирую расширить его так, чтобы вы могли выбрать соответствующие пиксели.


Я бы пошел на вариант matrix-of-bools. Если вы обнаружите, что стандартные списки Python слишком неэффективны для этого, вы можете использовать массив. Хранение для лабиринта пикселей 1000x1000 составляет всего 1 МБ.

не беспокойтесь о создании каких-либо структур данных дерева или графика. Это просто способ думать об этом, но не обязательно хороший способ представить его в памяти; булева матрица легче кодировать и более эффективна.

затем используйте алгоритм A* для решить ее. Для эвристики расстояния используйте расстояние Манхэттена (distance_x + distance_y).

представляют узлы кортежем (row, column) координаты. Всякий раз, когда алгоритм (псевдокод Википедия) призывает "соседей", это простой вопрос зацикливания на четырех возможных соседях (обратите внимание на края изображения!).

Если вы обнаружите, что он все еще слишком медленный, вы можете попробовать уменьшить масштаб изображения перед его загрузкой. Будьте осторожны, чтобы не потерять какие-либо узкие тропинки в процесс.

возможно, можно сделать масштабирование 1:2 в Python, а также, проверяя, что вы на самом деле не теряете никаких возможных путей. Интересный вариант, но над ним нужно еще немного подумать.


вот некоторые идеи.

(1. Обработка Изображений:)

1.1 загрузите изображение как RGB с пиксель карте. В C# это тривиально, используя system.drawing.bitmap. В языках без простой поддержки изображений просто преобразуйте изображение в портативный формат pixmap (PPM) (текстовое представление Unix, создает большие файлы) или какой-то простой двоичный формат файла, который вы можете легко прочитать, например BMP или TGA. ImageMagick в Unix или IrfanView в Windows.

1.2 вы можете, как упоминалось ранее, упростить данные, взяв (R+G+B)/3 для каждого пикселя в качестве индикатора серого тона, а затем пороговое значение для создания черно-белой таблицы. Что-то близкое к 200, предполагая, что 0=черный и 255=белый вынут артефакты JPEG.

(2. Решения:)

2.1 глубина-первый поиск: введите пустой стек с начальным местоположением, соберите доступные последующие ходы, выберите один наугад и нажмите на стек, продолжайте, пока не будет достигнут конец или тупик. На deadend backtrack, выскакивая стек, вам нужно отслеживать, какие позиции были посещены на карте, поэтому, когда вы собираете доступные ходы, вы никогда не берете один и тот же путь дважды. Очень интересно анимировать.

2.2 ширина-первый поиск: упоминалось ранее, как и выше, но только с использованием очередей. Также интересно анимировать. Это работает как flood-fill в редактировании изображений программное обеспечение. Я думаю, вы сможете решить лабиринт в Photoshop, используя этот трюк.

2.3 последователь стены: геометрически говоря, лабиринт сложенная/свернутая трубка. Если вы держите руку на стене вы в конечном итоге найти выход ;) это не всегда работает. Есть определенные предположения re: совершенные лабиринты и т. д. например, в некоторых лабиринтах есть острова. Поищите его, это увлекательно.

(3. Комментарии:)

это самое сложное. Это легко решите лабиринты, если они представлены в некотором простом формальном массиве, каждый элемент которого является типом ячейки с северной, восточной, южной и Западной стенами и посещаемым полем флага. Однако, учитывая, что вы пытаетесь сделать это, учитывая рисованный эскиз, он становится грязным. Я честно думаю, что попытка рационализировать скетч сведет тебя с ума. Это сродни проблемам компьютерного зрения, которые довольно вовлечены. Возможно, переход непосредственно на карту изображений может быть проще, но более расточительным.


вот решение с использованием R.

### download the image, read it into R, converting to something we can play with...
library(jpeg)
url <- "https://i.stack.imgur.com/TqKCM.jpg"
download.file(url, "./maze.jpg", mode = "wb")
jpg <- readJPEG("./maze.jpg")

### reshape array into data.frame
library(reshape2)
img3 <- melt(jpg, varnames = c("y","x","rgb"))
img3$rgb <- as.character(factor(img3$rgb, levels = c(1,2,3), labels=c("r","g","b")))

## split out rgb values into separate columns
img3 <- dcast(img3, x + y ~ rgb)

RGB в оттенки серого, см.:https://stackoverflow.com/a/27491947/2371031

# convert rgb to greyscale (0, 1)
img3$v <- img3$r*.21 + img3$g*.72 + img3$b*.07
# v: values closer to 1 are white, closer to 0 are black

## strategically fill in some border pixels so the solver doesn't "go around":
img3$v2 <- img3$v
img3[(img3$x == 300 | img3$x == 500) & (img3$y %in% c(0:23,988:1002)),"v2"]  = 0

# define some start/end point coordinates
pts_df <- data.frame(x = c(398, 399),
                     y = c(985, 26))

# set a reference value as the mean of the start and end point greyscale "v"s
ref_val <- mean(c(subset(img3, x==pts_df[1,1] & y==pts_df[1,2])$v,
                  subset(img3, x==pts_df[2,1] & y==pts_df[2,2])$v))

library(sp)
library(gdistance)
spdf3 <- SpatialPixelsDataFrame(points = img3[c("x","y")], data = img3["v2"])
r3 <- rasterFromXYZ(spdf3)

# transition layer defines a "conductance" function between any two points, and the number of connections (4 = Manhatten distances)
# x in the function represents the greyscale values ("v2") of two adjacent points (pixels), i.e., = (x1$v2, x2$v2)
# make function(x) encourages transitions between cells with small changes in greyscale compared to the reference values, such that: 
# when v2 is closer to 0 (black) = poor conductance
# when v2 is closer to 1 (white) = good conductance
tl3 <- transition(r3, function(x) (1/max( abs( (x/ref_val)-1 ) )^2)-1, 4) 

## get the shortest path between start, end points
sPath3 <- shortestPath(tl3, as.numeric(pts_df[1,]), as.numeric(pts_df[2,]), output = "SpatialLines")

## fortify for ggplot
sldf3 <- fortify(SpatialLinesDataFrame(sPath3, data = data.frame(ID = 1)))

# plot the image greyscale with start/end points (red) and shortest path (green)
ggplot(img3) +
  geom_raster(aes(x, y, fill=v2)) +
  scale_fill_continuous(high="white", low="black") +
  scale_y_reverse() +
  geom_point(data=pts_df, aes(x, y), color="red") +
  geom_path(data=sldf3, aes(x=long, y=lat), color="green")

вуаля!

solution that correctly finds shortest path

это то, что происходит, если вы не заполняете некоторые пиксели границы (ха!)...

solution version where the solver goes around the maze

полное раскрытие: я спросил и ответил очень аналогичный вопрос меня, прежде чем я нашел это. Затем благодаря магии SO, нашел этот один из лучших "связанных вопросов". Я решил использовать этот лабиринт в качестве дополнительного теста... Я был очень рад обнаружить, что мой ответ там также работает для этого приложения с очень небольшими изменениями.