Самый быстрый способ найти ближайшую точку к данной точке в 3D, в Python

Итак, предположим, у меня есть 10 000 точек в A и 10 000 точек в B и я хочу найти ближайшую точку в A для каждой точки B.

В настоящее время я просто перебираю каждую точку в B и A, чтобы найти, какая из них ближе всего на расстоянии. то есть.

B = [(.5, 1, 1), (1, .1, 1), (1, 1, .2)]
A = [(1, 1, .3), (1, 0, 1), (.4, 1, 1)]
C = {}
for bp in B:
   closestDist = -1
   for ap in A:
      dist = sum(((bp[0]-ap[0])**2, (bp[1]-ap[1])**2, (bp[2]-ap[2])**2))
      if(closestDist > dist or closestDist == -1):
         C[bp] = ap
         closestDist = dist
print C

однако, я уверен, что есть более быстрый способ сделать это... есть идеи?

3 ответов


обычно я использую KD-дерево в таких ситуациях.

есть реализация C++, завернутая в SWIG и в комплекте с BioPython это простой в использовании.


вы можете использовать некоторую структуру пространственного поиска. Простой вариант -восьмеричного дерева набора; более модные из них включают дерево BSP.


вы можете использовать numpy broadcasting. Например,

from numpy import *
import numpy as np

a=array(A)
b=array(B)
#using looping
for i in b:
    print sum((a-i)**2,1).argmin()

будет печатать 2,1,0, которые являются строками в a, которые ближе всего к 1,2,3 строкам B, соответственно.

в противном случае вы можете использовать broadcasting:

z = sum((a[:,:, np.newaxis] - b)**2,1)
z.argmin(1) # gives array([2, 1, 0])

надеюсь, это поможет.