Найти суммы диагоналей в numpy (быстрее)
у меня есть несколько board
numpy массивы, как это:
array([[0, 0, 0, 1, 0, 0, 0, 0],
[1, 0, 0, 0, 0, 1, 0, 1],
[0, 0, 0, 0, 0, 0, 0, 1],
[0, 1, 0, 1, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0, 0, 1],
[0, 0, 0, 0, 1, 0, 0, 0],
[0, 0, 1, 0, 0, 0, 1, 0],
[1, 0, 0, 0, 0, 1, 0, 0]])
и я использую следующий код, чтобы найти сумму элементов на каждой N-й диагонали от -7 до 8 платы (и ее зеркальной версии).
n = 8
rate = [b.diagonal(i).sum()
for b in (board, board[::-1])
for i in range(-n+1, n)]
после некоторого профилирования эта операция занимает около 2/3 общего времени работы, и, похоже, из-за 2 факторов:
- на
.diagonal
метод создает новый массив вместо представления (похоже, numpy 1.7 будет иметь новый.diag
метод для решения этой проблемы) - итерация выполняется на python внутри понимания списка
Итак, есть какие-либо методы, чтобы найти эти суммы быстрее (возможно, в слое c numpy)?
после еще нескольких тестов я мог бы уменьшить 7.5 x общее время, кэшируя эту операцию... Может, я искал не то горлышко?
еще одно:
нашел .trace
метод, который заменяет diagonal(i).sum()
вещь и... Не было большого улучшения в производительности (около 2 до 4%).
таким образом, проблема должна заключаться в понимании. Есть идеи?
2 ответов
существует возможное решение с использованием stride_tricks
. Это частично основано на изобилии информации, доступной в ответах на этот вопрос, но проблема достаточно разная, я думаю, чтобы не считаться дубликатом. Вот основная идея, примененная к квадратной матрице-см. ниже функцию, реализующую более общее решение.
>>> cols = 8
>>> a = numpy.arange(cols * cols).reshape((cols, cols))
>>> fill = numpy.zeros((cols - 1) * cols, dtype='i8').reshape((cols - 1, cols))
>>> stacked = numpy.vstack((a, fill, a))
>>> major_stride, minor_stride = stacked.strides
>>> strides = major_stride, minor_stride * (cols + 1)
>>> shape = (cols * 2 - 1, cols)
>>> numpy.lib.stride_tricks.as_strided(stacked, shape, strides)
array([[ 0, 9, 18, 27, 36, 45, 54, 63],
[ 8, 17, 26, 35, 44, 53, 62, 0],
[16, 25, 34, 43, 52, 61, 0, 0],
[24, 33, 42, 51, 60, 0, 0, 0],
[32, 41, 50, 59, 0, 0, 0, 0],
[40, 49, 58, 0, 0, 0, 0, 0],
[48, 57, 0, 0, 0, 0, 0, 0],
[56, 0, 0, 0, 0, 0, 0, 0],
[ 0, 0, 0, 0, 0, 0, 0, 7],
[ 0, 0, 0, 0, 0, 0, 6, 15],
[ 0, 0, 0, 0, 0, 5, 14, 23],
[ 0, 0, 0, 0, 4, 13, 22, 31],
[ 0, 0, 0, 3, 12, 21, 30, 39],
[ 0, 0, 2, 11, 20, 29, 38, 47],
[ 0, 1, 10, 19, 28, 37, 46, 55]])
>>> diags = numpy.lib.stride_tricks.as_strided(stacked, shape, strides)
>>> diags.sum(axis=1)
array([252, 245, 231, 210, 182, 147, 105, 56, 7, 21, 42, 70, 105,
147, 196])
конечно, я понятия не имею, как быстро это будет на самом деле. Но я уверен, что это будет быстрее, чем список Python понимание.
для удобства, вот полностью общий . Предполагается, что вы хотите переместить диагональ вдоль самой длинной оси:
def diagonals(a):
rows, cols = a.shape
if cols > rows:
a = a.T
rows, cols = a.shape
fill = numpy.zeros(((cols - 1), cols), dtype=a.dtype)
stacked = numpy.vstack((a, fill, a))
major_stride, minor_stride = stacked.strides
strides = major_stride, minor_stride * (cols + 1)
shape = (rows + cols - 1, cols)
return numpy.lib.stride_tricks.as_strided(stacked, shape, strides)
как я написал в комментарии, я бы не пошел в C-код.
С PyPy. На самом деле поддержка numpy тихая хорошая (однако она не поддерживает непосредственно массив.диагонали) - я не проверить, если есть другой способ построены для этого. Не нервничая, я попробовал следующий код::
try:
import numpypy # required by PyPy
except ImportError:
pass
import numpy
board = numpy.array([[0, 0, 0, 1, 0, 0, 0, 0],
[1, 0, 0, 0, 0, 1, 0, 1],
[0, 0, 0, 0, 0, 0, 0, 1],
[0, 1, 0, 1, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0, 0, 1],
[0, 0, 0, 0, 1, 0, 0, 0],
[0, 0, 1, 0, 0, 0, 1, 0],
[1, 0, 0, 0, 0, 1, 0, 0]])
n=len(board)
def diag_sum(i, b):
s = 0
if i>=0:
row = 0
end = n
else:
row = -i
end = n+i
i = 0
while i<end:
s += b[row, i]
i+=1
row+=1
return s
import time
t=time.time()
for i in xrange(50000):
# rate = [b.diagonal(i).sum()
# for b in (board, board[::-1])
# for i in range(-n+1, n)]
rate = [diag_sum(i,b)
for b in (board, board[::-1])
for i in range(-n+1, n)]
print time.time() - t
результаты:
- 0.64 с PyPy с
diag_sum
- 6.01 s CPython версия с
diag_sum
- 5.60 ы с CPython версия с
b.diagonal