Как реализовать функцию ReLU в Numpy

Question

Как реализовать функцию ReLU в Numpy

Я хочу сделать простую нейронную сеть, и я хочу использовать функцию ReLU. Может кто-нибудь дать мне ключ к тому, как я могу реализовать функцию с помощью numpy. Спасибо, что уделили время!

35

machine-learning neural-network numpy python

автор: Andoni Zubizarreta

7 ответов

автор: Sid · Accepted Answer · 2015-08-20 12:08:11

есть несколько способов.

>>> x = np.random.random((3, 2)) - 0.5
>>> x
array([[-0.00590765,  0.18932873],
       [-0.32396051,  0.25586596],
       [ 0.22358098,  0.02217555]])
>>> np.maximum(x, 0)
array([[ 0.        ,  0.18932873],
       [ 0.        ,  0.25586596],
       [ 0.22358098,  0.02217555]])
>>> x * (x > 0)
array([[-0.        ,  0.18932873],
       [-0.        ,  0.25586596],
       [ 0.22358098,  0.02217555]])
>>> (abs(x) + x) / 2
array([[ 0.        ,  0.18932873],
       [ 0.        ,  0.25586596],
       [ 0.22358098,  0.02217555]])

если синхронизация результатов со следующим кодом:

import numpy as np

x = np.random.random((5000, 5000)) - 0.5
print("max method:")
%timeit -n10 np.maximum(x, 0)

print("multiplication method:")
%timeit -n10 x * (x > 0)

print("abs method:")
%timeit -n10 (abs(x) + x) / 2

получаем:

max method:
10 loops, best of 3: 239 ms per loop
multiplication method:
10 loops, best of 3: 145 ms per loop
abs method:
10 loops, best of 3: 288 ms per loop

таким образом, умножение кажется самым быстрым.

автор: Richard Möhn · Accepted Answer · 2018-07-24 05:30:54

Если вы не возражаете x изменения, использовать np.maximum(x, 0, x). На это указал Даниэль S. Это намного быстрее, и потому, что люди могут это упустить, я перепечатаю его как ответ. Вот сравнение:

max method:
10 loops, best of 3: 238 ms per loop
multiplication method:
10 loops, best of 3: 128 ms per loop
abs method:
10 loops, best of 3: 311 ms per loop
in-place max method:
10 loops, best of 3: 38.4 ms per loop

автор: Tobias · Accepted Answer · 2017-10-19 19:54:06

Я нашел более быстрый метод для ReLU с numpy. Вы также можете использовать функцию fancy index numpy.

галантерейных индекс:

20.3 MS ± 272 µs в петлю (среднее ± std. разработка. из 7 трасс по 10 петель каждая)

>>> x = np.random.random((5,5)) - 0.5 
>>> x
array([[-0.21444316, -0.05676216,  0.43956365, -0.30788116, -0.19952038],
       [-0.43062223,  0.12144647, -0.05698369, -0.32187085,  0.24901568],
       [ 0.06785385, -0.43476031, -0.0735933 ,  0.3736868 ,  0.24832288],
       [ 0.47085262, -0.06379623,  0.46904916, -0.29421609, -0.15091168],
       [ 0.08381359, -0.25068492, -0.25733763, -0.1852205 , -0.42816953]])
>>> x[x<0]=0
>>> x
array([[ 0.        ,  0.        ,  0.43956365,  0.        ,  0.        ],
       [ 0.        ,  0.12144647,  0.        ,  0.        ,  0.24901568],
       [ 0.06785385,  0.        ,  0.        ,  0.3736868 ,  0.24832288],
       [ 0.47085262,  0.        ,  0.46904916,  0.        ,  0.        ],
       [ 0.08381359,  0.        ,  0.        ,  0.        ,  0.        ]])

вот мой тест:

import numpy as np
x = np.random.random((5000, 5000)) - 0.5
print("max method:")
%timeit -n10 np.maximum(x, 0)
print("max inplace method:")
%timeit -n10 np.maximum(x, 0,x)
print("multiplication method:")
%timeit -n10 x * (x > 0)
print("abs method:")
%timeit -n10 (abs(x) + x) / 2
print("fancy index:")
%timeit -n10 x[x<0] =0

max method:
241 ms ± 3.53 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
max inplace method:
38.5 ms ± 4 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
multiplication method:
162 ms ± 3.1 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
abs method:
181 ms ± 4.18 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
fancy index:
20.3 ms ± 272 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

автор: ShitalShah · Accepted Answer · 2017-12-22 05:51:39

вы можете сделать это гораздо проще и без numpy:

def ReLU(x):
    return x * (x > 0)

def dReLU(x):
    return 1. * (x > 0)

автор: ivanpp · Accepted Answer · 2018-09-14 09:55:15

сравнение Рихарда Мена это не справедливо.
As комментарий Андреа Ди Бьяджио в метод np.maximum(x, 0, x) изменит x в первом цикле.
Итак, вот мой ориентир:

import numpy as np

def baseline():
    x = np.random.random((5000, 5000)) - 0.5
    return x

def relu_mul():
    x = np.random.random((5000, 5000)) - 0.5
    out = x * (x > 0)
    return out

def relu_max():
    x = np.random.random((5000, 5000)) - 0.5
    out = np.maximum(x, 0)
    return out

def relu_max_inplace():
    x = np.random.random((5000, 5000)) - 0.5
    np.maximum(x, 0, x)
    return x

время:

print("baseline:")
%timeit -n10 baseline()
print("multiplication method:")
%timeit -n10 relu_mul()
print("max method:")
%timeit -n10 relu_max()
print("max inplace method:")
%timeit -n10 relu_max_inplace()

получить результаты:

baseline:
10 loops, best of 3: 425 ms per loop
multiplication method:
10 loops, best of 3: 596 ms per loop
max method:
10 loops, best of 3: 682 ms per loop
max inplace method:
10 loops, best of 3: 602 ms per loop

in-place maximum метод только немного быстрее, чем maximum метод, и это может быть, потому что он опускает присвоение переменной для "out". И это еще медленнее, чем метод умножения.
И так как вы реализуете ReLU func. Возможно, вам придется сохранить " x " для backprop через relu. Е. Г.:

def relu_backward(dout, cache):
    x = cache
    dx = np.where(x > 0, dout, 0)
    return dx

поэтому я рекомендую вам использовать метод умножения.

автор: Patel Sunil · Accepted Answer · 2018-02-23 11:56:28

Это более точная реализация:

def ReLU(x):
    return abs(x) * (x > 0)

0

автор: Patel Sunil

автор: Boooooooooms · Accepted Answer · 2018-08-29 10:54:35

если у нас есть 3 параметра (t0, a0, a1) для Relu, то есть мы хотим реализовать

if x > t0:
    x = x * a1
else:
    x = x * a0

мы можем использовать следующий код:

X = X * (X > t0) * a1 +  X * (X < t0) * a0

X есть матрица.