Keras: не хватает памяти при выполнении поиска сетки параметров hyper

Я запускаю несколько вложенных циклов для поиска сетки параметров hyper. Каждый вложенный цикл проходит через список значений параметров hyper, а внутри самого внутреннего цикла строится и оценивается последовательная модель Keras каждый раз с помощью генератора. (Я не делаю никакого обучения, я просто случайно инициализирую, а затем оцениваю модель несколько раз, а затем извлекаю среднюю потерю).

моя проблема в том, что во время этого процесса Keras, похоже, заполняет мою память GPU, так что я в конечном итоге получаю ошибку OOM.

кто-нибудь знает, как решить эту проблему и освободить память GPU каждый раз после оценки модели?

мне больше не нужна модель после того, как она была оценена, я могу выбросить ее полностью каждый раз, прежде чем строить новую в следующем проходе внутреннего цикла.

Я использую бэкэнд Tensorflow.

вот код, хотя это не имеет отношения к общей проблеме. Модель построен внутри четвертого цикла,

for fsize in fsizes:

Я думаю, что детали того, как построена модель, не имеют большого значения, но вот все это в любом случае:

model_losses = []
model_names = []

for activation in activations:
    for i in range(len(layer_structures)):
        for width in layer_widths[i]:
            for fsize in fsizes:

                model_name = "test_{}_struc-{}_width-{}_fsize-{}".format(activation,i,np.array_str(np.array(width)),fsize)
                model_names.append(model_name)
                print("Testing new model: ", model_name)

                #Structure for this network
                structure = layer_structures[i]

                row, col, ch = 80, 160, 3  # Input image format

                model = Sequential()

                model.add(Lambda(lambda x: x/127.5 - 1.,
                          input_shape=(row, col, ch),
                          output_shape=(row, col, ch)))

                for j in range(len(structure)):
                    if structure[j] == 'conv':
                        model.add(Convolution2D(width[j], fsize, fsize))
                        model.add(BatchNormalization(axis=3, momentum=0.99))
                        if activation == 'relu':
                            model.add(Activation('relu'))
                        if activation == 'elu':
                            model.add(ELU())
                            model.add(MaxPooling2D())
                    elif structure[j] == 'dense':
                        if structure[j-1] == 'dense':
                            model.add(Dense(width[j]))
                            model.add(BatchNormalization(axis=1, momentum=0.99))
                            if activation == 'relu':
                                model.add(Activation('relu'))
                            elif activation == 'elu':
                                model.add(ELU())
                        else:
                            model.add(Flatten())
                            model.add(Dense(width[j]))
                            model.add(BatchNormalization(axis=1, momentum=0.99))
                            if activation == 'relu':
                                model.add(Activation('relu'))
                            elif activation == 'elu':
                                model.add(ELU())

                model.add(Dense(1))

                average_loss = 0
                for k in range(5):
                    model.compile(optimizer="adam", loss="mse")
                    val_generator = generate_batch(X_val, y_val, resize=(160,80))
                    loss = model.evaluate_generator(val_generator, len(y_val))
                    average_loss += loss

                average_loss /= 5

                model_losses.append(average_loss)

                print("Average loss after 5 initializations: {:.3f}".format(average_loss))
                print()

1 ответов


Как указано в бэкэнде, используемом в Tensorflow. В TensorFlow backend текущая модель не разрушается. Поэтому вам нужно очистить сеанс.

после использования модели просто поставить:

if K.backend() == 'tensorflow':
    K.clear_session()

включить серверный :

from keras import backend as K

Также вы можете использовать оболочку sklearn для поиска сетки. Проверьте этот пример:здесь. Также для более продвинутых hyperparameter поиска вы можете использовать hyperas.