Создание кластера домашних серверов для анализа данных

Я видел здесь пару вопросов, которые похожи на то, о чем я думаю, но не совсем. Поэтому я решил спросить и посмотреть, что получится.

В принципе, у меня есть 2 или 3 старых, более медленных ноутбука, лежащих вокруг. Что я хотел бы сделать, так это объединить эти компьютеры в кластер, чтобы выполнить на них некоторые "смущающе параллельные" процедуры анализа данных (например, обучение алгоритму машинного обучения на множестве разных ядер). Чтобы быть более конкретным, я хочу бежать Код Python (scikit-learn, который может работать на многих разных ядрах) в этом кластере.

В идеале я хотел бы создать кластер с 3 ноутбуками, связанными вместе, и устройством хранения данных (1-2 ТБ), подключенным к сети. Затем я хотел бы написать сценарии для анализа данных на моем текущем ноутбуке, каким-то образом получить доступ к кластеру (ssh?) и запустить сценарии для данных, хранящихся на подключенном устройстве, разделяя анализ между различными ноутбуками. Мысли?

Я кое-что читал о кластерах Беовульфа, кластеризации с Ubuntu и других вещах. Однако у меня нет опыта работы с сетями, кластеризацией, командами Unix и т. Д., И я действительно ничего из этого не понимаю. Я готов учиться, но на самом деле понятия не имею, с чего начать, поэтому буду очень признателен за советы, ресурсы, предложения.