Каково лучшее продвижение Hydra MPI

Я изучаю новый менеджер процессов, который пришел автоматически с MPICH2, но до сих пор я не могу понять, что такое большой прогресс этой реализации, кто-то знает хороший учебник или имеет некоторый опыт?
Аргоннская Вики-это слишком просто:http://wiki.mcs.anl.gov/mpich2/index.php/Using_the_Hydra_Process_Manager

2 ответов


с точки зрения того, где я работаю, самым большим шагом вперед является масштабируемость запуска процесса. Запуск заданий 8000 + с предыдущими пусковыми установками процессов в mpich2-реализациях MPI был непригодно медленным и часто терпел неудачу из-за тайм-аутов или других сетевых проблем, которые почти исключили Mpich2-основанные MPI для наших крупнейших рабочих мест. Но у Hydra есть хорошая иерархическая модель запуска, которая также может воспользоваться вашим менеджером ресурсов.

в стратегии распределения с учетом топологии тоже хороши, но по сравнению с разницей между неудачным запуском заданий (или занятием часов) и успешными заданиями это эффект второго порядка.


Я полностью согласен с Джонатаном о существенном улучшении времени запуска работы. Кроме того, hydra, как правило, гораздо более полезна и надежна, чем предыдущие менеджеры процессов почти во всех аспектах. Он запускается более надежно, имеет больше функций (привязка ядра процесса, перенаправление выходного файла на основе формата, интеграция диспетчера ресурсов и пакетного планировщика и т. д.), и имеет меньше загадочных сообщений об ошибках, чем все предыдущие менеджеры процессов для MPICH2.

другой ключевым соображением является то, что hydra активно поддерживается, в то время как почти все другие PMs устарели и/или не поддерживаются на данный момент. Поэтому, если вы сообщите об ошибке в hydra, она, скорее всего, будет исправлена, что неверно для MPD или remshell.

AFAIK, вы также можете использовать hydra для запуска заданий без MPI, таких как программы UPC, если вы знаете, что делаете.