В чем разница между fair и capacity schedulers?

Я новичок в мире Hadoop и хочу знать разницу между справедливыми и планировщиками мощности. Также, Когда мы должны использовать каждый из них? Пожалуйста, ответьте простым способом, потому что я читаю много вещей в интернете, но я не получаю от них много.

3 ответов


справедливое планирование-это метод назначения ресурсов заданиям, чтобы все задания получали в среднем равную долю ресурсов с течением времени. Когда выполняется одно задание, это задание использует весь кластер. При отправке других заданий свободные слоты заданий назначаются новым заданиям, так что каждое задание получает примерно одинаковое количество времени процессора. В отличие от планировщика Hadoop по умолчанию, который формирует очередь заданий, это позволяет коротким заданиям заканчиваться в разумное время, не голодая долго джобс. Это также разумный способ совместного использования кластера между несколькими пользователями. Наконец, справедливое распределение также может работать с приоритетами работы - приоритеты используются в качестве весов для определения доли общего вычислительного времени, которое должна получить каждая работа.

CapacityScheduler конструировано для того чтобы позволить делить большой кластер пока дающ каждой организации минимальную гарантию емкости. Основная идея заключается в том, что доступные ресурсы в кластере Hadoop Map-Reduce разделены между несколько организаций, которые совместно финансируют кластер на основе вычислительных потребностей. Существует дополнительное преимущество, что организация может получить доступ к любому избыточному потенциалу, который не используется другими. Это обеспечивает эластичность для организаций эффективным с точки зрения затрат образом.


Ниже приведено функциональное сравнение двух планировщиков.

enter image description here


Fair Scheduler, выделяет пулы ресурсов (по весам), с справедливым разделением в каждом пуле

планировщик емкости, выделяет ресурсы для пулов, с планированием FIFO в каждом пуле

планировщик емкости предназначен для совместного использования большого кластера, предоставляя гарантии емкости каждой организации. с возможностью избыточного потенциала, не используемого другими.