Пряжа Apache Hadoop - Недостаточное использование сердечников

Независимо от того, насколько я возился с настройками в yarn-site.xml, используя все приведенные ниже опции

Я просто все еще не могу получить свое приложение i.e Spark, чтобы использовать все ядра в кластере. Кажется, что исполнители искры правильно занимают всю доступную память, но каждый исполнитель просто держит одно ядро и не более.

Обратите внимание, что для параметра spark.executor.cores установлено значение 3, но оно не работает. Как это исправить?

Ответы

Ответ 1

Проблема заключается не в yarn-site.xml или spark-defaults.conf, а на самом деле с калькулятором ресурсов, который присваивает ядра исполнителям или в случае заданий MapReduce для Mappers/Reducers.

Калькулятор ресурсов по умолчанию i.e org.apache.hadoop.yarn.util.resource.DefaultResourceCalculator использует только информацию о памяти для распределения контейнеров, а планирование по умолчанию не включено по умолчанию. Для использования как памяти, так и ЦП калькулятор ресурсов необходимо изменить на org.apache.hadoop.yarn.util.resource.DominantResourceCalculator в файле capacity-scheduler.xml.

Здесь что нужно изменить.

<property>
    <name>yarn.scheduler.capacity.resource-calculator</name>
    <value>org.apache.hadoop.yarn.util.resource.DominantResourceCalculator</value>
</property>