Ответ 1
Помимо Apache Hadoop, это более или менее третья скачка для распределения Hadoop между HortonWorks, Cloudera и MapR. Тогда есть GreenPlum HD и IBM InfoSphere BigInsights.
Является ли CDH свободным или коммерческим?
CDH из Cloudera может свободно использоваться. Но нужно платить за любые инструменты поддержки и управления поверх CDH.
В чем разница между этими двумя?
В Apache все проекты (Pig, Hive и т.д.) независимы. Cloudera гарантирует, что все эти фреймворки работают правильно друг с другом и упаковывают их как CDH. С CDH есть регулярный релиз, которого я не видел в Apache. Другое дело, трудно получить поддержку Apache Hadoop, в то время как Cloudera и другие предоставляют коммерческую поддержку своим версиям Hadoop.