Какой из многих ядер Spark/Scala для Jupyter/IPython выбрать?
Существует много ядер Scala/Spark для IPython/Jupyter:
Кто-нибудь знает, какой из них наиболее совместим с IPython/Jupyter и наиболее удобен в использовании:
Ответы
Ответ 1
Я не могу говорить для всех из них, но я использую Ядро искры, и он отлично работает для использования как Scala, так и Spark.
Я нашел IScala и Jupyter Scala менее стабильным и менее полированным. Jupyter Scala всегда печатает каждое значение переменной после выполнения ячейки; Я не хочу видеть это в 99% случаев.
Ядро искры - мой любимый. И для Spark, и для обычного старого Scala.
Ответ 2
Ядро искры было принято в Apache Incubator и переместило всю разработку в Apache Toree a > .
Ответ 3
Я использую искровое ядро (ваш вариант №4) и вполне удовлетворен.
Здесь вы можете найти хорошую практическую установку (CDH 5.5 на CentOS 7) (я сам использовал ее для установки в Single node в псевдораспределенном режиме).
http://www.davidgreco.me/blog/2015/12/24/how-to-use-jupyter-with-spark-kernel-and-cloudera-hadoop-slash-spark/