Ответ 1
это обходной путь
spark_df.limit(5).toPandas().head()
хотя, я не знаю вычислительного бремени этого запроса. Я думаю, что limit()
не дорого. исправления приветствуются.
pyspark.sql.DataFrame
отображает беспорядочно с DataFrame.show()
- перенос строк вместо свитка.
но отображается с pandas.DataFrame.head
Я пробовал эти параметры
import IPython
IPython.auto_scroll_threshold = 9999
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
from IPython.display import display
но не повезло. Хотя прокрутка работает, когда используется в редакторе Atom с плагином jupyter:
это обходной путь
spark_df.limit(5).toPandas().head()
хотя, я не знаю вычислительного бремени этого запроса. Я думаю, что limit()
не дорого. исправления приветствуются.
Я создал ниже li'l функцию, и она отлично работает:
def printDf(sprkDF):
newdf = sprkDF.toPandas()
from IPython.display import display, HTML
return HTML(newdf.to_html())
вы можете использовать его прямо на своих искровых запросах, если хотите, или на любом искровом кадре данных:
printDf(spark.sql('''
select * from employee
'''))
Теперь это возможно изначально с Spark 2.4.0, установив для параметра spark.sql.repl.eagerEval.enabled
значение True
: