Ответ 1
попробуйте использовать параметр List as:
sc.parallelize(List(line)).collect()
он возвращает
res1: Array[String] = Array(hello,world)
У меня есть простая строка:
line = "Hello, world"
Я хотел бы преобразовать его в RDD только с одним элементом. Я пробовал
sc.parallelize(line)
Но он получает:
sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd']
Любые идеи?
попробуйте использовать параметр List as:
sc.parallelize(List(line)).collect()
он возвращает
res1: Array[String] = Array(hello,world)
Нижеприведенный код отлично работает на Python
sc.parallelize([строка]). собирать()
['Привет, мир']
Здесь мы передаем параметр "строка" в виде списка.