Определить кортежи в сценарии свиньи
В настоящее время я отлаживаю скрипт свиньи. Я бы хотел определить кортеж в файле Pig напрямую (вместо базовой функции "Загрузить").
Есть ли способ сделать это?
Я ищу что-то вроде этого:
A= ('name#bob'','age#29';'name#paul','age#12')
Свалка вернется:
('bob',29)
('paul',12)
Ответы
Ответ 1
На самом деле это невозможно сделать в свинье, как оно сейчас стоит. Если вы просто хотите отлаживать создание файла в hadoop и загрузить его. Напишите данные, которые вы хотите в файл (независимо от того, что вы создали вручную, если бы это было возможно) и загрузите его. Затем загрузите его с помощью свиньи.
Ответ 2
Следующий (грязный) трюк выполняет задание: - создайте файл. С одной пустой строкой и сохраните ее в HDFS. - загрузить его: Line = load/user/toto/onelinefile USING.. - создать собственные данные: foreach line сгенерировать "bob" как имя, 22 по возрасту;