Ответ 1
Я думаю, что хорошим начинанием для новичков станет курс с большими данными от Coursera
Например, я изучил основы технологии MapReduce.
Я хотел бы начать изучать технологии больших данных. Я хочу работать в этой области в будущем. Кто-нибудь знает хорошие книги, чтобы начать узнавать об этом? Hadoop, HBase.
Новичок - промежуточный - продвинутый -
Заранее спасибо
Я думаю, что хорошим начинанием для новичков станет курс с большими данными от Coursera
Например, я изучил основы технологии MapReduce.
Как насчет Hadoop: окончательное руководство от O'Reilly Media. Он охватывает все, что связано с Hadoop, MapReduce, HDFS и т.д.
Помимо ресурсов Cloudera
, я настоятельно рекомендую вам справочники из O'Reilly:
Вы также можете проверить его набор для научных исследований.
Если вы заинтересованы в Hive and Pig, есть также более специализированные книги об этих технологиях:
Я бы предложил изучить машинное обучение наряду с технологической частью https://www.coursera.org/course/ml. Статистика обучения также очень важна.