Сокращение карты Hadoop: алгоритмы

Может ли кто-нибудь указать мне хороший веб-сайт с хорошей коллекцией алгоритмов Hadoop. Например, самая сложная вещь, которую я могу сделать с Hadoop прямо сейчас, это Page Rank. Кроме этого, я могу делать тривиальные вещи, такие как подсчет слов и прочее.

Я хочу увидеть веб-сайт, который покажет мне другое использование hadoop.

Ответы

Ответ 3

На этой странице дается хороший обзор некоторых общих шаблонов Map Reduce в широком спектре приложений от создания инвертированного индекса, реализации Page Rank и выполнения объединений и других операций set

http://highlyscalable.wordpress.com/2012/02/01/mapreduce-patterns/

В основном везде, где вы видите линейную алгебру (матричные/векторные операции), вы можете применить Map Reduce. Это означает, что существует множество приложений для совместной фильтрации (см. Рекомендации Netflix), кластеризации и других алгоритмов машинного обучения. Другим очень интересным проектом для изучения является Mahout, целью которого является внедрение масштабируемых алгоритмов машинного обучения, в значительной степени расширяющих MapReduce через Hadoop.

http://mahout.apache.org/