Ответ 1
Здесь довольно много алгоритмов машинного обучения. Здесь академические статьи, которые могут быть интересными. Наконец, здесь книга на карте уменьшает интересность.
Может ли кто-нибудь указать мне хороший веб-сайт с хорошей коллекцией алгоритмов Hadoop. Например, самая сложная вещь, которую я могу сделать с Hadoop прямо сейчас, это Page Rank. Кроме этого, я могу делать тривиальные вещи, такие как подсчет слов и прочее.
Я хочу увидеть веб-сайт, который покажет мне другое использование hadoop.
Здесь довольно много алгоритмов машинного обучения. Здесь академические статьи, которые могут быть интересными. Наконец, здесь книга на карте уменьшает интересность.
Посмотрите на этот обзор: http://atbrox.com/2010/05/08/mapreduce-hadoop-algorithms-in-academic-papers-may-2010-update/
На этой странице дается хороший обзор некоторых общих шаблонов Map Reduce в широком спектре приложений от создания инвертированного индекса, реализации Page Rank и выполнения объединений и других операций set
http://highlyscalable.wordpress.com/2012/02/01/mapreduce-patterns/
В основном везде, где вы видите линейную алгебру (матричные/векторные операции), вы можете применить Map Reduce. Это означает, что существует множество приложений для совместной фильтрации (см. Рекомендации Netflix), кластеризации и других алгоритмов машинного обучения. Другим очень интересным проектом для изучения является Mahout, целью которого является внедрение масштабируемых алгоритмов машинного обучения, в значительной степени расширяющих MapReduce через Hadoop.