Крупномасштабный интеллектуальный анализ данных с помощью clojure
Я ищу хорошую ссылку на
крупномасштабный интеллектуальный анализ данных с помощью Clojure
Я знаю много хороших книг программирования clojure (Программирование Clojure, Радость Clojure,...) и множество хороших текстовых книг для интеллектуального анализа данных (разработка массивных наборов данных, управление гигабайтами,...). Однако я не знаю никакой ссылки, которая специально адресована
крупномасштабный интеллектуальный анализ данных с помощью Clojure
Часть "с clojure" для меня важна по следующим причинам:
* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)
В частности, я думаю, что существует много взаимодействий между JVM, clojure Data Structures, независимо от того, хранятся ли данные в памяти или лениво читаются с диска, - которые могут иметь "тот же самый" алгоритм, существенно отличающийся от времени выполнения "немного" различных реализаций.
Таким образом, мой вопрос (все вышесказанное заключалось в том, чтобы не закрывать "Проверить Google" ):
что такое хороший ресурс для массивного интеллектуального анализа данных с помощью Clojure?
Спасибо!
Ответы
Ответ 1
Я не думаю, что кто-то еще написал хорошую всеобъемлющую ссылку. Но в этом пространстве, безусловно, много работы (включая мою собственную компанию!)
Некоторые интересные ссылки для наблюдения:
- Storm - распределенное вычисление в реальном времени с использованием Clojure. Может использоваться для крупномасштабного интеллектуального анализа данных.
- http://www.infoq.com/presentations/Why-Prismatic-Goes-Faster-With-Clojure - интересное видео о производительности и оптимизации Clojure для приложений машинного обучения
- Incanter - вероятно, ведущая библиотека Clojure для статистики и визуализации данных
- Weka - очень обширная библиотека интеллектуального анализа данных/машинного обучения для Java (и, следовательно, очень проста в использовании непосредственно из Clojure)
Ответ 2
В мае 2013 года появилась замечательная книга: Clojure Поваренная книга по анализу данных. Вероятно, я куплю его.
http://www.amazon.co.uk/Clojure-Data-Analysis-Cookbook-ebook/dp/B00BECVV9C/ref=sr_1_1?s=books&ie=UTF8&qid=1360697819&sr=1-1
Подробнее
Данные повсюду, и все более важно иметь возможность получить которые мы можем действовать. Использование Clojure для анализа данных и коллекции, эта книга покажет вам, как получить свежие идеи и перспективы из ваших данных с существенной коллекцией практических, структурированные рецепты.
"Clojure Поваренная книга по анализу данных" представляет рецепты для каждого этапа процесса анализа данных. Независимо от того, очищают ли данные данные с веб-страницы, выполняя интеллектуальный анализ данных или создавая графики для Интернета, эта книга имеет что-то для этой задачи.
Вы узнаете, как получить данные, очистить их и преобразовать в полезные графики, которые затем могут быть проанализированы и опубликованы Интернет. Покрытие включает в себя такие расширенные темы, как обработка данных одновременно применяя мощные статистические методы, такие как байесовский моделирования и даже алгоритмов интеллектуального анализа данных, таких как кластеризация K-средств, нейронных сетей и правил ассоциации.
подход
Полные практические советы, "Clojure Cookbook по анализу данных" помогут вы полностью используете свои данные с помощью серии пошаговых, реальных мировые рецепты, охватывающие все аспекты анализа данных.
Кто эта книга для
Опыт работы с Clojure и методами анализа данных и рабочие процессы будут полезными, но не важными.