Что такое современное состояние при неконтролируемом обучении по временным данным?
Я ищу обзор самых современных методов, которые
Другими словами, учитывая пародию/последовательность (потенциально высокомерных) данных, как вы находите те общие подпоследовательности, которые лучше всего захватывают структуру в
данных.
-
Любые указатели на последние разработки или документы (которые выходят за рамки HMM, надеюсь) приветствуются!
-
Возможно, эта проблема понятна
в более конкретной области приложения, например
- захват движения
- обработка речи
- обработка естественного языка
- последовательности действий игры
- прогноз фондового рынка?
- Кроме того, некоторые из этих методов достаточно общие, чтобы иметь дело с
- очень шумные данные
- иерархическая структура
- нерегулярное расстояние по временной оси
(Я не заинтересован в обнаружении известных шаблонов, а также при классификации или сегментировании последовательностей.)
Ответы
Ответ 1
В последнее время большое внимание уделяется непараметрическим HMM, расширениям для бесконечных пространств состояний, а также факториальным моделям, объясняющим наблюдение с использованием набора факторов, а не одного компонента смеси.
Вот некоторые интересные статьи, которые можно начать с (только названия документов в Google):
- "Выборка луча для бесконечной скрытой марковской модели"
- "Бесконечная факториальная скрытая марковская модель"
- "Байесовский непараметрический вывод переключения динамических линейных моделей"
- "Обмен функциями динамических систем с бета-процессами"
В разделах экспериментов эти статьи обсуждаются, в частности, приложениями в текстовом моделировании, диараризации динамиков и захвате движения.
Ответ 2
Я не знаю, какие данные вы анализируете, но я бы предложил (с точки зрения динамического анализа системы) взглянуть на:
- Графы повторения (легко найти его в googling)
- Вкладывание с задержкой по времени (может раскрывать потенциальные отношения между различными измерениями данных) + матрица расстояний (возможно, могут быть изучены окрестности окрестности)
Обратите внимание, что это просто еще один способ представить ваши данные и проанализировать их на основе этого нового представления. Просто предложение!