Что такое современное состояние при неконтролируемом обучении по временным данным?

Я ищу обзор самых современных методов, которые

  • найдите временные шаблоны (произвольной длины) в временных данных

  • и неконтролируемые (без меток).

Другими словами, учитывая пародию/последовательность (потенциально высокомерных) данных, как вы находите те общие подпоследовательности, которые лучше всего захватывают структуру в данных.

  • Любые указатели на последние разработки или документы (которые выходят за рамки HMM, надеюсь) приветствуются!

  • Возможно, эта проблема понятна в более конкретной области приложения, например

    • захват движения
    • обработка речи
    • обработка естественного языка
    • последовательности действий игры
    • прогноз фондового рынка?

  • Кроме того, некоторые из этих методов достаточно общие, чтобы иметь дело с
    • очень шумные данные
    • иерархическая структура
    • нерегулярное расстояние по временной оси

(Я не заинтересован в обнаружении известных шаблонов, а также при классификации или сегментировании последовательностей.)

Ответы

Ответ 1

В последнее время большое внимание уделяется непараметрическим HMM, расширениям для бесконечных пространств состояний, а также факториальным моделям, объясняющим наблюдение с использованием набора факторов, а не одного компонента смеси.

Вот некоторые интересные статьи, которые можно начать с (только названия документов в Google):

  • "Выборка луча для бесконечной скрытой марковской модели"
  • "Бесконечная факториальная скрытая марковская модель"
  • "Байесовский непараметрический вывод переключения динамических линейных моделей"
  • "Обмен функциями динамических систем с бета-процессами"

В разделах экспериментов эти статьи обсуждаются, в частности, приложениями в текстовом моделировании, диараризации динамиков и захвате движения.

Ответ 2

Я не знаю, какие данные вы анализируете, но я бы предложил (с точки зрения динамического анализа системы) взглянуть на:

  • Графы повторения (легко найти его в googling)
  • Вкладывание с задержкой по времени (может раскрывать потенциальные отношения между различными измерениями данных) + матрица расстояний (возможно, могут быть изучены окрестности окрестности)

Обратите внимание, что это просто еще один способ представить ваши данные и проанализировать их на основе этого нового представления. Просто предложение!