Как ускорить модель марки PyMC?

Есть ли способ ускорить эту простую модель PyMC? В 20-40 точках данных требуется ~ 5-11 секунд.

Только с 40 точками данных требуется 11 секунд для запуска:

(с 80 очками требуется 20 секунд). Это игрушечный пример. Выражения внутри Lambda(), которые определяют переходы, на практике более сложны. Эта базовая структура кода является гибкой (тогда как кодирование модели с переходными матрицами менее гибко). Есть ли способ сохранить подобную структуру кода, но получить лучшую производительность? С удовольствием переключитесь на PyMC3, если это необходимо. Спасибо.

Ответы

Ответ 1

Марковская цепь Монте-Карло является известной последовательной проблемой.

Это означает, что его время выполнения пропорционально количеству шагов и времени выполнения вашей фитнес-функции.

Есть некоторые трюки, которые вы можете сделать, однако:

Использовать PyPy (требуется переписать, pymc не поддерживается)
Используйте выборку Gibbs для улучшения следующего шага.
Использовать несколько стартовых точек (параллельно)
Использовать несколько ветвей (параллельно)
Используйте эвристику, чтобы остановить цепочку раньше
Использовать аппроксимацию для точек, близких к уже вычисленным

Более сложные подходы:

Использовать Numba (компилирует функцию работоспособности для машинного кода)
перепишите свою функцию работоспособности в C (или аналогичную)
использовать собственный MCMC-код (не-Python, требуется выше)

Наконец, там много исследований:

http://www.mas.ncl.ac.uk/~ndjw1/docs/pbc.pdf

https://sites.google.com/site/parallelmcmc/

http://pyinsci.blogspot.com/2010/12/efficcient-mcmc-in-python.html (pypy)