Многомерный нормальный CDF в Python с использованием scipy
Чтобы вычислить CDF многомерного стандарта, я следовал примеру this (для одномерного случая), но не мог интерпретировать вывод, полученный scipy:
from scipy.stats import norm
import numpy as np
mean = np.array([1,5])
covariance = np.matrix([[1, 0.3 ],[0.3, 1]])
distribution = norm(loc=mean,scale = covariance)
print distribution.cdf(np.array([2,4]))
Выводимый результат:
[[ 8.41344746e-01 4.29060333e-04]
[ 9.99570940e-01 1.58655254e-01]]
Если общий CDF определяется как:
P (X1 ≤ x1, . . . ,Xn ≤ xn)
тогда ожидаемый результат должен быть действительным числом от 0 до 1.
Ответы
Ответ 1
После многого поиска, я думаю, this в блоге Ноя Х. Сильберт описывает единственный готовый код из стандартной библиотеки, которая может быть использована для вычисления cdf для многомерного нормали в Python. У Scipy есть способ сделать это, но, как упоминалось в блоге, его сложно найти. Этот подход основан на документе Алана Генца.
Из блога это то, как это работает.
from scipy.stats import mvn
import numpy as np
low = np.array([-10, -10])
upp = np.array([.1, -.2])
mu = np.array([-.3, .17])
S = np.array([[1.2,.35],[.35,2.1]])
p,i = mvn.mvnun(low,upp,mu,S)
print p
0.2881578675080012
Ответ 2
SciPy multivariate_normal
из v1.1.0 имеет CDF встроенную функцию в систему:
from scipy.stats import multivariate_normal as mvn
import numpy as np
mean = np.array([1,5])
covariance = np.array([[1, 0.3],[0.3, 1]])
dist = mvn(mean=mean, cov=covariance)
print("CDF:", dist.cdf(np.array([2,4])))
CDF: 0.14833820905742245
Документацию для v1.2.0 можно найти здесь.
Ответ 3
Если вы не заботитесь о производительности (т.е. выполняете его только изредка), вы можете создать многомерный обычный pdf с помощью multivariate_normal
, а затем вычислить cdf integrate.nquad