Ответ 1
попробуйте следующее:
X = sm.add_constant(X)
sm.OLS(y,X)
как в документах :
Интерсепт не включается по умолчанию и должен быть добавлен пользователем
Вот что я делаю:
$ python
Python 2.7.6 (v2.7.6:3a1db0d2747e, Nov 10 2013, 00:42:54)
[GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin
>>> import statsmodels.api as sm
>>> statsmodels.__version__
'0.5.0'
>>> import numpy
>>> y = numpy.array([1,2,3,4,5,6,7,8,9])
>>> X = numpy.array([1,1,2,2,3,3,4,4,5])
>>> res_ols = sm.OLS(y, X).fit()
>>> res_ols.params
array([ 1.82352941])
Я ожидал массив с двумя элементами?!? Перехват и коэффициент наклона?
попробуйте следующее:
X = sm.add_constant(X)
sm.OLS(y,X)
как в документах :
Интерсепт не включается по умолчанию и должен быть добавлен пользователем
Чтобы быть полным, это работает:
>>> import numpy
>>> import statsmodels.api as sm
>>> y = numpy.array([1,2,3,4,5,6,7,8,9])
>>> X = numpy.array([1,1,2,2,3,3,4,4,5])
>>> X = sm.add_constant(X)
>>> res_ols = sm.OLS(y, X).fit()
>>> res_ols.params
array([-0.35714286, 1.92857143])
Это дает мне другой коэффициент наклона, но я думаю, что цифры, которые у нас сейчас есть, имеют перехват.
Я запускаю 0.6.1, и похоже, что функция "add_constant" была перенесена в модуль statsmodels.tools. Вот что я побежал, что сработало:
res_ols = sm.OLS(y, statsmodels.tools.add_constant(X)).fit()