Ответ 1
Предполагая, что вы правильно использовали тест, я предполагаю, что у вас есть отклонение small от нормального распределения, и поскольку ваш размер выборки настолько велик, даже небольшие отклонения приведут к отказу от нулевая гипотеза нормального распределения.
Одна из возможностей - визуально проверить ваши данные, построив гистограмму normed
с большим количеством ящиков и pdf с loc=data.mean()
и scale=data.std()
.
Существуют альтернативные тесты для тестирования нормальности, в статистических моделях используются тесты Андерсона-Дарлинга и Лилифорса (Колмогоров-Смирнов), когда оцениваются параметры распределения.
Однако я ожидаю, что результаты не будут сильно отличаться при большом размере выборки.
Основной вопрос заключается в том, хотите ли вы проверить, соответствует ли ваш образец "точно" из нормального дистрибутива, или вас просто интересует, относится ли ваш образец к распределению, которое очень близко к нормальному распределению, закрыть с точки зрения практического использования.
Чтобы уточнить последний пункт:
http://jpktd.blogspot.ca/2012/10/tost-statistically-significant.html http://www.graphpad.com/guides/prism/6/statistics/index.htm?testing_for_equivalence2.htm
По мере увеличения размера выборки тест гипотезы получает больше мощности, это означает, что тест сможет отклонить нулевую гипотезу равенства даже для меньших и меньших различий. Если мы будем фиксировать уровень значимости, то в конце концов мы откажемся от крошечных различий, которые нам действительно не нравятся.
Альтернативный тип теста гипотез - это то, где мы хотим показать, что наш образец близок к данной гипотезе точки, например, два образца имеют почти одно и то же среднее значение. Проблема в том, что мы должны определить, какова наша область эквивалентности.
В случае хороших тестов пригодности нам нужно выбрать меру расстояния и определить порог для измерения расстояния между образцом и предполагаемым распределением. Я не нашел объяснений, где интуиция поможет выбрать этот порог расстояния.
stats.normaltest основан на отклонениях перекоса и эксцесса от изменений нормального распределения.
Андерсон-Дарлинг основан на интеграле от взвешенных квадратов различий между cdf.
Колмогоров-Смирнов основан на максимальной абсолютной разности между cdf.
chisquare для двоичных данных будет основываться на взвешенной сумме квадратичных вероятностей.
и т.д.
Я только когда-либо пробовал тестирование эквивалентности с бинными или дискретизованными данными, где я использовал порог из некоторых ссылочных случаев, который был все еще довольно произвольным.
В медицинском тестировании эквивалентности существуют некоторые предопределенные стандарты, чтобы указать, когда два лечения можно рассматривать как эквивалентные или аналогично низшим или превосходным в одностороннем варианте.