Как рассчитать эти статистические данные?
Я пишу приложение, чтобы помочь некоторым исследованиям, и часть этого включает в себя некоторые статистические вычисления. В настоящее время исследователи используют программу под названием SPSS. Часть результата, который им нравится, выглядит следующим образом:
![[Part of the SPSS output]()
Они действительно обеспокоены значениями F
и Sig.
. Моя проблема в том, что у меня нет фона в статистике, и я не могу понять, какие вызовы вызывают или как их вычислять.
Я думал, что значение F
может быть результатом F-test, но после выполнения шагов, указанных в Википедии, я получил результат, отличный от того, что дает SPSS
.
Ответы
Ответ 1
Этот веб-сайт может помочь вам немного больше. Также этот.
Я работаю с довольно ржавой памятью курса статистики, но здесь ничего не получается:
Когда вы выполняете анализ дисперсии (ANOVA), вы фактически вычисляете статистику F как отношение от среднеквадратичных отклонений "между группами" и среднеквадратичных отклонений "внутри групп". Вторая ссылка выше кажется довольно хорошей для этого расчета.
Это позволяет статистике F точно точно влиять на вашу модель, поскольку дисперсия "между группами" является объяснительной, а дисперсия "внутри групп" является случайной ошибкой. Высокий F подразумевает очень значительную модель.
Как и во многих статистических операциях, вы возвращаете Sig. используя статистику F. Здесь, где ваша информация в Википедии поставляется немного под рукой. То, что вы хотите сделать, - использование степеней свободы, предоставляемых вам SPSS, - найти правильное значение P, при котором таблица F будет давать вы рассчитываете F-статистику. Значение P, где это происходит [F (таблица) = F (вычисленное)], является значением.
Концептуально меньшее значение значимости показывает очень сильную способность отклонять нулевую гипотезу (которая для этих целей означает, что ваша модель имеет объяснительную силу).
Извините, если кто-либо из них ошибается. Я вернусь, чтобы внести изменения!
Удачи вам. Статистика - это весело, возможно, не эта часть. =)
Ответ 2
Я полагаю из вашего вопроса, что ваши коллеги-исследователи хотят автоматизировать процесс, посредством которого выполняются определенные статистические анализы (т.е. они хотят группировать наборы данных процесса). У вас есть два варианта:
1) SPSS теперь доступен для сценариев через python (начиная с версии 15) - перейдите на spss.com и выполните поиск python. Вы можете писать скрипты python для автоматизации анализа данных и извлечения ключевых значений из сводных таблиц, а затем обрабатывать ответы любым способом. Это позволяет точно сравнивать результаты с вашим python script и затраченные вручную усилия в SPSS ваших сотрудников. Таким образом, вам не нужно будет действительно знать какую-либо статистику для выполнения этой работы (что является ключевым преимуществом)
2) Вы можете сделать это в R, свободной статистической среде, которая, вероятно, может быть написана сценарием. Это имеет тот недостаток, что вам придется изучать статистику, чтобы убедиться, что вы делаете это правильно.
Ответ 3
Статистика сложная:-). После года чтения и перечитания книг и документов и могу только с уверенностью сказать, что я понимаю его основные принципы.
Возможно, вы захотите исследовать готовые библиотеки для любого языка программирования, который вы используете, потому что они много полезны в математике в целом и в частности статистики (ошибки округления являются очевидным примером).
В качестве примера вы можете посмотреть проект R, который является одновременно интерактивной средой и библиотекой, которую вы можете использовать из ваш код на С++, распространяемый под GPL (т.е. если вы используете его только внутри страны и публикуете только результаты, вам не нужно открывать свой код).
Ответ 4
Короче: не делайте этого вручную, связывайте/используйте существующее программное обеспечение. И ответ sain_grocen неверен.: (
Это все тесты для значимости оценок параметров, которые обычно используются в многорежимном ответе "Множественные регрессии". Это не было бы простым способом сделать это вне среды статистического программирования. Я бы предложил либо получить вывод из ранее существовавшей статистической программы, либо использовать тот, с которым вы можете ссылаться и использовать этот код.
Я боюсь, что первый ответ (sain_grocen's) приведет вас к неправильному пути. Его объяснение, скорее всего, является особым случаем того, с чем вы на самом деле имеете дело. Анова объяснила в своих ссылках, что для одного ответного ответа в сбалансированном дизайне. Это не статистика F, которую вы видите. Имена в вашем выпуске (Pillai Trace, Hotelling Trace,...) - это некоторые из доступных многомерных версий. Они имеют F-распределения при определенных предположениях. Я не могу объяснить учебники, в которых стоит материал, я бы посоветовал вам начать с рассмотрения
"Прикладной многомерный статистический анализ" Джонсона и Вичерна
Ответ 5
Можете ли вы объяснить, почему сам SPSS не является прекрасным решением проблемы? Это то, что он генерирует сводные таблицы как выходные данные, которые трудно манипулировать? Это стоимость программы?
F-статистика может возникать из любого числа конкретных тестов. F является просто распределением (свободно: описание "частот" групп значений), как нормальный (гауссовский) или униформа. В целом они возникают из-за соотношения дисперсий. Мнение: многие статистики (включая меня), считают, что тесты на основе F нестабильны (жаргон: ненадежный).
Конкретная статистика выхода (трасса Пиллаи и т.д.) предполагает, что исходный анализ представляет собой пример MANOVA, который, как описывают другие плакаты, является сложной и труднодоступной процедурой.
Я также предполагаю, что, основываясь на MANOVA и использовании SPSS, это проект психологии или социологии... если не пожалуйста, просветите. Возможно, другие более простые модели могут быть легче понятны и более повторяемы. Проконсультируйтесь с вашей местной статистической консультационной группой, если таковой имеется.
Удачи!
Ответ 6
Здесь объясняется вывод MANOVA с очень хорошего сайта по статистике и SPSS:
Результат с объяснением:
http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm
Как и почему делать MANOVA или многомерный GLM:
(тот же путь, что и выше, но заканчивается в '/manova.htm')
Написание программного обеспечения с нуля для расчета этих результатов будет как продолжительным, так и сложным;
существует множество числовых задач и инверсии матриц.
Как сказал Генри, используйте скрипты Python или R. Я бы предложил работать с кем-то, кто знает SPSS, если скрипты.
Кроме того, сам SPSS способен экспортировать выходные таблицы в файлы с помощью OMS.
A script в SPSS может сделать это.
Узнайте, кто в вашей исследовательской группе знает SPSS и работает с ними.