Glmer logit - эффекты взаимодействия с вероятностной шкалой (репликация `эффектов` на` прогноз`)

Я запускаю glitter logit с использованием пакета lme4. Меня интересуют различные два и три способа взаимодействия и их интерпретации. Чтобы упростить, меня интересуют только коэффициенты фиксированных эффектов.

Мне удалось придумать код для расчета и построения этих эффектов по шкале logit, но у меня возникли проблемы с преобразованием их в прогнозируемый масштаб вероятностей. В конце концов, я хотел бы реплицировать вывод пакета effects.

До сих пор это все управление данными, функции и пакеты, которые мне нужны.

Это модель. Требуется минута, и она сходится со следующим предупреждением:

Несмотря на то, что я не совсем уверен, должен ли я беспокоиться о предупреждении, я использую оценки для расчета средних предельных эффектов для взаимодействия, представляющего интерес. Сначала я готовлю набор данных для подачи в функцию predict, а затем вычисляю маржинальные эффекты, а также доверительные интервалы, используя параметры фиксированных эффектов.

Я достаточно уверен, что это правильные оценки по шкале logit, но, возможно, я ошибаюсь. Во всяком случае, это сюжет:

Я думаю, что теперь шкала OY измеряется по шкале logit, но чтобы понять это, я бы хотел преобразовать ее в предсказанные вероятности. На основе wikipedia что-то вроде exp(value)/(exp(value)+1) должно сделать трюк, чтобы добраться до прогнозируемых вероятностей. Хотя я мог бы сделать newdat$remission <- exp(newdat$remission)/(exp(newdat$remission)+1), я не уверен, что как это сделать для доверительных интервалов?

В конце концов я хотел бы получить тот же сюжет, который генерирует пакет effects. То есть:

Несмотря на то, что я мог просто использовать пакет effects, он, к сожалению, не компилируется с множеством моделей, которые мне приходилось запускать для моей собственной работы:

Фиксация, которая потребует корректировки процедуры оценки, которую я хотел бы избежать в данный момент. плюс, мне также интересно, что effects на самом деле здесь. Буду благодарен за любой совет о том, как настроить мой первоначальный синтаксис, чтобы получить предсказанные вероятности!

Ответы

Ответ 1

Чтобы получить аналогичный результат с функцией effect, предоставленной в вашем вопросе, вам просто нужно вернуть преобразование как прогнозируемых значений, так и границ вашего доверительного интервала из шкалы логита в исходную шкалу с предоставленным вами преобразованием: exp(x)/(1+exp(x)).

Это преобразование может быть выполнено в базе R с помощью функции plogis:

> a <- 1:5
> plogis(a)
[1] 0.7310586 0.8807971 0.9525741 0.9820138 0.9933071
> exp(a)/(1+exp(a))
[1] 0.7310586 0.8807971 0.9525741 0.9820138 0.9933071

Поэтому, используя предложение от @eipi10, используя ленты для доверительных диапазонов вместо пунктирных линий (я также считаю эту презентацию более читаемой):

   ggplot(newdat, aes(LengthofStay, fill=factor(CancerStage), color=factor(CancerStage))) +
        geom_ribbon(aes(ymin = plogis(plo), ymax = plogis(phi)), colour=NA, alpha=0.2) + 
        geom_line(aes(y = plogis(remission)), size=1.2) + 
        xlab("Length of Stay") + xlim(c(2, 10)) +
        ylab("Probability of Remission") + ylim(c(0.0, 0.5)) +
        labs(colour="Cancer Stage", fill="Cancer Stage") + 
        theme_minimal()

Результаты те же (с effects_3.1-2 и lme4_1.1-13):

> compare <- merge(newdat, eff.m) 
> compare[, c("remission", "plo", "phi")] <- 
+     sapply(compare[, c("remission", "plo", "phi")], plogis)
> head(compare) 
  CancerStage LengthofStay  remission Experience        plo       phi        fit        se      lower     upper
1           1           10 0.20657613   17.64129 0.12473504 0.3223392 0.20657613 0.3074726 0.12473625 0.3223368
2           1            2 0.35920425   17.64129 0.27570456 0.4522040 0.35920425 0.1974744 0.27570598 0.4522022
3           1            4 0.31636299   17.64129 0.26572506 0.3717650 0.31636299 0.1254513 0.26572595 0.3717639
4           1            6 0.27642711   17.64129 0.22800277 0.3307300 0.27642711 0.1313108 0.22800360 0.3307290
5           1            8 0.23976445   17.64129 0.17324422 0.3218821 0.23976445 0.2085896 0.17324530 0.3218805
6           2           10 0.09957493   17.64129 0.06218598 0.1557113 0.09957493 0.2609519 0.06218653 0.1557101
> compare$remission-compare$fit
 [1] 8.604228e-16 1.221245e-15 1.165734e-15 1.054712e-15 9.714451e-16 4.718448e-16 1.221245e-15 1.054712e-15 8.326673e-16
[10] 6.383782e-16 4.163336e-16 7.494005e-16 6.383782e-16 5.689893e-16 4.857226e-16 2.567391e-16 1.075529e-16 1.318390e-16
[19] 1.665335e-16 2.081668e-16

Различия между границами доверия выше, но все еще очень малы:

> compare$plo-compare$lower
 [1] -1.208997e-06 -1.420235e-06 -8.815678e-07 -8.324261e-07 -1.076016e-06 -5.481007e-07 -1.429258e-06 -8.133438e-07 -5.648821e-07
[10] -5.806940e-07 -5.364281e-07 -1.004792e-06 -6.314904e-07 -4.007381e-07 -4.847205e-07 -3.474783e-07 -1.398476e-07 -1.679746e-07
[19] -1.476577e-07 -2.332091e-07

Но если я использую реальный квантиль нормального распределения cmult <- qnorm(0.975) вместо cmult <- 1.96, я получаю очень небольшие различия также для этих границ:

> compare$plo-compare$lower
 [1] 5.828671e-16 9.992007e-16 9.992007e-16 9.436896e-16 7.771561e-16 3.053113e-16 9.992007e-16 8.604228e-16 6.938894e-16
[10] 5.134781e-16 2.289835e-16 4.718448e-16 4.857226e-16 4.440892e-16 3.469447e-16 1.006140e-16 3.382711e-17 6.765422e-17
[19] 1.214306e-16 1.283695e-16