Экстракт pvalue из glm

Question

Экстракт pvalue из glm

Я запускаю много регрессий и интересуюсь только влиянием на коэффициент и p-значение одной конкретной переменной. Итак, в моем скрипте я хотел бы иметь возможность просто извлечь p-значение из резюме glm (получить сам коэффициент легко). Единственный известный мне способ просмотра p-значения - это использование summary (myReg). Есть ли другой способ?

например:

fit <- glm(y ~ x1 + x2, myData)
x1Coeff <- fit$coefficients[2] # only returns coefficient, of course
x1pValue <- ???

Я пробовал обрабатывать fit$coefficients как Матрица, Но я все еще не могу просто извлечь p-значение.

возможно ли это сделать?

спасибо!

27

glm p-value r

автор: Clark Henry

4 ответов

автор: Gavin Simpson · Accepted Answer · 2014-05-23 22:31:05

вы хотите

coef(summary(fit))[,4]

который извлекает вектор-столбцом p значения из табличного вывода, показанного summary(fit). The p-значения фактически не вычисляются, пока вы не запустите summary() на модели.

кстати, используйте функции экстрактора, а не углубляться в объекты, если вы можете:

fit$coefficients[2]

должно быть

coef(fit)[2]

если нет функций экстрактора,str() - твой друг. Это позволяет посмотрите на структуру любого объекта, которая позволяет увидеть, что содержит объект и как его извлечь:

summ <- summary(fit)

> str(summ, max = 1)
List of 17
 $ call          : language glm(formula = counts ~ outcome + treatment, family = poisson())
 $ terms         :Classes 'terms', 'formula' length 3 counts ~ outcome + treatment
  .. ..- attr(*, "variables")= language list(counts, outcome, treatment)
  .. ..- attr(*, "factors")= int [1:3, 1:2] 0 1 0 0 0 1
  .. .. ..- attr(*, "dimnames")=List of 2
  .. ..- attr(*, "term.labels")= chr [1:2] "outcome" "treatment"
  .. ..- attr(*, "order")= int [1:2] 1 1
  .. ..- attr(*, "intercept")= int 1
  .. ..- attr(*, "response")= int 1
  .. ..- attr(*, ".Environment")=<environment: R_GlobalEnv> 
  .. ..- attr(*, "predvars")= language list(counts, outcome, treatment)
  .. ..- attr(*, "dataClasses")= Named chr [1:3] "numeric" "factor" "factor"
  .. .. ..- attr(*, "names")= chr [1:3] "counts" "outcome" "treatment"
 $ family        :List of 12
  ..- attr(*, "class")= chr "family"
 $ deviance      : num 5.13
 $ aic           : num 56.8
 $ contrasts     :List of 2
 $ df.residual   : int 4
 $ null.deviance : num 10.6
 $ df.null       : int 8
 $ iter          : int 4
 $ deviance.resid: Named num [1:9] -0.671 0.963 -0.17 -0.22 -0.956 ...
  ..- attr(*, "names")= chr [1:9] "1" "2" "3" "4" ...
 $ coefficients  : num [1:5, 1:4] 3.04 -4.54e-01 -2.93e-01 1.34e-15 1.42e-15 ...
  ..- attr(*, "dimnames")=List of 2
 $ aliased       : Named logi [1:5] FALSE FALSE FALSE FALSE FALSE
  ..- attr(*, "names")= chr [1:5] "(Intercept)" "outcome2" "outcome3" "treatment2" ...
 $ dispersion    : num 1
 $ df            : int [1:3] 5 4 5
 $ cov.unscaled  : num [1:5, 1:5] 0.0292 -0.0159 -0.0159 -0.02 -0.02 ...
  ..- attr(*, "dimnames")=List of 2
 $ cov.scaled    : num [1:5, 1:5] 0.0292 -0.0159 -0.0159 -0.02 -0.02 ...
  ..- attr(*, "dimnames")=List of 2
 - attr(*, "class")= chr "summary.glm"

отсюда отметим coefficients компонент, который мы можем извлечь с помощью coef(), но у других компонентов нет экстракторов, таких как null.deviance, который вы можете извлекать в качестве summ$null.deviance.

автор: James King · Accepted Answer · 2014-05-23 22:23:41

я использовал этот метод в прошлом, чтобы вытащить данные предиктора из summary или от приспособленного модельного объекта:

coef(summary(m))[grepl("var_i_want$",row.names(coef(summary(m)))), 4]

что позволяет мне легко редактировать, какую переменную я хочу получить данные.

или, как указано в @Ben, используйте match или %in%, несколько чище, чем grepl:

coef(summary(m))[row.names(coef(summary(m))) %in% "var_i_want" , 4]

автор: R. Prost · Accepted Answer · 2018-02-07 15:06:52

вместо числа вы можете поставить непосредственно имя

coef(summary(fit))[,'Pr(>|z|)']

другие доступные из резюме коэффициента:

Estimate Std. Error z value Pr(>|z|)

автор: Ebby · Accepted Answer · 2018-05-20 11:48:59

Ну, это был бы другой способ, однако не самый эффективный способ его выполнения:

a = coeftable(model).cols[4]
pVals = [ a[i].v for i in 1:length(a) ]

это гарантирует, что извлеченные значения из glm не находятся в StatsBase. В нем вы можете играть с pVals согласно вашему требованию. Надеюсь, это поможет, Ebby