Доверительный интервал для биномиальных данных в R?
Я знаю, что мне нужны mean и s.d чтобы найти интервал, однако, что, если вопрос:
A survey of 1000 randomly chosen workers, 520 of them are female. Create a 95% confidence interval for the proportion of wokrers who are female based on survey.
Как найти mean и s.d за это?
4 ответов
вы также можете использовать prop.test
пакета stats
или binom.test
prop.test(x, n, conf.level=0.95, correct = FALSE)
1-sample proportions test without continuity correction
data: x out of n, null probability 0.5
X-squared = 1.6, df = 1, p-value = 0.2059
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.4890177 0.5508292
sample estimates:
p
0.52
вы можете найти интересные в этой статье, где в Таблице 1 на стр. 861 приведены различные доверительные интервалы для одной пропорции, рассчитанные с использованием семи методов (для выбранных комбинаций n и r). Используя prop.test
вы можете получить результаты, найденные в строках 3 и 4 таблицы, в то время как binom.test
возвращает то, что вы видите в строке 5.
в этом случае у вас есть биномиальное распределение, поэтому вы будете вычислять доверительный интервал биномиальной пропорции.
R, вы можете использовать binconf()
пакета Hmisc
> binconf(x=520, n=1000)
PointEst Lower Upper
0.52 0.4890177 0.5508292
или вы можете рассчитать ее самостоятельно:
> p <- 520/1000
> p + c(-qnorm(0.975),qnorm(0.975))*sqrt((1/1000)*p*(1-p))
[1] 0.4890345 0.5509655
кроме того, использовать функцию propCI
С prevalence
пакет, чтобы получить пять наиболее часто используемых биномиальных доверительных интервалов:
> library(prevalence)
> propCI(x = 520, n = 1000)
x n p method level lower upper
1 520 1000 0.52 agresti.coull 0.95 0.4890176 0.5508293
2 520 1000 0.52 exact 0.95 0.4885149 0.5513671
3 520 1000 0.52 jeffreys 0.95 0.4890147 0.5508698
4 520 1000 0.52 wald 0.95 0.4890351 0.5509649
5 520 1000 0.52 wilson 0.95 0.4890177 0.5508292