Доверительный интервал для биномиальных данных в R?

Я знаю, что мне нужны mean и s.d чтобы найти интервал, однако, что, если вопрос:

A survey of 1000 randomly chosen workers, 520 of them are female. Create a 95% confidence interval for the proportion of wokrers who are female based on survey.

Как найти mean и s.d за это?

4 ответов


вы также можете использовать prop.test пакета stats или binom.test

prop.test(x, n, conf.level=0.95, correct = FALSE)

        1-sample proportions test without continuity correction

data:  x out of n, null probability 0.5
X-squared = 1.6, df = 1, p-value = 0.2059
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
 0.4890177 0.5508292
sample estimates:
   p 
0.52 

вы можете найти интересные в этой статье, где в Таблице 1 на стр. 861 приведены различные доверительные интервалы для одной пропорции, рассчитанные с использованием семи методов (для выбранных комбинаций n и r). Используя prop.test вы можете получить результаты, найденные в строках 3 и 4 таблицы, в то время как binom.test возвращает то, что вы видите в строке 5.


в этом случае у вас есть биномиальное распределение, поэтому вы будете вычислять доверительный интервал биномиальной пропорции.

R, вы можете использовать binconf() пакета Hmisc

> binconf(x=520, n=1000)
 PointEst     Lower     Upper
     0.52 0.4890177 0.5508292

или вы можете рассчитать ее самостоятельно:

> p <- 520/1000
> p + c(-qnorm(0.975),qnorm(0.975))*sqrt((1/1000)*p*(1-p))
[1] 0.4890345 0.5509655

кроме того, использовать функцию propCI С prevalence пакет, чтобы получить пять наиболее часто используемых биномиальных доверительных интервалов:

> library(prevalence)
> propCI(x = 520, n = 1000)
    x    n    p        method level     lower     upper
1 520 1000 0.52 agresti.coull  0.95 0.4890176 0.5508293
2 520 1000 0.52         exact  0.95 0.4885149 0.5513671
3 520 1000 0.52      jeffreys  0.95 0.4890147 0.5508698
4 520 1000 0.52          wald  0.95 0.4890351 0.5509649
5 520 1000 0.52        wilson  0.95 0.4890177 0.5508292

другой пакет: tolerance высчитает ряды доверия / допуска для тонны типичных функций распределения.