Среднее значение переменной по двум факторам
у меня есть следующие данные:
a <- c(1,1,1,1,2,2,2,2)
b <- c(2,4,6,8,2,3,4,1)
c <- factor(c("A","B","A","B","A","B","A","B"))
df <- data.frame(
sp=a,
length=b,
method=c)
Я могу использовать следующее, Чтобы получить подсчет количества образцов каждого вида методом:
n <- with(df,tapply(sp,method,function(x) count(x)))
Как мне также получить среднюю длину методом для каждого вида?
2 ответов
лично я бы использовал aggregate
:
aggregate(length ~ sp, data = df, FUN= "mean" )
# by species only
# sp length
#1 1 5.0
#2 2 2.5
aggregate(length ~ sp + method, data = df, FUN= "mean" )
# by species and method
# sp method length
#1 1 A 4
#2 2 A 3
#3 1 B 6
#4 2 B 2
за все вместе можно:
aggregate(length ~ method, data = df, function(x) c(m = mean(x), counts = length(x)) )
# counts and mean for each method
# method length.m length.counts
#1 A 3.5 4.0
#2 B 4.0 4.0
библиотека plyr очень полезна для таких вещей, как это
library(plyr)
new.df <- ddply(df, c("method", "sp"), summarise,
mean.length=mean(length),
max.length=max(length),
n.obs=length(length))
дает
> new.df
method sp mean.length max.length n.obs
1 A 1 4 6 2
2 A 2 3 4 2
3 B 1 6 8 2
4 B 2 2 3 2
больше примеров в http://www.inside-r.org/packages/cran/plyr/docs/ddply.