Как получить среднее значение двух столбцов с помощью dplyr?
Как получить среднее значение двух столбцов таблицы данных с помощью dplyr? Например, если мои данные, как показано ниже:
dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
Я хочу создать новый столбец "Avg", который является средним столбцом A и B для каждой строки:
dt %>% mutate(Avg=mean(c(A, B), na.rm=T))
но этот код не дает мне правильный результат. Как это сделать? Большое спасибо.
3 ответов
Если вы хотите использовать dplyr для достижения этого, я бы предложил использовать функцию rowwise()
:
R> library(dplyr)
R> dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
R> j <- dt %>% rowwise() %>% mutate(Avg=mean(c(A, B), na.rm=T))
R> j
Source: local data frame [5 x 3]
Groups: <by row>
A B Avg
(int) (dbl) (dbl)
1 1 1 1.0
2 2 4 3.0
3 3 NA 3.0
4 4 6 5.0
5 5 8 6.5
как о
dt %>% mutate(Avg=rowMeans(cbind(A, B), na.rm=T))
mean
не векторизованы. Он сворачивает все входные данные в одно значение. Если вы создадите матрицу с cbind()
, вы можете использовать rowMeans
чтобы сделать трюк.
в качестве начального набора данных data.table
, мы могли бы использовать data.table
методы
dt[, Avg:= mean(unlist(.SD), na.rm=TRUE) , .1:nrow(dt)]
dt
# A B Avg
#1: 1 1 1.0
#2: 2 4 3.0
#3: 3 NA 3.0
#4: 4 6 5.0
#5: 5 8 6.5