Как получить среднее значение двух столбцов с помощью dplyr?

Как получить среднее значение двух столбцов таблицы данных с помощью dplyr? Например, если мои данные, как показано ниже:

dt <- data.table(A=1:5, B=c(1,4,NA,6,8))

Я хочу создать новый столбец "Avg", который является средним столбцом A и B для каждой строки:

dt %>% mutate(Avg=mean(c(A, B), na.rm=T))

но этот код не дает мне правильный результат. Как это сделать? Большое спасибо.

3 ответов


Если вы хотите использовать dplyr для достижения этого, я бы предложил использовать функцию rowwise():

    R> library(dplyr)
    R> dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
    R> j <- dt %>% rowwise() %>% mutate(Avg=mean(c(A, B), na.rm=T)) 
    R> j
Source: local data frame [5 x 3]
Groups: <by row>

      A     B   Avg
  (int) (dbl) (dbl)
1     1     1   1.0
2     2     4   3.0
3     3    NA   3.0
4     4     6   5.0
5     5     8   6.5

как о

dt %>% mutate(Avg=rowMeans(cbind(A, B), na.rm=T))

mean не векторизованы. Он сворачивает все входные данные в одно значение. Если вы создадите матрицу с cbind(), вы можете использовать rowMeans чтобы сделать трюк.


в качестве начального набора данных data.table, мы могли бы использовать data.table методы

dt[, Avg:= mean(unlist(.SD), na.rm=TRUE) , .1:nrow(dt)]
dt
#   A  B Avg
#1: 1  1 1.0
#2: 2  4 3.0
#3: 3 NA 3.0
#4: 4  6 5.0
#5: 5  8 6.5