Tableau-подобная сгруппированная таблица в R для markdown
Я часто вычисляю сводную статистику в R с помощью dplyr, затем записываю результат в csv и загружаю его в Tableau для создания таблицы, потому что таблицы Tableau настолько просты и легки. Я бы предпочел генерировать таблицы непосредственно в R.
есть ли простое решение для сгруппированных таблиц в R?
очень легко генерировать данные, которые я хотел бы:
library(tidyr)
library(dplyr)
summary_table <- iris %>%
gather(measure, value, -Species) %>%
separate(measure, into=c("attribute", "dimension")) %>%
group_by(Species, attribute, dimension) %>%
summarise(mean=mean(value))
summary_table
Source: local data frame [12 x 4]
Groups: Species, attribute [?]
Species attribute dimension mean
<fctr> <chr> <chr> <dbl>
1 setosa Petal Length 1.462
2 setosa Petal Width 0.246
3 setosa Sepal Length 5.006
4 setosa Sepal Width 3.428
5 versicolor Petal Length 4.260
6 versicolor Petal Width 1.326
7 versicolor Sepal Length 5.936
8 versicolor Sepal Width 2.770
9 virginica Petal Length 5.552
10 virginica Petal Width 2.026
11 virginica Sepal Length 6.588
12 virginica Sepal Width 2.974
теперь я хотел бы представить это as:
Я хотел бы попробовать несколько разных способов организации, поэтому я хотел бы легко группировать строки вместо столбцов
ключевыми особенностями версии сгруппированных строк являются:
- Группирующая переменная находится слева, в отдельном столбце, а не в отдельной строке, в ячейке, которая охватывает все строки
- горизонтальные границы ячеек в группе уровень
Я новичок в rmarkdown, но конечная цель-иметь это в HTML-документе.
это возможно?
2 ответов
вот способы создания каждой из таблиц с помощью htmlTable
пакета. Я не был уверен, как добавить горизонтальные линии между видами, но я добавила тени зебры.
здесь rmarkdown
документ:
---
title: "<h3>Untitled</h3>"
author: "Author"
date: "September 3, 2016"
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = FALSE, message=FALSE, warning=FALSE)
```
```{r}
library(tidyr)
library(dplyr)
library(reshape2)
library(htmlTable)
```
```{r}
st = iris %>%
gather(measure, value, -Species) %>%
separate(measure, into=c("attribute", "dimension")) %>%
group_by(Species, attribute, dimension) %>%
summarise(mean=mean(value)) %>%
spread(dimension, mean)
# Keep only first value of outer grouping column
st = st %>%
group_by(Species) %>%
mutate(count=1:n()) %>%
ungroup %>%
mutate(Species = ifelse(count==1, as.character(Species), NA)) %>%
select(-count)
# Remove names of grouping columns
names(st)[1:2] = ""
# Round numeric columns to two decimal places
st[,sapply(st,is.numeric)] = sapply(st[,sapply(st,is.numeric)], function(x) sprintf("%1.2f",x))
htmlTable(st, rnames=FALSE, align="llrr", align.header="llrr",
col.rgroup = rep(c("none", "gray93"), each=2),
css.cell = c("padding-left: 0em","padding-left: 1em",rep("padding-left: 2em",2)))
```
```{r}
# Another option
htmlTable(st[,-1], rnames=FALSE, align="llrr", align.header="lrr",
n.rgroup=rep(2,3),
rgroup=rep(unique(iris$Species),2),
#col.rgroup = c("none","gray93"), # If you want to add alternating shading
css.cell=c("padding-left: 0.5em","padding-left: 4em","padding-left: 1.5em"))
```
```{r}
st = iris %>%
melt(id.var="Species") %>%
group_by(Species, variable) %>%
summarise(mean=mean(value)) %>%
dcast(Species ~ variable)
names(st)[1] = ""
# Round numeric columns to two decimal places
st[,sapply(st,is.numeric)] = sapply(st[,sapply(st,is.numeric)], function(x) sprintf("%1.2f",x))
# Set up grouping columns and column names
group_col = gsub("(.*)\..*", "\1", names(st))
group_col = factor(group_col, levels=unique(group_col))
names(st) = gsub(".*\.", "", names(st))
htmlTable(st, rnames=FALSE, align="lrrrr",
align.header="lrrrr",
cgroup=unique(group_col), n.cgroup=unclass(table(group_col)),
css.cell = c("padding-left: 0em","padding-left: 1.5em", rep("padding-left: 2em",3)))
```
вот вывод:
Я бы посмотрел варианты для на xtable
пакета. Примеры приведены в разделе 2.8 настоящего документа:
https://cran.r-project.org/web/packages/xtable/vignettes/xtableGallery.pdf