Как выбрать столбцы из объекта groupby в pandas?

я сгруппировал свой фрейм данных по двум столбцам ниже

df = pd.DataFrame({'a': [1, 1, 3],
                   'b': [4.0, 5.5, 6.0],
                   'c': [7L, 8L, 9L],
                   'name': ['hello', 'hello', 'foo']})
df.groupby(['a', 'name']).median()

в результате:

            b    c
a name            
1 hello  4.75  7.5
3 foo    6.00  9.0

как я могу получить доступ к name поле результирующей медианы (в данном случае hello, foo)? Это не удается:

df.groupby(['a', 'name']).median().name

3 ответов


вам нужно получить значения Индекса, они не столбцы. В этом случае level 1

df.groupby(["a", "name"]).median().index.get_level_values(1)

Out[2]:

Index([u'hello', u'foo'], dtype=object)

вы также можете передать имя индекса

df.groupby(["a", "name"]).median().index.get_level_values('name')

поскольку это будет более интуитивным, чем передача целых значений.

вы можете преобразовать значения индекса в список, вызвав tolist()

df.groupby(["a", "name"]).median().index.get_level_values(1).tolist()

Out[5]:

['hello', 'foo']

Set as_index = False во время groupby

df = pandas.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df.groupby(["a", "name"] , as_index = False).median()

вы можете reset_index() на результат groupby, чтобы вернуть фрейм данных с именем столбца теперь доступны.

import pandas as pd
df = pd.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df_grouped = df.groupby(["a", "name"]).median()
df_grouped.name
0    hello
1      foo
Name: name, dtype: object

Если вы выполняете операцию над одним столбцом, возврат будет серией с multiindex, и вы можете просто применить pd.DataFrame и потом reset_index.