Установить индекс нескольких столбцов в pandas

Я делаю dataframe вот так.

df = pd.DataFrame({
    'class' : ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
    'number' : [1,2,3,4,5,1,2,3,4,5],
    'math' : [90, 20, 50, 30, 57, 67, 89, 79, 45, 23],
    'english' : [40, 21, 68, 89, 90, 87, 89, 54, 21, 23]
})

и я хочу преобразовать индекс в это, используя некоторые методы pandas.(бывший. set_index, stack,,,)

df1 = pd.DataFrame(np.random.randint(1, 100, (5, 4)),
             columns = [['A', 'A', 'B', 'B'],['english', 'math', 'english', 'math']],
             index = [1, 2, 3, 4, 5])

Как я могу это сделать?

2 ответов


Я думаю, что вам нужно set_index С unstack для изменения формы, а затем поменять уровни в MultiIndex в Столбцах по swaplevel и последние столбцы сортировки по sort_index:

df1 = df.set_index(['number','class']).unstack().swaplevel(0,1,1).sort_index(1)

print (df1)
class        A            B     
       english math english math
number                          
1           40   90      87   67
2           21   20      89   89
3           68   50      54   79
4           89   30      21   45
5           90   57      23   23

другое решение с stack и unstack:

print (df.set_index(['number','class']).stack().unstack([1,2]))
class        A            B     
       english math english math
number                          
1           40   90      87   67
2           21   20      89   89
3           68   50      54   79
4           89   30      21   45
5           90   57      23   23

мне нравится @Изреель ответа много, но просто для полноты - вы можете также использовать pandas.DataFrame.pivot_table вместо set_index + unstack:

>>> df.pivot_table(index='number', columns='class').swaplevel(axis=1).sort_index(1)
class        A            B     
       english math english math
number                          
1           40   90      87   67
2           21   20      89   89
3           68   50      54   79
4           89   30      21   45
5           90   57      23   23