Установить индекс нескольких столбцов в pandas
Я делаю dataframe вот так.
df = pd.DataFrame({
'class' : ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
'number' : [1,2,3,4,5,1,2,3,4,5],
'math' : [90, 20, 50, 30, 57, 67, 89, 79, 45, 23],
'english' : [40, 21, 68, 89, 90, 87, 89, 54, 21, 23]
})
и я хочу преобразовать индекс в это, используя некоторые методы pandas.(бывший. set_index, stack,,,)
df1 = pd.DataFrame(np.random.randint(1, 100, (5, 4)),
columns = [['A', 'A', 'B', 'B'],['english', 'math', 'english', 'math']],
index = [1, 2, 3, 4, 5])
Как я могу это сделать?
2 ответов
Я думаю, что вам нужно set_index
С unstack
для изменения формы, а затем поменять уровни в MultiIndex
в Столбцах по swaplevel
и последние столбцы сортировки по sort_index
:
df1 = df.set_index(['number','class']).unstack().swaplevel(0,1,1).sort_index(1)
print (df1)
class A B
english math english math
number
1 40 90 87 67
2 21 20 89 89
3 68 50 54 79
4 89 30 21 45
5 90 57 23 23
другое решение с stack
и unstack
:
print (df.set_index(['number','class']).stack().unstack([1,2]))
class A B
english math english math
number
1 40 90 87 67
2 21 20 89 89
3 68 50 54 79
4 89 30 21 45
5 90 57 23 23
мне нравится @Изреель ответа много, но просто для полноты - вы можете также использовать pandas.DataFrame.pivot_table
вместо set_index
+ unstack
:
>>> df.pivot_table(index='number', columns='class').swaplevel(axis=1).sort_index(1)
class A B
english math english math
number
1 40 90 87 67
2 21 20 89 89
3 68 50 54 79
4 89 30 21 45
5 90 57 23 23