Как изменить одно значение индекса в Pandas dataframe?

energy.loc['Republic of Korea']

Я хочу изменить значение индекса с "Республика Корея" на "Южная Корея". Но фрейм данных слишком велик, и невозможно изменить каждое значение индекса. Как изменить только это единственное значение?

5 ответов


вы хотите сделать что-то вроде этого:

as_list = df.index.tolist()
idx = as_list.index('Republic of Korea')
as_list[idx] = 'South Korea'
df.index = as_list

в принципе, вы получаете индекс как список, изменяете этот один элемент и заменяете существующий индекс.


решение@EdChum выглядит хорошо. Вот один, использующий rename, который заменит все эти значения в индексе.

energy.rename(index={'Republic of Korea':'South Korea'},inplace=True)

вот пример

>>> example = pd.DataFrame({'key1' : ['a','a','a','b','a','b'],
           'data1' : [1,2,2,3,nan,4],
           'data2' : list('abcdef')})
>>> example.set_index('key1',inplace=True)
>>> example
      data1 data2
key1             
a       1.0     a
a       2.0     b
a       2.0     c
b       3.0     d
a       NaN     e
b       4.0     f

>>> example.rename(index={'a':'c'}) # can also use inplace=True
      data1 data2
key1             
c       1.0     a
c       2.0     b
c       2.0     c
b       3.0     d
c       NaN     e
b       4.0     f

вот еще один хороший, используя заменить на колонне.

df.reset_index(inplace=True)
df.drop('index', axis = 1, inplace=True)
df["Country"].replace("Republic of Korea", value="South Korea", inplace=True)
df.set_index("Country", inplace=True)

вот еще одна идея, основанная на set_value

df = df.reset_index()
df.drop('index', axis = 1, inplace=True)
index = df.index[df["Country"] == "Republic of Korea"]
df.set_value(index, "Country", "South Korea")
df = df.set_index("Country")
df["Country"] = df.index

Если у вас есть Многоиндексный фрейм данных, сделайте следующее:

# input DataFrame
import pandas as pd
t = pd.DataFrame(data={'i1':[0,0,0,0,1,1,1,1,2,2,2,2],
                       'i2':[0,1,2,3,0,1,2,3,0,1,2,3],
                       'x':[1.,2.,3.,4.,5.,6.,7.,8.,9.,10.,11.,12.]})
t.set_index(['i1','i2'], inplace=True)
t.sort_index(inplace=True)

# changes index level 'i1' values 0 to -1
t.rename(index={0:-1}, level='i1', inplace=True)