Pandas: изменить тип данных серии на строку
Я использую Pandas 'ver 0.12.0' с Python 2.7 и имею фрейм данных, как показано ниже:
df = pd.DataFrame({'id' : [123,512,'zhub1', 12354.3, 129, 753, 295, 610],
'colour': ['black', 'white','white','white',
'black', 'black', 'white', 'white'],
'shape': ['round', 'triangular', 'triangular','triangular','square',
'triangular','round','triangular']
}, columns= ['id','colour', 'shape'])
на , который производит выход ниже.
df['id'].astype(str)
0 1
1 5
2 z
3 1
4 1
5 7
6 2
7 6
1) как я могу преобразовать все элементы id
в строку?
2) в конечном итоге я буду использовать id
для индексирование кадров данных. Будет ли иметь строковые индексы в фрейме данных замедлять работу по сравнению с целочисленным индексом?
2 ответов
вы можете преобразовать все элементы id в str
используя apply
df.id.apply(str)
0 123
1 512
2 zhub1
3 12354.3
4 129
5 753
6 295
7 610
редактировать OP:
Я думаю, что проблема была связана с версии Python (2.7.), это работает:
df['id'].astype(basestring)
0 123
1 512
2 zhub1
3 12354.3
4 129
5 753
6 295
7 610
Name: id, dtype: object