Pandas несколько столбцов с одинаковым именем
Я создаю dataframe
с csv
.Я прошел через документы, несколько SO
сообщения, ссылки, как я только что начал Pandas
но не понял.Csv имеет несколько столбцов с одинаковыми именами, скажем a
.
Итак, после формирования dataframe
и когда я делаю df['a']
какое значение он вернется? Он не возвращает все значения .
и только одно из значений будет иметь строку, остальное будет!--7--> .Как я могу получить эту колонку?
1 ответов
соответствующий параметр mangle_dupe_cols
С docs
mangle_dupe_cols : boolean, default True Duplicate columns will be specified as 'X.0'...'X.N', rather than 'X'...'X'
по умолчанию, все ваши 'a'
столбцы по имени 'a.0'...'a.N'
как указано выше.
если вы используете mangle_dupe_cols=False
, импортирующих этот csv
приведет к ошибке.
вы можете получить все ваши столбцы с
df.filter(like='a')
демонстрация
from StringIO import StringIO
import pandas as pd
txt = """a, a, a, b, c, d
1, 2, 3, 4, 5, 6
7, 8, 9, 10, 11, 12"""
df = pd.read_csv(StringIO(txt), skipinitialspace=True)
df
df.filter(like='a')