чтение данных с разделителями табуляции без заголовка в pandas
у меня проблемы с использованием pandas
чтобы открыть данные с разделителями табуляции без заголовков.
мои тестовые данные (на самом деле содержит 200 строк, из которых я показываю первые 10):
Tag19184 CTAAC hffef 1 a 36 - chr1 10006 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10012 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10018 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10024 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10030 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10036 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10042 0 36M 36
Tag20198 CTAAC hffef 1 a 36 - chr1 10048 0 36M 36
Tag20198 CTAAC hffef 1 a 36 - chr1 10054 0 36M 36
Tag45093 CTAAC hffef 1 a 36 - chr1 10060 0 36M 36
мой код:
import pandas as pd
df = pd.read_csv('in_test.txt',sep='t',header=None)
print df
тем не менее, я получаю следующий вывод, который я не думаю, что могу использовать для дальнейшей обработки данных (?):
<class 'pandas.core.frame.DataFrame'>
Int64Index: 200 entries, 0 to 199
Data columns:
X.1 200 non-null values
X.2 200 non-null values
X.3 200 non-null values
X.4 200 non-null values
X.5 200 non-null values
X.6 200 non-null values
X.7 200 non-null values
X.8 200 non-null values
X.9 200 non-null values
X.10 200 non-null values
X.11 200 non-null values
X.12 200 non-null values
dtypes: int64(5), object(7)
на обучение говорит о том, что print df
нужно просто дать мне соответствующий фрейм данных. Что я делаю не так?
1 ответов
Я думаю, что вы получаете его правильно, но:
- посмотреть: изменить pandas 0.13.0 "print dataframe" для печати фрейма данных, как в более ранних версиях, это то, что делают панды в старых версиях. Таким образом, обновление решит его.
- можно использовать
ipython notebook
, гдеDataFrames
будет отображаться как таблицы HTML. - можно использовать
df.head(5)
(аналогr
' shead
), чтобы получить первые несколько строк, чтобы убедиться, что вашDataFrame
is правильный.