чтение данных с разделителями табуляции без заголовка в pandas

у меня проблемы с использованием pandas чтобы открыть данные с разделителями табуляции без заголовков.

мои тестовые данные (на самом деле содержит 200 строк, из которых я показываю первые 10):

Tag19184    CTAAC   hffef   1   a   36  -   chr1    10006   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10012   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10018   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10024   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10030   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10036   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10042   0   36M 36
Tag20198    CTAAC   hffef   1   a   36  -   chr1    10048   0   36M 36
Tag20198    CTAAC   hffef   1   a   36  -   chr1    10054   0   36M 36
Tag45093    CTAAC   hffef   1   a   36  -   chr1    10060   0   36M 36

мой код:

import pandas as pd
df = pd.read_csv('in_test.txt',sep='t',header=None)
print df

тем не менее, я получаю следующий вывод, который я не думаю, что могу использовать для дальнейшей обработки данных (?):

<class 'pandas.core.frame.DataFrame'>
Int64Index: 200 entries, 0 to 199
Data columns:
X.1     200  non-null values
X.2     200  non-null values
X.3     200  non-null values
X.4     200  non-null values
X.5     200  non-null values
X.6     200  non-null values
X.7     200  non-null values
X.8     200  non-null values
X.9     200  non-null values
X.10    200  non-null values
X.11    200  non-null values
X.12    200  non-null values
dtypes: int64(5), object(7)

на обучение говорит о том, что print df нужно просто дать мне соответствующий фрейм данных. Что я делаю не так?

1 ответов


Я думаю, что вы получаете его правильно, но:

  1. посмотреть: изменить pandas 0.13.0 "print dataframe" для печати фрейма данных, как в более ранних версиях, это то, что делают панды в старых версиях. Таким образом, обновление решит его.
  2. можно использовать ipython notebook, где DataFrames будет отображаться как таблицы HTML.
  3. можно использовать df.head(5) (аналог r ' s head), чтобы получить первые несколько строк, чтобы убедиться, что ваш DataFrame is правильный.