Преобразование времени unix в читаемую дату в Pandas DataFrame

у меня есть фрейм данных с Unix и цены в нем. Я хочу преобразовать столбец индекса так, чтобы он отображался в удобочитаемых датах. Так, например, у меня есть" дата " как 1349633705 в столбце индекса, но я бы хотел, чтобы она отображалась как 10/07/2012 (или, по крайней мере, 10/07/2012 18:15). Для некоторого контекста вот код, с которым я работаю, и то, что я уже пробовал:

import json
import urllib2
from datetime import datetime
response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json')
data = json.load(response)   
df = DataFrame(data['values'])
df.columns = ["date","price"]
#convert dates 
df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.index = df.date   
df

как вы можете видеть, я использую df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d")) здесь не работает, так как я работаю с целыми числами, а не строками. Думаю, я ... нужно использовать datetime.date.fromtimestamp но я не совсем уверен, как применить это ко всему ДФ.дата. Спасибо.

3 ответов


они кажутся секундами с эпохи.

In [20]: df = DataFrame(data['values'])

In [21]: df.columns = ["date","price"]

In [22]: df
Out[22]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 358 entries, 0 to 357
Data columns (total 2 columns):
date     358  non-null values
price    358  non-null values
dtypes: float64(1), int64(1)

In [23]: df.head()
Out[23]: 
         date  price
0  1349720105  12.08
1  1349806505  12.35
2  1349892905  12.15
3  1349979305  12.19
4  1350065705  12.15
In [25]: df['date'] = pd.to_datetime(df['date'],unit='s')

In [26]: df.head()
Out[26]: 
                 date  price
0 2012-10-08 18:15:05  12.08
1 2012-10-09 18:15:05  12.35
2 2012-10-10 18:15:05  12.15
3 2012-10-11 18:15:05  12.19
4 2012-10-12 18:15:05  12.15

In [27]: df.dtypes
Out[27]: 
date     datetime64[ns]
price           float64
dtype: object

если вы пытаетесь использовать:

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],***unit='s'***))

и получите сообщение об ошибке:

"панды.tslib.OutOfBoundsDatetime: не удается преобразовать входные данные с помощью единицы "s""

Это означает DATE_FIELD не указывается в секундах.

в моем случае это были миллисекунды - EPOCH time.

преобразование работало, используя ниже:

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],unit='ms')) 

предполагая, что мы импортировали pandas as pd и df это наш фрейм данных

pd.to_datetime(df['date'], unit='s')

работает для меня.