Преобразование времени unix в читаемую дату в Pandas DataFrame
у меня есть фрейм данных с Unix и цены в нем. Я хочу преобразовать столбец индекса так, чтобы он отображался в удобочитаемых датах. Так, например, у меня есть" дата " как 1349633705 в столбце индекса, но я бы хотел, чтобы она отображалась как 10/07/2012 (или по крайней мере 10/07/2012 18:15). Для некоторого контекста вот код, с которым я работаю, и то, что я уже пробовал:
import json
import urllib2
from datetime import datetime
response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json')
data = json.load(response)
df = DataFrame(data['values'])
df.columns = ["date","price"]
#convert dates
df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.index = df.date
df
как вы можете видеть, я использую
df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d")) здесь не работает, так как я работаю с целыми числами, а не строками. Я думаю, что я нужно использовать datetime.date.fromtimestamp но я не совсем уверен, как применить это ко всему ДФ.дата. Спасибо.
3 ответов:
Это, кажется, секунды с эпохи.
In [20]: df = DataFrame(data['values']) In [21]: df.columns = ["date","price"] In [22]: df Out[22]: <class 'pandas.core.frame.DataFrame'> Int64Index: 358 entries, 0 to 357 Data columns (total 2 columns): date 358 non-null values price 358 non-null values dtypes: float64(1), int64(1) In [23]: df.head() Out[23]: date price 0 1349720105 12.08 1 1349806505 12.35 2 1349892905 12.15 3 1349979305 12.19 4 1350065705 12.15 In [25]: df['date'] = pd.to_datetime(df['date'],unit='s') In [26]: df.head() Out[26]: date price 0 2012-10-08 18:15:05 12.08 1 2012-10-09 18:15:05 12.35 2 2012-10-10 18:15:05 12.15 3 2012-10-11 18:15:05 12.19 4 2012-10-12 18:15:05 12.15 In [27]: df.dtypes Out[27]: date datetime64[ns] price float64 dtype: object
если вы попытаетесь использовать:
df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],***unit='s'***))и получить сообщение об ошибке:
"панды.tslib.OutOfBoundsDatetime: не удается преобразовать входные данные с помощью единицы 's'"
Это означает
DATE_FIELDне указывается в секундах.в моем случае это были миллисекунды -
EPOCH time.преобразование работало, используя ниже:
df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],unit='ms'))
предполагая, что мы импортировали
pandas as pdиdfэто наш фрейм данныхpd.to_datetime(df['date'], unit='s')работает для меня.
Comments