Конвертировать время Unix в читаемую дату в панде
У меня есть датафрейм со временем Unix и ценами. Я хочу преобразовать столбец индекса, чтобы он отображался в удобочитаемых датах.
Так, например, у меня есть date
как 1349633705
в столбце индекса, но я бы хотел, чтобы она отображалась как 10/07/2012
(или, по крайней мере, 10/07/2012 18:15
).
Для некоторого контекста вот код, с которым я работаю, и то, что я уже пробовал:
import json
import urllib2
from datetime import datetime
response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json')
data = json.load(response)
df = DataFrame(data['values'])
df.columns = ["date","price"]
#convert dates
df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.index = df.date
Как вы можете видеть, я использую здесь df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
который не работает, так как я работа с целыми числами, а не со строками. Я думаю, что мне нужно использовать datetime.date.fromtimestamp
но я не совсем уверен, как применить это ко всему df.date
.
Благодарю.
Ответы
Ответ 1
Кажется, это секунды с эпохи.
In [20]: df = DataFrame(data['values'])
In [21]: df.columns = ["date","price"]
In [22]: df
Out[22]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 358 entries, 0 to 357
Data columns (total 2 columns):
date 358 non-null values
price 358 non-null values
dtypes: float64(1), int64(1)
In [23]: df.head()
Out[23]:
date price
0 1349720105 12.08
1 1349806505 12.35
2 1349892905 12.15
3 1349979305 12.19
4 1350065705 12.15
In [25]: df['date'] = pd.to_datetime(df['date'],unit='s')
In [26]: df.head()
Out[26]:
date price
0 2012-10-08 18:15:05 12.08
1 2012-10-09 18:15:05 12.35
2 2012-10-10 18:15:05 12.15
3 2012-10-11 18:15:05 12.19
4 2012-10-12 18:15:05 12.15
In [27]: df.dtypes
Out[27]:
date datetime64[ns]
price float64
dtype: object
Ответ 2
Если вы попытаетесь использовать:
df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],***unit='s'***))
и получите сообщение об ошибке:
"pandas.tslib.OutOfBoundsDatetime: невозможно преобразовать ввод с единицей '"
Это означает, что DATE_FIELD
не указано в секундах.
В моем случае это было миллисекунды - EPOCH time
.
Преобразование работало следующим образом:
df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],unit='ms'))
Ответ 3
Предполагая, что мы импортировали pandas as pd
а df
- наш фрейм данных
pd.to_datetime(df['date'], unit='s')
работает для меня.
Ответ 4
В качестве альтернативы, изменив строку кода выше:
# df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.date = df.date.apply(lambda d: datetime.datetime.fromtimestamp(int(d)).strftime('%Y-%m-%d'))
Это также должно работать.