Разница между as.POSIXct/as.POSIXlt и strptime для преобразования векторов символов в POSIXct/POSIXlt
Я задал несколько вопросов, которые задают вопрос о том, как преобразовать символьные векторы в классы datetime. Я часто вижу 2 метода, метод strptime и as.POSIXct/as.POSIXlt. Я посмотрел на 2 функции, но неясно, в чем разница.
strptime
function (x, format, tz = "")
{
y <- .Internal(strptime(as.character(x), format, tz))
names(y$year) <- names(x)
y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>
as.POSIXct
function (x, tz = "", ...)
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>
as.POSIXlt
function (x, tz = "", ...)
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>
Выполнение микрообъектива, чтобы увидеть, есть ли различия в производительности:
library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)
Unit: milliseconds
expr min lq median uq max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2 strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422
strptime кажется немного быстрее. так что дает? почему было бы две аналогичные функции или есть различия между ними, которые я пропустил?
Ответы
Ответ 1
Ну, функции выполняют разные вещи.
Во-первых, есть две внутренние реализации даты/времени: POSIXct
, которая хранит секунды с эпохи UNIX (+ некоторые другие данные) и POSIXlt
, где хранится список дней, месяца, года, часа, минуты, секунды и т.д.
strptime
- это функция прямого преобразования векторов символов (различных форматов) в формат POSIXlt
.
as.POSIXlt
преобразует различные типы данных в POSIXlt
. Он пытается быть умным и делать разумную вещь - в случае символа он действует как обертка на strptime
.
as.POSIXct
преобразует различные типы данных в POSIXct
. Он также пытается быть умным и делать разумную вещь - в случае символа он сначала запускает strptime
, а затем переходит от POSIXlt
в POSIXct
.
Имеет смысл, что strptime
быстрее, потому что strptime
обрабатывает только ввод символов, в то время как другие пытаются определить, какой метод использовать из типа ввода. Также должно быть немного безопаснее в том, что передача неожиданных данных просто приведет к ошибке, вместо того, чтобы пытаться сделать разумную вещь, которая может быть не такой, какой вы хотите.
Ответ 2
Существует два типа POSIXt, POSIXct и POSIXlt. "ct" может стоять за календарное время, он хранит количество секунд с момента начала. "lt" или местное время сохраняет дату как список атрибутов времени (например, "час" и "mon" ).
Попробуйте следующие примеры:
date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")
date=c("26/10/2016")
time=c("19:51:30")
day<-paste(date,"T", time)
day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")
day.time1
day.time1$year
day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")
day.time2
day.time2$year