Разница между Как.POSIXct / as.POSIXlt и strptime для преобразования символьных векторов в POSIXct / POSIXlt



Я следил за рядом вопросов здесь, который спрашивает о том, как конвертировать символьные векторы в классы datetime. Я часто вижу 2 метода, strptime и as.POSIXct / as.Методы POSIXlt. Я посмотрел на 2 функции, но неясно, в чем разница.



strptime



function (x, format, tz = "") 
{
y <- .Internal(strptime(as.character(x), format, tz))
names(y$year) <- names(x)
y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>


как.POSIXct



function (x, tz = "", ...) 
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>


как.POSIXlt



function (x, tz = "", ...) 
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>


выполнение microbenchmark, чтобы увидеть, если есть производительность различия:



library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)

Unit: milliseconds
expr min lq median uq max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2 strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422


strptime кажется немного быстрее. так что же получается? почему бы не было 2 подобных функций или есть различия между ними, которые я пропустил?

790   2  

2 ответов:

Ну, функции делают разные вещи.

во-первых, есть две внутренние реализации даты/времени: POSIXct, который хранит секунды с эпохи UNIX (+некоторые другие данные), и POSIXlt, в котором хранится список дня, месяца, года, часа, минуты, секунды и т. д.

strptime это функция для прямого преобразования символьных векторов (различных форматов) в .

as.POSIXlt преобразует различные типы данных POSIXlt. Он пытается быть умный и делать разумную вещь - в случае характера, он действует как обертка для strptime.

as.POSIXct преобразует различные типы данных POSIXct. Он также пытается быть умным и делать разумные вещи - в случае характера, он работает strptime во-первых, то делает преобразование из POSIXlt to POSIXct.

это имеет смысл, что strptime быстрее, потому что strptime обрабатывает только ввода символов, в то время как другие пытаются определить, какой метод использовать от типа ввода. Это также должно быть немного безопаснее в том, что передача неожиданных данных просто даст ошибку, вместо того, чтобы пытаться сделать разумную вещь, которая может быть не тем, что вы хотите.

существует два типа POSIXt, POSIXct и POSIXlt. "ct" может стоять в течение календарного времени, он хранит количество секунд с момента начала. "lt", или местное время, сохраняет дату в виде списка атрибутов времени (таких как" час "и"пн"). Попробуйте следующие примеры:

date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")

date=c("26/10/2016")

time=c("19:51:30")

day<-paste(date,"T", time)

day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time1

day.time1$year

day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time2

day.time2$year

Comments

    Ничего не найдено.