Найдите ближайшую строку DataFrame до заданного времени в Pandas

У меня есть Pandas dataframe, который индексируется DatetimeIndex:

Я хочу найти строку, которая ближе всего к определенному времени:

и найдите, насколько он близок. До сих пор я пробовал разные вещи, основываясь на идее вычитания времени, которое я хочу со всех времен, и нахождения наименьшей абсолютной величины, но, похоже, никто не работает.

Дает ошибку, которая, как мне кажется, связана с +/- в индексе Datetime, меняющим вещи, поэтому я попытался помещать индекс в другой столбец, а затем работал над этим:

Кажется, что это работает, но для того, чтобы делать то, что я хочу, мне нужно получить разницу по времени ABSOLUTE, а не относительную разницу. Однако при запуске abs или np.abs на нем появляется сообщение об ошибке:

Я подхожу к этому правильно? Если да, как мне заставить работать abs, чтобы я мог выбрать минимальную абсолютную разницу во времени и, таким образом, получить самое близкое время. Если нет, каков наилучший способ сделать это с помощью временного ряда Pandas?

Ответы

Ответ 1

Я думаю, вы можете попробовать DatetimeIndex.asof найти самую последнюю метку вплоть до ввода и включить ее. Затем используйте возвращенное время datetime для выбора соответствующей строки. Если вам нужны только значения для определенного столбца, Series.asof существует и объединяет два шага выше в один.

Это предполагает, что вы хотите получить самое близкое время и время. Если вам не нужна дата и просто нужно одно и то же время каждый день, используйте at_time в DataFrame.

Последующие действия:

Изменить: ложный сигнал тревоги, у меня была более ранняя версия локально. Последний из мастеров должен работать с np.abs.

In [10]: np.abs(df.time - image_time)
Out[10]: 
0    27 days, 13:39:02
1    26 days, 13:39:02
2    25 days, 13:39:02
3    24 days, 13:39:02
4    23 days, 13:39:02
5    22 days, 13:39:02

Также просто уточнить:

aeronet.index - image_time не работает, потому что вычитание по индексу является заданной разницей (в тот же день, когда индекс был ограничен, чтобы быть уникальным).

Ответ 2

Этот простой метод вернет индекс (целочисленный индекс) элемента TimeSeriesIndex, ближайший к данному объекту datetime. Нет необходимости копировать индекс в обычный столбец - просто используйте метод .to_pydatetime.

import numpy as np

i = np.argmin(np.abs(df.index.to_pydatetime() - image_time))

Затем вы просто используете индексор DataFrame .iloc:

df.iloc[i]

Вот функция для этого:

def fcl(df, dtObj):
    return df.iloc[np.argmin(np.abs(df.index.to_pydatetime() - dtObj))]

Затем вы можете дополнительно фильтровать плавно, например.

fcl(df, dtObj)['column']