Среднее взвешенное скользящее среднее в python

У меня есть данные, отобранные по существу случайными интервалами. Я хотел бы вычислить взвешенное скользящее среднее с использованием numpy (или другого пакета python). У меня есть грубая реализация скользящей средней, но мне трудно найти хороший способ сделать взвешенную скользящую среднюю, так что значения в центре бункера взвешиваются больше, чем значения по краям.

Здесь я генерирую некоторые данные образца, а затем беру скользящее среднее. Как я могу наиболее легко реализовать взвешенную скользящую среднюю? Спасибо!

Используя совет crs17 для использования "weights =" в функции np.average, я подошел к средневзвешенной функции, которая использует функцию Гаусса для взвешивания данных:

Ответы

Ответ 1

Вы можете использовать numpy.average, который позволяет указать вес:

>>> bin_avg[index] = np.average(items_in_bin, weights=my_weights)

Итак, чтобы рассчитать весы, вы можете найти координаты x каждой точки данных в бункере и вычислить их расстояния до центра бункера.

Ответ 2

Это не даст точного решения, но это сделает вашу жизнь проще и, вероятно, будет достаточно хороша... Во-первых, сравните свои образцы в маленьких корзинах. После того, как вы переконфигурировали свои данные для выравнивания, вы можете использовать трюки с шагами и np.average, чтобы сделать средневзвешенное значение:

from numpy.lib.stride_tricks import as_strided

def moving_weighted_average(x, y, step_size=.1, steps_per_bin=10,
                            weights=None):
    # This ensures that all samples are within a bin
    number_of_bins = int(np.ceil(np.ptp(x) / step_size))
    bins = np.linspace(np.min(x), np.min(x) + step_size*number_of_bins,
                       num=number_of_bins+1)
    bins -= (bins[-1] - np.max(x)) / 2
    bin_centers = bins[:-steps_per_bin] + step_size*steps_per_bin/2

    counts, _ = np.histogram(x, bins=bins)
    vals, _ = np.histogram(x, bins=bins, weights=y)
    bin_avgs = vals / counts
    n = len(bin_avgs)
    windowed_bin_avgs = as_strided(bin_avgs,
                                   (n-steps_per_bin+1, steps_per_bin),
                                   bin_avgs.strides*2)

    weighted_average = np.average(windowed_bin_avgs, axis=1, weights=weights)

    return bin_centers, weighted_average

Теперь вы можете сделать что-то вроде этого:

#plot the moving average with triangular weights
weights = np.concatenate((np.arange(0, 5), np.arange(0, 5)[::-1]))
bins, average = moving_weighted_average(x, y, steps_per_bin=len(weights),
                                        weights=weights)
plt.plot(bins, average,label='moving average')

plt.show()