Как пропустить пустые даты (выходные) в финансовом графике Matplotlib Python?
ax.plot_date((dates, dates), (highs, lows), '-')
В настоящее время я использую эту команду для построения финансовых максимумов и минимумов с помощью Matplotlib. Он отлично работает, но как удалить пробелы по оси x, оставленные днями без рыночных данных, таких как выходные и праздничные дни?
У меня есть списки дат, максимумов, минимумов, закрытий и открытий. Я не могу найти примеров создания графика с осью х, которая показывает даты, но не обеспечивает постоянный масштаб.
Ответы
Ответ 1
Я думаю, вам нужно "искусственно синтезировать" точную форму сюжета, которую вы хотите, используя xticks
, чтобы установить метки тика на строки, представляющие даты (конечно, помещая тики в равные интервалы, даже если даты, re-представление не равно), а затем с помощью простой plot
.
Ответ 2
Вот пример того, как это сделать, на сайте Matplotlib:
https://matplotlib.org/gallery/ticks_and_spines/date_index_formatter.html
Ответ 3
Одной из рекламируемых функций scikits.timeseries является "Создание графиков временных рядов с интеллектуально разнесенными метками осей".
Вы можете увидеть некоторые примеры графиков здесь. В первом примере (показанном ниже) частота "бизнес" используется для данных, что автоматически исключает праздничные и выходные дни и тому подобное. Он также маскирует пропущенные точки данных, которые вы видите на этом графике как пропуски, вместо линейной интерполяции их.
![alt text]()
Ответ 4
Я обычно использую NumPy NaN (а не число) для недопустимых или отсутствующих значений. Они представлены Matplotlib как пробелы в сюжете, а NumPy является частью pylab/Matplotlib.
>>> import pylab
>>> xs = pylab.arange(10.) + 733632. # valid date range
>>> ys = [1,2,3,2,pylab.nan,2,3,2,5,2.4] # some data (one undefined)
>>> pylab.plot_date(xs, ys, ydate=False, linestyle='-', marker='')
[<matplotlib.lines.Line2D instance at 0x0378D418>]
>>> pylab.show()
Ответ 5
Обновленный ответ (2018) с Matplotlib 2.1.2, Python 2.7.12
Функция equidate_ax
обрабатывает все, что вам нужно для простой оси X с одинаковым расстоянием между точками данных. Реализовано с помощью ticker.FuncFormatter
на основе этого примера.
from __future__ import division
from matplotlib import pyplot as plt
from matplotlib.ticker import FuncFormatter
import numpy as np
import datetime
def equidate_ax(fig, ax, dates, fmt="%Y-%m-%d", label="Date"):
"""
Sets all relevant parameters for an equidistant date-x-axis.
Tick Locators are not affected (set automatically)
Args:
fig: pyplot.figure instance
ax: pyplot.axis instance (target axis)
dates: iterable of datetime.date or datetime.datetime instances
fmt: Display format of dates
label: x-axis label
Returns:
None
"""
N = len(dates)
def format_date(index, pos):
index = np.clip(int(index + 0.5), 0, N - 1)
return dates[index].strftime(fmt)
ax.xaxis.set_major_formatter(FuncFormatter(format_date))
ax.set_xlabel(label)
fig.autofmt_xdate()
#
# Some test data (with python dates)
#
dates = [datetime.datetime(year, month, day) for year, month, day in [
(2018,2,1), (2018,2,2), (2018,2,5), (2018,2,6), (2018,2,7), (2018,2,28)
]]
y = np.arange(6)
# Create plots. Left plot is default with a gap
fig, [ax1, ax2] = plt.subplots(1, 2)
ax1.plot(dates, y, 'o-')
ax1.set_title("Default")
ax1.set_xlabel("Date")
# Right plot will show equidistant series
# x-axis must be the indices of your dates-list
x = np.arange(len(dates))
ax2.plot(x, y, 'o-')
ax2.set_title("Equidistant Placement")
equidate_ax(fig, ax2, dates)
![Comparison of default plotting method and equidistant x-axis]()
Ответ 6
Я снова столкнулся с этой проблемой и смог создать приличную функцию для решения этой проблемы, особенно в отношении внутридневных дат. Благодарим @Primer за этот ответ.
def plot_ts(ts, step=5, figsize=(10,7), title=''):
"""
plot timeseries ignoring date gaps
Params
------
ts : pd.DataFrame or pd.Series
step : int, display interval for ticks
figsize : tuple, figure size
title: str
"""
fig, ax = plt.subplots(figsize=figsize)
ax.plot(range(ts.dropna().shape[0]), ts.dropna())
ax.set_title(title)
ax.set_xticks(np.arange(len(ts.dropna())))
ax.set_xticklabels(ts.dropna().index.tolist());
# tick visibility, can be slow for 200,000+ ticks
xticklabels = ax.get_xticklabels() # generate list once to speed up function
for i, label in enumerate(xticklabels):
if not i%step==0:
label.set_visible(False)
fig.autofmt_xdate()
Ответ 7
Функциональность scikits.timeseries была в основном перенесена в pandas, поэтому теперь вы можете повторно формировать образец данных, чтобы включить значения только в рабочие дни.
>>>import pandas as pd
>>>import matplotlib.pyplot as plt
>>>s = pd.Series(list(range(10)), pd.date_range('2015-09-01','2015-09-10'))
>>>s
2015-09-01 0
2015-09-02 1
2015-09-03 2
2015-09-04 3
2015-09-05 4
2015-09-06 5
2015-09-07 6
2015-09-08 7
2015-09-09 8
2015-09-10 9
>>> s.resample('B', label='right', closed='right').last()
2015-09-01 0
2015-09-02 1
2015-09-03 2
2015-09-04 3
2015-09-07 6
2015-09-08 7
2015-09-09 8
2015-09-10 9
а затем построить график данных как обычно
s.resample('B', label='right', closed='right').last().plot()
plt.show()