Несколько гистограмм в Pandas
Я хотел бы создать следующую гистограмму (см. рисунок ниже), взятую из книги "Think Stats". Однако я не могу получить их на одном и том же участке. Каждый DataFrame берет свой собственный подзаговор.
У меня есть следующий код:
import nsfg
import matplotlib.pyplot as plt
df = nsfg.ReadFemPreg()
preg = nsfg.ReadFemPreg()
live = preg[preg.outcome == 1]
first = live[live.birthord == 1]
others = live[live.birthord != 1]
#fig = plt.figure()
#ax1 = fig.add_subplot(111)
first.hist(column = 'prglngth', bins = 40, color = 'teal', \
alpha = 0.5)
others.hist(column = 'prglngth', bins = 40, color = 'blue', \
alpha = 0.5)
plt.show()
Вышеприведенный код не работает, когда я использую ax = ax1, как предлагается в: pandas несколько графиков, которые не работают в качестве hists, и этот пример не делает то, что мне нужно: Наложение нескольких гистограмм с помощью pandas. Когда я использую код как есть, он создает два окна с гистограммами. Есть идеи, как их сочетать?
Вот пример того, как я хочу, чтобы конечная фигура выглядела:
![enter image description here]()
Ответы
Ответ 1
Насколько я могу судить, pandas не может справиться с этой ситуацией. Это нормально, поскольку все их методы построения предназначены только для удобства. Вам нужно будет использовать matplotlib напрямую. Вот как я это делаю:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import pandas
#import seaborn
#seaborn.set(style='ticks')
np.random.seed(0)
df = pandas.DataFrame(np.random.normal(size=(37,2)), columns=['A', 'B'])
fig, ax = plt.subplots()
a_heights, a_bins = np.histogram(df['A'])
b_heights, b_bins = np.histogram(df['B'], bins=a_bins)
width = (a_bins[1] - a_bins[0])/3
ax.bar(a_bins[:-1], a_heights, width=width, facecolor='cornflowerblue')
ax.bar(b_bins[:-1]+width, b_heights, width=width, facecolor='seagreen')
#seaborn.despine(ax=ax, offset=10)
И это дает мне:
![enter image description here]()
Ответ 2
На веб-сайте pandas (http://pandas.pydata.org/pandas-docs/stable/visualization.html#visualization-hist):
df4 = pd.DataFrame({'a': np.random.randn(1000) + 1, 'b': np.random.randn(1000),
'c': np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
plt.figure();
df4.plot(kind='hist', alpha=0.5)
Ответ 3
Вот фрагмент. В моем случае я явно указал ячейки и диапазон, так как я не обрабатывал удаление удаления в качестве автора книги.
fig, ax = plt.subplots()
ax.hist([first.prglngth, others.prglngth], 10, (27, 50), histtype="bar", label=("First", "Other"))
ax.set_title("Histogram")
ax.legend()
Обратитесь к многостраничному сюжету Matplotlib с различными размерами example.