Boxplot из нескольких столбцов фрейма Pandas на том же рисунке (морской)

Я чувствую, что, вероятно, не думаю о чем-то очевидном. Я хочу поставить на том же рисунке, блок-диаграмму каждого столбца кадра данных, где на оси X у меня есть имена столбцов. В seaborn.boxplot() это будет равно groupby для каждого столбца.

В пандах я бы сделал

df = pd.DataFrame(data = np.random.random(size=(4,4)), columns = ['A','B','C','D'])
df.boxplot()

который дает

enter image description here

Теперь я хотел бы получить то же самое в Seaborn. Но когда я пробую sns.boxplot(df), я получаю только один сгруппированный боксплот. Как воспроизвести ту же фигуру в морском роге?

Спасибо

Ответы

Ответ 1

Морской эквивалент

df.boxplot()

является

sns.boxplot(x="variable", y="value", data=pd.melt(df))

Полный пример:

import numpy as np; np.random.seed(42)
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame(data = np.random.random(size=(4,4)), columns = ['A','B','C','D'])

sns.boxplot(x="variable", y="value", data=pd.melt(df))

plt.show()

enter image description here

Это работает, потому что pd.melt преобразует широкоформатный фрейм

          A         B         C         D
0  0.374540  0.950714  0.731994  0.598658
1  0.156019  0.155995  0.058084  0.866176
2  0.601115  0.708073  0.020584  0.969910
3  0.832443  0.212339  0.181825  0.183405

к длинной форме

   variable     value
0         A  0.374540
1         A  0.156019
2         A  0.601115
3         A  0.832443
4         B  0.950714
5         B  0.155995
6         B  0.708073
7         B  0.212339
8         C  0.731994
9         C  0.058084
10        C  0.020584
11        C  0.181825
12        D  0.598658
13        D  0.866176
14        D  0.969910
15        D  0.183405

Ответ 2

Вы можете использовать встроенный метод панд df.plot(kind = 'box'), как предложено в этом вопросе.
Я понимаю, что этот ответ не поможет вам, если вам нужно использовать seaborn, но он может быть полезен для людей с более простыми требованиями.

import numpy as np; np.random.seed(42)
import pandas as pd
import matplotlib.pyplot as plt

df = pd.DataFrame(data = np.random.random(size=(4,4)), columns = ['A','B','C','D'])

df.plot(kind='box')
plt.show()