R summary() эквивалентно в numpy
Существует ли эквивалент функции R
summary()
в numpy
?
numpy
имеет std, mean, средние функции отдельно, но имеет ли он функцию, которая суммирует все, например summary
делает в R
?
Если найден этот вопрос, относящийся к pandas
и этой статье с R-to-numpy, но у него нет того, что я ищу.
Ответы
Ответ 1
Нет. Вам нужно использовать pandas
.
R для языка статистики, поэтому многие базовые функции, которые вам нужны, такие как summary()
и lm()
, загружаются при загрузке. Python имеет много применений, поэтому вам необходимо установить и импортировать соответствующие статистические пакеты. numpy
не является пакетом статистики - он для численного вычисления в более общем плане, поэтому вам нужно использовать такие пакеты, как pandas
, scipy
и statsmodels
, чтобы позволить Python делать то, что R может делать из коробки.
Ответ 2
1. Загрузите Pandas в консоль и загрузите файл данных csv
import pandas as pd
data = pd.read_csv("data.csv", sep = ",")
2. Изучите первые несколько строк данных
data.head()
3. Рассчитать итоговую статистику
summary = data.describe()
4. Транспонирование статистики для получения аналогичного формата как функция резюме резюме()
summary = summary.transpose()
5. Визуализация итоговой статистики в консоли
summary.head()