Считать частоту значений в столбце pandas DataFrame

Я хочу подсчитать количество раз, когда каждое значение появляется в кадре данных.

Вот мой dataframe - df:

Я хочу словарь слов:

ех. counts = {N: 14, C:2, S:4}

Я пробовал df['status']['N'], но он дает keyError, а также df['status'].value_counts, но не используется.

Ответы

Ответ 1

Вы можете использовать value_counts и to_dict:

print df['status'].value_counts()
N    14
S     4
C     2
Name: status, dtype: int64

counts = df['status'].value_counts().to_dict()
print counts
{'S': 4, 'C': 2, 'N': 14}

Ответ 2

Альтернативный один лайнер с использованием underdog Counter:

In [3]: from collections import Counter

In [4]: dict(Counter(df.status))
Out[4]: {'C': 2, 'N': 14, 'S': 4}

Ответ 3

Вы можете попробовать это.

df.stack().value_counts().to_dict()

Ответ 4

Можете ли вы преобразовать df в список?

Если да:

a = ['a', 'a', 'a', 'b', 'b', 'c']
c = dict()
for i in set(a):
    c[i] = a.count(i)

Использование понимания dict:

c = {i: a.count(i) for i in set(a)}

Ответ 5

Смотрите мой ответ в этой теме для вывода данных Pandas DataFrame,

подсчитать частоту появления значения в столбце данных

Для вывода словаря вы можете изменить его следующим образом:

def column_list_dict(x):
    column_list_df = []
    for col_name in x.columns:        
        y = col_name, len(x[col_name].unique())
        column_list_df.append(y)
    return dict(column_list_df)