Pandas. Подсчитать уникальные значения (обновлено)

Для подсчета уникальных значений в датафрейме необходимо использовать функцию nunique ().

Синтаксис функции nunique ()

Функция nunique () в использовании достаточно проста:

# подсчет уникальных значений в каждом столбце
df.nunique()
# подсчет уникальных значений в каждой строке
df.nunique(axis=1)

Пример функции nunique ()

В приведенном ниже примере показано, как использовать эту функцию на практике

import pandas as pd
#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'points': [8, 8, 13, 13, 22, 22, 25, 29],
                   'assists': [5, 8, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 11, 6, 6, 5, 9, 12]})

Пример 1: Подсчет уникальных значений в каждом столбце

df.nunique()

Пример 2: Подсчет уникальных значений в каждой строке

df.nunique(axis=1)

Пример 3: Подсчет уникальных значений c группировкой по 'team'

df.groupby('team')['points'].nunique()

Обновлено. Ссылка на Google Colab