Pandas. Подсчитать уникальные значения (обновлено)
Для подсчета уникальных значений в датафрейме необходимо использовать функцию nunique ().
Синтаксис функции nunique ()
Функция nunique () в использовании достаточно проста:
# подсчет уникальных значений в каждом столбце df.nunique() # подсчет уникальных значений в каждой строке df.nunique(axis=1)
Пример функции nunique ()
В приведенном ниже примере показано, как использовать эту функцию на практике
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], 'points': [8, 8, 13, 13, 22, 22, 25, 29], 'assists': [5, 8, 7, 9, 12, 9, 9, 4], 'rebounds': [11, 8, 11, 6, 6, 5, 9, 12]})
Пример 1: Подсчет уникальных значений в каждом столбце
df.nunique()
Пример 2: Подсчет уникальных значений в каждой строке
df.nunique(axis=1)
Пример 3: Подсчет уникальных значений c группировкой по 'team'
df.groupby('team')['points'].nunique()
Обновлено. Ссылка на Google Colab