Рубрика: Анализ данных

Как сортировать мультииндексы (MultiIndex) в Pandas

Как сортировать мультииндексы (MultiIndex) в Pandas

Синтаксис сортировки MultiIndex: Для сортировки MultiIndex необходимо указать все уровни, которые будут использоваться для сортировки. Иначе появиться ошибку типа: ValueError: The column label 'Depth' is not unique. For a multi-index, the label must be...

Pandas 7 функций для быстрого исследования датафрейма

Данные функции нужны для исследовательского анализа (EDA), чтобы быстро изучить ваш датафрейм, а уже потом выполнять более сложные задачи. 1. Для любого датафрейма функция .info () покажет сколько у вас записей, имена каждого столбца,...

Pandas как посчитать долю

Есть файл с данными — https://github.com/Yorko/mlcourse.ai/blob/main/data/adult.data.csv Задача — узнать доля граждан Германии (Germany), признак «native-country» Решение — необходимо отфильтровать данные, отвечающие определенному условию (содержание определенного слова в определенном столбце) и посчитать долю отфильтрованных данных в общей массе...

Pandas pivot_table ()

Pandas pivot_table ()

Функция pivot_table () в Pandas используется для создания таблицы пивота в стиле электронной таблицы в качестве DataFrame. Позволяет анализировать совокупную информацию в DataFrame. Синтаксис функции следующий: Пример использования pandas.pivot_table (): Результат выполнения: Источник: https://appdividend.com/2020/03/11/python-pandas-pivot-table-example-pandas-pivot_table/

Pandas crosstab ()

Pandas crosstab ()

Функция crosstab Pandas используется для вычисления перекрестной таблицы двух или более факторов. Данная функция определена в библиотеке Pandas. По умолчанию crosstab вычисляет частотную таблицу всех упомянутых факторов, если не передан массив или список значений...

Решение реальной проблемы при помощь MySQL, Pandas (pd.concat)

Проблема: пишет маркетолог — у нас перестали отправляться emails пользователям из CRM (!) Я сижу и думаю, ситуация странная — алерты о том что лежит сервис не приходит. Зашел в CRM, там тоже все спокойно и...

3 Python пакета для каждого аналитика данных

Перевод статьи Medium Mito Mito (https://docs.trymito.io/) — это модуль электронных таблиц для Python. Работать с Mito можно в Jupyter Notebook, и каждая правка, сделанная во внешнем интерфейсе, будет генерировать эквивалент Python. С Mito не придется...

Pandas конвертировать Datetime в Date

Синтаксис функции: Пример использования: Демо-датасет Чтобы конвертировать колонку «datetime» небходимо воспользоваться встроенным to_datetime методом: Теперь колонка «date» содержит просто дату без времени Преведение колонки к правильному формату: Для начала следует проверить и понять какие...