Автор: Олександр Пантелеєв

Pandas как посчитать долю

Есть файл с данными — https://github.com/Yorko/mlcourse.ai/blob/main/data/adult.data.csv Задача — узнать доля граждан Германии (Germany), признак «native-country» Решение — необходимо отфильтровать данные, отвечающие определенному условию (содержание определенного слова в определенном столбце) и посчитать долю отфильтрованных данных в общей массе...

Как сортировать мультииндексы (MultiIndex) в Pandas

Как сортировать мультииндексы (MultiIndex) в Pandas

Синтаксис сортировки MultiIndex: Для сортировки MultiIndex необходимо указать все уровни, которые будут использоваться для сортировки. Иначе появиться ошибку типа: ValueError: The column label 'Depth' is not unique. For a multi-index, the label must be...

Pandas 7 функций для быстрого исследования датафрейма

Данные функции нужны для исследовательского анализа (EDA), чтобы быстро изучить ваш датафрейм, а уже потом выполнять более сложные задачи. 1. Для любого датафрейма функция .info () покажет сколько у вас записей, имена каждого столбца,...

Pandas crosstab ()

Pandas crosstab ()

Функция crosstab Pandas используется для вычисления перекрестной таблицы двух или более факторов. Данная функция определена в библиотеке Pandas. По умолчанию crosstab вычисляет частотную таблицу всех упомянутых факторов, если не передан массив или список значений...

Решение реальной проблемы при помощь MySQL, Pandas (pd.concat)

Проблема: пишет маркетолог — у нас перестали отправляться emails пользователям из CRM (!) Я сижу и думаю, ситуация странная — алерты о том что лежит сервис не приходит. Зашел в CRM, там тоже все спокойно и...

Pandas отчет о продажах

В качестве источника данных используется — https://www.kaggle.com/carrie1/ecommerce-data. Для начала подключается Pandas и вычитывается файл: Теперь нужно найти пустые данные в датасете: Обратите внимание, что есть пустые значения в CustomerID. К сожалению метод groupby игнорирует NaN,...

Pandas конвертировать Datetime в Date

Синтаксис функции: Пример использования: Демо-датасет Чтобы конвертировать колонку «datetime» небходимо воспользоваться встроенным to_datetime методом: Теперь колонка «date» содержит просто дату без времени Преведение колонки к правильному формату: Для начала следует проверить и понять какие...

3 Python пакета для каждого аналитика данных

Перевод статьи Medium Mito Mito (https://docs.trymito.io/) — это модуль электронных таблиц для Python. Работать с Mito можно в Jupyter Notebook, и каждая правка, сделанная во внешнем интерфейсе, будет генерировать эквивалент Python. С Mito не придется...