Автор: Олександр Пантелеєв
Есть файл с данными — https://github.com/Yorko/mlcourse.ai/blob/main/data/adult.data.csv Задача — узнать доля граждан Германии (Germany), признак «native-country» Решение — необходимо отфильтровать данные, отвечающие определенному условию (содержание определенного слова в определенном столбце) и посчитать долю отфильтрованных данных в общей массе...
Синтаксис сортировки MultiIndex: Для сортировки MultiIndex необходимо указать все уровни, которые будут использоваться для сортировки. Иначе появиться ошибку типа: ValueError: The column label 'Depth' is not unique. For a multi-index, the label must be...
Данные функции нужны для исследовательского анализа (EDA), чтобы быстро изучить ваш датафрейм, а уже потом выполнять более сложные задачи. 1. Для любого датафрейма функция .info () покажет сколько у вас записей, имена каждого столбца,...
Функция crosstab Pandas используется для вычисления перекрестной таблицы двух или более факторов. Данная функция определена в библиотеке Pandas. По умолчанию crosstab вычисляет частотную таблицу всех упомянутых факторов, если не передан массив или список значений...
Проблема: пишет маркетолог — у нас перестали отправляться emails пользователям из CRM (!) Я сижу и думаю, ситуация странная — алерты о том что лежит сервис не приходит. Зашел в CRM, там тоже все спокойно и...
В качестве источника данных используется — https://www.kaggle.com/carrie1/ecommerce-data. Для начала подключается Pandas и вычитывается файл: Теперь нужно найти пустые данные в датасете: Обратите внимание, что есть пустые значения в CustomerID. К сожалению метод groupby игнорирует NaN,...
Синтаксис функции: Пример использования: Демо-датасет Чтобы конвертировать колонку «datetime» небходимо воспользоваться встроенным to_datetime методом: Теперь колонка «date» содержит просто дату без времени Преведение колонки к правильному формату: Для начала следует проверить и понять какие...
Перевод статьи Medium Mito Mito (https://docs.trymito.io/) — это модуль электронных таблиц для Python. Работать с Mito можно в Jupyter Notebook, и каждая правка, сделанная во внешнем интерфейсе, будет генерировать эквивалент Python. С Mito не придется...