При работе с датасетеми переодически их приходится объеденять. К примеру есть датасет с пользователями и продажами, и нужно посчитать какие-то оъедененные данные. В Pandas для этих целей есть функция Pandas.Merge ()
Метка: Pandas
Pandas — программная библиотека на языке Python для обработки и анализа данных.
Работа Pandas с данными строится поверх библиотеки NumPy, являющейся инструментом более низкого уровня. Предоставляет специальные структуры данных и операции для манипулирования числовыми таблицами и временны́ми рядами.
В разделе представлена полезная информация о том как использовать Pandas: анализ данных, подготовка и очистка данных
Pandas. Подсчитать уникальные значения (обновлено)
Для подсчета уникальных значений в датафрейме необходимо использовать функцию nunique (). Синтаксис функции nunique () Функция nunique () в использовании достаточно проста: Пример функции nunique () В приведенном ниже примере показано, как использовать эту функцию на практике Пример 1: Подсчет уникальных значений в каждом столбце Пример 2: Подсчет уникальных значений в каждой строке Пример 3:… Читать далее Pandas. Подсчитать уникальные значения (обновлено)
4 инструмента Python, которые помогут вам писать быстрее
Pandas GUI — графический интерфейс для Pandas Pandas GUI превращает Pands в действительно дружественную пользователю среду, которая делает анализ данных и работу с данными гораздо более наглядными для пользователя. Вот демонстрационное видео: В графическом интерфейсе Pandas GUI вы можете фильтровать наборы данных, генерировать сводную статистику и многое другое! Mito — расширение электронной таблицы для Jupyter Lab с… Читать далее 4 инструмента Python, которые помогут вам писать быстрее
Решение реальной проблемы при помощь MySQL, Pandas (pd.concat)
Проблема: пишет маркетолог — у нас перестали отправляться emails пользователям из CRM (!) Я сижу и думаю, ситуация странная — алерты о том что лежит сервис не приходит. Зашел в CRM, там тоже все спокойно и рассылки уходят. Думаю, а что же это может быть... Пошел в кабинет сервиса (mandrill) проверить что там происходит — и каково было… Читать далее Решение реальной проблемы при помощь MySQL, Pandas (pd.concat)
3 Python пакета для каждого аналитика данных
Перевод статьи Medium Mito Mito (https://docs.trymito.io/) — это модуль электронных таблиц для Python. Работать с Mito можно в Jupyter Notebook, и каждая правка, сделанная во внешнем интерфейсе, будет генерировать эквивалент Python. С Mito не придется тратить время на поиск синтаксиса на Stack Overflow или в Google. Код генерируется за вас, поэтому вы можете быть уверены, что… Читать далее 3 Python пакета для каждого аналитика данных
Pandas конвертировать Datetime в Date
Синтаксис функции: Пример использования: Демо-датасет Чтобы конвертировать колонку «datetime» небходимо воспользоваться встроенным to_datetime методом: Теперь колонка «date» содержит просто дату без времени Преведение колонки к правильному формату: Для начала следует проверить и понять какие типы данных в датафрейме Сейчас колонка «date» является объектом. Чтобы это исправить необходимо использовать normalize () Источник: geeksforgeeks
Pandas отчет о продажах
В качестве источника данных используется — https://www.kaggle.com/carrie1/ecommerce-data. Для начала подключается Pandas и вычитывается файл: Теперь нужно найти пустые данные в датасете: Обратите внимание, что есть пустые значения в CustomerID. К сожалению метод groupby игнорирует NaN, поэтому давайте заполним его отрицательными значениями, чтобы сохранить числовой тип данных: И сразу конвертируем дату в дату питона (если pandas будет… Читать далее Pandas отчет о продажах
Pandas 7 функций для быстрого исследования датафрейма
Данные функции нужны для исследовательского анализа (EDA), чтобы быстро изучить ваш датафрейм, а уже потом выполнять более сложные задачи. 1. Для любого датафрейма функция .info () покажет сколько у вас записей, имена каждого столбца, тип данных каждого столбца и количество ненулевых значений в каждом столбце. Вы можете сравнить количество ненулевых значений с общим количеством записей,… Читать далее Pandas 7 функций для быстрого исследования датафрейма