Рубрика: Анализ данных

Pandas отчет о продажах

В качестве источника данных используется — https://www.kaggle.com/carrie1/ecommerce-data. Для начала подключается Pandas и вычитывается файл: Теперь нужно найти пустые данные в датасете: Обратите внимание, что есть пустые значения в CustomerID. К сожалению метод groupby игнорирует NaN,...

Чем когорта отличается от сегмента?

Главное отличие — привязка ко времени. Допустим, у нас есть список клиентов. Мы можем его разбить (сегментировать) по городам или по рекламным источникам. Это нам позволит отвечать на вопросы: — сколько заказов делают пользователи...

Pandas. Объединение DataFrames по именам столбцов

Есть два DataFrames со следующими именами столбцов: Необходимо получить DataFrame со следующими столбцами путем объединения (слева) по county_ID = countyid: Нужно использовать опции left_on и right_on в pd.merge следующим образом: Или при помощи DataFrame.merge:

Pandas + Mito nginx accesslog

Продолжаю эксперементы с Pandas и Mito. В этот раз решил проанализировать nginx accesslog. Размер моего анализируемого лога составил 150 мб. Работаю на Macbook Air M1 16 GB Ram, процесс парсинга accesslog и создание дата-фрейма...

Pandas.Merge () – объединение двух объектов DataFrame

При работе с датасетеми переодически их приходится объеденять. К примеру есть датасет с пользователями и продажами, и нужно посчитать какие-то оъедененные данные. В Pandas для этих целей есть функция Pandas.Merge ()

4 инструмента Python, которые помогут вам писать быстрее

Pandas GUI — графический интерфейс для Pandas Pandas GUI превращает Pands в действительно дружественную пользователю среду, которая делает анализ данных и работу с данными гораздо более наглядными для пользователя. Вот демонстрационное видео: В графическом интерфейсе...