Помечено: Pandas

Pandas — разбор всех основных возможностей на реальном датасете

Если есть желание познакомиться с тем, как работать с данными в Pandas — рекомендую очень хорошее видео на эту тему: Из софта который нужен: Python, Jupyter, Pandas Чтобы быстро установить себе Jupyter на пк вот...

Pandas — подбор видео-уроков поясняющих работу с библиотекой

Продолжаю изучение библиотеки Pandas, нашел отличные видео-уроки для новичков. Все очень подробно расписано. Единственное что требуется от вас это понимание того, какие отчеты вы в результате исследований данных нужно получить (мне кажется, что визуализация...

Как выбрать столбцы по индексу в Pandas

Как выбрать столбцы по индексу в Pandas

Может понадобиться выбрать столбцы DataFrame на основе индекса. Если нужно выбрать столбцы на основе целочисленной индексации — необходима функция .iloc. Если нужно выбрать столбцы на основе индексации по меткам — .loc. Пример 1: Выбор столбцов на...

Pandas crosstab ()

Pandas crosstab ()

Функция crosstab Pandas используется для вычисления перекрестной таблицы двух или более факторов. Данная функция определена в библиотеке Pandas. По умолчанию crosstab вычисляет частотную таблицу всех упомянутых факторов, если не передан массив или список значений...

Как сортировать мультииндексы (MultiIndex) в Pandas

Как сортировать мультииндексы (MultiIndex) в Pandas

Синтаксис сортировки MultiIndex: Для сортировки MultiIndex необходимо указать все уровни, которые будут использоваться для сортировки. Иначе появиться ошибку типа: ValueError: The column label 'Depth' is not unique. For a multi-index, the label must be...

Pandas как посчитать долю

Есть файл с данными — https://github.com/Yorko/mlcourse.ai/blob/main/data/adult.data.csv Задача — узнать доля граждан Германии (Germany), признак «native-country» Решение — необходимо отфильтровать данные, отвечающие определенному условию (содержание определенного слова в определенном столбце) и посчитать долю отфильтрованных данных в общей массе...

Pandas 7 функций для быстрого исследования датафрейма

Данные функции нужны для исследовательского анализа (EDA), чтобы быстро изучить ваш датафрейм, а уже потом выполнять более сложные задачи. 1. Для любого датафрейма функция .info () покажет сколько у вас записей, имена каждого столбца,...