Есть файл с данными — https://github.com/Yorko/mlcourse.ai/blob/main/data/adult.data.csv Задача добавить новую колонку «is-german» и заполнить ее признаком False, если в колонке «native-country» стоит признак Germany добавить новую колонку «age-group» (Возрастная группа, и запонить ее даннными исходя из того, сколько лет указано в строке Решение — их может быть несколько. Для того, чтобы выполнить задачи, смотрите на команды ниже. 1.… Читать далее Pandas. Заполнить столбец с помощью условия (обновлено)
Метка: Pandas
Pandas — программная библиотека на языке Python для обработки и анализа данных.
Работа Pandas с данными строится поверх библиотеки NumPy, являющейся инструментом более низкого уровня. Предоставляет специальные структуры данных и операции для манипулирования числовыми таблицами и временны́ми рядами.
В разделе представлена полезная информация о том как использовать Pandas: анализ данных, подготовка и очистка данных
Pandas как посчитать долю
Есть файл с данными — https://github.com/Yorko/mlcourse.ai/blob/main/data/adult.data.csv Задача — узнать доля граждан Германии (Germany), признак «native-country» Решение — необходимо отфильтровать данные, отвечающие определенному условию (содержание определенного слова в определенном столбце) и посчитать долю отфильтрованных данных в общей массе данных (то есть посчитать долю отфильтрованного кол-ва строк в общем кол-ве строк). Для того, чтобы отфильтровать данные я воспользовался следующими командами.… Читать далее Pandas как посчитать долю
Pandas pivot_table ()
Функция pivot_table () в Pandas используется для создания таблицы пивота в стиле электронной таблицы в качестве DataFrame. Позволяет анализировать совокупную информацию в DataFrame. Синтаксис функции следующий: Пример использования pandas.pivot_table (): Результат выполнения: Источник: https://appdividend.com/2020/03/11/python-pandas-pivot-table-example-pandas-pivot_table/
Pandas crosstab ()
Функция crosstab Pandas используется для вычисления перекрестной таблицы двух или более факторов. Данная функция определена в библиотеке Pandas. По умолчанию crosstab вычисляет частотную таблицу всех упомянутых факторов, если не передан массив или список значений и функций агрегирования. Синтаксис функции следующий: Пример использования pandas.crosstab () Результат выполнения: Источник: https://appdividend.com/2020/07/02/pandas-crosstab-function-example-in-python/
Как сортировать мультииндексы (MultiIndex) в Pandas
Синтаксис сортировки MultiIndex: Для сортировки MultiIndex необходимо указать все уровни, которые будут использоваться для сортировки. Иначе появиться ошибку типа: ValueError: The column label 'Depth' is not unique. For a multi-index, the label must be a tuple with elements corresponding to each level. Шаг 1: Создание многоиндексного DataFrame Очень часто функция агрегирования множества данных превращается в… Читать далее Как сортировать мультииндексы (MultiIndex) в Pandas
Как выбрать столбцы по индексу в Pandas
Может понадобиться выбрать столбцы DataFrame на основе индекса. Если нужно выбрать столбцы на основе целочисленной индексации — необходима функция .iloc. Если нужно выбрать столбцы на основе индексации по меткам — .loc. Пример 1: Выбор столбцов на основе целочисленной индексации Следующий код показывает, как создать pandas DataFrame и использовать .iloc для выбора столбца с целочисленным индексом, равным 3:… Читать далее Как выбрать столбцы по индексу в Pandas
Установка Jupyter и Pandas в MacOS
Это краткая инструкция по установке Jupyter Notebook в MacOS. Cразу будут установлены инструменты для аналитики данных. Требования — у вас на Mac должен быть установлен Python + Virtualenv, если таковых нет в системе — в этой статье представлена подробная информация о том как установить Python на Mac. В этой статье я просто напишу кратко команды для установки… Читать далее Установка Jupyter и Pandas в MacOS
Установка Python и Jupyter Notebook в Windows 11 (windows 10)
В этом небольшом посте шаг-за-шагом напишу как установить Jupyter Notebook в Windows 11 Шаг 1. Скачать и установить Python на ваш ПК https://www.python.org/downloads/ . Чтобы проверить есть ли Python на ПК — откройте командную строку и введите команду ответ на команду будет примерно следующий: Шаг 2. Установить виртуальное окружение Python:: Подготовка закончена. Шаг 3. Войдите в… Читать далее Установка Python и Jupyter Notebook в Windows 11 (windows 10)