3 Python пакета для каждого аналитика данных

Перевод статьи Medium

Mito

Mito (https://docs.trymito.io/) — это модуль электронных таблиц для Python.

Работать с Mito можно в Jupyter Notebook, и каждая правка, сделанная во внешнем интерфейсе, будет генерировать эквивалент Python.

С Mito не придется тратить время на поиск синтаксиса на Stack Overflow или в Google. Код генерируется за вас, поэтому вы можете быть уверены, что создаете правильный, чистый код.

Вот видео-урок:

Чтобы установить Mito просто выполните команды в терминале:

python -m pip install mitoinstaller
python -m mitoinstaller install

Чтобы открыть Mitosheet:

import mitosheet
mitosheet.sheet()

Вот ссылка на полную инструкцию по установке — https://docs.trymito.io/getting-started/installing-mito

Вы можете настроить pivot table в Mito, выбрав кнопку Pivot на панели инструментов, а затем выбрав строки, столбцы, значения и типы агрегации.

Каждая правка в Mito генерирует эквивалент Python в ячейке кода ниже. Это гораздо более быстрый способ создания кода, чем постоянно обращаться к Stack Overflow в поисках правильного синтаксиса.

Приведенная выше pivot table генерирует этот код и автоматически комментирует его (!):

Mito генерирует код не только для pivot table. Mito может объединять наборы данных, фильтровать, сортировать, использовать функции, просматривать сводную статистику и многое другое. Mito сгенерирует эквивалентный Python код для каждого из изменений.

Чтобы создать график Plotly, достаточно нажать кнопку графика и выбрать оси:

Streamlit

Streamlit (https://docs.streamlit.io/) — это пакет для Python с открытым исходным кодом, который позволяет очень просто создавать приложения для работы с данными для ML и Data Science.

Чтобы начать работать с Streamlit необходимо установить и вызвать пакет:

pip install streamlit
streamlit hello

Вторая команда откроет демонстрационную среду.

В Streamlit можно выполнять такие действия, как создание линейного графика:

chart_data = pd.DataFrame(
np.random.randn(20, 3),
columns=['a', 'b', 'c'])st.line_chart(chart_data)

Или добавить интерактивные виджеты:

if st.checkbox('Show dataframe'):
    chart_data = pd.DataFrame(
       np.random.randn(20, 3),
       columns=['a', 'b', 'c'])    chart_data

Вот ссылка на полную документацию с пакетом: https://docs.streamlit.io/library/get-started

Plotly

Plotly (https://plotly.com/graphing-libraries/) — это библиотека графиков будущего. Наверное лучший пакет для быстрого и простого создания интерактивных графиков и диаграмм. Такие пакеты, как matplotlib и seaborn, конечно, тоже интуитивно понятны, но им не хватает интерактивности, которая делает Plotly таким сильным.

Чтобы установить Plotly, выполните следующую команду:

pip install plotly==5.2.1

В Plotly есть целый ряд интерактивных графиков на выбор. Есть более простые графики, где интерактивность заключается в изменении цвета столбиков

import plotly.graph_objects as go
fig = go.Figure(data=go.Bar(y=[2, 3, 1]))
fig.show()