3 Python пакета для каждого аналитика данных
Перевод статьи Medium |
Mito
Mito (https://docs.trymito.io/) — это модуль электронных таблиц для Python.
Работать с Mito можно в Jupyter Notebook, и каждая правка, сделанная во внешнем интерфейсе, будет генерировать эквивалент Python.
С Mito не придется тратить время на поиск синтаксиса на Stack Overflow или в Google. Код генерируется за вас, поэтому вы можете быть уверены, что создаете правильный, чистый код.
Вот видео-урок:
Чтобы установить Mito просто выполните команды в терминале:
python -m pip install mitoinstaller python -m mitoinstaller install
Чтобы открыть Mitosheet:
import mitosheet mitosheet.sheet()
Вот ссылка на полную инструкцию по установке — https://docs.trymito.io/getting-started/installing-mito
Вы можете настроить pivot table в Mito, выбрав кнопку Pivot на панели инструментов, а затем выбрав строки, столбцы, значения и типы агрегации.
Каждая правка в Mito генерирует эквивалент Python в ячейке кода ниже. Это гораздо более быстрый способ создания кода, чем постоянно обращаться к Stack Overflow в поисках правильного синтаксиса.
Приведенная выше pivot table генерирует этот код и автоматически комментирует его (!):
Mito генерирует код не только для pivot table. Mito может объединять наборы данных, фильтровать, сортировать, использовать функции, просматривать сводную статистику и многое другое. Mito сгенерирует эквивалентный Python код для каждого из изменений.
Чтобы создать график Plotly, достаточно нажать кнопку графика и выбрать оси:
Streamlit
Streamlit (https://docs.streamlit.io/) — это пакет для Python с открытым исходным кодом, который позволяет очень просто создавать приложения для работы с данными для ML и Data Science.
Чтобы начать работать с Streamlit необходимо установить и вызвать пакет:
pip install streamlit streamlit hello
Вторая команда откроет демонстрационную среду.
В Streamlit можно выполнять такие действия, как создание линейного графика:
chart_data = pd.DataFrame( np.random.randn(20, 3), columns=['a', 'b', 'c'])st.line_chart(chart_data)
Или добавить интерактивные виджеты:
if st.checkbox('Show dataframe'): chart_data = pd.DataFrame( np.random.randn(20, 3), columns=['a', 'b', 'c']) chart_data
Вот ссылка на полную документацию с пакетом: https://docs.streamlit.io/library/get-started
Plotly
Plotly (https://plotly.com/graphing-libraries/) — это библиотека графиков будущего. Наверное лучший пакет для быстрого и простого создания интерактивных графиков и диаграмм. Такие пакеты, как matplotlib и seaborn, конечно, тоже интуитивно понятны, но им не хватает интерактивности, которая делает Plotly таким сильным.
Чтобы установить Plotly, выполните следующую команду:
pip install plotly==5.2.1
В Plotly есть целый ряд интерактивных графиков на выбор. Есть более простые графики, где интерактивность заключается в изменении цвета столбиков
import plotly.graph_objects as go fig = go.Figure(data=go.Bar(y=[2, 3, 1])) fig.show()