Первые шаги в JupyterLab

Jupyter и JupyterLab используются специалистами по анализу данных, или специалистами Data Science, или дата-сатанистами, или аналитиками данных, или специалистами по машинному обучению (не знаю, как правильно называется специальность).

Установка JupyterLab

Я всё это выполняю в Debian. Для начала у вас должен быть уже установлен pip (специальная утилита для установки различных пакетов Python). Затем с его помощью устанавливаем JupyterLab:

После этого убедитесь, что каталог ~/.local/bin содержится в переменной окружения PATH.

Если его там нет, то его туда нужно добавить:

А ещё лучше прописать это в “~.bashrc”., чтобы не пришлось каждый раз добавлять этот каталог в PATH перед запуском JupyterLab.

Краткий обзор JupyterLab

После этого можно запускать JupyterLab:

У вас откроется окно браузера, в котором мы и будем делать всё остальное.

Jupyterlab window
Jupyterlab

В левой части окна мы видим файлы, которые были в том каталоге, в котором мы находились в момент запуска JupyterLab. В правой части отображаются вкладки с открытыми в данный момент файлами. У нас также есть стандартное горизонтальное меню, как в большинстве современных офисных приложений.

JupyterLab умеет открывать огромное количество файлов. В моём случае у меня в рабочем каталоге лежат два файла: “face.png” и “pushkin.pdf”. Их можно открыть кликнув на них два раза.

JupyterLab открыт файл PNG  с рожицей
JupyterLab PNG file
JupyterLab открыт файл PDF со стихом Пушкина: "Чем чаще празднует лицей Своя святую годовщину"
JupyterLab PDF file

Мы также можем создавать свои notebook-и. Внутри открывшейся в браузере среды кликните FileNewNotebook. В диалоговом окне выберите “Python 3” и кликните “SELECT”. В правой части JupyterLab появится новая вкладка “Untitled.ipynb”. Это и есть наш созданный notebook (не знаю, как переводить, лучше оставлю на английском)

Что такое notebook в Jupyter

Notebook в Jupyter — это файл с чередующимися ячейками, каждая из которых содержит либо markdown, либо программный код на Python.

Работа с notebook-ами в JupyterLab

Сам notebook выглядит примерно так:

Ячейки в Jupyter notebook-ах

Обратите внимание на маркер текущей ячейки. Мы можем перемещаться между ячейками с помощью клавиш со стрелками. Для добавления ячейки перед текущей используйте клавишу “a”, для добавления ячейки после текущей используйте клавишу “b”. Удалить ячейку можно два раза нажав клавишу “d”. Остальные команды можно посмотреть в пункте “Edit” горизонтального меню.

Каждая ячейка содержит либо разметку Markdown, либо программный код Python. Вы можете менять тип текущей ячейки с помощью клавиш “y” (программный код) и “m” (Markdown).

Для примера давайте сделаем первую ячейку с простенькой разметкой Markdown. Для этого выберем её и с помощью клавиши “m” переключим её тип на разметку. Нажмите клавишу “Enter”, чтобы перейти в режим редактирования ячейки. Введите туда следующее содержимое:

А вторую ячейку сделаем с простой программой на Python. По окончании редактирования предыдущей ячейки нажмите клавишу “Escape”, чтобы выйти из режима редактирования содержимого ячейки. Затем нажмите клавишу “b”, чтобы добавить ячейку после неё. Выберите добавленную ячейку используя стрелки на клавиатуре, поменяйте её тип на программный код с помощью клавиши “y”, нажмите “Enter” и введите в неё следующее содержимое:

Отлично. Нажмите “Escape”, чтобы выйти из режима редактирования ячейки и запустите текущую ячейку на выполнение с помощью комбинации “Shift+Enter”.

У вас должно получиться примерно следующее:

Jupyter notebook example
Jupyter notebook example

А теперь давайте в третью ячейку вставим программу для построения диаграммы из статьи про Matplotlib и запустим её. Диаграмма успешно построится, но перед ней появится странный вывод:

Как его убрать? В самый конец кода в ячейке добавьте ещё вызов:

И в результате получим красивую диаграмму без лишнего вывода.

Зачем всё это нужно

Судя по всему, notebook-и позволяют строить красивые отчёты, содержащие вперемешку текст и легко обновляемые графики, собранные из различных источников. Notebook-и можно экспортировать в PDF, HTML и другие форматы, чтобы затем передавать людям, не связанным с программированием и анализом данных.

Рекомендуемые статьи

Пишем на Python в Eclipse

Установка Python 3 и Spyder


Поделиться:

Добавить комментарий

Ваш адрес email не будет опубликован.