Развертываем Anaconda – дистрибутив Python для data science

Anaconda – обширный пакет для data science с открытым исходным кодом и сообществом в 6 млн пользователей.

Как и многие другие, однажды я начал свой путь в быстро растущей сфере науки о данных. Когда проходил курсы по языкам программирования R и Python на Udemy, я скачивал и устанавливал нужные приложения независимо друг от друга. Столкнувшись с трудностями установки data science пакетов вроде NumPy и Matplotlib и пытаясь «подружить» различные зависимости, я и узнал о дистрибутиве Anaconda для Python.

Пакет легко скачать и установить, имеется поддержка Linux, MacOS и Windows. Мне нравится, как Anaconda облегчает новым пользователям первые шаги.

В дистрибутив входит более 1000 пакетов для работы с данными, а также пакет Conda вместе с системой управления виртуальной средой. Благодаря этому отпадает необходимость устанавливать каждую библиотеку по отдельности. Как отмечено на сайте Anaconda, «Пакеты для Python и R в репозитории Anaconda настраиваются и компилируются в нашей безопасной среде, так что вы получаете оптимизированные исполняемые файлы, которые просто работают на вашей системе».

Я советую использовать Anaconda Navigator — десктопный графический интерфейс (GUI), предоставляющий доступ ко всем приложениям в дистрибутиве, включая RStudioiPythonJupyter NotebookJupyterLabSpyderGlue, и Orange. Среда исполнения по умолчанию — Python 3.6, но вы можете с легкостью установить Python 3.5, Python 2.7 или R. Документация невероятно подробная, а дополнительную поддержку можно получить от замечательного сообщества пользователей.

Установка Anaconda

Чтобы установить Anaconda на мой ноутбук (Linux, Core i3 с 4Гб RAM), я скачал установщик Anaconda 5.1 для Linux и запустил для файла проверку хеш-суммы md5sum:

$ md5sum Anaconda3-5.1.0-Linux-x86_64.sh

Дальше я последовал инструкциям в документации. Там предписывали запустить следующую bash-команду (даже если ваша командная оболочка — не Bash):

$ bash Anaconda3-5.1.0-Linux-x86_64.sh

Я в точности придерживался указаний, и процесс установки занял около 5 минут. Инсталлятор спросил, желаю ли я добавить путь к установленной Anaconda в переменную среды PATH в моем файле /home/<user>/.bashrc. Я согласился и перезапустил shell, чтобы применить изменения в .bashrc.

После установки запустил Anaconda Navigator с помощью следующей команды:

$ anaconda-navigator

Каждый раз при запуске Anaconda Navigator проверяет наличие новых версий и предлагает их установить.

Уведомление об обновлении Anaconda

Anaconda успешно обновилась, возвращаться к командной строке не понадобилось. Первый запуск Anaconda был несколько медленным. Учитывая обновления, на то, чтобы приступить, ушло еще несколько минут. Обновления можно также запустить вручную при помощи следующей команды:

$ conda update anaconda-navigator

Поиск и установка приложений

Запустив Navigator, я смог исследовать разнообразие приложений, поставляющихся с Anaconda Distribution. Согласно документации, версия Anaconda для Python 3.6 (64 бита) поддерживает 499 пакетов. Первым приложением, с которым я ознакомился, было Jupyter QtConsole. Его простой в использовании GUI поддерживает встроенные графики и подсветку синтаксиса.

Интерфейс Jupiter QtConsole

Jupyter Notebook уже включен в дистрибутив, поэтому в отдельной установке нет нужды (в отличие от других сред разработки Python, которыми мне приходилось пользоваться).

Интерфейс Jupyter Notebook

С RStudio я уже был знаком. Этот инструментарий не установлен по умолчанию, но добавляется одним кликом мыши, как и целый ряд других приложений: JupyterLab, Orange, Glue, Spyder и т.д.

Прочие приложения в Anaconda Navigator

Одно из преимуществ дистрибутива Anaconda – возможность настроить несколько сред разработки. Например, если я захочу создать среду c Python 2.7 вместо дефолтной версии Python 3.6, я введу в консоли:

$ conda create -n py27 python=2.7 anaconda

Conda позаботится об установке. Чтобы ее запустить, введите в терминале:

$ anaconda-navigator

Выберите среду py27 из выпадающего списка «Приложения на» в Anaconda GUI.

Поиск приложений в Anaconda Navigator

Больше об Anaconda Python

Информации об Anaconda очень много. Если желаете глубже изучить ее инструментарий, можно начать со списка ресурсов на этой странице и с данного форума.