Machine Learning, Big Data, Data Science: книги 2020 года

Машинное обучение, большие данные, наука о данных сегодня у всех на слуху. Не удивительно, что многие программисты хотят приобрести дополнительные навыки в этих областях знаний, чтобы использовать в следующих проектах или даже чтобы просто для красоты вставить в резюме. Мы собрали для вас подборку самых свежих книг по этим темам.

Python: Искусственный интеллект, большие данные и облачные вычисления

Авторы: Пол Дейтел, Харви Дейтел. Язык: русский.


Эта книга логически разделена на две части. Первая, состоящая из 10 глав, по сути посвящена изучению языка Python. Вы познакомитесь с такими базовыми вещами, как команды присваивания, операторы, переменные, функции, списки и кортежи, словари и множества и т. д. От книг, обучающих непосредственно языку Python, эту книгу отличает то, что в каждой из вступительных десяти глав есть раздел «Введение в data science», в котором тема главы рассматривается именно в этом разрезе.

Вторая часть книги посвящена изучению data science, искусственного интеллекта и big data. Здесь вы найдете массу интересных примеров, освоите нужные термины и концепции.

К основным особенностям книги авторы относят простоту подачи материала, краткость (примеры кода обычно небольшие), а также актуальность.

В книге разбираются обработка естественного языка, машинное и глубокое обучение, Hadoop, MapReduce, Spark, IBM Watson. Читая книгу, вы познакомитесь с основными библиотеками data science (NumPy, pandas, Keras и др.) и визуализации (Matplotlib, Seaborn, Folium).

Для закрепления новых знаний читателям предлагается поработать с открытыми наборами данных.

Machine Learning with Python for Everyone

Автор: Mark E. Fenner. Язык: английский.

Марк Феннер несколько лет рассказывал о концепциях науки о данных и машинного обучения людям с самым разным бэкграундом. Это помогло ему отточить свое умение доносить сложные идеи простыми словами. В конечном итоге он решил записать свои объяснения и объединить их в одной книге.

Книга «Machine Learning with Python for Everyone» предназначена для обучения (хм…) машинному обучению с нуля. Для ее чтения вам не понадобятся какие-то продвинутые знания по части математики. Но языку Python книга не учит, так что вы должны его знать хотя бы на уровне чтения кода.

При написании этой книги Феннер использовал минимум профессионального жаргона, благодаря чему текст легко читается. Кроме того автор снабдил все пояснения конкретными примерами, которые читатель может протестировать лично, на своем компьютере.

Любопытно, что сам автор заинтересовался темой машинного обучения еще в детстве, когда посмотрел фильм «Военные игры». Возможность научить машину размышлять показалась ему потрясающей.

Machine Learning with Spark™ and Python, Second Edition

Автор: Michael Bowles. Язык: английский.


Эти книга предназначена для Python-разработчиков, желающих добавить в свой набор навыков машинное обучение. В этой книге вы найдете описание основных задач, которые решает машинное обучение, познакомитесь с несколькими новейшими алгоритмами и их принципами действия. Разумеется, будут приведены примеры кода.

Для наилучшего понимания материала книги нужны общие знания информатики, математики и статистики (нужно уметь находить производную, знать линейную алгебру, уметь умножать матрицы).

Также предполагается, что читатели умеют читать и писать код. Поскольку все примеры в книге написаны на Python (все библиотеки и пакеты — тоже питоновские), можно сказать, что книга предназначена для разработчиков-питонистов.

В своей книге автор разбирает алгоритмы машинного обучения двух видов: штрафную линейную регрессию и ансамблевые методы. Эти два семейства алгоритмов теперь доступны как часть PySpark.

Когда вышло первое издание этой книги, для построения моделей машинного обучения для очень больших наборов данных требовалась работа сотен процессоров, а это, в свою очередь, требовало много дополнительных знаний и навыков. Ко времени выхода второго издания архитектура Spark позволила исправить этот недостаток. Код для запуска алгоритма машинного обучения теперь можно запустить в PySpark практически так же просто, как любую программу на Python.

Во втором издании книги все примеры написаны на Python 3. Также, помимо текстового варианта, примеры в каждой главе доступны в виде Jupyter notebooks. Этот код при выполнении рисует графики и таблицы для большей наглядности.

Learn TensorFlow 2.0

Авторы: Pramod Singh, Avinash Manure. Язык: английский.

Прамод Сингх имеет богатый практический опыт в машинном обучении, глубоком обучении, сфере искусственного интеллекта, в проектировании алгоритмов и разработке программ. Он проработал больше 10 лет над проектами, связанными с обработкой данных (в разных компаниях). Регулярно выступает на конференциях и является автором уже трех книг.

Авинаш Манур — специалист по data science. Уже больше восьми лет он использует данные для решения проблем бизнеса. Хорошо разбирается в развертывании сложных алгоритмов машинного обучения и статистического моделирования. У Манура это первая книга.

Одна из основных целей книги «Learn TensorFlow 2.0» — познакомить читателей с главными изменениями, произошедшими в библиотеке с выходом второй версии. Авторы фокусируются на разных аспектах TensorFlow, касающихся машинного обучения.

В первой части вы найдете введение в обработку данных при помощи TensorFlow 2.0. Во второй обсуждается использование библиотеки для построения моделей машинного и глубокого обучения, а также затрагивается тема нейролингвистического программирования (NLP). Третья часть посвящена деплойменту моделей в продакшен.

Edge AI

Авторский коллектив: Xiaofei Wang, Yiwen Han, Victor C. M. Leung, Dusit Niyato, Xueqiang Yan, Xu Chen. Язык: английский.

В наше время искусственный интеллект все больше проникает во все сферы жизни. Мы наблюдаем развитие «умных» заводов, городов, домов, интернета вещей. Но реализация ИИ требует поддержки высокомасштабируемых данных. В настоящее время количество данных в сети растет экспоненциально. Это хорошо для развития ИИ, но является огромной проблемой для современной архитектуры сети. Граничные вычисления (edge computing), благодаря периферийным узлам, способны снизить нагрузку на сеть и уменьшить задержку ответов на запросы.

Цель этой книги — рассказать о современных достижениях в отношениях между граничными вычислениями и искусственным интеллектом.

Авторы обсуждают передовые технологии граничного ИИ (edge AI). Они разбирают основы, концепции, фреймворки, случаи применения, методы оптимизации и прогнозы на будущее этих технологий.

Книга может служить справочным пособием для студентов, исследователей и практиков в сфере искусственного интеллекта и смежных областей знаний.

Deep Learning for Coders with Fastai and PyTorch: AI Applications Without a PhD

Авторы: Jeremy Howard, Sylvain Gugger. Язык: английский.

Книга предназначена для новичков в глубоком и машинном обучении. Однако предполагается, что читатели умеют программировать (предпочтительно — на Python).

Впрочем, первые части книги посвящены основам глубокого обучения и, по словам авторов, для их освоения не потребуется даже умение программировать. Это делает книгу полезной даже для не-программистов (директоров, менеджеров продуктов и т. д.).

Прочитав эту книгу, вы узнаете, как работают модели глубокого обучения и как можно повысить точность и скорость их работы. Вы познакомитесь с новейшими приемами глубокого обучения. Научитесь тренировать модели для использования в сфере компьютерного зрения, обработки естественного языка, коллаборативной фильтрации. Кроме того, вы научитесь превращать свои модели в веб-приложения.

В конце каждой главы есть раздел с вопросами на повторение. Как отметил один из ревьюеров, он считает удобным вообще начинать чтение глав с этих разделов, чтобы точно знать, на что обращать внимание. Нам кажется, что этот прием может быть полезным и при чтении других книг.

Один из авторов книги, Джереми Ховард, имеет огромный опыт по части преподавания машинного обучения — около 30 лет. Он начал работать с нейронными сетями 25 лет назад. За прошедшие годы ему случалось поработать над многими проектами машинного обучения во многих компаниях. Вместе Рейчел Томас он основал fast.ai — организацию для создания учебного курса по искусственному интеллекту. На базе этого курса и написана данная книга.

В отличие от своего соавтора, Сильвайн Гаггер знает многое о формальном техническом образовании и математике (автор 10 учебников). Мир машинного обучения для него был в новинку.

По тексту книги вы найдете примечания от обоих авторов. Джереми будет давать советы людям, меньше разбирающимся в математике и имеющим технический бэкграунд, а Сильвайн — людям с бэкграундом математике, не слишком разбирающимся в программировании.

Deep Learning Architectures

Автор: Ovidiu Calin. Язык: английский.

В этой книге объясняется, как функционируют нейронные сети, с позиции математики. Авторы старались донести мысль, что за успешностью работы нейронных сетей стоит не удача и не метод проб и ошибок, а точный математический анализ.

В изложении акцент делается именно на математику, потому что большинство современных книг этот аспект обычно упускают, сосредотачиваясь на вопросах информатики и практическом применении нейронных сетей в приложениях.

Книга не содержит кода вообще, так что она точно не о программировании. Вы не найдете здесь готовых рецептов, применимых в ваших программах. Но если вы хотите разобраться в теоретических основах работы нейронных сетей, это то, что надо.

Для лучшего освоения материала в книге есть упражнения с ответами или подсказками.

Human Centric Visual Analysis with Deep Learning

Авторский коллектив: Liang Lin, Dongyu Zhang, Ping Luo, Wangmeng Zuo. Язык: английский.

Человекоцентричный визуальный анализ — одна из основных задач компьютерного зрения. Он используется в сфере виртуальной реальности, робототехнике и других областях. Сравнительно недавно для человекоцентричного визуального анализа стали применять методы глубокого обучения. Именно об использовании глубокого обучения и рассказывает эта книга.

В первой части для лучшего понимания читателями основных концепций дается краткий обзор развития нейронных сетей и задач человекоцентричного визуального анализа. Далее авторы переходят к разбору задач, касающихся распознавания людей на картинках. В частности, вы узнаете об использовании моделей глубокого обучения для обнаружения пешеходов. В последующих частях все эти темы разбираются на более глубоком уровне.


А вы читали какую-нибудь из этих книг? Поделитесь своими впечатлениями в комментариях!