КаталогКниг.РФ

Глубокое обучение с подкреплением. AlphaGo и другие технологии (Лапань Максим) ; Питер, 2020

Книга: Глубокое обучение с подкреплением. AlphaGo и другие технологии (Лапань Максим) ; Питер, 2020

от 2241 р. до 2659 р.


Сравнить цены

Цена от 2241 р. до 2659 р. в 4 магазинах

МагазинЦенаНаличие
Буквоед

5/5

2659 р.
Минимальная сумма заказа 100 рублей
Book24

5/5

2659 р. 2829 р.
Мегамаркет

5/5

2393 р. 4216 р.
Питер

5/5

2241 р.
Лабиринт

5/5

Читай-город

5/5

МАЙШОП

5/5

Один из первых книжных интернет-магазинов, работающий с 2002 года

Как купить или где мы находимся +

Описание

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.
Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.
В этой книге
- Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.
- Изучите основу RL: марковские процессы принятия решений.
- Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.
- Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.
- Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.
- Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.
- Реализуете метод AlphaGo Zero для игры в Connect4.
- Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Смотри также Характеристики.

Яндекс.Маркет


Содержание

Об авторе
О редакторах
Предисловие к русскоязычному изданию
Предисловие
Глава 1. Что такое обучение с подкреплением
Глава 2. OpenAI Gym
Глава 3. Глубокое обучение с помощью PyTorch
Глава 4. Метод кросс-энтропии
Глава 5. Динамическое программирование и уравнение Беллмана
Глава 6. Глубокие Q-сети
Глава 7. Расширения для DQN
Глава 8. Торговля акциями с использованием обучения с подкреплением
Глава 9. Градиенты по стратегиям
Глава 10. Метод актора-критика
Глава 11. Асинхронный метод актора-критика
Глава 12. Тренировка чат-ботов с помощью обучения с подкреплением
Глава 13. Веб-навигация
Глава 14. Непрерывное пространство действий
Глава 15. Доверительные области - TRPO, PPO и ACKTR
Глава 16. Оптимизация методом черного ящика в RL
Глава 17. Методы, основанные на моделях среды: воображение
Глава 18. AlphaGo Zero
Заключение

Видео обзоры (2)

Искусство интеллекта. Обучение с подкреплением (Reinforcement learning)

Искусство интеллекта. Обучение с подкреплением (Reinforcement learning)запуск видео

 

Машинное обучение и искусственный интеллект

Машинное обучение и искусственный интеллектзапуск видео

 

О книге

СерияДля профессионалов
ИздательПитер
Год издания2020
Страниц496
Переплётмягкий
ISBN978-5-4461-1079-7
Размеры16,40 см × 23,30 см × 2,20 см
Формат70х100/16 (165х233 мм)
Автор(ы)
ТематикаТекстовые редакторы
Тираж700
ПереплетМягкий переплёт
Возрастные ограничения16
Кол-во страниц496
ИздательствоООО "Прогресс книга"
Количество страниц496
Тип обложкимягкая
Возрастное ограничение16+
Количество книг1
Вес640
Язык изданияРусский
Обложкамягкая обложка

Отзывы (4)

  • 3/5

    Замечательная книга, автор провел большую работу по систематизации научных статей и реализации кода.

    0    0

  • 4/5

    очень полезная книга для темы обучения с подкрепление, тут описана как математика для данной области, так и инструменты для ее применения, минусом могу отметить что у оглавления нет ссылок из-за этого навигация по книги сильно усложняется

    0    0

  • 4/5

    Познакомился с кодом к главе 8. Заметное число критических ошибок. Код с листа не проходит, нужны исправления. Подключение некоторых, необходимых для выполнения кода пакетов опущено. Приходится восстанавливать по факту ошибок и с поиском в сети. Запуск кода из командной строки приведен только для одного скрипта. Все остальные аргументы параметры запуска пришлось вычислять анализом кода. Удивило, что критерием остановки цикла принят np.inf и в коде train_model.py и в коде train_model_conv.py. Содержание файла requirements.txt, которое определяет необходимый софт для работы с книгой - некорректно. Приходится достаточно долго подбирать вручную, без шансов для новичков. Предоставленные скрипты в неудовлетворительном состоянии. Текстовая часть книги сжата, но представляет интерес принятой манерой изложения. В английском варианте книги этот пример уже в главе 10 количество недочетов никак не меньше, прежние сохранились.

    0    0

Добавить отзыв



1 ms.

 

Машинное обучение. Анализ данных - издательство "Питер"

Категория 1792 р. - 2689 р.

Программирование - издательство "Питер" »

0 ms.

Машинное обучение. Анализ данных

Категория 1792 р. - 2689 р.

ADS
закладки (0) сравнение (0)

 

preloader

7 ms