Обучение с подкреплением на PyTorch. Сборник рецептов. Свыше 60 рецептов проектирования, разработки (Юси (Хэйден) Лю) ; ДМК-Пресс, 2020

от 1519 р. до 6660 р.

Автор(ы): Юси (Хэйден) Лю;
Издатель: ДМК-Пресс
ISBN: 978-5-97060-853-1
все характеристики
ID: SKU87244
Добавлено: 15.08.2021

Рейтинг:

(0/5)

Отзывы (0) Написать отзыв

Цены (6)Описание Содержание О книге Отзывы (0)

Сравнить цены

Цена от 1519 р. до 6660 р. в 6 магазинах

Магазин	Цена	Наличие
Лабиринт 5/5 ООО "ЛАБИРИНТ.РУ" ИНН: 7728644571	1700 р. 2428 р. история цены
Буквоед 5/5 ООО «Новый Книжный Центр» ИНН: 7710422909	1671 р. Минимальная сумма заказа 100 рублей история цены
Book24 5/5 ООО "Новый Книжный Центр" ИНН: 7710422909	1699 р. 2409 р. история цены
Мегамаркет 5/5 ООО "МАРКЕТПЛЕЙС" ИНН: 9701048328	6660 р. история цены
Яндекс.Маркет 5/5 ООО "ЯНДЕКС" ИНН: 7736207543	2459 р. история цены
МАЙШОП 5/5 ООО "МАГАЗИН КНИГ" ИНН: 9725076959	1519 р. 2267 р. история цены
Читай-город 5/5 ООО "Новый Книжный Центр" ИНН: 7710422909

Как купить или где мы находимся +

Описание

Библиотека PyTorch выходит на передовые позиции в качестве средства обучения с подкреплением (ОП) благодаря эффективности и простоте ее использования. Эта книга организована как справочник по работе с PyTorch, охватывающий широкий круг тем – от самых азов (настройка рабочей среды) до практических задач (рассмотрение ОП на конкретных примерах).
Вы научитесь использовать алгоритм «многоруких бандитов» и аппроксимацию функций; узнаете, как победить в играх Atari с помощью глубоких Q-сетей и как эффективно реализовать метод градиента стратегии; увидите, как применить метод ОП к игре в блэкджек, к окружающим средам в сеточном мире, к оптимизации рекламы в интернете и к игре Flappy Bird.
Издание предназначено для специалистов по искусственному интеллекту, которым требуется помощь в решении задач ОП. Для изучения материала необходимо знакомство с концепциями машинного обучения; опыт работы с библиотекой PyTorch необязателен, но желателен.

Смотри также Характеристики.

Яндекс.Маркет

Содержание

Об авторе
О рецензентах
Предисловие
Глава 1. Приступаем к обучению с подкреплением и PyTorch
Глава 2. Марковские процессы принятия решений и динамическое
программирование
Глава 3. Применение методов Монте-Карло для численного оценивания
Глава 4. TD-обучение и Q-обучение
Глава 5. Решение задачи о многоруком бандите
Глава 6. Масштабирование с помощью аппроксимации функций
Глава 7. Глубокие Q-сети в действии
Глава 8. Реализация методов градиента стратегии и оптимизация
стратегии
Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird
Предметный указатель

О книге


Автор(ы)	Юси (Хэйден) Лю
Раздел	Программирование
Издатель	ДМК-Пресс
ISBN	978-5-9706-0853-1
Год издания	2020
Количество страниц	282
Формат	170x240мм
Вес	0.58кг
Переплет	Твердый переплёт
Возрастные ограничения	6
Кол-во страниц	282
Назначение	для технических ВУЗов
Количество книг	1
Вес, в граммах	576
Автор	Юси (Хэйден) Лю
Издательство	ДМК-Пресс
Тип обложки	твердая
Размеры	70x100/16
Язык издания	Русский
Обложка	твердый переплёт