КаталогКниг.РФ

Обучение с подкреплением на PyTorch. Сборник рецептов. Свыше 60 рецептов проектирования, разработки (Юси (Хэйден) Лю) ; ДМК-Пресс, 2020

Книга: Обучение с подкреплением на PyTorch. Сборник рецептов. Свыше 60 рецептов проектирования, разработки (Юси (Хэйден) Лю) ; ДМК-Пресс, 2020

от 1519 р. до 6660 р.


Сравнить цены

Цена от 1519 р. до 6660 р. в 6 магазинах

МагазинЦенаНаличие
Лабиринт

5/5

1700 р. 2428 р.
Буквоед

5/5

1671 р.
Минимальная сумма заказа 100 рублей
Book24

5/5

1699 р. 2409 р.
Мегамаркет

5/5

6660 р.
Яндекс.Маркет

5/5

2459 р.
МАЙШОП

5/5

1519 р. 2267 р.
Читай-город

5/5

Как купить или где мы находимся +

Описание

Библиотека PyTorch выходит на передовые позиции в качестве средства обучения с подкреплением (ОП) благодаря эффективности и простоте ее использования. Эта книга организована как справочник по работе с PyTorch, охватывающий широкий круг тем – от самых азов (настройка рабочей среды) до практических задач (рассмотрение ОП на конкретных примерах).
Вы научитесь использовать алгоритм «многоруких бандитов» и аппроксимацию функций; узнаете, как победить в играх Atari с помощью глубоких Q-сетей и как эффективно реализовать метод градиента стратегии; увидите, как применить метод ОП к игре в блэкджек, к окружающим средам в сеточном мире, к оптимизации рекламы в интернете и к игре Flappy Bird.
Издание предназначено для специалистов по искусственному интеллекту, которым требуется помощь в решении задач ОП. Для изучения материала необходимо знакомство с концепциями машинного обучения; опыт работы с библиотекой PyTorch необязателен, но желателен.

Смотри также Характеристики.

Яндекс.Маркет


Содержание

Об авторе
О рецензентах
Предисловие
Глава 1. Приступаем к обучению с подкреплением и PyTorch
Глава 2. Марковские процессы принятия решений и динамическое
программирование
Глава 3. Применение методов Монте-Карло для численного оценивания
Глава 4. TD-обучение и Q-обучение
Глава 5. Решение задачи о многоруком бандите
Глава 6. Масштабирование с помощью аппроксимации функций
Глава 7. Глубокие Q-сети в действии
Глава 8. Реализация методов градиента стратегии и оптимизация
стратегии
Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird
Предметный указатель

О книге

Автор(ы)
РазделПрограммирование
ИздательДМК-Пресс
ISBN978-5-9706-0853-1
Год издания2020
Количество страниц282
Формат170x240мм
Вес0.58кг
ПереплетТвердый переплёт
Возрастные ограничения6
Кол-во страниц282
Назначениедля технических ВУЗов
Количество книг1
Вес, в граммах576
АвторЮси (Хэйден) Лю
ИздательствоДМК-Пресс
Тип обложкитвердая
Размеры70x100/16
Язык изданияРусский
Обложкатвердый переплёт

Отзывы (0)

    Добавить отзыв



    1 ms.

     

    Машинное обучение. Анализ данных - издательство "ДМК-Пресс"

    Категория 1215 р. - 1822 р.

    Машинное обучение. Анализ данных - издательство "ДМК-Пресс" »

    1 ms.

    Машинное обучение. Анализ данных

    Категория 1215 р. - 1822 р.

    ADS
    закладки (0) сравнение (0)

     

    preloader

    7 ms