Обучение с подкреплением на PyTorch. Сборник рецептов. Свыше 60 рецептов проектирования, разработки (Юси (Хэйден) Лю) ; ДМК-Пресс, 2020
от 1519 р. до 6660 р.
Автор(ы): Юси (Хэйден) Лю;
Издатель: ДМК-Пресс
ISBN: 978-5-97060-853-1
ID: SKU87244
Добавлено: 15.08.2021
Сравнить цены
Цена от 1519 р. до 6660 р. в 6 магазинах
Магазин | Цена | Наличие |
---|---|---|
Лабиринт 5/5 | 1700 р. 2428 р. | |
Буквоед 5/5 | 1671 р. Минимальная сумма заказа 100 рублей | |
Book24 5/5 | 1699 р. 2409 р. | |
Мегамаркет 5/5 | 6660 р. | |
Яндекс.Маркет 5/5 | 2459 р. | |
МАЙШОП 5/5 | 1519 р. 2267 р. | |
Читай-город 5/5 | ||
Описание
Библиотека PyTorch выходит на передовые позиции в качестве средства обучения с подкреплением (ОП) благодаря эффективности и простоте ее использования. Эта книга организована как справочник по работе с PyTorch, охватывающий широкий круг тем – от самых азов (настройка рабочей среды) до практических задач (рассмотрение ОП на конкретных примерах).
Вы научитесь использовать алгоритм «многоруких бандитов» и аппроксимацию функций; узнаете, как победить в играх Atari с помощью глубоких Q-сетей и как эффективно реализовать метод градиента стратегии; увидите, как применить метод ОП к игре в блэкджек, к окружающим средам в сеточном мире, к оптимизации рекламы в интернете и к игре Flappy Bird.
Издание предназначено для специалистов по искусственному интеллекту, которым требуется помощь в решении задач ОП. Для изучения материала необходимо знакомство с концепциями машинного обучения; опыт работы с библиотекой PyTorch необязателен, но желателен.
Вы научитесь использовать алгоритм «многоруких бандитов» и аппроксимацию функций; узнаете, как победить в играх Atari с помощью глубоких Q-сетей и как эффективно реализовать метод градиента стратегии; увидите, как применить метод ОП к игре в блэкджек, к окружающим средам в сеточном мире, к оптимизации рекламы в интернете и к игре Flappy Bird.
Издание предназначено для специалистов по искусственному интеллекту, которым требуется помощь в решении задач ОП. Для изучения материала необходимо знакомство с концепциями машинного обучения; опыт работы с библиотекой PyTorch необязателен, но желателен.
Смотри также Характеристики.
Яндекс.Маркет
Содержание
Об авторе
О рецензентах
Предисловие
Глава 1. Приступаем к обучению с подкреплением и PyTorch
Глава 2. Марковские процессы принятия решений и динамическое
программирование
Глава 3. Применение методов Монте-Карло для численного оценивания
Глава 4. TD-обучение и Q-обучение
Глава 5. Решение задачи о многоруком бандите
Глава 6. Масштабирование с помощью аппроксимации функций
Глава 7. Глубокие Q-сети в действии
Глава 8. Реализация методов градиента стратегии и оптимизация
стратегии
Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird
Предметный указатель
О рецензентах
Предисловие
Глава 1. Приступаем к обучению с подкреплением и PyTorch
Глава 2. Марковские процессы принятия решений и динамическое
программирование
Глава 3. Применение методов Монте-Карло для численного оценивания
Глава 4. TD-обучение и Q-обучение
Глава 5. Решение задачи о многоруком бандите
Глава 6. Масштабирование с помощью аппроксимации функций
Глава 7. Глубокие Q-сети в действии
Глава 8. Реализация методов градиента стратегии и оптимизация
стратегии
Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird
Предметный указатель
О книге
Автор(ы) | Юси (Хэйден) Лю |
Раздел | Программирование |
Издатель | ДМК-Пресс |
ISBN | 978-5-9706-0853-1 |
Год издания | 2020 |
Количество страниц | 282 |
Формат | 170x240мм |
Вес | 0.58кг |
Переплет | Твердый переплёт |
Возрастные ограничения | 6 |
Кол-во страниц | 282 |
Назначение | для технических ВУЗов |
Количество книг | 1 |
Вес, в граммах | 576 |
Автор | Юси (Хэйден) Лю |
Издательство | ДМК-Пресс |
Тип обложки | твердая |
Размеры | 70x100/16 |
Язык издания | Русский |
Обложка | твердый переплёт |
1 ms.
Машинное обучение. Анализ данных - издательство "ДМК-Пресс"
Категория 1215 р. - 1822 р.
Машинное обучение. Анализ данных - издательство "ДМК-Пресс" »
1 ms.
Машинное обучение. Анализ данных
Категория 1215 р. - 1822 р.