КаталогКниг.РФ

Обучение с подкреплением (Саттон Ричард С., Барто Эндрю Г.) ; ДМК-Пресс, 2020

Книга: Обучение с подкреплением (Саттон Ричард С., Барто Эндрю Г.) ; ДМК-Пресс, 2020

от 2902 р. до 5252 р.


Сравнить цены

Цена от 2902 р. до 5252 р. в 8 магазинах

МагазинЦенаНаличие
Буквоед

5/5

5252 р.
Минимальная сумма заказа 100 рублей
Book24

5/5

5252 р.
Яндекс.Маркет

5/5

3672 р.
Лабиринт

5/5

3554 р. 7108 р.
наличие уточняйте
11.03.2024
Читай-город

5/5

3844 р. 5141 р.
наличие уточняйте
02.12.2023
Мегамаркет

5/5

3332 р. 5552 р.
наличие уточняйте
13.04.2024
МАЙШОП

5/5

3023 р. 5212 р.
наличие уточняйте
11.03.2024
OZON
2902 р.
наличие уточняйте
03.01.2024
AliExpress

5/5

Как купить или где мы находимся +

Описание

Идея обучения с подкреплением возникла десятки лет назад, но этой дисциплине предстояло пройти долгий путь, прежде чем она стала одним из самых активных направлений исследований в области машинного обучения и нейронных сетей. Сегодня это предмет интереса ученых, занимающихся психологией, теорией управления, искусственным интеллектом и многими другими отраслями знаний.
Подход, принятый авторами книги, ставит акцент на практическое использования обучения с подкреплением. В первой части читатель знакомится с базовыми его аспектами. Во второй части представлены приближенные методы решения в условиях ограниченных вычислительных ресурсов. В третьей части книги обсуждается важность обучения с подкреплением для психологии и нейронаук.
Издание предназначено для студентов технических вузов, разработчиков, специализирующихся на машинном обучении и искусственном интеллекте, а также представителей нетехнических профессий, которые могут использовать описанные методики в своей работе.
2-е издание.

Смотри также Характеристики.

Яндекс.Маркет


Содержание

Вступительное слово
Предисловие ко второму изданию
Предисловие к первому изданию
Обозначения
От издательства
Глава 1. Введение
Часть I. ТАБЛИЧНЫЕ МЕТОДЫ РЕШЕНИЯ
Глава 2. Многорукие бандиты
Глава 3. Конечные марковские процессы принятия
решений
Глава 4. Динамическое программирование
Глава 5. Методы Монте-Карло
Глава 6. Обучение на основе временных различий
Глава 7. n-шаговый бутстрэппинг
Глава 8. Планирование и обучение табличными
методами
Часть II. ПРИБЛИЖЕННЫЕ МЕТОДЫ РЕШЕНИЯ
Глава 9. Предсказание с единой стратегией и
аппроксимацией
Глава 10. Управление с единой стратегией и
аппроксимацией
Глава 11. Методы с разделенной стратегией и
аппроксимацией
Глава 12. Следы приемлемости
Глава 13. Методы градиента стратегии
Часть III. ЗАГЛЯНЕМ ПОГЛУБЖЕ
Глава 14. Психология
Глава 15. Нейронауки
Глава 16. Примеры и приложения
Глава 17. Передовые рубежи
Предметный указатель

Видео обзоры (4)

Что такое обучение с подкреплением? Лайтовое интро за 2 минуты

Что такое обучение с подкреплением? Лайтовое интро за 2 минутызапуск видео

 

Искусственный интеллект в трейдинге. Обучение с подкреплением в торговле

Искусственный интеллект в трейдинге. Обучение с подкреплением в торговлезапуск видео

 

Искусство интеллекта. Обучение с подкреплением (Reinforcement learning)

Искусство интеллекта. Обучение с подкреплением (Reinforcement learning)запуск видео

 

Что же делает AlphaGo? Глубокое обучение с подкреплением | Сергей Николенко | Лекториум

Что же делает AlphaGo? Глубокое обучение с подкреплением | Сергей Николенко | Лекториумзапуск видео

 

О книге

Автор(ы)
РазделПрограммирование
ИздательДМК-Пресс
ISBN978-5-9706-0097-9
Год издания2020
Количество страниц552
Формат170x240мм
Вес1.00кг
ПереплетТвердый переплёт
Возрастные ограничения12
Кол-во страниц552
Жанрпсихология
Тип обложкитвердая
Возрастное ограничение0+
ИздательствоДмк Пресс
Количество книг1
Размеры70x100/16
Язык изданияРусский
Обложкатвердый переплёт

Отзывы (0)

    Добавить отзыв



    1 ms.

    Книги с похожим названием

    Искать все [10]

    Книги где авторы: Саттон Ричард С., Барто Эндрю Г.

    Искать всё

     

    Машинное обучение. Анализ данных - издательство "ДМК-Пресс"

    Категория 2321 р. - 3482 р.

    Программирование - издательство "ДМК-Пресс" »

    0 ms.
    ADS
    закладки (0) сравнение (0)

     

    preloader

    7 ms