Глубокое обучение с подкреплением. AlphaGo и другие технологии

Эта книга – подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.
Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.
- Серия: Для профессионалов
- Жанр:Компьютеры
- Страницы: 496
- Возраст: 16
- Формат: fb2, epub, pdf, txt
Советуем прочитать похожую литературу

Здесь должен быть текст. Профессиональный UX-райтинг
Без текста приложения стали бы бесполезной мешаниной геометрических фигур и значков, а голосовые...

Программирование под iOS. Для профессионалов
Эта книга, выходящая уже в третьем издании и удостоенная премии «Jolt Productivity Award 2012»...

Недокументированные и малоизвестные возможности Windows Vista. Для...
Книга, которую вы сейчас держите в руках, предназначена для пользователей, которые уже успели не...

HTML5. Для профессионалов
Мы стоим на пороге революции в веб-разработке и программировании для мобильных устройств, и в...

Joomla! 3.0: Официальное руководство
Перед вами – официальное руководство по разработке сайтов с помощью Joomla!, подготовленное...

Photoshop CS2
Эта книга посвящена новой версии самой популярной программы для работы с растровой графикой –...
Отзывы (0)
Вам понравилось читать онлайн книгу «Глубокое обучение с подкреплением. AlphaGo и другие технологии»? Уделите пару минут, что бы оставить полезный отзыв другому читателю.