Reinforcement Learning от Otus
Программа курса
Ознакомьтесь с программой курса «Reinforcement Learning» от Otus
Введение в Reinforcement Learning
- Знакомство с Reinforcement Learning
- Ключевые понятия RL: агент, среда, награда, политика. Построение среды
- Основные алгоритмы RL: Value based
- Основные алгоритмы RL: Policy based
Deep Reinforcement Learning
- Введение в Deep Reinforcement Learning
- Deep Q-Network (DQN) алгоритм
- Deep Policy Gradient (PG) алгоритм
- Actor-Critic алгоритм
- TRPO -> PPO
- DDPG -> TD3 -> LSTM-TD3
Advanced Reinforcement Learning
- Обучение с использованием модели среды (model-based rl)
- Model-based, часть 2
- Иерархическое обучение с подкреплением
- Выбор темы и организация проектной работы
- Многоагентное обучение и кооперация агентов
- Трансформеры в RL: decision transformers и action transformers
Применение RL в реальных задачах
- Применение RL в игровой индустрии
- Применение RL в робототехнике
- RL в рекомендательных системах
- RL в задаче скоринга
- Применение RL в управлении финансовым портфелем
Проектная работа
- Консультация по проектам и домашним заданиям
- Предзащита
- Защита проектных работ. Подведение итогов курса
- Трудоустройство
- Помощь с трудоустройством
- Город
- Онлайн
- Формат обучения
- Онлайн
- Практика
- Задания с проверкой
- Сертификат
- Есть
- Инструменты на курсе
-
Actor-CriticDeep Q-NetworkJupyter NotebookPolicy GradientPython
Преподаватели-эксперты. Педагоги делятся актуальными знаниями и реальными кейсами, востребованными в современной IT-индустрии.
Уровень подготовки неважен. В онлайн-школе предусмотрены программы 3-х уровней сложности для начинающих и профи.
Удобный интерфейс. Сайт школы построен таким образом, что любой сможет с лёгкостью в нём разобраться.
Обратная связь. Кураторы и педагоги 24/7 помогают справляться студентам с возникающими сложностями.
Высокая стоимость курсов. Хорошее и качественное образование не может стоить дёшево.
Навязанные рекламные рассылки. Спам от онлайн-школы иногда вызывает лёгкое неудобство.
Взгляните, что студенты и выпускники говорят про Otus
Для меня принять решение об обучении на курсе по языку Java было довольно просто, достаточно было посмотреть на преподавателя и структуру курса, также огромным плюсом было увидеть в партнерах Otus.ru компанию, в которой я хотел работать. Очень важно, что перед началом курса прово...
После прохождения курса я приобрел, во-первых, понимание того как python устроен и работает вплоть до погружения на уровень кода интерпретатора, что собственно, помогает уяснить с какими нюансами можно будет столкнуться при использовании языка в целом (что полезно для проектирова...