СРАВНИТЕЛЬНЫЙ АНАЛИЗ АЛГОРИТМОВ ГЛУБОКОГО ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ DDPG, PPO И SAC ДЛЯ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ АВТОМОБИЛЕМ В СИМУЛЯТОРЕ CARLA
В данной статье представлен сравнительный анализ трех передовых алгоритмов глубокого обучения с подкреплением: Deep Deterministic Policy Gradient (DDPG), Proximal Policy Optimization (PPO) и Soft Actor-Critic (SAC), реализованных в библиотеке Stable Baselines 3. Целью исследования является оценка эффективности и применимости каждого из алгоритмов для задачи управления беспилотным автомобилем в сложной и динамичной среде, предоставляемой симулятором CARLA, с акцентом на такие ключевые показатели, как суммарная дистанция, суммарное вознаграждение, средняя скорость, отклонение от центра дорожной полосы и доля успешных эпизодов. Авторы подробно описывают методологию экспериментального тестирования, включая настройку параметров обучения и критерии оценки производительности. Результаты экспериментов демонстрируют различия в производительности алгоритмов, выявляя их сильные и слабые стороны в контексте автономного вождения. Статья вносит вклад в понимание преимуществ и ограничений каждого алгоритма в контексте автономного вождения и предлагает рекомендации по их практическому применению.
Тихонов М.К. Сравнительный анализ алгоритмов глубокого обучения с подкреплением DDPG, PPO и SAC для управления беспилотным автомобилем в симуляторе CARLA // Научный результат. Информационные технологии. – Т.9, №2, 2024. – С. 69-74. DOI: 10.18413/2518-1092-2024-9-2-0-8
Пока никто не оставил комментариев к этой публикации.
Вы можете быть первым.