Авторы |
Дарьина Анна Николаевна, кандидат физико-математических наук, доцент, ведущий научный сотрудник, Федеральный исследовательский центр «Информатика и управление» Российской академии наук (Вычислительный центр им. А. А. Дородницына РАН) (119333, Россия, г. Москва, ул. Вавилова, 40), Е-mail: daryina@ccas.ru
Прокопьев Игорь Витальевич, доктор технических наук, старший научный сотрудник, отдел управления робототехническими устройствами, Федеральный исследовательский центр «Информатика и управление» Российской академии наук, (Вычислительный центр им. А. А. Дородницына РАН) (119333, Россия, г. Москва, ул. Вавилова, 40), E-mail: fvi-2003@mail.ru
|
Аннотация |
При работе с беспилотным транспортным средством обычно ставится задача нахождения такого управления, которое осуществляет его переход из начального состояния в заданное конечное. Разрабатываемые законы управления должны обеспечивать требуемые показатели качества (точность, быстродействие и т.п.) по всем управляемым координатам с учетом заданных ограничений на управление и состояние беспилотного транспортного средства. С практической точки зрения очень важно, чтобы эти законы управления были оптимальными по отношению к заданному функционалу качества. Однако в ряде случаев этого недостаточно и требуется синтезировать законы управления, обеспечивающие достижение цели управления в широком классе неопределенности модели динамики беспилотного транспортного средства. При этом система управления должна обеспечить управление с учетом динамических ограничений в реальном времени, параметры которых заранее не известны. Решение таких задач классическими методами осложняется тем, что требуется большое количество вычислений, и они не могут быть реализованы на борту робота в процессе его эксплуатации. В данной статье рассматривается решение задачи квазиоптимального управления в реальном времени, для этого объединяются традиционный подход к синтезу законов управления и приближение нейронных сетей к этим законам с учетом информации, которую традиционный подход не учитывает. В результате метод состоит в последовательном выполнении трех этапов: генерации траекторий, синтезе функции выбора и обучении нейронной сети. Функция выбора определяется эволюционными методами символьной регрессии и учитывает динамические ограничения в реальном времени. Для этого используется нейросетевое представление алгоритмов программного, адаптивного и интеллектуального управления, т.е. объединенная сеть, в которой нейронная сеть прямого распространения подражает, например, пропорциональному интегральному дифференциальному регулятору, а сверточная применяется для определения характеристик дороги и принятия правильных решений по управлению. Приводится пример применения метода на реальном роботе.
|
Список литературы |
1. Howard, T. M. State space sampling of feasible motions for high performance mobile robot navigation in complex environments / T. M. Howard, C. Green, D. Ferguson, A. Kelly // Journal of Field Robotics. – 2008. – Vol. 25, № 6-7. – P. 325–345.
2. Howard, T. M. Trajectory and spline generation for all-wheel steering mobile robots / T. M. Howard, A. Kelly // Proceedings of the IEEE/RSJ International Conference on Intelligent Robotics and Systems. – Beijing, China, 2006. – October.
3. Howard, T. M. Optimal rough terrain trajectory generation for wheeled mobile robots / T. M. Howard, A. Kelly // International Journal of Robotics Research. – 2007. – Vol. 26, № 2. – P. 141–166.
4. Howard, T. M. Receding horizon model-predictive control for mobile robot navigation of intricate paths / T. M. Howard, C. Green, A. Kelly // Proceedings of the 7th International Conference on Field and Service Robotics. – Chennai, India, 2009. – July.
5. Kelly, A. Reactive nonholonomic trajectory generation via parametric optimal control / A. Kelly, B. Nagy // International Journal of Robotics Research. – 2003. – Vol. 22 (7-8). – P. 583–601.
6. Motion planning in complex environments using closed-loop prediction / Y. Kuwata, J. Teo, S. Karaman, G. Fiore, E. Frazzoli, J. P. How // AIAA Guidance, Navigation and Control Conference and Exhibit. – Honolulu, HI, AIAA–2008–7166, 2008. – August.
7. Diveev, A. I. Application of network operator method for synthesis of optimal structure and parameters of automatic control system / A. I. Diveev, E. A. Sofronova // Proceedings of 17-th IFAC World Congress (05.07.2008 – 12.07.2008). – Seoul, 2008. – P. 6106–6113.
8. Diveev, A. I. Numerical method of network operator for multi-objective synthesis of optimal control system / A. I. Diveev, E. A. Sofronova // Proceedings of Seventh International Conference on Control and Automation (ICCA’09). – Christchurch, New Zealand, 2009. – P. 701–708.
9. Diveev, A. I. A Numerical Method for Network Operator for Synthesis of a Control System with Uncertain Initial Values / A. I. Diveev // Journal of Computer and Systems Sciences International. – 2012. – Vol. 51, № 2. – P. 228–243.
10. Понтрягин, Л. С. Принцип максимума в оптимальном управлении / Л. С. Понтрягин. – Москва : Наука, 1989.
11. Beckov, A. V. Problem of Cost Function Synthesis for Mobile Robot’s Trajectory and the Network Operator Method for its Solution / A. V. Beckov, I. V. Prokopiev // 13th International Symposium Intelligent Systems. – St. Petersburg, Russia, 2018. – P. 695–701.
12. Дивеев, А. И. Библиотека Рython для синтеза интеллектуальных систем управления / А. И. Дивеев, А. В. Доценко // Вестник РУДН. Сер.: Инженерные исследования. – 2018. – Vol. 19, № 2. – С. 177–189.
|