Страница публикации
Поиск глобального минимума функционала на основе технологий обучения с подкреплением
Тип публикации: Материал конференции
Тип материала: Текст
Авторы: Зароднюк Т.С., Горнов А.Ю.
Журнал: Тез. докл. 12-й Междунар. конф. "Интеллектуализация обработки информации" (Москва, Россия - Гаэта, Италия, 8-12 октября 2018 г.)
Язык публикации: russian
Номера страниц: 74-75
Количество страниц: 2
Год публикации: 2018
Отчетный год: 2018
Издательство: ООО "ТОРУС ПРЕСС"
Местоположение издательства: Москва
Адрес издателя: Москва
Название издательства: ООО "ТОРУС ПРЕСС"
Аннотация: Основные вычислительные затраты при решении задач оптимального управления в большинстве случаев приходятся на интегрирование систем дифференциальных уравнений при различных «пробных» управлениях. При решении прикладных задач с жесткими управляемыми системами соотношение затрат на вычисление функционалов может достигать нескольких порядков. В таком случае можно трактовать задачи оптимального управления как задачи вычислительно трудоемкие («expensive function optimization problems»). Популярным подходом к этому классу экстремальных проблем в последние годы становится методика Model Based Algorithms («алгоритмы, основанные на моделях»). В докладе рассматривается эвристический алгоритм поиска экстремума в невыпуклой задаче оптимального управления, основанный на идее накопления информации о значениях функционала и прогнозирования значения на «новом» управлении. Конструкция алгоритма позволяет неявно строить на множестве достижимости системы поверхность уровня оптимизируемого терминального функционала c применением алгоритмов генерации квазислучайных управлений кусочно-линейного или сплайнового типа. В качестве модели, позволяющей аккумулировать уже имеющуюся информацию о функционале, используется функция Шепарда, демонстрирующая хорошие вычислительные характеристики на целом ряде разнородных многомерных задач аппроксимации.
Индексируется WOS: Нет
Индексируется Scopus: Нет
Индексируется УБС: Нет
Индексируется РИНЦ: Да
Индексируется ВАК: Нет
Индексируется CORE: Нет