Вісник НАН України. 2018. № 8. С.65-75
https://doi.org/10.15407/visn2018.08.066

ГРУШКОВСЬКА Вікторія Василівна —
кандидат фізико-математичних наук, старший науковий співробітник відділу прикладної механіки Інституту прикладної математики і механіки НАН України
https://orcid.org/0000-0003-0439-6834

БЕЗГРАДІЄНТНІ АЛГОРИТМИ КЕРУВАННЯ ДЛЯ ЗАДАЧ ДИНАМІЧНОЇ ОПТИМІЗАЦІЇ
За матеріалами наукового повідомлення на засіданні Президії НАН України 30 травня 2018 року

Доповідь присвячено дослідженню задач динамічної оптимізації з функцією якості, аналітичний вираз якої може бути повністю або частково невідомим. Через це обмеження класичні методи керування, які потребують обчислення градієнта функції якості, виявляються неефективними. У роботі представлено новий безградієнтний метод синтезу функцій керування для задач динамічної оптимізації, який об’єднує та узагальнює деякі наявні результати і дає змогу будувати нові керування з потрібними властивостями. На відміну від більшості безградієнтних алгоритмів керування, які забезпечують лише властивість практичної асимптотичної стійкості, отримано умови асимптотичної (і навіть експоненціальної) стійкості за Ляпуновим. Одержані результати проілюстровано за допомогою чисельного інтегрування та експериментів з мобільним роботом.
Ключові слова: оптимізація, пошук екстремуму, асимптотична стійкість, безградієнтні алгоритми керування, апроксимація з дужками Лі.

Задачі динамічної оптимізації виникають у різних галузях сучасної науки і техніки. Наприклад, в енергетиці важливо стабілізувати таку конфігурацію сонячної батареї або вітрогенератора, яка забезпечувала б максимальну віддачу енергії. У хімічній промисловості потрібно отримувати максимальний вихід продукту. Широке коло застосувань виникає також у робототехніці, зокрема у задачах відстеження роботом сталої або рухомої цілі з невідомою траєкторією, задачах консенсусу в багатоагентних системах тощо [1]. Усі ці задачі об’єднує необхідність стабілізувати деяку оптимальну конфігурацію системи, в якій певна функція якості досягає екстремального (мінімального чи максимального) значення. Відповідна функція якості може описувати, скажімо, відстань до статичного або рухомого об’єкта, інтенсивність сонячного випромінювання, концентрацію хімічних чи біологічних агентів. Одна з основних проблем полягає в тому, що оптимальна конфігурація часто є невідомою апріорі і навіть може змінюватися з часом, тож важливим завданням є розроблення таких керуючих алгоритмів, які знаходили б і стабілізували цю невідому конфігурацію. Таку задачу називають задачею динамічної оптимізації; у світовій літературі поширеним також є термін «задача пошуку екстремуму» (extremum seeking problem) [2].

Задачі пошуку екстремуму є популярним науковим напрямом як в Україні, так і закордоном. Перші роботи з цієї тематики з’явилися ще у 20-х роках ХХ ст., проте значне зростання теоретичного інтересу до них та їх практичних застосувань відбулося відносно недавно [3].

Класичні підходи до розв’язання задач динамічної оптимізації ґрунтуються на побудові керуючих алгоритмів, які використовують значення градієнта функції якості. Однак такі підходи не можна безпосередньо застосовувати у випадках частково або повністю невідомого аналітичного виразу функції якості та невідомої точки екстремуму. Зважаючи на це, важливим напрямом досліджень є розроблення так званих безградієнтних керуючих алгоритмів, які знаходять і стабілізують апріорі невідомий оптимальний стан системи, використовуючи при цьому лише значення функції якості (але не її похідні). Вочевидь, вибір керуючого алгоритму відіграє важливу роль через вплив на швидкість спадання та можливі обмеження на керування, а отже, дослідження різних типів керування є актуальною науковою проблемою.

У статті представлено новий клас безградієнтних керуючих алгоритмів, що стабілізують систему в околі точки екстремуму функції якості, аналітичний вираз якої може бути частково або повністю невідомим. Слід підкреслити, що отриманий клас узагальнює деякі відомі керування для задач пошуку екстремуму і, більше того, дозволяє будувати нові керування з важливими властивостями. Зокрема, на відміну від більшості наявних результатів з пошуку екстремуму, що забезпечують лише властивість практичної стійкості, доведено нові умови асимптотичної стійкості відповідних траєкторій за Ляпуновим. У статті розглянуто також кілька прикладів і наведено результати експериментів з мобільним роботом, які дають змогу наочно продемонструвати властивості різних керуючих алгоритмів.

Представлені в статті результати дослідження проблеми пошуку екстремуму є природним продовженням тематики школи з аналітичної механіки та теорії керування в Інституті прикладної математики і механіки НАН України. Саме поєднання постановки задачі, що виникає в інженерних застосуваннях, і фундаментальних результатів у теорії стійкості і керування рухом, отриманих представниками цієї школи, дозволило створити новий ефективний підхід до розв’язання широкого кола задач динамічної оптимізації. Частину наведених у статті результатів одержано в рамках спільних досліджень з професором О.Л. Зуєвим та колегами з Інституту теорії систем та автоматичного керування (Університет Штутгарта, Німеччина) [4–6].

Метод апроксимації з дужками Лі. Для розв’язання задач динамічної оптимізації створено чимало підходів. Один з ефективних підходів ґрунтується на алгоритмах керування з періодичними за часом осцилюючими функціями (збуджуючими сигналами) для динамічних систем з векторними полями, що залежать від значень функції якості. За певних умов такі керування дозволяють апроксимувати напрямок антиградієнта (або інший напрямок спадання) функції якості; при цьому в самому алгоритмі не використовуються похідні від функції якості. Зокрема, такий підхід становить основу методу апроксимацій з дужками Лі [7].

Повний текст