Оптимальність у системах керування
Розглянемо випадок, коли при фіксованому правий кінець вільний. Ця задача полягає в тому, щоб із заданого стану за заданий час пройти по траєкторії з довільним кінцевим станом за умови мінімізації цільового функціонала. Умови трансверсальності для цієї задачі набувають вигляду: Зрозуміло, що будь-яке оптимальне керування є екстремальним. Тому, щоб знайти оптимальне керування, що переводить фазову… Читати ще >
Оптимальність у системах керування (реферат, курсова, диплом, контрольна)
оптимальність у системах керування
1. Умови оптимальності у неавтономних системах керування
У загальному випадку неавтономної системи права частина закону руху й підінтегральна функція цільового функціонала залежать явно від часу, тобто закон руху має вигляд:
(1)
а цільовий функціонал дорівнює
. (2)
Тут функції і - неперервні по сукупності змінних і неперервно диференційовані по змінних, , .
Також вважатимемо, що момент часу, який відповідає початковому стану, відомий, а момент часу проходження через кінцеву точку не заданий і повинен бути знайдений, тобто сформульована задача — це задача з вільним часом.
Поставлена задача може бути зведена до автономної задачі введенням додаткової змінної. До закону руху при цьому додається рівняння
а до початкових умов — співвідношення .
Тепер систему (2) можна переписати у вигляді:
(3)
а функціонал дорівнюватиме
(4)
де (відповідно до доданого у початкову систему рівняння).
Отже, неавтономнувимірну задачу було зведено до автономної задачі з розширеним фазовим простором. У новій задачі потрібно знайти оптимальну траєкторію, що поєднує точку розширеного фазового простору з деякою точкою на прямій, яка проходить через точку паралельно осі. Оскільки кінцеве значення змінної невідоме, то нова задача — це задача з фіксованим лівим і рухомим правим кінцями.
Якщо в задачі оптимального керування (3) — (4) відомі і початковий момент часу й кінцевий момент часу, то задача називається задачею з фіксованим часом. Перетворення цієї задачі введенням додаткового змінного приводить до задачі з фіксованими кінцями в такому формулюванні. Потрібно знайти керування, що переводить фазову точку системи (2) зі стану в момент часу у стан в момент часу, причому функціонал (4) набуває найменшого значення. Зауважимо, що момент часу попадання в точку можна не вважати фіксованим, оскільки в силу тотожності попадання в точку може відбутися тільки в цей момент часу. Таким чином, до даної задачі можна застосувати теорему, відповідно до якої для одержання необхідних умов екстремуму функціонала необхідно максимізувати функцію Понтрягіна
(5)
де — загальний вигляд функції Понтрягіна з теореми 1, у якій не врахована додаткова, ()-ша змінна. Спряжена система для цієї задачі за умов набуває вигляду:
(6)
Має місце така теорема.
Припустимо, , — оптимальний процес для задачі з фіксованим часом. Тоді існує ненульова вектор-функція, що відповідає цьому процесу, така що:
1. Для будь-якого функція змінної набуває максимального значення в точці, тобто:
: .
2., .
Оскільки, як і раніше,, то умову 2 цієї теореми достатньо перевірити в якій-небудь одній точці відрізка .
Розглянемо випадок, коли при фіксованому правий кінець вільний. Ця задача полягає в тому, щоб із заданого стану за заданий час пройти по траєкторії з довільним кінцевим станом за умови мінімізації цільового функціонала. Умови трансверсальності для цієї задачі набувають вигляду:
. (7)
Для цього випадку необхідна умова оптимальності полягає в тому, щоб функція досягала максимального значення для кожного на оптимальному керуванні і мала місце умова (7).
2 Поняття особливого керування
На практиці часто зустрічаються задачі оптимального керування, у яких функція Понтрягіна лінійно залежить від всіх керувань або від частини з них (наприклад, в лінійних задачах оптимальної швидкодії). Однак у нелінійних задачах оптимального керування (якщо функція Понтрягіна є нелінійною по одній або декількох фазових змінних) можлива ситуація, коли на оптимальній траєкторії коефіцієнт при одній з компонент вектора керування обертається на нуль всюди на деякому інтервалі часу, і тоді умова максимуму функції за не дозволяє однозначно визначити оптимальне керування. Ця ситуація називається особливим режимом керування. Дослідимо її детальніше.
Розглянемо автономну задачу оптимального керування
Де; ,, , ,
— довільна множина з ;
— лінійний простір кусково-неперервних на функцій.
Крайові умови задачі мають вигляд:
.
Потрібно знайти таке припустиме керування, що переводить систему зі стану у стан, причому відповідний припустимий процес доставляє мінімальне значення функціоналу
де функції, неперервні по сукупності всіх змінних і неперервно-диференційовані по змінних .
Вважатимемо, що функція Понтрягіна для цієї задачі є лінійною за частиною компонент вектора. Виділимо із цих компонент групу з керувань (з тих, за якими функція лінійна) і позначимо їх через, а інші керувань зберемо у вектор (він також може включати компоненти, за якими функція лінійна). За таких умов закон руху набуває вигляду:
де .
Складемо функцію Понтрягіна для даної задачі:
.
Очевидно, що
. (8)
Припустимо, що процес разом з розв’язком спряженої системи
, (9)
задовольняє принципу максимуму і, крім того, припустимо, що у всіх точках деякого інтервалу має місце рівність
(10)
або, враховуючи (10),
,. (11)
Ця ситуація означає, що коефіцієнти при на деякому часовому відрізку дорівнюють 0, і оптимальне керування визначити неможливо. У цьому випадку вектор керувань називається особливим керуванням на відрізку, процес — особливим режимом, траєкторія — траєкторією особливого режиму, а відрізок часу — ділянкою особливого керування.
З формули (11) випливає, що на ділянці особливого режиму функція Понтрягіна не залежить від. Дійсно, :
.
Тому в даній ситуації умова максимуму по не дає жодної інформації про конкретні значення керувань .
Оскільки на ділянці особливого режиму має місце співвідношення (11), то очевидно, що
і т.д. Останні співвідношення разом з умовою (10) дозволяють визначити всі особливі режими.
3. Лінійна задача оптимальної швидкодії
Розглянемо лінійну задачу оптимальної швидкодії:
, (12)
де, ,
— числові матриці розмірності та відповідно.
Область керування задачі - замкнутий обмежений багатогранник в :
, (13)
Якщо для будь-якого вектора, паралельного будь-якому ребру багатогранника, система векторів, , …, (14) є лінійно незалежною, то багатогранник задовольняє умові спільності положення відносно системи (14).
Для перевірки лінійної незалежності векторів (13) достатньо перевірити, чи матриця, стовпцями якої є стовпці (12), є невиродженою, тобто
.
Перепишемо формулу (10):
,
де , — -і рядки матриць і .
Функція Понтрягіна лінійної задачі оптимальної швидкодії має вигляд:
(15)
Оскільки перший доданок у формулі (15) не залежить від, то функція досягає максимуму за змінною одночасно з функцією
.
Спряжена система у цьому випадку може бути записана у вигляді:
,
або у векторній формі
. (16)
Позначимо через. З теореми 2 випливає, що якщо — оптимальне керування, то існує такий ненульовий розв’язок системи (16), для якого в кожний момент часу функція набуватиме максимального значення за змінною :
. (17)
Оскільки система (17) з постійними коефіцієнтами не містить невідомих функцій і, то всі її розв’язки можна легко знайти, після чого, використовуючи їх для розв’язання задачі максимізації функції на множині, знаходимо оптимальні керування .
Для будь-якого нетривіального розв’язання системи (11) співвідношення (14) однозначно визначає керування, причому це керування кусково стале, а значеннями керування в точках неперервності є вершини багатогранника .
Точки розриву оптимальної функції керування відповідають зміні значення керування і називаються точками перемикання. Якщо — точка перемикання, то ліворуч від неї керування має одне значення, наприклад,, а праворуч інше — .
Позначимо через підмножину у виду
. (18)
Якщо всі корені характеристичного рівняння матриці з (14) є дійсними, то для будь-якого розв’язання рівняння (18) кожна з функцій є кусково сталою і має не більше ніж перемикань (- порядок системи (16)).
Керування називається екстремальним керуванням, якщо воно задовольняє принципу максимуму.
Для лінійної задачі оптимальної швидкодії з областю керування — багатогранником керування є екстремальним, якщо існує таке нетривіальне розв’язання системи (17), для якого матиме місце співвідношення (18).
Зрозуміло, що будь-яке оптимальне керування є екстремальним. Тому, щоб знайти оптимальне керування, що переводить фазову точку зі стану у стан, треба відшукати всі екстремальні керування з цими крайовими умовами, а потім серед них вибрати те, що здійснює перехід за найменший час.
У загальному випадку можуть існувати кілька оптимальних керувань, що переводять фазову точку зі стану у стан, але якщо початок координат у просторі керувань є внутрішньою точкою багатогранника, то екстремальне керування єдине. Отже, у лінійних задачах оптимальної швидкодії принцип максимуму дозволяє не тільки визначити вид оптимальних керувань, але й одержати умови єдиності оптимального керування.
Припустимо, що початок координат є внутрішньою точкою багатогранника припустимих керувань. Якщо і - два екстремальних керування, що переводять фазову точку зі стану у стан за час і відповідно, то і, .
У теоремі має місце умова .
Теорема. Якщо існує хоча б одне керування, що переводить систему (17) зі стану у стан, то існує й оптимальне по швидкодії керування, що також переводить систему з у .
4. Умови оптимальності у задачі з рухомими кінцями
У задачі з рухомими кінцями або початковий стан, або кінцевий стан, або обидва ці стани невідомі. Задані тільки множини і, що містять точки та .
Гіперповерхня — це множина всіх точок, які задовольняють співвідношенню
де — скалярна диференційована функція. Якщо — лінійна функція, то гіперповерхня називається гіперплощиною і описується рівнянням
. (19)
Якщо, то гіперплощина (19) є ()-вимірним лінійним підпростором в .
Будь-який ()-вимірний підпростір може бути заданий як множина розв’язань лінійної однорідної системи з рівнянь із невідомими, матриця якої має ранг :
.
Такий лінійний підпростір називаєтьсявимірною площиною. Множина розв’язань системи нелінійних рівнянь де функції, …, диференційовані і ранг матриці Якобі цієї системи функцій дорівнює, євимірним гладким різноманіттям.
Задача оптимального керування з рухомими кінцями полягає в тому, щоб знайти таке припустиме керування для системи із законом руху
, ,
яке переводить фазову точку з деякого, заздалегідь невідомого, стану навимірному різноманітті () у деякий стан навимірному різноманітті () і надає найменшого значення функціоналу
.
Задача оптимального керування з фіксованими кінцями є окремим випадком цієї задачі при, тобто коли різноманіття і вироджуються в точку.
Відсутність рівнянь, що задають початковий і кінцевий стани, приводить до того, що система необхідних умов перестає бути повною. У цьому разі для одержання відсутніх рівнянь використовують умови, що називаються умовами трансверсальності.
Умови трансверсальності. Вектор спряжених змінних із принципу максимуму задовольняє умові трансверсальності на лівому кінці траєкторії, якщо вектор ортогональний дотичній площини до різноманіття в точці, тобто
(20)
де — довільний вектор, що лежить у дотичній площини. Аналогічно формулюється умова на правому кінці.
Якщо , — оптимальний процес у задачі з рухомими кінцями, , то ненульова вектор-функція, що існує відповідно до теореми 3, задовольняє на кожному з кінців траєкторії умовам трансверсальності.
Розглянемо окремий випадок задачі з рухомими кінцями, коли, наприклад, правий кінець траєкторії вільний (тобто). Тоді умови трансверсальності зводяться до співвідношення. Повний вектор спряжених змінних визначається з точністю до довільної сталої, зокрема, вважають, що (відповідно до принципу максимуму ,) і тоді
.