Принцип максимальне значення. Регулярування лінійної регресії

У цьому параграфі ми доведемо властивість розв'язків одномірного рівняння теплопровідності, що називається принципом максимального значення. Воно може бути сформульоване як теорема.

Т е о р е м а. Якщо функція u(x,t), певна та безперервна в замкнутій області і , задовольняє у цій галузі рівняння теплопровідності

то максимальне та мінімальне значення функції u(x,t)досягаються або в початковий момент часу або в граничних точках x = 0 чи x = l.

Функція , очевидно, задовольняє рівняння (40) і досягає максимального (мінімального) значення в будь-якій точці. Однак це не суперечить теоремі, так як з її умови випливає, що якщо максимальне (мінімальне) значення досягається всередині області, то воно також має досягатися або за t= 0, або при x = 0 або при x=l.

Фізичний зміст цієї теореми очевидний і полягає в наступному. Якщо температура на кордоні або початковий момент не перевищує певного значення M, то за відсутності джерел тепла всередині тіла не може утворитися температура, більша ніж М.

Зупинимося на доказ теореми для максимального значення. Воно ведеться від неприємного. Отже, нехай М– максимальне значення функції u(x,t) при t = 0 (0 ≤ xl) або при x = 0 або при x = l(0 ≤ tT). Допустимо тепер, що в деякій точці області ( x 0 ,t 0), такий, що 0< x 0 < lі0< t 0 ≤ T, функція u(x,t) досягає свого максимального значення, що перевершує Мна величину?, тобто.

Тоді в точці ( x 0 ,t 0) повинні виконуватись співвідношення

причому при всіх значеннях виконуватиметься знак рівності.

де k –постійний коефіцієнт. Очевидно, що

Виберемо так, щоб kTбуло менше ε/2, тобто. тоді максимальне значення v(x,t) при t = 0 (0 ≤ xl) або при x = 0 або при x = lнічого очікувати перевищувати , тобто.

(при t = 0 або x = 0 або x = l), (44)

оскільки для цих аргументів перший доданок у формулі (43) не перевищує М, а друге.

Через безперервність функції v(x,t), вона повинна в деякій точці ( x 1 ,t 1) досягати свого максимального значення, причому

Момент часу t 1 строго більше за нуль і , так як при або , або має місце нерівність (44). У точці ( x 1 ,t 1), за аналогією з (41) і (42), має бути

Маючи на увазі визначення функції v(x,t) (43), отримаємо

Звідси слідує що

тобто. рівняння (40) у внутрішній точці ( x 1 ,t 1) не задовольняється. Тим самим доведено, що рішення u(x,t) рівняння теплопровідності (40) всередині області не може набувати значень, що перевершують найбільше значення u(x,t) на кордоні.



Аналогічно може бути доведена друга частина теореми для мінімального значення.

Наведемо та доведемо слідства з принципу максимального значення:

Наслідок 1.Якщо два рішення рівняння (40) та задовольняють умовам:

,

Доведення.З огляду на лінійності (40) функція є його рішенням, отже, задовольняє принципу максимального значення. При цьому:

Отже:

в іншому випадку мала негативне мінімальне значення. Наслідок 1 доведено.

Наслідок 2.Якщо три рішення рівняння (40) і задовольняють умові:

при , і , то це ж нерівність виконуються і для всіх .

Доведення.Проводиться просто застосуванням слідства 1 до пар функцій і , і .

Розглянемо рішення рівняння (1), відповідне початковому і граничним умовам виду:

Нехай є рішення рівняння (40), що відповідає обуреним початковим і граничним умовам, що задаються функціями , і такими, що:

Використовуємо слідство 3, можемо зробити висновок, що: , Що й передбачає скільки завгодну близькість рішень вихідної та обуреної задач.


Специфіка завдань на максимальну швидкодію починає позначатися під час запису критерію якості. Для цих завдань критерієм якості є наступний функціонал (5.1)

Таким чином, потрібно знайти таке управління, при якому переведення об'єкта управління з початкового стану в кінцевий час виконується за мінімально можливий час.

Послідовність вирішення розглянутих завдань не відрізняється від процедури вирішення інших завдань, які вирішуються на основі принципу максимуму:

Складання Гамільтоніана;

визначення залежності оптимального керуючого впливу від сполучених змінних на основі максимізації Гамільтоніана;

Складання пов'язаної системи диференціальних рівнянь;

Складання загальної системи диференціальних рівнянь, серед розв'язків якої і знаходиться керуюча дія, що шукається.

При розгляді об'єктів управління, що описуються лінійними рівняннями, завдання максимальної швидкодії мають певну особливість. Справа в тому, що відповідна цим завданням функція Гамільтона містить управління в ступеня не вище за першу і, отже, визначення максимального значення гамільтоніана не може бути виконано шляхом прирівнювання нулю його першої похідної з управління. Пошук максимального значення гамільтоніана в цьому випадку здійснюється шляхом аналізу можливих комбінацій між управлінням та змінними сполученою системою рівнянь. При цьому виявляється, що оптимальне керування має бути максимально по модулю всередині інтервалу керування і в деяких його точках миттєво змінювати знак у відповідності зі знаком певної функції від змінних. У разі такого слабкого впливу сполученої системи рівнянь на керуючий вплив виникає можливість взагалі відмовитися від розв'язання сполученої системи рівнянь і розглядати моменти зміни знака управління (моменти перемикання) як самостійні змінні.

Докладніше розглянемо розв'язання задачі максимальної швидкодії на прикладі.

Об'єкт управління:

Критерій якості:

Гамільтоніан:

Аналізуючи можливі комбінації значень і можна дійти невтішного висновку у тому, що забезпечення максимальної величини Гамільтоніана залежно від управління необхідно виконання наступного співвідношення:

Сполучена система рівнянь:

Загальна система рівнянь:

Оскільки в системі рівнянь (5.1) рівняння для сполучених змінних не залежать від станів об'єкта управління, то вирази можна знайти тільки з системи сполучених рівнянь не звертаючи уваги на рівняння для станів об'єкта управління.

В даному випадку:

Аналізуючи отримані висловлювання можна дійти невтішного висновку у тому, що шуканий управляючий вплив має вигляд прямокутної хвилі, яка змінює знак трохи більше одного разу. Очевидно, що момент зміни знака управління (момент перемикання) повинен вибиратися з умови забезпечення заданих граничних умов станів об'єкта управління. визначення моментів перемикання може бути використано кілька способів.

Перший спосіб визначення моментів перемикання– аналітичний. При використанні цього способу необхідно отримати аналітичний вираз для реакції об'єкта управління на вплив, що управляє, має вигляд прямокутної хвилі. Використовуємо для цього перетворення Лапласа. Момент перемикання позначимо через .

Перетворена за Лапласом система рівнянь об'єкта управління, що враховує вплив прямокутної хвилі має вигляд:

З цієї системи рівнянь можна отримати такі вирази для L-зображень станів об'єкта управління:

або, після виконання зворотного перетворення Лапласа, власне аналітичні вирази для перехідних процесів у часі:

Останні вирази дозволяють визначити як значення моменту перемикання , і моменту часу переведення об'єкта управління у необхідний стан .

Другий спосіб визначення моментів перемикання- Пошук мінімуму.

Для можливості застосування для розв'язання задач оптимального управління алгоритмів пошуку мінімуму задачу максимальної швидкодії сформулюємо наступним чином:

Припустимо, що керуючий вплив є кусковопостійною функцією часу, яка змінює знак в момент часу, а переведення об'єкта управління в кінцевий стан відбувається в момент часу. Потрібно визначити такі значення параметрів і за яких досягається мінімальне значення нев'язки між фактичними та необхідними значеннями станів об'єкта управління в момент. Значення нев'язки обчислюється як сума квадратів різниць між фактичними та заданими значеннями станів об'єкта управління на момент часу.

Обчислення параметрів оптимального управління методом пошуку мінімуму може бути виконано за допомогою наступної програми MATLAB:

Файл Main5.m

%вектор початкових наближень для моменту перемикання та

%моменту завершення інтервалу управління

T=fminsearch("fms5",ti0)

function f=fms5(T)

%чисельне рішення дифф. ур-ний об'єкта управління при дії

%на нього прямокутної хвилі управління

Ode45("odefun5",,);

% обчислення нев'язки

f=x(length(t),1)^2+x(length(t),2)^2;

%генерація масиву значень управління для побудови графіка

for i=1:length(t)

plot(t,x(:,1),t,u)

Файл odefun5.m

function f = odefun5 (t, x)

Третій спосіб визначення моментів перемикання– графічна побудова лінії перемикання.

Цей метод відрізняється великою наочністю, але застосовний до об'єктів управління другого порядку, т.к. поведінка таких об'єктів повністю описується фазовим портретом. З використанням цього способу завдання оптимального управління вирішується шляхом побудови лінії перемикання, геометричного місця точок фазового простору об'єкта управління, з яких переведення об'єкта в кінцевий стан можливий без перемикання знака управління. У тому випадку, коли лінія перемикання знайдена, процедура керування об'єктом полягає в наступному:

До об'єкта прикладається управління деякого знака і під дією цього управління об'єкт рухається доти, доки його зображуюча точка не опиниться на лінії перемикання

При попаданні зображувальної точки на лінію перемикання виконується зміна знака керуючого впливу і його точка починає рухатися по лінії перемикання до цільового стану. Таким чином, гарантія потрапляння зображувальної точки в цільовий стан забезпечується визначення лінії перемикання.

Очевидним способом побудови лінії перемикання є сканування всієї фазової площини і запам'ятовування її точок, з яких цільовий стан досягається шляхом застосування постійного за величиною і знаку управління.

Однак існує спосіб побудови всієї лінії перемикання за один прийом. Справа в тому, що фазова траєкторія руху об'єкта в зворотному часі з цільової точки під дією постійного за величиною і знаку управлінні має всі властивості лінії перемикання. Отже, лінія перемикання може бути побудована шляхом розв'язання диференціальних рівнянь об'єкта управління, записаних у зворотному часі. Математично перехід до зворотного часу виконується заміною на рівняннях об'єкта. Потрібно враховувати. що лінія перемикання має дві гілки: одна з них відповідає позитивному значенню керуючого впливу, а інша негативному.

Програмне забезпечення вирішення задачі максимальної швидкодії складається з двох частин:

Скрипт, що виконує побудову фазової траєкторії об'єкта шляхом чисельного розв'язання його рівнянь, записаних у зворотному часі з початкової точки, що відповідає цільовому стану (побудова лінії перемикання);

Скрипт, що виконує побудову фазової траєкторії об'єкта шляхом чисельного розв'язання його рівнянь записаних у звичайному часі з початкової точки, що відповідає початковому стану (знак впливу, що управляє, протилежний знаку, використаному при побудові лінії перемикання).

Тривалість фазової траєкторії, що породжується другим скриптом, повинна бути достатньою для її перетину з лінією перемикання. Момент перетину і є моментом перемикання.

§1.Рівняння теплопровідності

До класичних рівнянь параболічного типу належать рівняння теплопровідності.

Теорема (принцип максимального значення): .

Функція u(x,t) безперервна G і задовольняє однорідному рівнянню теплопровідності:

(*) utt = a2uxx у G + H приймає найбільше та найменше значення на межі Г (тобто при х = 0, x = l або t = 0).

Фізичний зміст: якщо температура на кордоні або в початковий момент часу менша за K, то за відсутності джерел тепла, всередині тіла не може створюватися температура, більша за До.

Доказ: від неприємного.

Позначимо М найбільше значення u(x,t) G = G + H + Г, а через m - найбільше значення u(x,t) на Г:

Припустимо, що таке рішення u(x,t), котрій M > m, тобто. де не виконується умова теореми.

Нехай ця функція набуває значення М у певній точці (x0, t0) є G + H; тобто. u(x0, t0) = M.

Примітка: будь-яка безперервна функція в замкнутій області досягає максимального значення. Достатньою умовою існування відносного мінімуму функції у точці x0 є (0;l) є:

тоді для максимуму:

б) не може бути f"" (x0)>0; тобто. .

Порівняємо знаки лівої та правої частин рівняння у точці М, де за припущенням u(x,t) досягає максимуму: ; так як u(x0, t) досягає максимуму при t = t0, то.

Отримуємо, що у точці (x0,t0): .

Однак, це ще не є протиріччя, оскільки може бути 0.

Для повного доказу знайдемо точку (x1, t1), в якій оцінка однієї з приватних похідних, що входять до рівняння, матиме строгу нерівність.

Розглянемо допоміжну функцію:

Функція х(x0,t0) = u(x 0,t0) = M і отже, найбільше значення х(x,t) у G не менше, ніж М:

Але на межі Р для х(x,t) маємо (на Г max(x - x0)) = l:

(оскільки m< M).

Отже, функція х(x,t) так само як і u(x,t) не набуває найбільшого значення на Г. Нехай х(x,t) набуває найбільшого значення у точці (x1,t1) є G (внутрішня точка).

Відповідно до необхідних умов максимуму в точці (x1, t1) для х (x, t) має бути: , тобто в точці (x1, t1): .

Тоді в цій же точці для функції u(x,t) з (**):

Тоді для функції u(x,t) у точці (x1,t1) отримуємо:

тобто. рівняння (*) у внутрішній точці (x1,t1)є G не задовольняється.

Примітка: при доказі спочатку ми не вимагаємо, щоб u(x,t) задовольняла рівняння теплопровідності, ми лише вивчаємо її поведінку (max і min) і показуємо, що якщо максимум u(x,t) досягається всередині G, то u( x, t) - не задовольняє рівняння.

Следствие1. Якщо два рішення рівняння теплопровідності u1(x,t) та u2(x,t) задовольняють умовам:

для всіх.

Доказ: хай х(x,t) = u2(х,t) - u1(х,t): f(x,t) = 0, звідси u max, min;

Звідси неотрицательный max досягається межі, тоді G u(x,t) - неотрицательна, тобто. у G.

Следствие2. Якщо три рішення рівняння теплопровідності щ, u, u задовольняють умовам: при t = 0; x = 0; x = l, ці нерівності виконуються тотожно, тобто. (x, t) є G.

Доказ: застосовуючи следствие1 спочатку до функцій u(x,t), u(x,t), та був щ(x,t) і u(x,t) отримаємо необхідні співвідношення.

Следствие3. Якщо двох рішень рівняння теплопровідності u1(х,t) і u2(х,t) має місце:

для t = 0; x = 0; x = l, тототожно в G.

Доказ: до функцій:

u(x,t) = u1(х,t) - u2(х,t)

застосуємо следствие2, тоді отримаємо те, що потрібно довести.

Це наслідок доводить стійкість розв'язання першого крайового завдання рівняння теплопровідності.

§2.Приклади застосування принципу максимуму у завданнях управління процесами

Принцип максимуму є основним математичним прийомом, використовуваним для розрахунку оптимального управління у багатьох важливих завданнях математики, техніки та економіки.

Принцип максимуму застосовується до загального завдання управління, що має вигляд

x = f (x, u, t), x (t0) = x0, x (t1) = x1, (u (t)) U. (1)

рівняння параболічний максимум екстремальний

Тут I(...), F(..) і f(...) - задані безперервно диференційовані функції, t0, x0 - фіксовані параметри, t1 або x1 - фіксовані параметри (або за допомогою рівняння T(x, t)=0 визначається закінчена поверхню). Траєкторія управління (u(t)) повинна належати фіксованій множині управлінь U, причому u(t) - шматково-безперервна функція часу, значення якої повинні належати деякій фіксованій множині, що є непустим компактним підмножиною простору Er.

Наведемо деякі завдання оптимального управління, які завдяки їх типовості часто зустрічаються в багатьох підручниках з теорії оптимальних процесів. Ці завдання відносяться до різних галузей людської діяльності: техніки, економіки, екології та ін Але в той же час вони є "навчальними" і служать в основному для ілюстрації деяких теоретичних положень. Очевидно, завдання та моделі, які становлять безпосередній практичний інтерес, повинні бути більш докладними, глибокими та складними. Навчальні завдання – це перше наближення до реальних практичних завдань, їхній спрощений аналог.

Максимізація дальності польоту апарату у атмосфері. Розглядається літальний апарат, положення якого описується наступними параметрами: дальність та висота польоту, величина та кут нахилу до горизонту вектора швидкості. Роль управлінь відіграють кут атаки та функція, що відповідає можливості змінювати в польоті геометрію крил (тобто їх ефективну площу). Потрібно знайти такі керуючі функції, які доставляють максимум дальності польоту.

Завдання ракетодинаміки в однорідному полі (завдання про оптимальне в сенсі витрати палива рух ракети в порожнечі). Розглядається керований ракетний апарат, стан якого визначається координатами в тривимірному просторі, вектором швидкості і значенням маси. Управління здійснюється вибором напряму та абсолютного значення тяги ракети. Потрібно так керувати ракетою, щоб у фіксований момент часу вона досягла заданої точки, маючи певну швидкість і витративши мінімум палива (тобто маючи максимально можливу масу).

Завдання про максимальну висоту підйому вертикально злітає в атмосфері ракети-зонда. Стан ракети задається значеннями висоти, швидкості та маси. Завдання полягає у виборі тяги, яка б максимізувала висоту підйому при вільній тривалості польоту.

Завдання про оптимізацію м'ясозаготівель. На фермі є череда худоби. Щорічно частина стада вирушає на м'ясозаготівлі, причому дохід ферми залежить від кількості проданої худоби. Фазової змінної виступає кількість худоби на фермі наприкінці кожного року після м'ясозаготівель, керуючим параметром - кількість проданої на м'ясо худоби. Потрібно визначити, яким чином ферма може отримати максимальний дохід за кілька років за певного мінімуму щорічних м'ясозаготівель та заданого значення поголів'я худоби на кінець планового періоду.

Оптимальний розподіл ресурсів. Деяка задана початкова сума грошей витрачається придбання устаткування двох типів А і У. З допомогою цього устаткування організується виробництво. Розподіляючи наявні кошти між різними типами устаткування, до кінця терміну експлуатації одержують певний економічний ефект. Потім амортизоване обладнання реалізують, а отримані кошти використовують як початкову суму для наступного циклу, і т.д. Потрібно знайти таку стратегію розподілу коштів на купівлю устаткування типів А і У кожному циклі, щоб забезпечити найбільший економічний ефект після фіксованого числа виробничо-економічних циклів.

Принцип максимуму визначає необхідні умови оптимальності управління нелінійних керуючих системах. Він поширений і на випадки, коли координати стану системи накладаються обмеження. Розглянемо основну теорему принципу максимуму і дамо зручніше формулювання оптимального управління.

Нехай оптимальне керування описується системою нелінійних диференціальних рівнянь:

(1)

або у векторній формі:

--мірний вектор стану об'єкта

--мірний вектор керуючих впливів

- функція правої частини рівняння (1)

Вважаємо, що вектор управління набуває значень із деякої замкнутої області Ur-мірного простору управлінь. Припустимо, що функції
безперервні за всіма аргументами і мають безперервні похідні за змінними станами . Назвемо допустимими управліннями ті управління
, які є шматково-безперервними функціями часу і набувають значення з множини U.

Основне завдання оптимального управління формулюється наступним чином: серед усіх допустимих управління, що приводять зображувальну точку у фазовому просторі X з початкового положення у кінцеве якщо ці управління існують. І потрібно знайти такі управління, для яких функціонал:

(2)

досягає мінімуму.

Введемо нову змінну яка визначається наступним диференціальним рівнянням:

(3)

Тут
- Підінтегральна функція функціоналу (2).

Приєднавши рівняння (3) до системи рівнянь (1), отримаємо:


(4)

Запишемо (4) у векторній формі. Для цього введемо в розгляд (n+1) вектор координат стану:
тоді у векторній формі запису це рівняння запишеться наступним чином:

(5)

Вектор правих частин системи (5).

Зауважимо, що вектор-функція
не залежить від координати вектора . Позначимо через точку з координатами
в (n+1)-му фазовому просторі . Нехай
- деяке допустиме управління, для якого відповідна фазова траєкторія (1) проходить при
через точку . А при виконанні рівності
через точку .

З рівняння (2) випливає, що координата визначається рівністю:

Якщо
, то матимемо:

Таким чином, у просторі фазова траєкторія системи (5), що відповідає тому ж управлінню
, проходить за
через точку
, а при
через точку
. Це ілюструє наступний малюнок:

Позначимо через П пряму у просторі , що проходить через точку
та паралельну осі . Тоді основне завдання оптимального управління можна сформулювати наступним чином:

У (n+1)-мірному просторі задані початкова точка
та пряма П, паралельна осі і проходить через точку
. Серед усіх допустимих управлінь, що мають ту властивість, що рішення системи (5) з початковими умовами
проходить через точку прямої П, необхідно вибрати таке управління, для якого координата точки мало б мінімальне значення.

Сформульована задача є завданням Майєра на умовний екстремум. Проте з обмежень, накладених на допустиме управління методами класичного варіаційного обчислення, це завдання вирішується.

Формулювання теореми, що дає необхідну умову екстремуму:

Введемо на розгляд допоміжні змінні
, які задовольняю наступній системі рівнянь:


(6)

Система (6) називається сполученою стосовно системи рівнянь (5). Якщо вибрати деяке допустиме керування
на відрізку
та знайти відповідне йому рішення
із заданими початковими умовами
, то при підстановці в систему рівнянь (6) управління
та рішення
, Отримаємо лінійну однорідну систему рівнянь:


(7)

Система (7) задовольняє умов існування та єдиності рішення системи диференціальних рівнянь. Системи рівнянь (5) і (6) можна поєднати однією формою запису, для цього треба ввести в розгляд функцію H:

(8)

Тоді системи (5) та (6) запишуться наступним чином:


(9)


(10)

Зазначимо, що вектор функцій
і
безперервні всюди, крім точок розриву допустимого управління
. Ці векторні функції мають безперервні похідні. При фіксованих значеннях
і
функція H стає функцією тільки керування
.

Постановка задачі.Нехай стан керованої системи характеризується п-вимірним вектором стану x(t). Цілеспрямований вплив на процес можна здійснювати за допомогою m-вимірного вектора управління u(t). На вектори керування та стану можуть накладатися обмеження: x(t)eX, u(t)eU,де Uі х- відповідно області допустимих управлінь та станів. Будемо вважати допустимими керуючими впливами шматково-безперервні функції на відрізку управління, в точках розриву першого роду безперервні праворуч і на кінцях відрізка. Між x(t) та u(t)існує залежність, що записується у вигляді системи диференціальних рівнянь

Задано граничні умови: початковий стан керованої системи x,(t 0) = *f і кінцевий стан -х ((??) = **, i = l,2,...,n в n-мірному фазовому просторі. часу п вважаємо незафіксованим, а що характеризує лише момент переходу в кінцевий стан х 1 .Критерій якості перебігу процесу управління описується функціоналом

Тепер постановку завдання оптимального управління можна сформулювати в такий спосіб. У п-мірному фазовому просторі Xдано дві точки, х° і х 1 . Серед усіх допустимих управлінь, для яких фазова траєкторія, що виходить в момент часу t 0 з точки х °, приходить в точку х 1 знайти таке управління, для якого функціонал Iнабуває екстремального значення. Таке управління називається оптимальним управлінням, а відповідна йому траєкторія – оптимальною траєкторією.

Постановку завдання можна змінити, ввівши на розгляд ще одну координату вектора стану, що характеризує поточне значення функціоналу:

Диференціюючи, отримуємо рівняння щодо нової координати вектора стану

I

з граничними умовами

Тепер йтиметься про (п + 1)-мірний фазовий простір стану X,а постановку завдання, еквівалентну попередньої, можна сформулювати в такий спосіб.

В (п + 1)-мірному фазовому просторі Xзадані: точка з координатами (0,х°) та пряма П, що проходить паралельно осі х 0 через точку (0,х х). Серед усіх допустимих управлінь, для яких відповідна фазова траєкторія, виходячи в момент часу з точки (0,х°), перетне пряму П, знайти управління, що забезпечує найменше можливе значення координати перетину з прямою П вздовж осі х 0 .

Постановка задачі геометрично інтерпретована для випадку п = 2 на рис. 2.3.

Крім основної системи диференціальних рівнянь (2.22) та (2.24), які разом запишуться як

введемо на розгляд додаткову систему диференціальних рівнянь щодо допоміжної вектор-функції |/(t)


Мал. 2.3.

Після введення поняття функції Гамільтона

системи (2.25) та (2.26) можна об'єднати записом у вигляді так званої гамільтонової системи

Позначимо через М(х, i)максимальне значення функції Гамільтона

або, точніше, значення її верхньої грані - супремуму.

Основна теорема.Нехай u(t) на відрізку - допустиме керування, що задовольняє постановку задачі. Тоді для оптимальності вектора управління u(t) необхідно, щоб існувала ненульова вектор-функція |/(t), така, що:

1) для всіх tна відрізку] функція Гамільтона як функція і, ueUдосягала максимуму

2) у кінцевий момент часу t = П виконувались співвідношення

Зважаючи на важливість першого пункту для змісту теореми, остання названа авторами принципом максимуму,який у цьому випадку дає необхідні умови визначення оптимального управління.

Таким чином, ми маємо 2(п + 1) + ш співвідношень (2.25), (2.26) та (2.29), між 2(п + 1) + ш координатами векторів x(t), p(t) та u(t ). Так як тспіввідношень не диференціальні, то рішення системи (2.25), (2.26) і (2.29) залежить від 2(n + 1) невідомих параметрів, крім того, >t 0 або ti-t 0= т також параметром. Одне з параметрів несуттєвий, оскільки v|/(t) визначається з точністю до загального множника з однорідності Я щодо |/. Таким чином, для знаходження 2(n + 1) параметрів маємо (2n + 1) граничних умов на функцію x(t) та другий пункт принципу максимуму.

Принцип максимуму для оптимальної швидкодії.Важливим для технічних додатків є клас завдань на оптимальну швидкодію: потрібно знайти управління u(t), що переводить фазову точку стану х° в момент часу t 0 х 1 за мінімальний час, тобто. функціонал у разі запишеться як

тобто. /0 (x,u)sl. Функція Гамільтона набуває вигляду

де

Таким чином, величина р 0 не впливає значення u(t), при якому досягається максимум, а впливає тільки на величину максимуму. У силу сказаного в принципі максимуму для оптимальної швидкодії можна говорити про функції Н(х, ц/, і)і М(х, |/, і)= max Н(х, |/, і),тому рівність (2.29) основної теореми матиме вигляд

а рівність (2.30) матиме вигляд

Застосуємо принцип максимуму оптимального швидкодії до керованим системам, які описуються системою лінійних диференціальних рівнянь з постійними параметрами. Таке завдання називається завданням на лінійну оптимальну швидкодію. Система записується як

Вважаємо, що керуючі впливи підпорядковані обмеженням виду

Потрібно мінімізувати час переходу з х в х 1 , тобто. I= t x -t 0. Складемо функцію Гамільтона:

Змінимо порядок підсумовування у другій групі доданків:

На підставі принципу максимуму u(t) слід шукати, виходячи з максимуму Н(х, |/, і) щодо u (Про для всіх f з урахуванням обмеження (2.31). Неважко бачити (рис. 2.4), що значення, -

маємо u; (t) у кожен момент t визначається знаком?b^|/,-(t), тобто. зміна u, (t) відбувається за законом, = 1

Таким чином, першу властивість управління в задачах на лінійну оптимальну швидкодію можна сформулювати наступним чином: керуючі впливу являють собою кусковопостійні функції, які приймають або максимально, або мінімально допустиме для них значення.

Змінимо порядок підсумовування у першій групі доданків виразу (2.32)

Рівняння гамільтонової системи щодо допоміжної функції j/(t) (2.26) матиме вигляд


Мал. 2.4.

t*, t**- Точки перемикання управління

Система рівнянь є однорідною, отже, загальне рішення можна записати як

де [Ху] - сукупність коренів характеристичного рівняння чи власні значення матриці А= [а,-у].

Вважаємо, що Xj,j=l,2,...,nє простим речовим корінням. Тоді кожна з функцій v|/, (t) як сума пмонотонних функцій не більше (п- 1) рази перетинає вісь t. Оскільки функція

Cy(t) = ^byyl|/y(t) є сумою пмонотонних функцій, можна 1=1

сформулювати другу властивість задачі на лінійну оптимальну швидкодію систем n-го порядку, коріння характеристичного рівняння яких речові: керуючі впливи мають не більше ппроміжків знакостійності чи більше (п - 1) перемикання.

Пояснимо результат на конкретному прикладі. Нехай керована система є подвійне інтегруюче ланка, тобто.

з обмеженням на керуючий вплив u(t) |

Потрібно знайти u(t), що переводить фазову точку з довільного положення х ° початок координат фазового простору за мінімальний час.

1. Введемо фазові координати:

Тоді у нормальній формі рівняння системи запишуться як

2. Запишемо вираз для функції Гамільтона:

Гамільтонова система щодо допоміжної вектор-функції j/(t) має вигляд

Звідси

3. На підставі властивостей управління:

Рівняння сімейств фазових траєкторій (рис. 2.5, а, б):

Під дією управління н = ±1 фазова точка може потрапити на початок координат лише з виділеної траєкторії (рис. 2.6). Щоб фазова точка потрапила на початок координат лише за одне перемикання, рух має бути організовано, як показано на рис. 2.6.

Завдання оптимального керування кінцевим станом.Завдання управління кінцевим станом за відсутності обмежень на вектор управління завдання Майєракласичного варіаційного обчислення У цих завданнях функціонал визначає значення функції від координат стану на момент часу t = t bтобто.


Мал. 2.5.

а- u(t) = + 1; б - u(t) = -1


Мал. 2.6.

Нехай керована система описується системою диференціальних рівнянь n-го порядку

з граничними умовами

Ці рівняння лінійні щодо m-вимірного вектора управління u(t). На керуючі дії накладаються обмеження виду

Потрібно визначити вектор управління, що мінімізує функціонал

Введемо нову координату

Додаткове диференціальне рівняння щодо x 0 (t) запишеться у вигляді

з граничними умовами

Функція Гамільтона для даної системи

Виконаємо такі перетворення:

За виконання перетворень з ф; = 0 і | / 0 (П) = -1 вважаємо v | / 0 (t) = -l. На підставі принципу максимуму при зазначених обмеженнях на керування оптимальне керування кінцевим станом для даної системи визначається виразом

Таким чином, керування є кусково-постійною функцією зі значеннями на межі області допустимих управлінь. Оптимальна функція перемикання

може бути обчислена після розв'язання гамільтонової системи рівнянь за заданих граничних умов.

Завдання управління щонайменше витрати енергії.Це завдання оптимального керування має велике практичне значення. Витрата енергії, витраченої управління, пропорційний інтегралу за часом від квадрата управляючого впливу. Якщо витрати енергії по всіх входах брати з однаковими вагами, то функціонал можна записати у вигляді

де коефіцієнт 1/2 введено зручності наступних викладок.

Розглянемо систему, що описується системою диференціальних рівнянь п-го порядку:

Розглянемо два випадки визначення оптимального управління з витрат енергії на управління:

1) коли вектор управління не накладається обмежень;

2) коли керуючі впливи підкоряються обмеженням виду

Введемо нову координату

Відповідне цій координаті диференціальне рівняння за граничних умов

Функція Гамільтона для цієї системи має вигляд

Змінюємо порядок підсумовування в останній групі доданків і вважаємо, як і раніше, j/0=-1. Тоді

1-й випадок.Вектор u(t) не накладається обмежень.

Максимум функції Гамільтона Н(х, |/, і) щодо іможе бути знайдений на підставі необхідної умови екстремуму функції класичного аналізу

Диференціюємо по п; :

Звідси оптимальне управління

2-й випадок.Керуючі впливи підкоряються обмеженню

З попереднього випадку ясно, що якщо | З; (?) | Uj(t) = З іншого боку, для тих t,для яких | Cj(t) | > Mj, звраховуючи обмеження на Uj(t)функція Гамільтона максимальна, якщо Uj(t) = MjSignCj(t).Звідси укладаємо, що оптимальне управління може бути записане у вигляді

Для визначення Cj(t)необхідно вирішити гамільтонову систему рівнянь.



Останні матеріали розділу:

Священний Коран арабською мовою – рятівник душі і тіла людини Коран всі сури арабською
Священний Коран арабською мовою – рятівник душі і тіла людини Коран всі сури арабською

Все, що є у Всесвіті і все, що в ньому відбувається, пов'язане з Кораном і отримує своє відображення. Людство не мислимо без Корану, і...

Жіночий Султанат – Султанші мимоволі на екрані та у звичайному житті
Жіночий Султанат – Султанші мимоволі на екрані та у звичайному житті

У статті ми докладно охарактеризуємо Жіночий султанат Ми розповімо про його представниць та їх правління, про оцінки цього періоду в...

Правителі Османської імперії
Правителі Османської імперії

З моменту створення Османської імперії державою безперервно правили Османських нащадків по чоловічій лінії. Але незважаючи на плідність династії, були...