7 Зв'язок методу динамічного програмування із принципом максимуму

Розглянемо задачу оптимального керування з фіксованими кінцями та вільним часом (6) з цільовим функціоналом , і крайовими умовами , . Вважатимемо, що час  невідомий.

Оптимальне керування будемо вибирати серед кусково-неперервних вектор-функцій . За принципом динамічного програмування для оптимального процесу  існує такий розв’язок  рівняння Беллмана

,(19)

що  – значення, на якому досягається мінімум у лівій частині рівняння (19).

Доведемо, що з рівняння (19) випливає існування деякого вектора , який задовольняє співвідношенням принципу максимуму. Нехай  – функція Беллмана, що відповідає оптимальному процесу . Розглянемо нову змінну

і нову функцію

,


де .

Використовуючи ці позначення, перетворимо рівняння Беллмана. Очевидно, що

, , ,

тому

Оскільки , то останнє співвідношення можна привести до вигляду:

.(20)

Позначимо

, .

Тоді формула (20) стає аналогом функції Понтрягіна

,


де .

Це означає, що на оптимальному процесі  функція Понтрягіна набуває максимального значення, рівного 0. Очевидно, що функція Понтрягіна не залежить від , тому що  і ,  не залежать від .

Доведемо, що спряжені змінні  задовольняють спряженій системі

, .(21)

Для цього припустимо, що функція Беллмана  має неперервні частинні похідні другого порядку. Позначимо

.(22)

Оскільки оптимальне керування  однозначно визначає оптимальну траєкторію , то функція  досягає на кожному фіксованому  по змінній  максимального значення, рівного 0, у точці , що відповідає оптимальному керуванню  в цій точці. У цьому випадку для функції  в будь-який момент часу для процесу  буде виконана умова

, , .(23)

Продиференціюємо співвідношення (22):

, .

Тоді відповідно до (23) для оптимального процесу дістанемо

, .(24)

Оскільки

,

то співвідношення (24) можна переписати у вигляді:

,

або, з урахуванням позначень (21),

, .

Оскільки , то

,

а це, у свою чергу означає, що

, .

Отже, встановлено теоретичний зв'язок принципу максимуму з методом динамічного програмування. Але на практиці виконати подібну операцію не завжди можливо. Так наприклад, рівняння (21) було отримано в припущенні, що функція Беллмана  має неперервні похідні другого порядку, що не завжди виконується.

Обидва методи придатні для задач, у яких відсутні обмеження на керування, і всі функції гладкі. Кожний з цих методів може бути застосований там, де не працює інший. Рівняння Беллмана вимагає більше припущень для застосування (неперервність і диференційованість функцій), а принцип максимуму складніше використовувати для розв’язання дискретних задач.


Информация о работе «Метод динамічного програмування»
Раздел: Экономико-математическое моделирование
Количество знаков с пробелами: 13680
Количество таблиц: 0
Количество изображений: 1

Похожие работы

Скачать
48339
9
15

... у формулу (2.11) і визначити наступний стан системи . Для зміненого стану знайти оптимальне управління , підставити у формулу (2.11) і так далі. Для і-гo стану , знайти  і  і т.д. [1]. 3. Оптимальний розподіл інвестицій, як задача динамічного програмування Інвестор виділяє кошти в розмірі  умовних одиниць, котрі повинні бути розподілені між -підприємствами. Кожне і-те підприємство при і ...

Скачать
38280
0
5

... стратегія володіє тим властивістю, що стосовно будь-якого первісного стану після деякого етапу рішення сукупність наступних рішень повинна становити оптимальну стратегію. Цей принцип оптимальності лежить в основі всієї концепції динамічного програмування. Саме завдяки йому вдається при наступних переходах випробовувати не всі можливі варіанти, а лише оптимальні виходи. Рекурентні співвідношення ...

Скачать
135325
38
7

... "Баланс" за 2007 – 2008 роки (додаток В); -          форма № 2 "Звіт про фінансові результати" за 2007 – 2008 роки (додаток Г). 3 Підвищення ефективності виробництва МКВП "Дніпроводоканал" на підставі методів Економіко-математичного моделювання У грудні 2008 року Дніпропетровський міськвиконком та комунальне Підприємство "Дніпроводоканал", яке знаходиться у власності м. Дніпропетровська ...

Скачать
52551
7
0

... ічно зростають показники ефективноств їх діяльності. Науково-дослідні інститути закордоном працюють над новими моделями, які раніше чи пізніше пристосуються до практики управління. Щоб якимось чином впорядкувати та зробити більш наочним питання про сфери застосування тих чи інших моделей і методів наведемо таблицю (див. табл.7).Таблиця 7: Сфери застосування моделей і методів обгруниування управлі ...

0 комментариев


Наверх