ОКРЕМІ ВИПАДКИ ЗАДАЧ ОПТИМАЛЬНОГО СТОХАСТИЧНОГО КЕРУВАННЯ
1. Зовнішній інтеграл
Функції і
можуть бути довільними, а математичні сподівання можна обчислювати, якщо
як функція від
є вимірною.
Якщо ж оптимальна стратегія, отримана в результаті оптимізації, виявиться невимірною, то і функція може виявитися невимірною. У цьому випадку математичне сподівання невизначено.
Для розв’язання цієї проблеми застосовують два підходи. Перший полягає в накладенні на функції і
таких обмежень, які забезпечували б вимірність підінтегральної функції на кожному кроці оптимізації
: функції
і
,
, повинні бути неперервними по своїх аргументах і повинна існувати щільність імовірності розподілу випадкової величини
, а множини
значень припустимих стратегій повинні бути компактними.
На жаль, на практиці ці вимоги не завжди виконуються. Тому другий підхід пов’язаний з використанням зовнішнього інтеграла.
Позначимо через простір елементарних подій, що є довільною множиною, а
– деяка система підмножин множини
.
Математичним сподіванням випадкової величини , заданої на імовірнісному просторі
, називається число
, якщо інтеграл з правої частини існує.
Нехай і
– борелівські простори,
,
є
-алгеброю в
. Функція
називається
-вимірною, якщо
для будь-якої множини
. Тут
– борелівська
-алгебра простору
.
Для функції , (
) зовнішній інтеграл за мірою
визначається як нижня грань інтегралів від всіх вимірних функцій
(
), що мажорують
, тобто
,
.
Тут – функція розподілу випадкової величини
, що відповідає ймовірнісній мірі
.
Для довільної функції має місце співвідношення:
,
де ,
, і вважають, що
.
Оскільки зовнішній інтеграл визначений для будь-якої функції, як для вимірної, так і для невимірної, то ніяких додаткових обмежень на функції і
накладати не треба.
Для вимірних функцій обидва види математичних сподівань співпадають. Отже, у постановках задач можна замінити звичайне математичне сподівання на зовнішнє, і навіть якщо знайдена при цьому функція виявиться вимірною, то отримана стратегія керування не перестане бути оптимальною.
Зовнішня міра множини визначається співвідношенням
.
Для будь-якої множини
,
де – це індикатор множини
, що визначається як
а) якщо , то
;
б) якщо і
, то
;
в) якщо або
, то
;
г) якщо задовольняє рівності
, то для будь-якої функції
має місце рівність
;
д) якщо , то
для будь-якої функції
;
е) якщо і
, то
. Якщо при цьому хоча б одна з функцій
або
-вимірна, то останнє співвідношення вірно зі знаком рівності.
Позначимо через дійсну пряму, а через
– розширену дійсну пряму і надалі у всіх висновках замість дійсної прямої використовуватимемо поняття розширеної дійсної прямої.
Вважатимемо, що для розширеної дійсної прямої мають місце всі співвідношення порядку додавання і множення, які було введено для , і припустимо, що
і
.
Позначимо через множину всіх дійсних у розширеному розумінні функцій
, де
– простір станів.
– банахів простір всіх обмежених дійсних функцій
з нормою, що визначається за формулою
,
.
Позначатимемо , якщо
,
,
і
, якщо
,
,
.
Для будь-якої функції і будь-якого числа
позначимо через
функцію, що приймає значення
в кожній точці
, так, що
,
.
Припущення монотонності. Для будь-яких станів , керування
і функцій
мають місце нерівності
якщо
і
;
, якщо
і
;
, якщо
,
і
.
Для будь-якого стратегія
називається
-оптимальною при горизонті
, якщо
і -оптимальною, якщо
Багато задач послідовної оптимізації, що становлять практичний інтерес, можуть розглядатися як окремі випадки задач загального виду. Розглянемо деякі з них:
· задачі детермінованого оптимального керування;
· задачі стохастичного керування зі зліченним простором збурень;
· задачі стохастичного керування із зовнішнім інтегралом;
· задачі стохастичного керування з мультиплікативним функціоналом витрат;
· задачі мінімаксного стохастичного керування.
2. Детерміноване оптимальне керуванняРозглянемо відображення , що задане формулою
,
,
,
(1)
за таких припущень:
функції і
відображають множину
відповідно в множини
і
, тобто
,
; скаляр
додатний.
За цих умов відображення задовольняє припущенню монотонності. Якщо функція
дорівнює нулю, тобто
,
, то відповідна
-крокова задача оптимізації (1) набуває вигляду:
, (2)
. (3)
Ця задача є задачею детермінованого оптимального керування зі скінченним горизонтом. Задача з нескінченним горизонтом має наступний вигляд:
, (4)
. (5)
Границя в (4) існує, якщо має місце хоча б одна з наступних умов:
· ,
,
;
· ,
,
;
· ,
,
,
і деякого
.
У задачі (4) – (5) може бути уведене додаткове обмеження на стан системи ,
. У такому разі, якщо
, позначатимемо
.
Розглянемо відображення , що задане формулою
, (6)
за таких припущень:
параметр приймає значення зі зліченної множини
з заданим розподілом ймовірностей
, що залежать від
і
; функції
і
відображають множину
відповідно в множини
і
, тобто
,
; скаляр
додатний.
Якщо ,
, – елементи множини
,
– довільний розподіл ймовірностей на
, а
– деяка функція, то математичне сподівання визначається за формулою
,
де ,
,
.
Оскільки , то математичне сподівання
визначене для будь-якої функції
і будь-якого розподілу ймовірностей
на множині
.
Зокрема, якщо ,
,… – розподіл ймовірностей
на множині
, то формулу (6) можна переписати так:
При використанні цього співвідношення треба пам’ятати, що для двох функцій ,
рівність
має місце, якщо виконується хоча б одна з трьох умов:
та
;
та
;
та
.
Відображення задовольняє припущенню монотонності. Якщо функція
– тотожний нуль, тобто
,
, то за умови
,
, функцію витрат за
кроків можна подати у вигляді:
(7)
де ,
.
Ця умова означає, що математичне сподівання обчислюється послідовно по всіх випадкових величинах .
При цьому зміна порядку операцій додавання і узяття математичного сподівання припустима, тому що ,
, і для довільних простору з мірою
, вимірної функції
і числа
має місце рівність
.
Якщо виконується одна з двох нерівностей
або
,
то функцію витрат за кроків
можна записати у вигляді:
,
де математичне сподівання обчислюється на добутку мір на , а стани
,
, виражаються через
за допомогою рівняння
.
Якщо функція допускає подання у такому вигляді для будь-якого початкового стану
та будь-якої стратегії
, то
-крокова задача може бути сформульована так:
, (8)
. (9)
Відповідна задача з нескінченним горизонтом формулюється так:
, (10)
. (11)
Границя в (10) існує при виконанні будь-якої з трьох наступних умов:
· ,
,
,
;
· ,
,
,
;
· ,
,
,
,
і деякого
.
Математичне сподівання визначається і як звичайний інтеграл, і як зовнішній інтеграл з -алгеброю в множині
, що складається із всіх підмножин
, в залежності від вимірності або невимірності функцій.
Для багатьох практичних задач виконується припущення про зліченність множини .
Якщо ж множина незліченна, то справа ускладнюється необхідністю обчислення математичного сподівання
для будь-якої функції . Подолання цих труднощів і пов’язане з використанням зовнішнього інтеграла.
Похожие работы
... провести, то одержимо співвідношення . Це означає, що різним реалізаціям випадкового збурення для одного початкового стану відповідатимуть різні оптимальні стратегії керування . 4 Формальна постановка задачі оптимального стохастичного керування Розглянемо систему (2) із цільовим функціоналом (3). Надалі, якщо інше не обговорено спеціально, будемо вважати, що оптимальні керування на ...
... "Баланс" за 2007 – 2008 роки (додаток В); - форма № 2 "Звіт про фінансові результати" за 2007 – 2008 роки (додаток Г). 3 Підвищення ефективності виробництва МКВП "Дніпроводоканал" на підставі методів Економіко-математичного моделювання У грудні 2008 року Дніпропетровський міськвиконком та комунальне Підприємство "Дніпроводоканал", яке знаходиться у власності м. Дніпропетровська ...
... регулирования движения судов: Отчет о НИР (промежуточный) // ХАИ. – 501-4/2002; – Харьков, 2002. – 30 с. АНОТАЦІЯ Жеребятьєв Д.П. Методи обробки динамічних сцен при впливі нестаціонарних завад у радіотехнічних системах супроводження надводних протяжних об'єктів. – Рукопис. Дисертація на здобуття наукового ступеня кандидата технічних наук за фахом 05.12.17 – радіотехнічні та телевізійні ...
... тоді вони їй будуть заважати, а не допомагати. Отже, використання програм реабілітації сприяє усвідомленню дитиною необхідності позбавитися від хімічної залежності та скорішому одужанню, поверненню до нормального життя. 2.3 Психокорекційна робота Психологічна корекція базується на консультуванні і припускає цілеспрямований психологічний вплив на клієнта або пацієнта з метою приведення його ...
0 комментариев