Л.Г. Лабскер, профессор кафедры "Математическое моделирование экономических процессов"

Аннотация

Предлагается некоторая общая схема формирования критериев выбора оптимальных стратегий в играх с природой. В рамках этой схемы вводятся понятия функции игры, показателей игры и показателей оптимальности и неоптимальности стратегий. На основе предложенной схемы выделяются некоторые классы критериев, которые, с одной стороны, включают в себя известные классические критерии, такие как критерии Вальда, Сэвиджа, Гурвица и др., а с другой стороны, дают возможность получать новые критерии оптимальности. Устанавливается эквивалентность некоторых из рассмотренных критериев. Приводится пример нахождения оптимальных стратегий по рассмотренным критериям.

 Часто во многих задачах финансово-экономической сферы приходится принимать решения в условиях недостаточной осведомленности или полной неосведомленности о состояниях окружающей эти задачи среды. Математические модели подобных ситуаций называются "играми с природой", где под "природой" понимается окружающая среда. Обозначим ее буквой П. Лицо, принимающее решение или выбирающее стратегию действий, называется игроком. Обозначим его через А.

Считаются известными всевозможные состояния П1, П2, ..., Пn природы П, которые она проявляет случайным образом независимо от действий игрока А, не противодействуя злонамеренно его стратегиям. Природа может находиться только в одном из отмеченных состояний, но в каком именно – неизвестно, хотя в некоторых случаях могут быть известны лишь вероятности этих состояний

О некоторой общей схеме формирования критериев оптимальности в играх с природой

Известны также возможные стратегии A1, A2, ..., An игрока А и его выигрыши О некоторой общей схеме формирования критериев оптимальности в играх с природойпри каждой из стратегий О некоторой общей схеме формирования критериев оптимальности в играх с природойи каждом из состояний природы Пj. Эти выигрыши можно расположить в виде матрицы выигрышей:

Пj

Ai

П1 П2 ... Пn
А1 а11 а12 ... а1n
(aij) = А2 а21 a22 ... a2n
... ... ... ... ...
Аm аm1 am2 ... amn
qj q1 q2 ... qn

В нижней строке матрицы указаны вероятности qj состояний природы Пj, j = 1, ..., n.

Предположим, что игрок А, не зная состояния природы, выбрал стратегию Аi. Если природа приняла состояние Пj, то выигрыш игрока А будет аij. Но если бы игрок А заранее знал, что природа примет состояние Пj, то он выбрал бы стратегию Аi0, при которой достигается наибольший выигрыш аi0j, т.е.

О некоторой общей схеме формирования критериев оптимальности в играх с природой(1)

Разность О некоторой общей схеме формирования критериев оптимальности в играх с природой(2)

между выигрышем О некоторой общей схеме формирования критериев оптимальности в играх с природойигрока А при заранее известном ему состоянии природы Пj и выигрышем аij при незнании игроком А состояния природы называется риском при стратегии Аi и состоянии природы Пj. Таким образом, риск rij есть та часть наибольшего выигрыша О некоторой общей схеме формирования критериев оптимальности в играх с природойпри состоянии природы Пj, которую игрок А не выиграл, применяя стратегию О некоторой общей схеме формирования критериев оптимальности в играх с природой, по причине незнания состояния природы.

Матрица

Пj

Аi

П1 П2 ... Пn
A1 r11 r12 ... r1n
(rij) = A2 r21 r22 ... r2n
... ... ... ... ...
Am rm1 rm2 ... rmn
qj q1 q2 ... qn

называется матрицей рисков. В последней строке указаны вероятности состояний природы qj, j = 1, …, n. Так как О некоторой общей схеме формирования критериев оптимальности в играх с природой(правое неравенство следует из (1)), то из (2) получаем, что О некоторой общей схеме формирования критериев оптимальности в играх с природой.

Вероятность О некоторой общей схеме формирования критериев оптимальности в играх с природойсостояния природы Пj является очевидно вероятностью выигрыша О некоторой общей схеме формирования критериев оптимальности в играх с природойи риска О некоторой общей схеме формирования критериев оптимальности в играх с природойпри каждой стратегии Ai, i = 1, …, m.Поэтому каждую стратегию О некоторой общей схеме формирования критериев оптимальности в играх с природойможно интерпретировать как дискретную случайную величину, которая может принимать значения, равные выигрышам ai1, …, ain или рискам ri1, …, rin с соответствующими вероятностями q1, …, qn.

Задача игрока А состоит в выборе из возможных стратегий Ai, ..., Am оптимальной. Таким образом, речь идет о решении задачи в чистых стратегиях ([1], с. 502, 508). Оптимальность стратегии понимают в различных смыслах и выбирают ее по различным критериям. Отметим, например, классические критерии Байеса ([2], с. 119*; [3], с. 46), Лапласа ([1], с. 500; [2], с. 119; [4], с. 103), Вальда ( [1], с. 504; [3], с. 91; [5], с. 56), Сэвиджа ([1], с. 504; [3], с. 92; [5], с. 57), Гурвица ([1], с. 505; [2], с. 120; [3], с. 47; [5], с. 57).

Цель настоящей статьи – предложить некоторую общую схему формирования критериев выбора оптимальных стратегий, на основе которой можно выделить некоторые классы критериев, включающие в себя отмеченные классические критерии и дающие возможность получать новые критерии оптимальности.

 Результат игры в общем случае зависит от трех числовых параметров: выигрышей а игрока А, рисков r, которые появляются при выборе игроком А той или иной стратегии, и вероятностей q сoстояний природы. Желание "свернуть" эти три параметра в один показатель приводит к некоторой числовой функции, зависящий от этих трех параметров. Обозначим ее G(a, r, q) и назовем функцией игры. Характер зависимости функции игры G от а, r и q мотивируется логикой применяемого критерия. Значения

О некоторой общей схеме формирования критериев оптимальности в играх с природой

функции игры назовем показателями игры. Эти показатели образуют матрицу игры

Пj

Ai

П1 П2 ... Пn
A1 G11 G12 ... G1n
(Gij) = A2 G21 G22 ... G2n
... ... ... ... ...
Am Gm1 Gm2 ... Gmn

Критерий предполагает задание некоторой числовой функции  векторного аргумента О некоторой общей схеме формирования критериев оптимальности в играх с природойзначение которой

О некоторой общей схеме формирования критериев оптимальности в играх с природой

назовем показателем стратегии Ai.

Затем среди показателей Gi стратегий Ai выбирается экстремальный О некоторой общей схеме формирования критериев оптимальности в играх с природой. Для одних критериев это максимальное значение: Ext = max, а для других минимальное: Ext = min.

Если Ext = max, то показатель Gi назовем показателем оптимальности стратегии Ai; если же Ext = min, то Gi назовем показателем неоптимальности стратегии Ai.

Оптимальной по критерию называется стратегия Ai0, для которой достигается экстремум показателя Gi , т.е.

О некоторой общей схеме формирования критериев оптимальности в играх с природой

Применяя описанную схему, сформируем некоторые классы критериев.

 Максиминные критерии (крайнего пессимизма).

Для этих критериев

О некоторой общей схеме формирования критериев оптимальности в играх с природой(3)

а показатели стратегий Ai определяются следующим образом:

О некоторой общей схеме формирования критериев оптимальности в играх с природой

и являются, в силу (3), показателями оптимальности стратегий.

Таким образом, Gi является наихудшим показателем игры при стратегии Ai. Отсюда следует, что функция игры G(a, r, q) должна быть неубывающей по выигрышу а и невозрастающей по риску r.

На показатели игры также оказывают влияние вероятности состояний природы q. Так, например, если наихудший, т.е. наименьший выигрыш аij при стратегии Ai имеет достаточно малую вероятность qj, то считать его практически наименьшим уже нецелесообразно. Чтобы этот выигрыш оставался и практически наименьшим, он должен иметь достаточно большую вероятность. С рисками обстоит все наоборот: чтобы наихудший, т.е. наибольший риск rij при стратегии Ai оставался практически наибольшим, его вероятность должна быть также достаточно большой. Это говорит о том, что функция игры должна невозрастать по вероятности q.

Итак, логика максиминного критерия определяет характер поведения функции игры в зависимости от выигрыша а, риска r и вероятности q:

G(a, r, q) Ú по a; Ø по r; Ø по q.

Для удобства различий в дальнейшем для максиминного критерия обозначим функцию игры G через W, показатели игры Gij через Wij, показатели оптимальности Gi стратегий Ai через Wi.

Таким образом, для максиминного критерия функция игры

W(a,r,q) Ú по a; Ø по r; Ø по q, (4)

показатели игры

Wij = W(aij, rij, qj), i = 1, ..., m; j = 1, ..., n,

показатели оптимальности стратегий

Wi=О некоторой общей схеме формирования критериев оптимальности в играх с природой

Оптимальной по максиминному критерию считается стратегия Ai0, для которой

О некоторой общей схеме формирования критериев оптимальности в играх с природой.

Максиминный критерий является критерием крайнего пессимизма лица, выбирающего стратегию, так как ориентирует его на наихудшее для него проявление состояний природы и как следствие – на весьма осторожное поведение при принятии решения.

Конкретная функция игры W(a,r,q) может быть выбрана по-разному, но с непременным требованием обладания свойствами (4).

Примерами максиминных критериев с конкретными функциями игры W(a,r,q) могут служить следующие критерии:

3.1. W(a,r,q) = a;

3.2. W(a,r,q) = (1-q)a;

3.3. W(a,r,q) = a-r;

3.4. W(a,r,q) = (1-q)a-qr.

То, что каждая их этих функций обладает свойствами (4), можно проверить по знаку частных производных.

В критерии 3.1 показателями игры являются выигрыши: Wij=aij, а потому он не учитывает ни рисков, ни вероятностей состояний природы. Критерий 3.1 является критерием Вальда ([1], с. 504; [3], с. 91; [5], с. 56), позволяющим обосновать выбор решения в условиях полной неопределенности, т.е. в условиях незнания вероятностей состояний природы. Критерий 3.2 учитывает выигрыши и вероятности состояний природы, но не учитывает риски. В критерии 3.3 учитываются выигрыши и риски без учета вероятностей состояний природы. И наконец, в критерии 3.4 учитываются выигрыши, риски и вероятности состояний природы.

Минимаксные критерии (крайнего пессимизма).

Для минимаксного критерия функцию игры обозначим через S(a,r,q). Она должна быть невозрастающей по выигрышу а и неубывающей по риску r и по вероятности q состояний природы:

S(a,r,q) Ø по а; Ú по r; Ú по q. (5)

Тогда Sij = S(aij, rij, qj ) – показатели игры. Показатели стратегий определяются следующим образом:

О некоторой общей схеме формирования критериев оптимальности в играх с природой(6)

Стратегия О некоторой общей схеме формирования критериев оптимальности в играх с природойсчитается оптимальной, если

О некоторой общей схеме формирования критериев оптимальности в играх с природой. (7)

В силу (7) показатели Si являются показателями неоптимальности стратегий Аi.

То, что функция игры S(a, r, q) должна обладать свойствами (5) мотивируется аналогично мотивировке в п. 3 с учетом (6) и (7).

Приведем некоторые минимаксные критерии с конкретными функциями игры S(a,r,q), удовлетворяющими условиям (5):

4.1. S(a,r,q) = r;

4.2. S(a,r,q) = qr;

4.3. S(a,r,q) = r-a;

4.4. S(a,r,q) = qr-(1-q)a.

Критерий 4.1, в котором показатели игры – риски, не учитывает ни выигрышей, ни вероятностей состояний природы. Это есть критерий Сэвиджа ([1], с. 504; [3], с. 92, [5], с. 57).

Сравнивая максиминные и минимаксные критерии, можно высказать следующее.

Утверждение 1. Максиминные критерии 3.3 и 3.4 эквивалентны соответственно минимаксным критериям 4.3 и 4.4:


Информация о работе «О некоторой общей схеме формирования критериев оптимальности в играх с природой»
Раздел: Экономика
Количество знаков с пробелами: 24468
Количество таблиц: 16
Количество изображений: 0

Похожие работы

Скачать
46759
7
2

... , способных нанести урон компании. Вместе с тем рисками можно управлять так же, как процессами производства или закупки материалов. Для того чтобы компания могла принимать обоснованные решения в условиях неопределенности, она должна выработать политику по управлению рисками. Управление рисками следует регламентировать специальным внутренним документом – программой по управлению рисками. Основная ...

Скачать
795696
13
12

... за собой её гибель, либо требующие подключения к процессу самоуправления суперсистемы иерархически высшего управления. Так соборный интеллект видится индивидуальному интеллекту с точки зрения достаточно общей теории управления; возможно, что кому-то всё это, высказанное о соборных интеллектах, представляется бредом, но обратитесь тогда к любому специалисту по вычислительной технике: примитивная ...

Скачать
100976
13
26

... . // Информатика и образование. -1994. - №4. 45.      Подиновский В.В., Ногин В.Д. Паретооптимальные решения многокритериальных задач. - М.: Наука, 1982, - 256 с., ил. 46.      Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр: Учебное пособие для университетов: / - М.: Высш. шк., Книжный дом "Университет", 1998. - 304с.: ил. 47.      Программа курса информатики для начальной школы по ...

Скачать
45054
11
3

... из сторон преследует собственные цели, не всегда совпадающие друг с другом. Неопределенность такого рода при принятии решений относят к классу поведенческих неопределенностей. Теоретической основой нахождения оптимального решения в условиях неопределенности и конфликтных ситуаций является теория игр. Игра - это математическая модель процесса функционирования конфликтующих элементов систем, в ...

0 комментариев


Наверх