Три признака хорошей стратегии в условиях неопределенности. Open Library - открытая библиотека учебной информации

Выше рассмотренная задача из теории игр предполагала выбор оптимальной стратегии в условиях риска. Это ситуации, когда игрок знает вероятности наступления исходов и последствий для каждого решения.

Совсем другая ситуация наступает, когда эти вероятности не известны, т.е. имеет место полная неопределённость в отношении возможности реализации состояния среды. В этом случае игру можно представить таким образом, что в ней имеется один игрок и некая действительность, называемая природой. Условия такой игры обычно представляется такой же платёжной матрицей, что и раньше, в которой строки представляют стратегии игрока, а столбцы – стратегии природы.

В данном случае при выборе наилучшего решения обычно используют следующие критерии:

1. Максимаксный критерий, или критерий крайнего оптимизма – определяет альтернативу, которая максимизирует максимальный результат для каждой альтернативы, т.е. выбирается стратегия, которой соответствует

2. Максиминный критерий Вальда, или критерий крайнего пессимизма – определяет альтернативу, которая максимизирует минимальный результат для каждой альтернативы, т.е. выбирается стратегия, которой соответствует

3. Критерий минимаксного риска Сэвиджа. Согласно этому критерию выбирается стратегия, при которой величина риска в наихудших условиях минимальна, т.е. равна

Здесь риск = () – .

4. Критерий оптимизма-пессимизма Гурвица рекомендует при выборе решения не руководствоваться ни крайним пессимизмом, ни крайним оптимизмом. Согласно этому критерию стратегия выбирается из условия

+ (1 – k ) }.

Значение коэффициента пессимизма k выбирается исследователем между нулём и единицей из практических соображений.

5. Критерий безразличия Лапласа. В условиях полной неопределённости предполагается, что все возможные среды (природы) равновероятны. Этот критерий выявляет альтернативу с максимальным средним результатом, т.е.

Если известны вероятности реализации для всех состояний среды, можно определить ожидаемую стоимостную оценку EMV для каждой альтернативы. Один из наиболее распространённых критериев выбора альтернативы – максимальная EMV.



Для каждой альтернативы ожидаемая стоимостная оценка EMV есть сумма всевозможных выигрышей для этой альтернативы, умноженных на вероятности реализаций этих выигрышей:

Максимальная EMV в случае равных вероятностей совпадает с критерием безразличия Лапласа.

Проиллюстрируем эти положения на следующем примере, реализованном в модуле Decision Analysis/Decision Tables.

На рисунке 4.6 просчитаны почти все описываемые критерии, кроме критерия минимаксного риска Сэвиджа, который рассчитан на рисунке 4.7.

Из обозначений строк и столбцов очевидны те или иные критерии. Так, например, в столбце EMV (рисунок 4.6) внизу показана максимальная EMV. Кроме того, внизу этого рисунка прописаны значения конкретных критериев и указано, на каких альтернативах они реализованы.

Рисунок 4.6 – Окно отчёта о решении задачи анализа решений

Рисунок 4.7Окно отчёта о вычислении критерия минимаксного риска Сэвиджа

На рисунке 4.7 показаны расчёты критерия минимаксного риска Сэвиджа (он равен 4 и реализован второй альтернативой).

Задания к выполнению лабораторной работы №4

Необходимо выполнить анализ всех задач, описанных в этом разделе.

Исходную информацию для выполнения лабораторной работы возьмёте из задания по транспортной задаче. Игра должна быть 4х4. Матрица транспортных расходов – это три стратегии игрока А. Четвёртую стратегию этого игрока составит строка потребностей (последняя строка, не включённая в матрицу транспортных расходов).

Для решения задачи графическим методов выберите две активные стратегии игрока А с минимальными частотами.

Для анализа игры с природой возьмите эту же платёжную матрицу.

Лабораторная работа №5

Системы массового обслуживания

Общие сведения

Существует широкий класс задач, с которыми приходится постоянно сталкиваться в повседневной и хозяйственной деятельности, где имеют место процессы, приводящие к задержкам в обслуживании и очередям. Системы, в которых протекают указанные процессы, получили название систем массового обслуживания (МО), а математическим описанием или разработкой математических моделей процессов, протекающих в них, занимается теория МО.

В процессе изучения очередей сначала необходимо обращать внимание на следующие основные её компоненты: входящий поток требований, каналы обслуживания, наличие очереди и выходящий поток. Эти составляющие не требуют разъяснения, за исключением дисциплины очереди. Последнее – это просто правило обслуживания. В дальнейшем мы будем рассматривать правило: первый пришёл, первый обслуживается. Системы МО связаны с двумя видами издержек: издержки обслуживания, увеличивающиеся при повышении уровня обслуживания, и издержки, связанные с ожиданием, уменьшающиеся с увеличением уровня обслуживания. Как известно, существует точка минимума общих издержек системы МО.

Определение оптимального уровня обслуживания, минимизирующего суммарные издержки системы МО, и является одной из основных задач при разработке и эксплуатации систем МО.

В условиях неопределенности в самом общем случае возможны два подхода к принятию стратегического решения.

Первый подход, когда руководитель может использовать имеющуюся информацию или опыт для идентификации своих предположений относительно вероятностей возможных внешних условий, в каких окажется его компания. В случае когда вероятность состояний объективных условий неизвестна, в соответствие с критерием Байеса-Лапласа нужно исходить из их равновозможности. То есть при отсутствии основания для иного надо предполагать равенство вероятностей возникновения условий, приводящих к каждому из возможных результатов. Применение этого критерия позволяет свести задачу к варианту с полной информацией состояния объективных условий, условия неопределенности становятся аналогичными условиям риска.

При втором подходе, когда степень неопределенности слишком высока, то руководитель предпочитает не делать допущений относительно вероятностей различных внешних условий. Применяя данный подход для оценки предполагаемых стратегий возможны следующие критерии решения:

· критерий крайнего оптимизма;

· критерий Вальда, называемый также максимином;

· альфа-критерий Гурвица;

· критерий Сэвиджа, называемый также критерием отказа от минимакса.

Выбор критерия предопределяется конкретными обстоятельствами, а также субъективными психологическими особенностями, темпераментом и общее мировоззрением руководства фирмы (оптимистические или пессимистические; консервативные или прогрессивные). Рассмотрим эти критерии на следующем примере.

Пример 4.Для реализации по цене 50 руб. за 1 ед. закупается некоторое количество скоропортящегося продукта по цене 30 руб. за единицу. Из наблюдений известно, что реализация продукта может произойти на уровне 1 ед., 2 ед., 3 ед. и 4 ед. Если продукт за день не продан, то в конце дня он продается по сниженной цене 20 руб. за единицу. Нужно определить, сколько еди­ниц должен закупать менеджер для того, чтобы его решение было опти­мальным в соответствии с разными критериями оптимальности.

При продаже каждой единицы продукта будет получена прибыль в разме­ре 20 руб. (50 -30). При продаже каждой единицы закупленного продукта по сниженной цене убыток от реализации составит 10 руб. (30 - 20).

Составим табл. 8.5, иллюстрирующую возможные результаты торгов­ли.

Таблица 8.1.Возможные доходы при разных вариантах развития событий

Возможный вариант закупки, ед.
-10

По горизонтали расположим возможные варианты спроса на продук­цию за день, по вертикали - возможные варианты решения ЛПР о закуп­ках продукции. В каждой клетке таблицы рассчитаем прибыль (со знаком «плюс») или убыток (со знаком «минус») от операций реализации.



Критерий крайнего оптимизма диктует менеджеру страте­гию действий, при которой он получает возможность зарабо­тать максимальный доход. Это случится, если менеджер закупит максимально возможное количество продукции и всю ее реали­зует в течение дня:

4 х (50 - 30) = 80 (руб.).

Такая стратегия и наиболее рискованная, потому что в слу­чае минимальных продаж (1 ед.) менеджер получит и макси­мальный убыток:

1 х (50 - 30) + 3 х (20 - 30) = -10 (руб.).

Критерий решения Вальда - критерий крайнего пессимизма предпола­гает наиболее осторожную стратегию поведения, гарантирую­щую максимизацию минимального дохода. Например, минимальный до­ход при различных вариантах закупок может составить 20, 10, 0 или -10 руб. Если менеджер закупит 1 ед. продукции, то мини­мальный выигрыш в размере 20 руб. ему гарантирован.

Этот критерий ориентирует лицо, принимающее решение, на наихудшие условия и рекомендует выбрать ту стратегию, для которой выигрыш максимален. В других, более благоприятных условиях использование этого критерия приводит к потере эффективности системы или операции. Поскольку критерий консервативен, он особенно хорошо подходит для мелких коммерческих фирм, выживание которых зависит от способности избежать убытков.

Критерий Сэвиджа , известный также под названием «дикий принцип», принцип для просчетов, критерий минимаксного риска, принцип минимакса последствий ошибочных решений и т.д. Критерий Сэвиджатакже пессимистический , но при выборе оптимальной стратегии в со­ответствии с ним следует ориентироваться не на доход, а на воз­можные потери с учетом упущенной выгоды.

Данные о возмож­ных потерях представим в табл. 8.2.

Таблица 8.2. Возможные потери при различных вариантах развития событий

Возможный вариант спроса, ед. Возможный вариант закупки, руб.

Как видно из табл. 8.2, при покупке 2 ед. и продаже 1 ед. по цене реализации, вторую мы реализуем по сниженной цене, те­ряя 10 руб. При покупке 2 ед. и спросе в 3 ед. 2 ед. мы реализуем по обычной цене, при этом теряя упущенную выгоду от отсутст­вия 1 ед. продукта в размере 20 руб.

Максимальные потери при каждом из вариантов закупок со­ставят 60, 40, 20 и 30 руб. Руководствуясь критерием Сэвиджа, необходимо выбрать из них минимальное значение 20 руб. и за­купать 3 ед. продукции.

В соответствии с этим критерием, если требуется в любых условиях избежать большого риска, то оптимальным будет то решение, для которого риск, максимальный при различных вариантах условий, окажется минимальным. Руководитель при использовании критерия Сэвиджа явно отказывается от попыток максимизировать отдачу, выбирая стратегию с удовлетворительной отдачей при более низком риске. Критерий Сэвиджа, следовательно, особенно полезен для оценки серии проектов на протяжении длительного периода.

Критерий Гурвица (пессимизма-оптимизма – этокомпро­миссный способ принятия решений в условиях неопределенно­сти. Для каждой из возможностей - получение максимального дохода и минимального дохода - определяется вероятность ее наступления. Сумма вероятностей двух вариантов должна быть равна единице. Затем вычисляется значение целевой функции как суммы произведений каждого результата на вероятность его достижения. Значения максимального и минимального доходов взяты из табл. 8,1. Расчеты представим в табл. 8.3.

Таблица 8 .3. Расчет значений целевой функции

Допустим, экспертным путем определено, что вероятность получения максимального дохода - 0,7, минимального дохо­да - 0,3. Тогда для решения закупать 2 ед. продукции значение целевой функции будет равно

0,7 х 40 + 0,3 х 10 = 31 (руб.)

Максимальное значение целевой функции 53 руб. достига­ется при выборе решения закупать 4 ед. продукции. Это реше­ние и будет оптимальным согласно критерию Гурвица. Относи­тельность такого выбора определяется степенью объективности при оценке вероятностей разных исходов.

Дерево решений. В управленческой практике нередко возникают ситуации, когда принятие одного решения ставит менеджера или соб­ственника компании перед следующим выбором. Когда нуж­но принять несколько решений в условиях неопределенности и при этом каждое следующее решение зависит от предыдуще­го, для решения такой задачи применяют схему, называемую де­ревом решений.

Дерево решений - это графическое изображение процес­са принятия решений, в котором отражены альтернативные решения и состояния среды, соответствующие вероятности, и «выигрыши» для любых комбинаций решений и состояний среды.

Построение и анализ «дерева решения» прием­лемы в любом случае, если последовательный ряд обусловленных решений принимается в условиях риска. Под обусловленным решени­ем имеется в виду решение, которое зависит от обстоятельств или опционов, появляющихся позднее. Построение «дерева решения» начинается с самого первого, или изначального, решения и продвигается вперед по времени через ряд последовательных событий и решений. При каждом решении или событии у этого «дерева» появляются ответвления, которые показы­вают каждое возможное направление действия до тех пор, пока, на­конец, все логические последовательности и вытекающие из них отдачи будут вычерчены.

Критерий максимакса (крайнего, «розового» оптимизма) основан на оптимистическом принципе Л. Гурвица, согласно которому выбирается вариант, обеспечивающий наибольший эффект в самой благоприятной ситуации.

Если матрицу последствий (3.1) рассматривать как матрицу эффекта Е,

Данный критерий соответствует стратегии 1 (см. рис.3.6), его целесообразно применять в тех случаях, когда имеется возможность повлиять на противоположную сторону, чтобы сделать более благоприятной неконтролируемую внешнюю среду, и реализовать возможности оптимального использования управляемых внутренних факторов.

Пример 3.3. Принимая матрицу последствий в примере 3.2 за матрицу эффектов выбрать вариант решения по критерию максимакса.

1. Исходные данные вводятся в Excel (рис.3.9). Затем, используя функцию МАКС для ячеек (B4:F4;…; B7:F7), последовательно находятся максимальные значения по каждому решению : a 1 =8, a 2 =12, a 3 =10, a 4 =8 .

Рис. 3.9. Результаты выбора оптимального решения по критерию максимакса

2. Из последовательности найденных максимальных значений a i (G4:G7) с помощью функции МАКС (ячейка G8) выбирается наибольшее значение: a 2 =12 , с учетом этого рекомендуется принять второе решение.

Если элементами матрицы A (3.1) являются затраты З, то их можно рассматривать как потери и тогда решение обеспечивающее наименьшие затраты выбирается из условий минимизации затрат:

. (3.10)

Критерий минимина (пессимизма)основан на пессимистическом принципе, согласно которому в условиях неблагоприятной внешней среды управляемые факторы могут быть использованы небла­гоприятным образом. Тогда, если матрица последствий является матрицей эффекта Е, то эффективное решение выбирается из условий обеспечения максимума:

. (3.11)

В реальных условиях не всегда возможен контроль за неконтролируемыми факторами внешней среды, особенно когда необходимо учитывать фактор времени. Например, при долгосрочном прогнозировании и планировании; проектировании сложных объектов и др. Или например, издержки производства являются контролируемыми факторами на коротких интервалах времени и неконтролируемые в долгосрочной перспективе, поскольку заранее неизвестны стоимость электроэнергии, стоимость материалов и покупных изделий и т.п. Еще одним примером является определение объемов производства продукции предприятия (управляемый фактор), которые зависят от разных факторов связанных с процессом производства. Эти факторы относятся к внутренней среде предприятия: уровень конструкторской и технологической подготовки производства, тип используемого обо­рудования, квалификация работающих и пр.

Этому критерию соответствует стратегия 2 (см. рис.3.6).

Пример 3.4. Принимая матрицу последствий в примере 3.2 за матрицу эффектов выбрать вариант решения по критерию минимина.

1. Исходные данные вводятся в Excel (рис.3.10). Затем, используя функцию МИН для ячеек (B4:F4;…; B7:F7), последовательно находятся минимальные значения по каждому i -му решению : .


Рис. 3.10. Результаты выбора оптимального решения по критерию минимина

3. Из последовательности найденных минимальных значений a i (G4:G7) с помощью функции МИН (ячейка G8) выбирается наименьшее значение: a 4 =1 , с учетом этого рекомендуется принять четвертое решение.

При анализе матрицы затрат критерий пессимизма принимает следующий вид

(3.12)

Критерий максимина (крайнего пессимизма) основан на пессимистическом принципе А. Вальда, согласно которому выбирается тот вариант, результат которого оказывается самым благоприятным среди наименее благоприятных.

Если ожидаемая ситуация будет складываться неблагоприятно, т.е. принесет самый малый доход: a i = min a i j , то выбирается такое решение, для которого минимальный (гарантированный) доход окажется наибольшим

. (3.13)

Данный критерий является консервативным, поскольку предлагает выбор с осторожной линией поведения, поэтому его целесообразно использовать в тех случаях, когда необходимо обеспечить успех при любых возможных условиях. В матрице решений (рис. 3.6) критерий Вальда соответствует стратегии 3.

Пример 3.5. Для матрицы последствий в примере 3.2 выбрать вариант решения по критерию максимина.

1. По каждому i –му альтернативному решению, используя функцию МИН находятся минимальные значения : a 1 =2, a 2 =2, a 3 =3, a 4 =1 (см. рис. 3.11, ячейки G4:G7)

Рис. 3.11. Результаты выбора оптимального решения по критерию максимина

2. С помощью функции МАКС из последовательности найденных минимальных значений a i (G4:G7) выбирается максимальное a 3 = 3 (ячейка G8).

3. Согласно правилу Вальда (3.11) предпочтение следует отдать третьему варианту решения (i=3 ), с максимально гарантированным результатом (выигрышем) независимо от варианта ситуации (внешних условий).

Критерий минимакса (минимаксного риска, ожидания убытков) основан на принципе разочарования Л. Сэвиджа. Согласно этому принципу, выбирается вариант, при реализации которого максимально возможное разочарование (разность между максимально возможным результатом и результатами, которые можно получить по каждому из оставшихся вариантов) оказывается наименьшим.

Здесь ориентируются на худшую ситуацию, которая сопряжена с наибольшим риском. При выборе решения используется матрица рисков R (3.5). Лучшим считается вариант решения, при котором максимальное значение риска будет наименьшим:

. (3.14)

При принятии инвестиционных решений в условиях неопределенности с ориентацией на наихудшие исходы применяются пессимистический критерий (максимина) и критерий разочарования (минимакса).

Данный критерий используется в тех случаях, когда требуется в любых условиях избежать большого риска, он соответствует стратегии 4 (рис. 3.6).

Пример 3.6. По матрице последствий в примере 3.2 выбрать вариант решения по критерию минимакса.

1. Предварительно по матрице последствий примера 2, используя выражение (3.4), рассчитываются элементы матрицы риска рис. 3.12.

2. В каждой строке матрицы рисков с помощью функции МАКС выбирается ее максимальный элемент (ячейки G4:G7): r i = : r 1 = 8, r 2 = 6, r 3 = 5, r 4 = 7.

Рис. 3.12. Результаты выбора оптимального решения по критерию минимакса

3. Согласно правилу Сэвиджа из этих величин выбирается наименьшая (функция МИН в ячейке G8): r 3 = 5, т.е. следует принять 3-е решение (i=3 ). Выбор этого варианта означает, что максимальные потери при различных вариантах ситуации окажутся минимальными и не превысят 5 единиц.

Критерий Гурвица обобщенного максимина (пессимизма-оптимизма) предполагает выбор смешанной стратегии , когдав определенной пропорции сочетаются пессимизм (осторожность) и оптимизм (склонность к значительному риску), т.е. выбирается промежуточное решение между линией поведения в расчете на худшее и линией поведения в расчете на лучшее.

По данному критерию выбирается вариант решения, при котором достигается максимальный показатель G , определяемый из выражения:

G i = max [a min a i j + (1 - a) max a i j ]. (3.15)

где а ij – выигрыш при i -м решении при j -м ва­рианте обстановки,

a – коэффициент, отражающий степень оптимизма (0 ≤ a ≤ 1 ): при a = 0 выбирается линия поведения в расчете на лучшее, т.е. делается ориентация на предельный риск (получаем максимаксный критерий); при a = 1 делается ориентация на худшее, тогда получаем критерий Вальда - ориентир на осторожное поведение. Промежуточные значения a между 0 и 1 и выбираются в зависимости от конкретной обстановки и склонности к риску лица, принимающего решение.

Пример.3.7. Предприятие готовится выпускать новые виды продукции, при этом возможны четыре варианта решений Q 1 , Q 2 , Q 3 , Q 4 , каждому из которых соответствует определенный вид продукции или их сочетание. Структуру спроса на продукцию характеризуют три варианта обстановки S 1 , S 2 , S 3 . Эффективности выпуска новых видов продукции а i j длякаждой парысочетаний решений Q i (i=1,2,…,m ) и обстановке S j (j=1,2,…,n ) приведены в таблице на рис.3.12. Необходимо по критерию Гурвица найти наиболее выгодное решение Q i и оценить влияние коэффициента оптимизма на выбор решения.

1. Зададимся последовательностью коэффициентов k с шагом 0,25: 0; 0,25; 0,50; 0,75; 1,00 и введем исходные данные на рабочий лист Excel, рис. 3.12.

2. Результаты расчета показателя G по выражению (3.13) для различ­ных вариантов решений в зависимости от величины коэффици­ента k приведены в нижней таблице рис.3.13.

Рис. 3.13. Исходные данные, расчетные формулы и результаты расчета критерия Гурвица (стрелки показывают эффективные решения)

Как видно из рисунка (ячейки В18:F18), изменение коэффициента k влияет на выбор вари­анта решения, которому стоит отдать предпочтение.

Выбор того или иного критерия зависит от ряда факторов:

Характера решаемой задачи;

Поставленных целей,

Совокупности ограничений,

Склонности к риску лиц, принимающих решение.

Следует отметить, что рассмотренные способы и приемы решения задач в условиях риска и неопределенности не ограничиваются перечисленными методами. В зависимости от конкретной ситуации в процессе анализа могут использоваться и другие методы, например, использование среднеквадратического отклонения и коэффициента вариации как меры риска.

Принятие решений в условиях неопределённости

1. Максиминный критерий Вальда.

2. Критерий Сэвиджа (минимаксного риска).

3. Критерий Гурвица (пессимизма-оптимизма).

1. Максиминный критерий Вальда (критерий крайнего пессимизма)

(«рассчитывай на худшее»)

В группу критериев выбора оптимальной стратегии статистика, применяемых при неизвестных априорных вероятностях состояний природы , входят критерии Вальда, Сэвиджа и Гурвица . Они используют анализ платежной матрицы либо матрицы рисков.

Если распределение вероятностей будущих состояний природы неизвестно , то вся информация о природе сводится к перечню ее возможных состояний .

Максиминный критерий Вальда – это критерий крайнего пессимизма, или критерий осторожного наблюдателя. Его можно сформулировать как для чистых, так и для смешанных стратегий.

Критерий Вальда является критерием крайнего пессимизма , так как статистик предполагает, что природа реализует такие состояния, при которых величина его выигрыша принимает наименьшее значение.

Критерий тождественен максиминному (пессимистическому) критерию, используемому при решении матричных игр в чистых стратегиях.

Из каждой строки выбираются минимальные элементы, т.е. которые соответствуют наихудшему результату ЛПР при известных состояниях «природы» . Затем выбирается стратегия ЛПР, соответствующая максимальному элементу из отобранных минимальных :

. (1)

Выбранные таким образом варианты полностью исключают риск, поскольку ЛПР не может столкнуться с худшим результатом, чем тот, на который он ориентируется.

Применение данного критерия оправданно, если ситуация, в которой принимается решение, характеризуется следующими признаками:

    вероятности состояний «природы» неизвестны;

    решение реализуется только один раз или малое количество раз;

    полная недопустимость риска.

Таким образом, оптимальной по критерию Вальда считается чистая стратегия , которая в наихудших условиях гарантирует максимальный выигрыш. Значит, оптимальной будет максиминная чистая стратегия , а максимальным выигрышем – нижняя чистая цена игры в парной игре с нулевой суммой.

Пример 1.

Игра "Поставщик".

Выпуск продукции фирмы существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед.

Если поставка не прибывает в срок, фирма теряет 400 ед. от недовыпуска продукции.

Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем.

Можно увеличить вероятность получения материала до 80%, если предварительно послать своего представителя, но расходы увеличатся еще на 50 ед.

Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его количество на складе превысит допустимую норму, равную одной партии.

Какой стратегии должен придерживаться завод в сложившейся ситуации?

Решение

У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транспорт, 3) послать к поставщику представителя и транспорт, 4) купить и привезти материал-заменитель от другого поставщика.

Составим таблицу расчетов:

Затраты и убытки фирмы-изготовителя

Ситуация

Стоимость материала

Недовыпуск продукции

Транспорт

Командировочные расходы

Издержки хранения

Общая сумма

Решение

На основе полученных результатов вычислений можно составить платежную матрицу:

Ответ . Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транспорт.

1 . Рассмотренный способ поиска оптимального решения есть критерий Вальда (максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:

ед.

Применяя этот критерий мы представляем на месте природы активного и злонамеренного противника. Это пессимистичный подход .

2. Максимаксный критерий . Самый благоприятный случай:

ед.

Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма .

Критерий Вальда для смешанных стратегий

Оптимальной считается та смешанная стратегия статистика , при которой минимальный средний выигрыш будет максимальным: . (2)

Критерий Вальда ориентируют статистика на самые неблагоприятные состояния природы, то есть выражают пессимистическую оценку ситуации.

2. Критерий Сэвиджа (минимаксного риска )

На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям , если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем в 1954 году и получил название принципа Сэвиджа . Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.

По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения , по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.

При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.

Для решения задачи строится так называемая «матрица рисков », элементы которой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального варианта решения.

Напомним, что Риском игрока при выборе стратегии в условиях (состояниях) природы называется разность между максимальным выигрышем, который можно получить в этих условиях, и выигрышем, который получит игрок в тех же условиях, применяя стратегию .

Критерий Сэвиджа – это критерий минимаксного риска, минимизации «сожалений». Этот критерий, как критерий Вальда, является максимально осторожным и пессимистическим.

В критерии Сэвиджа пессимизм проявляется по-другому: худшим считается не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, что можно было бы достичь в данных условиях (максимальный риск).

Критерий Сэвиджа ориентируется не на результат, а на риск (потери или штрафы) .

В качестве оптимальной выбирается стратегия, при которой величина потерь в наихудших условиях минимальна. Критерий Сэвиджа рекомендует выбирать в качестве оптимальной ту стратегию, которая минимизирует максимальный риск:

. (3)

Требования , предъявляемые к ситуации, в которой принимается решение по критерию Сэвиджа, совпадают с требованием к использованию критерия Вальда. Критерий Сэвиджа, как и критерий Вальда, ориентирует статистика на самые неблагоприятные состояния природы.

Пример 2. Для задачи «Поставщик» минимакс риска достигается сразу при двух стратегиях А 2 и А 3:

Найти оптимальное решение игры , применяя критерий Сэвиджа.

Решение.

Ориентируемся на самые неблагоприятные состояния «природы». Вычислим риски статистика .

Для первого столбца:

Для второго столбца:

Для третьего столбца:

Запишем матрицу рисков .

Стратегии статистика

Определим в каждой строке наибольшее число – наибольший риск статистика , если он применяет стратегию , а природа меняет свои состояния , , . Дополним матрицу рисков последним столбцом «наибольшие риски».

Матрица рисков и наибольшие риски

Стратегии статистика

Наибольшие риски

Найдем наименьший риск: .

Значит, оптимальной стратегией по критерию Сэвиджа является стратегия .

4.3. Критерий Гурвица (пессимизма-оптимизма)

Критерий Гурвица – критерий обобщенного максимума, или пессимизма-оптимизма.

Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы.

Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей.

Этот критерий обеспечивает промежуточное решение между крайним оптимизмом и крайним пессимизмом , которое определяется по принципу:

. (4)

Число () - степень оптимизма , удовлетворяет условию и выбирается из субъективных соображений, особенностей среды, здравого смысла, исходя из опыта ЛПР, его отношения к риску и т.п. На выбор значения степени оптимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень оптимизма  ближе к нулю.

Для каждой строки рассчитывается среднее взвешенное (с учетом выбранного значения ) наименьшего и наибольшего результатов, после чего выбирается строка с максимальным значением .

При имеем критерий крайнего оптимизма , т.е. отражает позицию азартного игрока, ожидающего наиболее благоприятное состояние среды.

При критерий Гурвица превращается в критерий крайнего пессимизма Вальда.

Если 0 промежуточное отношение ЛПР к возможным рискам. При желании подстраховаться в данной ситуации принимают близким к единице.

Выбор значения субъективен, а, следовательно, субъективен и выбор решения, что совершенно неизбежно в условиях неопределенности.

Чем опаснее ситуация, тем больше ЛПР стремится застраховать себя от возможных рисков , тем ближе к 0. А чем менее он азартен, тем ближе к 1.

Оптимальная по Гурвицу стратегия должна гарантировать статистику больший выигрыш по сравнению с выигрышем, принимаемым статистиком интуитивно или исходя из опыта.

Применение критерия Гурвица оправданно, если ситуация, в которой принимается решение, характеризуется признаками :

    вероятности состояний природы неизвестны;

    решение реализуется малое количество решений;

    допускается некоторый риск.

Пример 3. Найти оптимальное решение статистической игры, заданной платежной матрицей, применяя критерий Гурвица.

Решение.

Для применения критерия Гурвица нужно знать значение вероятности . Пусть, например, . Это означает, что событие «наименьший возможный выигрыш статистика » желаем сделать более правдоподобным ( близко к единице), то есть страхуемся от неблагоприятных ситуаций в игре. Тогда

.

Запишем все промежуточные результаты в таблицу.

Из последнего столбца таблицы видно, что максимальное значение равно (–7,2) и соответствует чистой стратегии ; она и будет оптимальной по критерию Гурвица.

Анализ практических ситуаций проводится по нескольким критериям одновременно , что позволяет глубже исследовать суть явления и выбрать наиболее обоснованное управленческое решение . В качестве оптимальной на основании совокупных исследований берется та стратегия, которая чаще других называлась оптимальной по всем критериям.

Выбор критерия (как и выбор принципа оптимальности) является наиболее трудной и ответственной задачей в теории принятия решений. Однако конкретная ситуация никогда не бывает настолько неопределенной, чтобы нельзя было получить хотя бы частичной информации относительно вероятностного распределения состояний природы. В этом случае, оценив распределение вероятностей состояний природы, применяют метод Байеса-Лапласа, либо проводят эксперимент, позволяющий уточнить поведение природы.

Контрольные вопросы

    Что понимается под играми с природой?

    Какими критериями пользуется статистик для определения своей оптимальной стратегии в условиях неопределенности?

    Что понимается под риском игрока?

    Поясните принципы использования моделей теории игр в экономических задачах в условиях неопределенности (игры с природой).

  1. ус­ловиях неопределённости , использующий аппарат нечёткой...
  2. Принятие решений в условиях неопределенности (5)

    Реферат >> Государство и право

    Ситуацией риска, а для другого – неопределённости . Риск принятия наихудшего решения в условиях , когда известны все исходные... потому, что в процессе принятия решений приходится осуществлять выбор в условиях неопределённости .. Процедуры и методы системного...

  3. Принятие управленческих решений в условиях риска и неопределенности

    Реферат >> Менеджмент

    ... Принятие управленческих решений в условиях риска и неопределенности. План: Введение. Источники и виды неопределенности. Принятие решений в условиях неопределённости ... и виды неопределенности. Принятие

Одним из важнейших условий принятия эффективного решения, направленного на достижение цели во временной перспективе, является наличие соответствующего объема релевантной информации. Неполная информация, невозможность достоверного предсказания будущих событий и факторов, могущих повлиять на результат, к которому приводит принимаемое решение, являются признаками неопределенности. Достаточно большая часть управляющих решений принимается в условиях неопределенности. Потенциал неопределенности - внешняя среда организации.

Принятие решений в условиях неопределенности связывается с понятием риска и производится с помощью методов исследования операций и теории статистических решений. В общем виде задача принятия решения в условиях неопределенности представляется в виде таблицы эффективности (табл.1).

Таблица1.

О 1 О 2 ... O n
p 1 a 11 a 12 ... a 1 n
p 2 a 21 a 22 ... a 2 n
... ... ... ... ...
p m a m1 a m2 ... a mn

где O n - условия обстановки, которые точно неизвестны, но о которых можно сделать n-предложений (спрос, количество поставщиков, удовлетворенность материалами);

P m -возможные стратегии, линии поведения решения.

Каждой паре стратегии и обстановки, соответствуют выигрыши -A mn .

Выигрыши, указанные в таблице, являются рассчитанными показателями эффективности стратегии (решения) в различных обстановках.

Представленная задача направлена на принятие решений при разработке планов развития предприятий, разработке производственных программ, планов выпуска новых видов продукции, направленности инноваций, выбора стратегий страхования, инвестиции, средств и т.д.

В теории статистических решений применяется специальный показатель риска, который показывает выгодность принимаемой стратегии в данной обстановке с учетом ее неопределенности. Риск рассчитывается как разность между ожидаемым результатом действий при наличии точных данных обстановки и результатом, который может быть достигнут, если эти данные неопределенны. По этой разности рассчитывается таблица рисков выпуска нового вида продукции. Таблица рисков дает возможность оценить качество различных решений и установить полноту реализации возможностей при наличии риска. Выбор наилучшего решения зависит от степени неопределенности.

В зависимости от степени неопределенности обстановки различают 3 варианта принятия решений:

1. Выбор оптимального решения, когда вероятности возможных вариантов обстановки известны. Оптимальное решение определяется по max сумм произведений вероятностей различных вариантов обстановки P(O 1) на соответствующие значения выигрышей А (таблица 6 эффективности) по каждому решению.

2. Выбор оптимального решения, когда вероятности возможных вариантов обстановки неизвестны.

3. Выбор оптимального решения по принципам подхода к оценке результата действий.

В условиях неизвестной вероятности обстановки возможно принятие следующих решений:

а) max-min или “рассчитывай на худшее“ - выбор решения, гарантирующий выигрыш в любых условиях, не меньше, чем наибольший возможный в худших условиях;

б) min max риск в любых условиях. За оптимальное принимается решение, для которого риск, max при различных вариантах обстановки, кажется минимальным.

За оптимальное решение в зависимости от линии ориентации ЛПР принимается решение, для которого показатель G (критерий пессимизма - оптимизма Гурвица) окажется максимальным:

где - минимальный выигрыш, соответствующий решению m;

Максимальный выигрыш, соответствующий решению m;

k - коэффициент, характеризующий линию поведения (ориентации) ЛПР, .

Графически значение k по отношению к линии поведения можно интерпретировать следующей схемой:

значение k


0 0,25 0,5 0,75 1

Линия ориентации в расчете

на лучшее на худшее

Задача:

Предлагается 3 варианта вложения инвестиций:

1) Вложить все имеющиеся средства в акции компании “Нефть-АГ”, что гарантирует высокий доход при соответствующей обстановке;

2) Вложить все средства в ГКО при гарантии низкого и стабильного дохода;

3) Вложить часть средств в акции “Нефть-АГ”, часть в ГКО - т.е. произвести диверсификацию портфеля средств.

Перспектива обозначена тремя вариантами обстановки (исхода событий).

Принять решение по проблеме вложения инвестиций, имея в качестве исходных данных таблицу выигрышей (табл.2).

Таблица 2.

Pi/Oi O 1 O 2 O 3
P 1 0.99 0.1
P 2 0.5 0.5 0.3
P 3 0.25 0.7 0.4

P i - вариант решения;

O i - вариант обстановки;

O 1 - компания “Нефть-АГ” - обанкротилась, ГКО - приносит стабильный доход.

O 2 - компания ”Нефть-АГ” - процветает;

O 3 - кризис в экономике.

Определим оптимальное решение, при котором выигрыш в любых условиях будет не меньше, чем наибольший возможный в худших условиях (max-min).

Из табл. 2 для решения P 1 наименьший выигрыш составит 0, для P 2 - 0.3, для P 3 - 0.25.

Наибольший возможный выигрыш при самом плохом стечении обстоятельств составит 0.3, что соответствует принятию решения P 2 , т.е. при любых вариантах обстановок решение P 2 будет не самым худшим.

Оптимальное решение при условии, что риск окажется минимальным из максимальных его значений при различных вариантах решений определяется из табл.7. Предварительно рассчитывается матрица рынков. При этом максимальный риск при принятии решения P 1 - 0.5; при P 2 - 0.49; при P 3 - 0.29. Из ряда максимальных рисков за оптимальное принимается решение P 3 , имеющее минимальный уровень риска 0,29.

Рассчитаем критерий пессимизма - оптимизма Гурвица для различных вариантов решений в зависимости от значения принятого коэффициента k.

Для решения P 1

Решение:

Рассчитаем матрицу рисков вложения инвестиций (табл.3).

Таблица3.

Pi/Oi O 1 O 2 O 3
P 1 0.5-0=0.5 0.99-0.99=0 0.4-0.1=0.3
P 2 0.5-0.5=0 0.99-0.5=0.49 0.4-0.3=0.1
P 3 0.5-0.25=0.25 0.99-0.7=0.29 0.4-0.4=0

При условии равновероятности обстановок их вероятности равны и составляют:

P(O 1)=P(O 2)=P(O 3)=0.33

Математически ожидания выигрышей при условии равновероятности обстановок определятся из выражения:

W i =P(O i)*A ij ,

где P(O i)-вероятность будущей обстановки;

A ij -выигрыш, соответствующий i-ому решению при j-той обстановке.

W 1 =0.33*0+0.33*0.99+0.33*0.1=0.3597

W 2 =0.33*0.5+0.33*0.5+0.33*0.3=0.329

W 3 =0.33*0.25+0.33*0.7+0.33*0.4=0.445

В условиях равновероятности будущих обстановок наиболее оптимальным является решение P 3.

При других значениях вероятностей обстановок решение может быть другим.

Выбор решения по критерию Гурвица:

для решения P 1: G 1 =0,495;

для решения P 2: G 2 =0,5*0,3+(1-0,5)*0,5=0,4;

для решения P 3: G 3 =0,5*0,25+(1-0,5)*0,7=0,475.

При k=0,5 за оптимальное принимается решение P 1 .

Аналогично рассчитываются значения G i при других значениях коэффициента.

Полученные значения G i сводим в таблицу 4.

Таблица4.

G i при заданных k i
P i /k i 0.00 0.25 0.5 0.75 1.00
P i 0.99 0.743 0.495 0.362
P 2 0.5 0.45 0.4 0.35 0.3
P 3 0.7 0.587 0.475 0.362 0.25
Выбранное решение P 1 P 1 P 1 P 1 P 3 P 2

Лицо, принимающее решение в соответствии с выбранным k i за оптимальное принимает решение, имеющее максимальное значение G i . При k i =0,75 - G max =0,362. За оптимальное принимается решение Р 1 или Р 3 .