|
любопытной игровой задаче. Это поможет читателю уловить связь и различия
развиваемых идей с теорией игр.
Дилемма заключенного
Напомним читателю основные сведения из теории игр.
Представим себе, что в игре участвуют два игрока, каждый из которых
владеет некоторым набором «потенциальных» действий. Эти действия называют
стратегиями. Пусть ?1,.., ?n — стратегии первого игрока, ?1,..., ?m — стратегии
второго игрока. Каждый игрок получает некоторый выигрыш, который зависит от
того, какую стратегию он выбрал сам и какую стратегию выбрал его противник.
Игру задают в виде так называемой платежной матрицы, каждой строчке
которой соответствует стратегия первого игрока, а каждому столбцу — стратегия
второго игрока. В «летке матрицы, находящейся на пересечении i-й строки и j-го
столбца, записываются два числа xij и уij, соответствую-
________________________________________
1 Некоторым сильным умам удавалось почувствовать это. Вот что
писал выдающийся шахматист, математик и психолог Эммануил Ласкер свыше 50 лет
назад: «...Всякого рода бои отличаются лишь с внешней стороны. Правящие ими
законы всегда одинаковы. В этом смысле войной считается конкуренция, погоня за
правдой, красотой или счастьем; все эти виды боев похожи друг на друга, а
одновременно и на шахматную игру...» (Э. Ласкер. Философия королевской игры. См.
Ежи Гижицкий. С шахматами через века и страны. Варшава, 1958, стр, 138).
? Конец страницы 8 ?
? Начало страницы 9 ?
щие «выигрышу» первого игрока и «выигрышу» второго игрока:
Слово «выигрыш» мы заключили в кавычки, так как возможен случай, когда
игрок не получает, а платит, — тогда его «выигрыш» отрицателен. Наиболее
изученными являются игры, когда выигрыш одного игрока в точности равен
проигрышу другого. Такие игры называют играми с нулевой суммой. В играх с
нулевой суммой в платежной матрице обычно пишут одно значение. По
договоренности выигрыши игрока 1 читаются с тем знаком, с которым они входят в
матрицу, а выигрыши игрока 2 — с противоположным знаком, Например, в матрице
максимальный выигрыш игрока 1 будет при условии, если он выберет первую
стратегию, а его противник будет придерживаться второй. В этом случае игрок 2
платит игроку 1 пять единиц.
Если в игровой матрице существует значение выигрыша xij, являющееся
максимальным среди минимальных по всем строкам і и одновременно минимальным
среди максимальных по всем столбцам j, то стратегии і и j являются наилучшими
для каждого игрока с точки зрения достижения ими гарантированного результата и
подобная матрица, как говорят, имеет седловую точку. Это означает, что в
распоряжении игрока 1 нет ничего лучшего, чем ?i, а игрок 2 поступит самым
благоразумным образом, если выберет ?j. Выбранные таким образом стратегии
игроков называются минимаксными стратегиями.
? Конец страницы 9 ?
? Начало страницы 10 ?
В матрице
седловой точки нет; для игрока 1 наилучшей стратегией, точнее наилучшей из
наихудших, является ?2, для игрока 2 — ?1. Этот случай не так прост, он требует
некоторых рассуждений игроков. В самом деле, игрок 1 убежден в том, что игрок 2
выберет в соответствии с принципом минимакса стратегию ?1 так как ?1 — лучший
ответ на ?2. Но в этом случае игроку 1 лучше выбирать ?1, чем ?2. Если же игрок
2 сумеет повторить это рассуждение, то он. очевидно, выберет ?2 а не ?1. Тогда
игроку 1 следует выбрать ?2 и оба игрока будут двигаться по кругу. Выход из
этой ситуации заключается в том, что игрокам целесообразно выбирать стратегии
случайным образом. Теория игр дает рекомендации, каким образом должен
«бросаться жребий»1. Полученные в итоге стратегии называются смешанными, они
определяют наилучший исход игры для каждого игрока.
Если же теперь -мы обратимся к играм с ненулевой суммой, то характер
рассуждений, которыми по необходимости пользуются игроки, существенно
усложнится. В играх с ненулевой суммой в каждую клетку матрицы мы должны
поместить не одно, а два значения платежей: xij и уij. ЕСЛИ игрок 1 выбрал
стратегию ?i, а игрок 2 — ?j, то первый получает выигрыш xij, а второй — уij.
Естественно интерпретировать отрицательные значения выигрышей как проигрыши.
Рассмотрим платежную матрицу следующей игры:
Известна следующая интерпретация матриц такого типа, приписываемая
американскому исследователю Таккеру, утверждавшему, что эпизод этот взят из
жизни.
|
|