Понятие о нижней и верхней цене игры. Решение игры в чистых стратегиях

Запись матричной игры в виде платежной матрицы

Рассмотрим конечную игру, в которой первый игрок имеет стратегий, а второй игрок – стратегий. Такая игра называется игрой . Обозначим стратегии ; и . Предположим, что каждая сторона выбрала определенную стратегию: или . Если игра состоит только из личных ходов, то выбор стратегий однозначно определяет исход игры – выигрыш одной из сторон . Если игра содержит кроме личных случайные ходы, то выигрыш при паре стратегий и является случайной величиной, зависящей от исходов всех случайных ходов. В этом случае естественной оценкой ожидаемого выигрыша является математическое ожидание случайного выигрыша, которое также обозначается как .

Предположим, что нам известны значения при каждой паре стратегий. Эти значения можно записать в виде матрицы, строки которой соответствуют стратегиям , а столбцы –стратегиям .

Тогда, в общем виде матричная игра может быть записана следующей платежной матрицей:

Таблица 1 – Общий вид платежной матрицы матричной игры

       
       
       
       
       

где – названия стратегий игрока 1, – названия стратегий игрока 2, – значения выигрышей игрока 1 при выборе им –й стратегии, а игроком 2 – -й стратегии. Поскольку данная игра является игрой с нулевой суммой, значение выигрыша для игрока 2 является величиной, противоположенной по знаку значению выигрыша игрока 1.

Каждый из игроков стремится максимизировать свой выигрыш с учетом поведения противодействующего ему игрока. Поэтому для игрока 1 необходимо определить минимальные значения выигрышей в каждой из стратегий, а затем найти максимум из этих значений, то есть определить величину

 

или найти минимальные значения по каждой из строк платежной матрицы, а затем определить максимальное из этих значений. Величина называется максимином матрицы или нижней ценой игры. Та стратегия игрока, которая соответствует максимину называется максиминной стратегией.

Очевидно, если мы придерживаться максиминной стратегии, то при любом поведении противника гарантирован выигрыш, не меньший . Поэтому величина – это тот гарантированный минимум, который можно обеспечить, придерживаясь наиболее осторожной стратегии.

Величина выигрыша игрока 1 равна, по определению матричной игры, величине проигрыша игрока. Поэтому для игрока 2 необходимо определить значение

 

или найти максимальные значения по каждому из столбцов платежной матрицы, а затем определить минимальное из этих значений. Величина называется минимаксом матрицы, верхней ценой игры или минимаксным выигрышем. Соответствующая выигрышу стратегия противника называется его минимаксной стратегией. Придерживаясь своей наиболее осторожной минимаксной стратегии, противник гарантирован, что в любом случае он проиграет не больше .

В случае, если значения и не совпадают, при сохранении правил игры (коэффициентов ) в длительной перспективе, выбор стратегий каждым из игроков оказывается неустойчивым. Устойчивость он приобретает лишь при равенстве . В этом случае говорят, что игра имеет решение в чистых стратегиях, а стратегии, в которых достигается – оптимальными чистыми стратегиями. Величина называется чистой ценой игры

Например, в матрице:

 

 

Таблица 2 – Платежная матрица, в которой существует решение в чистых стратегиях

           
 
 
 
   

существует решение в чистых стратегиях. При этом для игрока 1 оптимальной чистой стратегией будет стратегия , а для игрока 2 – стратегия .

В матрице решения в чистых стратегиях не существует, так как нижняя цена игры достигается в стратегии и ее значение равно 12, в то время как верхняя цена игры достигается в стратегии и ее значение равно 13.

Таблица 3 – Платежная матрица, в которой не существует решения в чистых стратегиях