ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ИГР

ОСНОВЫ ТЕОРИИ ИГР

Аппарат теории игр предназначен для выбора оптимального решения в условиях неопределенности, т. е. в ситуациях, когда отсутствует полная информация, необходимая для выбора решения.

Первые работы по теории игр относятся к началу ХХ в. Основателем теории игр является американский ученый–математик Дж. фон Нейман, который в 1928 г. доказал основополагающую теорему теории игр – теорему о минимаксе.

Определенную роль в развитии теории игр сыграло создание и совершенствование ЭВМ.

Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие интуитивно вкладывается такой смысл: стратегия игрока является оптимальной, если применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i (i =) определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2:аij (i = ), т.е. определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i-ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i = iо, при которой этот минимальный выигрыш будет максимальным, т.е. находится по формуле:

аij== (7).

 

Число , определённое по формуле (7) называется нижней чистой ценой игры и показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2. Игрок 2 при оптимальном своём поведении должен стремится по возможности за счёт своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 отыскивается аij, т.е. определяется max выигрыш игрока 1, при условии, что игрок 2 применит свою j-ю чистую стратегию, затем игрок 2 отыскивает такую свою j = j1 стратегию, при которой игрок 1 получит min выигрыш, т.е. находится по формуле:

 

aij == (8).

Число , определяемое по формуле (8), называется чистой верхней ценой игры и показывает, какой максимальный выигрыш за счёт своих стратегий может себе гарантировать игрок 1. Другими словами, применяя свои чистые стратегии игрок 1 может обеспечить себе выигрыш не меньше , а игрок 2 за счёт применения своих чистых стратегий может не допустить выигрыш игрока 1 больше, чем .

Если в игре с матрицей А =, то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры n = =.

Седловая точка – это пара чистых стратегий (iо,jо) соответственно игроков 1 и 2, при которых достигается равенство = . В это понятие вложен следующий смысл: если один из игроков придерживается стратегии, соответствующей седловой точке, то другой игрок не сможет поступить лучше, чем придерживаться стратегии, соответствующей седловой точке.

Задача № 4.1.

Задана платежная матрица игры A, необходимо найти решение игры:

A=элементы aij.

Найдем стратегию действия для первого игрока, согласно условию 7–это maxmin стратегию, т.е. необходимо проанализировать столбцы матрицы A, выбрать в них минимальные элементы, а затем из этих минимальных элементов выбрать максимальный, и тем самым будет определена стратегия для 1-го игрока.

1-й игрок.

Для первого столбца, min1=3, для второго столбца– min2=1 и для третьего– min3=2. Теперь анализируем минимальные элемента на max:{3, 1, 2}=3. Таким образом, для первого игрока целесообразно действовать 1-й стратегией.

2-й игрок.

Для второго игрока по такой же схеме отыскивается наилучшее решение, только здесь необходимо считать minmax стратегию.

Для первой строки, max1=7, для второй строки max2=6 и третье– max3=8. Анализируем максимальные элементы на min:{7, 6, 8}=6. Для второго игрока целесообразно действовать 2-й стратегией.

Подведем анализ решения:

Таким образом, решение не является седловой точкой, так как верхнее значение игры не совпадает с нижним значением игры.

Задача № 4.2.

Построить ЭММ и используя программный комплекс «Блок-3» определить оптимальные стратегии в сражениях для армий А и В.

A: (3,0,7)(2,6,2)(6,1,3)(4,0,6)(1,5,4),

B: (7,0,3)(2,3,5)(6,3,1)(5,0,5)(3,6,1).

Определим план процесса решения задачи на основании теории игр.

Для определения оптимальной стратегии в сражении, необходимо определить «правило игры», т.е. сражения:

– за каждое уничтоженное подразделение дается одно очко;

– за каждую взятую высоту – одно очко;

– в случае равенства подразделений в сражении за высоту, дается 0 очков.

 

Таблица 27

Платежная матрица игры

А+ В (3,0,7) (2,6,2) (6,1,3) (4,0,6) (1,5,4) max min max
(7,0,3) –4+0+4 –3+1–3 –7+1+0 –5+0+4 –2+1+4    
–5 –6 –1
(2,3,5) +3–1+6 0+4–3 +3–2–4 +3–1+6 –2+4–5    
–3 –3  
(6,3,1) –4–1+2 –3+4+2 0–2+2 –5–1+2 –2+4+2    
–3 –4  
(5,0,5) –4+0+6 –3+1–3 +6+1–4 –5+0+6 –2+1–5    
–5 –6
(3,6,1) 0–1+2 –3+0+2 +4–2+2 +4–1+2 –2–6+2    
–1 –6  
min –3 –5 –6 –4 –6 3 –3
max min –3        

Выигрыш является седловой точкой, так как = (A(3,0,7), B(7,0,3)).

В скобках указана стратегия (три числа – три высоты, значение –количество подразделений направленных для взятия этой высоты). Целесообразно весь ход сражения записать в платежную матрицу игры(табл. 27) для полного анализа сражения.

Победы в сражениях армии А обозначаем со знаком + (плюс), армии В со знаком – (минус). В числителе результаты сражений за высоты (результаты суммируются), знаменателе – общий итог сражений за высоты, знак + означает победу армии А, знак – победу армии В.

Предположим, что цена игры положительна (n > 0). Если это не так, то всегда можно подобрать такое число с, прибавление которого ко всем элементам матрицы выигрышей даёт матрицу с положительными элементами, и следовательно, с положительным значением цены игры. При этом оптимальные смешанные стратегии обоих игроков не изменяются.

Итак, пусть дана матричная игра с матрицей А порядка . Согласно оптимальным смешанным стратегиям х = (хi, ..., хm), y = (yj, ..., yn) соответственно игроков 1 и 2 и цена игры n должны удовлетворять соотношениям.

 

(9) (10).

 

Разделим все уравнения и неравенства в (9) и (10) на n (это можно сделать, т.к. по предположению n > 0) и введём обозначения:

, ,

Тогда (9) и (10) перепишется в виде :

, , , ,

, , , .

Поскольку первый игрок стремится найти такие значения хi и, следовательно, pi , чтобы цена игры n была максимальной, то решение первой задачи сводится к нахождению таких неотрицательных значений pi , при которых

, (11).

 

Поскольку второй игрок стремится найти такие значения yj и, следовательно, qj, чтобы цена игры n была наименьшей, то решение второй задачи сводится к нахождению таких неотрицательных значений qj, , при которых

, . (12).

Формулы (11) и (12) выражают двойственные друг другу задачи линейного программирования (ЛП).

Решив эти задачи, получим значения pi , qj и n. Тогда смешанные стратегии, т.е. xi и yj получаются по формулам:

(13).

 

Для преобразования данной задачи к ЭММ ЛП, необходимо взять значение числа с равным 6 (прибавить число 6 к результатам сражений, т. е. выигрышам) и согласно (11) и (12), исходная задача будет представлена:

 

Армия А Армия В

       
   
 

 

 


Введя данные в программный комплекс «Блок-3», получим следующие решения: цена игры равна n=5,6497.

Учитывая (13) получим следующие стратегии:

 

Задача № 4.3.

Игры с природой. Планирование посевов.

Фермер планирует посеять три вида культур: А1, А2 и А3. Урожай этих культур зависит главным образом от погоды, которая может находиться в трех состояниях: В1, В2 и В3. Информация зависимости урожайности от погоды отображена в табл. 28.

Таблица 28