Меня зовут Николай Саперов, я независимый преподаватель экономики (ранее преподаватель экономики НИУ-ВШЭ). Сайт n2tutor.ru посвящен обучению школьников экономике и финансовой грамотности, подготовке абитуриентов к олимпиадам по экономике (Всероссийской олимпиаде по экономике, олимпиаде НИУ-ВШЭ Высшая проба и другим олимпиадам).

Пособие приведено на сайте в сокращенном варианте. В данном варианте не приведены тестирования, даны лишь избранные задачи и качественные задания, урезаны на 30%-50% теоретические материалы. Полный вариант пособия я использую на занятиях с моими учениками. На контент, содержащийся в данном пособии, установлено правообладание. Попытки его копирования и использования без указания ссылок на автора будут преследоваться в соответствии с законодательством РФ и политикой поисковиков (см. положения об авторской политике Yandex и Google).

6.1 Теория игр

Эта относительно молодая ветвь математики была создана в 1930е годы Джоном фон Нейманом и Оскаром Моргеншетрном. Фон Нейман был замечательным математиком, и практически в одиночку создал теорию информации и теорию игр. Его исследования во многом поспособствовали развитию вычислительной техники и появлению компьютера. Позже, в 1950-е годы большую роль в развитие теории игр внес американский математик, лауреат Нобелевской премии по экономике, Джон Нэш. История жизни Джона Нэша настолько необычна, что легла в основу фильма «Игры разума» 2001 года. В школе Нэш не любил математику, поскольку ее преподавали посредственно. Но в 14 лет к нему в руки попала книга «Творцы математики» Эрика Белла, после прочтения которой он смог доказать малую теорему Ферма. Чуть позже Нэш наткнулся на труды фон Неймана и Моргенштерна, и в 21 год он написал диссертацию по теории игр. Именно за эту работу он получил в 1994 году Нобелевскую премию по экономике.

Теория игр (game theory) изучает, каким образом выстраивают свое поведение агенты в так называемых «играх» - ситуациях, когда результат принятия решений зависит не только от поведения данного агента, но и от поведения других участников игры.
Индивид, принимая решения, может догадываться о том, как будут вести себя другие участники игры. Индивид будет принимать решение исходя из рациональной догадки о поведении других. Говорят, что в этом случае индивид следует определённой игровой стратегии.

Игровая стратегия – это линия поведения участника в зависимости от предположений об ответных действиях других участников. Доминирующая игровая стратегия – это стратегия, при которой участник получает максимальный выигрыш при любых действиях других сторон.
Что такое игровая стратегия и доминирующая игровая стратегия лучше всего показать на конкретном примере – простейшей игре под названием «дилемма заключенного», анализ которой и положил начало теории игр.

Дилемма заключенного - это игра между двумя участниками с двумя возможными исходами и одновременными ходами.

Суть игры заключается в следующем. Представьте, что вы с напарником совершили преступление, например, ограбили банк. Полиция поймала вас обоих и теперь проводит допрос каждого из них в разных камерах. Полиция предлагает вам сделку: вы даете показания на своего напарника, и тогда выходите на свободу. Такую же сделку предлагают вашему напарнику.
Каждый из преступников имеет выбор: давать показания на напарника или молчать. Если вы оба даете показания друг на друга, то каждый получает по 2 года тюрьмы. Если вы оба молчите, то в полной мере вашу вину будет трудно доказать, и каждый получит только по 1 году. Но если вы даете показания на вашего подельника, а он нет, то вы выходите на свободу, а ваш подельник получает 5 лет тюрьмы.
Таким образом, приговор, который получит каждый преступник, зависит не только от его показаний, но и от показаний другого преступника.

То есть у Вас есть 4 варианта действий:

  1. Вы даете показания, а напарник молчит. Тогда вы выходите на свободу, а напарник садится на 5 лет.
  2. Вы даете показания, и ваш напарник дает показания. Вы оба получаете по 2 года.
  3. Вы молчите, и напарник молчит. Вы выходите на свободу через 1 год в виду недостаточности улик для более серьезного обвинения.
  4. Вы молчите, а напарник дает показания. В этом случае вы садитесь на 5 лет, а напарник выходит на свободу.
Какой вариант выберете Вы в данной ситуации?

Джон Нэш задал этот простой вопрос, и, проанализировав такую игру, пришел к выводам, которые совершили переворот во взглядах экономистов на то, как принимают решения люди при взаимодействиях друг с другом.

Ниже приведена матрица результатов для преступников в зависимости от их действий:

заключенный А
признаться не признаться
Заключенный В признаться (2;2) (5;0)
не признаться (0;5) (1;1)

В каждой клеточке сначала идет срок наказания для преступника А, потом срок наказания для преступника В.
Рассмотрим ход рассуждений каждого преступника:

Преступник А: я не знаю, как поведет себя преступник В. Если он не даст показания, то мне лучше их дать, потому что тогда я выйду на свободу. Если он будет молчать, то мне опять же лучше дать показания, потому что тогда я получу 2 года наказания, а не 5. Поэтому мне лучше дать показания вне зависимости от того, как поведет себя мой подельник.
Аналогичным образом рассуждает преступник В.
Таким образом, доминирующей игровой стратегией для каждого из них становится дача показаний. В этом случае игровое равновесие устанавливается, когда они оба признаются и получат по 2 года наказания. Данное равновесие достигается потому, что стратегия «дать показания» каждого участника является оптимальной при заданной стратегии другого участника. Достигнутое равновесие является равновесием по Нэшу.
Равновесие Нэша – равновесие, когда каждый участник игры выбирает стратегию, которая является для него оптимальной при условии, что остальные участники игры придерживаются определенной стратегии.

Нетрудно увидеть, что Нэш-равновесие не является наиболее оптимальным для участников. Если бы они оба выбрали стратегию «не признаться», то получили бы только по 1 году. В этом случае говорят, что равновесие не является Парето-оптимальным1. Если бы преступники смогли договориться заранее, то, возможно, они смогли бы достичь Парето-оптимального равновесия. Но даже в случае договоренности каждый из них имеет стимулы отступить от договоренностей и признаться, чтобы избежать наказания полностью. В этом случае эгоистические интересы каждого из участников и недоверие к напарнику заставляют преступников выбрать вариант «признаться». Согласованное поведение участников будет нерациональным с индивидуальной точки зрения каждого из участников.

Выводы Джона Нэша стали революционными. Адам Смит считал, что когда каждый член группы действует эгоистично, преследуя свои собственные интересы, это ведет к эффективному равновесному состоянию этой группы. Этот принцип был назван «невидимая рука рынка». Джон Нэш показал, что когда каждый член группы действует только в своих интересах, это не приводит к достижению максимальных интересов всей группы.
Эта идея часто иллюстрируется с помощью так называемого «парадокса блондинки». Допустим, компания холостяков отправляются вечером в бар, где за соседним столиком сидит компания молодых девушек, из которых одна является блондинкой. Каким образом компании молодых людей стоит начать знакомиться с девушками?
Если каждый из них попытается познакомиться сначала с блондинкой, то она не достанется никому. В этом случае остальные девушки (брюнетки) оттолкнут молодых людей, поскольку никто не хочет быть девушкой второго сорта. Компания молодых людей останется без девушек. Но вот если блондинку никто не заметит, то каждый из молодых людей найдет себе не менее достойную девушку.
На этом простом примере показывается, что преследование эгоистичных интересов может не всегда отвечать интересам группы. Если Адам Смит считал, что каждый индивид должен преследовать только свои личные интересы, то Джон Нэш ответил, что не только свои, но и интересы группы.

Дилемма заключенного и парадокс блондинки являются красивой метафорой. Тем не менее, в реальной жизни можно найти множество ситуаций, когда аппарат теории игр находит полезное применение.

На рынках многих благ существует так называемая дуополия – ситуация, когда рынок контролируется двумя крупными игроками. Например, на рынке прохладительных напитков можно обнаружить два гиганта: Coca-Cola company и Pepsi-Cola, на рынке самолетостроения есть два гиганта - Airbus и Boeing. Решение одного их игроков, например, о проведении рекламной кампании, отражается не только на его положении, но и на положении другого участника. В этой ситуации конкурирующие стороны начинают соперничать, неимоверно раздувая собственные рекламные бюджеты. Им можно было бы снизить объемы рекламы и увеличить получаемую прибыль, но для этого им нужно сначала договориться.

На простейшем примере игры «дилемма заключенного» показывается, что устойчивое равновесие в игре (так называемое равновесие по Нэшу) не обязательно обеспечивает наилучший для участников результат (так называемый Парето-оптимум). Дилемма заключенного является примером одномоментной игры, в которой участники принимают решения одновременно. Также существуют последовательные игры, в которых участники принимают решения один после другого. Примеры с обоими видами игр рассматриваются нами в главе «Олигополия».

Чистые и смешанные стратегии поведения

Принимая решения в реальной жизни, все мы играем во множество игр. Вы принимаете решения, ожидая определенного ответного поведения от ваших партнеров по бизнесу, начальника по работе, одногруппников по университету, возлюбленной. Нередко окружающие люди предлагают Вам сыграть в игру, в которой один из вариантов выглядит для Вас более выгодным. Вы выбираете данный вариант, и вскоре сталкиваетесь с новой игрой, и после нескольких подобных ходов обнаруживаете, что попали в непростую ситуацию: случилось то, чего Вы не хотели ни при каких обстоятельствах. Сейчас, с помощью понятий чистых и смешанных игровых стратегий, мы покажем, что во многих играх Ваше непредсказуемое поведение (например, основанное на подбрасывании монетки), станет лучшей стратегией.

Чистая стратегия – определенная реакция игрока на возможные варианты поведения других игроков.
Смешанная стратегия – вероятностная (не определенная точно) реакция игрока на поведение других игроков.

Давайте сыграем в простую игру. У меня есть шарик, который я прячу за спиной в левую или правую руку. Вы пытаетесь угадать, в какой руке шарик. Если Вы угадываете, я плачу Вам 1 доллар. Если Вы не угадываете, то платите один доллар мне. Мы оба пытаемся выиграть, и, допустим, мы оба умны. В данной игре у каждого из нас есть по две чистых стратегии: я могу положить шарик в правую или левую руку, Вы можете сказать, в какой руке шарик: в правой или левой.
Если я всегда буду класть шарик в одну и ту же руку, Вы быстро это заметите и обыграете меня. Если я буду чередовать руки (сначала класть в левую, потом в правую, потом опять в левую), то скоро Вы это опять заметите, и обыграете меня. В этих условиях, догадываясь о Вашем ответе, я буду стараться всякий раз менять руку, в которой находится шарик.
Рассмотрим это подробнее. Если моя стратегия заключается в том, чтобы класть шарик в правую руку, то Ваша стратегия заключается в том, чтобы сказать, что шарик в правой руке. Это является одним из видов Вашей чистой стратегии. Если я догадываюсь о Вашем ответе, то моей лучшей стратегией будет поменять руку. Это является моим вариантом чистой стратегии. Таким образом, чистые стратегии в нашей игре не приведут к равновесию. Любой Ваш рациональный вариант поведения невыгоден для меня, любой мой рациональный вариант поведения невыгоден Вам. Однако в подобной игре все же существуют мои и Ваши стратегии, являющиеся равновесными для нас обоих. Это означает, что я или Вы будем придерживаться определенного поведения вне зависимости от поведения противоположной стороны. Как выглядят подобные стратегии? Для ответа на этот вопрос давайте осознаем, что какое бы правило я ни изобрел, в конце концов, оно будет применено против меня. Поэтому моим лучшим решением для выбора руки станет … подбросить монетку. На языке теории игр это означает «смешать стратегии». Какую стратегию в этом случае выберете Вы? Зная, что мое поведение определяется случайным образом, Вы также не будет конструировать каких-либо правил угадывания – ведь со временем я их разгадаю и применю против Вас. Поэтому Вашей лучшей стратегией также становится подбросить монетку. Принятие решения на основе подбрасывания монетки стало равновесием в нашей игре.

Для лучшей иллюстрации приведем еще одну игру2. Допустим, вы пытаетесь укрыться в одном из множества убежищ на поле, а я летаю на бомбардировщике и пытаюсь сбросить на Вас бомбу. Моей задачей является угадать, в каком убежище укрылись Вы. Вашей задачей становится сделать так, чтобы моя догадка оказалась неверной. Вашей первой идей станет спрятаться в лучшем по надежности убежище. Догадываясь об этом, я попытаюсь сбросить бомбу именно туда. Это будет моей чистой стратегией. Если Вы подумаете дальше, то Вы не будете укрываться в лучшем по надежности убежище, а попытаетесь укрыться во втором по надежности. Это станет Вашей чистой стратегией в ответ на мою догадку. Если Вы достаточно умны, то Вы не будете придерживаться определённой чистой стратегии, а вместо этого прибегните к помощи случайности. Вы выберете убежища, которые дают Вам максимальный суммарный шанс выжить, а потом взвоете к случайности, подбросив монетку. Именно это сделаю и я.
Смешанные стратегии часто используются людьми в реальной жизни, хотя они могут даже не знать об этом. В книге Константина Сонина «Уроки экономики» рассматривается, что смешанные стратегии активно используются профессиональными спортивными игроками: например, футболистами при пробитии пенальти или теннисистами при подаче.
Таким образом, случайное поведение может стать лучшим решением даже в некоторых Ваших повседневных выборах.

6.1.2. Некоторые примеры игр

Решение об объеме выпуска

Рассмотрим двух гигантов, конкурирующих на рынке производства пассажирских самолетов: «Боинг» и «Эйрбас». Предельные издержки производства самолетов одинаковы у каждой компании и равны 10 млн. долларов за штуку.
Рыночный спрос выглядит следующим образом:

P, млн $ Q, штук
0 200
10 180
20 160
30 140
40 120
90 110
50 100
55 90
60 80
70 60
80 40
90 20
100 0

В случае, если «Боинг» и «Эйрбас» договариваются о разделе рынка пополам, то их прибыль выглядит следующим образом:

P, млн $ Q, штук TR, млн$ TC, млн$ общая прибыль прибыль каждого участника
0 200 0 2000 -2000 -1000
10 180 1800 1800 0 0
20 160 3200 1600 1600 800
30 140 4200 1400 2800 1400
40 120 4800 1200 3600 1800
90 110 9900 1100 8800 4400
50 100 5000 1000 4000 2000
55 90 4950 900 4050 2025
60 80 4800 800 4000 2000
70 60 4200 600 3600 1800
80 40 3200 400 2800 1400
90 20 1800 200 1600 800
100 0 0 0 0 0

Прибыль участников будет максимальна, если они оба произведут по 45 самолетов (вместе 90) и равна в этом случае 2025 млн $. Эта точка является Парето-оптимумом, то есть в ней состояние одного участника нельзя улучшить без ухудшения состояния другого.

Каждый из участников может думать следующим образом:
Если я произвожу 45 самолетов и мой конкурент производит 45 самолетов, то наша общая прибыль будет максимальной, и я получу половину от максимальной общей прибыли. Однако что мешает мне произвести не 45, а 55 самолетов? В этом случае, если мой конкурент не предпримет ответных действий, общий объем продаж вырастет до 100, цена упадет до 50, а получу выручку 55*50=2750 и прибыль 2750-550=2200. Тогда прибыль моего конкурента составит 50*45-10*45=1800.
Точно также может думать и другой участник, и в таком случае они оба произведут по 55 самолетов. В этом случае общий объём продаж вырастет до 110, цена упадет до 45, общая прибыль будет равна 1925, и каждый из участников получит прибыль 1925.

Игра этой ситуации описывается следующей матрицей выигрышей (payoff matrix):

Боинг
произвести 45 произвести 55
Эйрбас произвести 45 (2025;2025) (2200;1800)
произвести 55 (1800;2200) (1925;1925)

Первое значение в скобках означает прибыль Боинга, второе – прибыль Эйрбаса.
Если между участниками не заключено договоренностей, то каждый из них имеет стимулы произвести 55, а не 45 штук, чтобы увеличить свою прибыль. В этом случае производство 55 штук является доминирующей стратегий для каждого участника. Нэш-равновесие устанавливается в ситуации, когда они оба производят по 55 штук и получают прибыль в размере 1925 млн $. Это равновесие не является Парето-оптимальным.
Данная ситуация показывает, как эгоистические интересы каждого из участников мешают им достигнуть оптимального значения прибыли.


1 Критерий оптимальности по Парето звучит так: нельзя улучшить положение какого-либо из участников игры, не ухудшив положения другого.

ИНФОРМАЦИЯ О СВОБОДНЫХ МЕСТАХ

В настоящий момент активно набираю учеников на предстоящий учебный сезон. Есть около 10 мест

ТЕОРИЯ И ЗАДАНИЯ

Все задачи

ИНТЕРВЬЮ С УЧЕНИКАМИ

  • Интервью с Дмитрием Сорокиным, абсолютным победителем Всероссийской олимпиады по экономике 2009 года

    Первое интервью я взял, пожалуй, у своего самого неординарного ученика - Дмитрия Сорокина. Дмитрий являлся абсолютным победителем (1-е место) Всероссийской олимпиады школьников по экономике 2009 года. Я помню, что мне было приятно заниматься с Дмитрием, который с первого же занятия поставил максимальную планку уровня наших занятий, заявив, что его цель - победа во Всероссийской олимпиаде. С первых занятий мне показалось, что Дмитрий - будущий ученый-экономист. Траектория Дмитрия интересна: после года обучения на экономическом факультете ВШЭ, он перевелся на первый курс совместного бакалавриата ВШЭ-РЭШ, а сейчас уезжает на семестр в Нью-Йоркский университет. В данном интервью Дмитрий рассказывает об этом выборе, а также о том, почему он решил стать академическим ученым, какие задачи сейчас стоят перед молодым экономистом. подробнее…

Все интервью