Что такое дилемма заключенного

Дилемма заключённых

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенногоTV Tropes
Для англоязычных и желающих ещё глубже ознакомиться с темой в проекте TV Tropes есть статья Prisoner’s Dilemma. Вы также можете помочь нашему проекту и перенести ценную информацию оттуда в эту статью.
«Ранее, на одном из их занятий, Гарри про неё уже рассказывал. Дилемма заключённого состоит в следующем: двое заключённых заперты в отдельных камерах. Против каждого из них есть улики, не слишком серьёзные, но достаточные, чтобы посадить их в тюрьму на два года. Каждый узник может выбрать сотрудничество с властями: предать другого и свидетельствовать против него в суде, в этом случае сам он получит только год тюрьмы, а другой получит на два года больше. Или узник может хранить молчание. Таким образом, если оба узника свидетельствуют друг против друга, оба получают по три года тюрьмы, если оба молчат — оба получают по два года. Но если один соглашается сотрудничать с властями, а второй молчит, то первый получает один год, а второй — четыре.

И оба заключённых должны принять решение, не зная, что сделает другой, и изменить решение в дальнейшем нельзя.

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенного

Дилемма заключённых — задача из теории игр, условия — см. эпиграф. Двое игроков и выбор: поступить кооперативно, что будет означать для обоих игроков большую общую выгоду, если второй игрок выберет то же самое, или минимальный выигрыш себе, максимальный — второму игроку, если он выберет предать, либо — предать, что будет означать максимальный выигрыш себе и минимальный — другому игроку, если тот поступит кооперативно, или небольшой (меньше, чем при обоюдной кооперации, но больше, чем для преданного кооператора) выигрыш для обоих, если и второй игрок предал.

Главная проблема ситуации: если оба участника стараются вести себя, как разумные эгоисты, то есть, всегда максимизировать свою выгоду, не заботясь о чужой, они оба выберут предательство (ведь оно выгоднее при обоих вариантах поведения другого участника!) и окажутся в менее выигрышном положении, чем если оба были бы альтруистами и смогли взаимно скооперироваться.

Известна также повторяющаяся дилемма заключённых, в которой участники делают выбор несколько раз подряд, и предыдущий выбор второго игрока им известен. В таком варианте игры разумный эгоизм приобретает смысл: ты можешь предавать в ответ на предательство и кооперироваться в ответ на кооперацию, награждая оппонента за стремление к увеличению общей выгоды и наказывая за его отсутствие.

Дилемма заключённых в обобщённом виде описывает мир в целом. Она показывает, почему теоретически общество способно быть справедливым и работать на благо каждого, а не только горстки избранных: ведь в реальности-то воплощается как раз продолженный вариант, в котором разумно-кооперирующиеся стратегии — выигрышные! Она же объясняет, откуда у человека и животных могло сформироваться инстинктивное понимание этики без вмешательства сверхъестественных сил: просто быть склонным к кооперации в обмен на кооперацию более выгодно в реальности, чем всегда выбирать вариант «предать».

При утоплении педали в пол может превратиться в садистский выбор.

Источник

Дилемма заключённого

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенного

Если вы по роду своей деятельности сталкиваетесь с ведением переговоров, например, занимаетесь собственным бизнесом, являетесь руководителем крупной организации или занимаете какую-то иную должность, которая требует владения навыком ведения переговоров, то, вероятнее всего, вас время от времени одолевает вопрос на тему того, в какой ситуации следует быть «мягким и пушистым», а когда нужно проявить стойкость и показать твёрдость своих намерений.

Ответ на представленный вопрос способен многократно повысить эффективность любых переговоров, но это лишь одна сторона «медали». Другая же заключается в том, что найти этот ответ не так-то просто, что нередко ставит в тупик. Однако существенную помощь в этом деле может оказать любому человеку решение так называемой Дилеммы заключённого.

Дилемма заключённого

Дилемма заключённого представляет собой одну из самых популярных концепций, относящихся к теории игр. Кстати говоря, иногда её ещё называют Дилеммой бандита.

Основывается Дилемма заключённого на идее о том, что законодательство большинства стран предполагает для группы людей, совершивших преступление в сговоре, больший срок заключения, нежели для преступника, который совершил преступление в одиночку. Исходя из этого, в Дилемме бандита двум сообщникам, которые не имеют возможности взаимодействовать друг с другом, общаться и договариваться, приходится решать дилемму, подразумевающую два варианта поведения:

Если изобразить суть Дилеммы заключённого схематически, то выглядеть она будет следующим образом:

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенного

Несмотря на то, что речь идёт о совершении преступления и наказании за него, данная дилемма касается вовсе не реальных уголовников, а каждого из нас с вами, ведь в процессе своей жизнедеятельности, без разницы – на работе мы находимся или дома – мы сталкиваемся с ней буквально каждый день.

Примеры Дилеммы заключённого

В качестве первого примера Дилеммы заключённого можно привести один из знакомых многим анекдотов, когда два коммерсанта подписывают договор о совершении сделки по купле/продаже вагона помидоров. После того как договор подписан, первый коммерсант начинает искать товар, а второй отправляется на поиски денег. По сути, представленный пример Дилеммы заключённого является «классикой жанра».

Вот смотрите: договор подписан, но что, если один из коммерсантов сможет найти помидоры и отправить целый вагон, как и договорено, но второй не отыщет денег? А что делать, если ситуация сложится наоборот? Какова вероятность, что партнёр по бизнесу не подведёт и можно ли ему доверять? Какие усилия нужно предпринимать, чтобы защитить свои интересы? Да и нужно ли вообще собирать деньги? Пускай этот неудачник ищет свои помидоры и отправляет их, а второй просто не станет платить, но какая в таком случае будет репутация у обязавшегося произвести оплату партнёра? Захочет ли кто-то иметь в перспективе дела с таким недобросовестным человеком?

А вот второй пример: две крупные корпорации должны определить размер своего бюджета, предусмотренного на создание телевизионной рекламы в следующем году. Качественная реклама по телевидению – дело довольно затратное. Исходя из этого, чем большее количество рекламы будет запущено, тем меньшее количество чистой прибыли будет получено и, вполне вероятно, станет хуже качество товара, т.к. нужно экономить на формуле создаваемого продукта.

Однако в том случае, если один конкурент сможет разрекламироваться лучше, то второй потеряет репутацию, прибыль и часть потребителей. По этой причине обоим конкурентам необходимо, боясь друг другу не проиграть, каждый год вкладывать в рекламу невероятное количество средств. Результатом такой погони становится то, что продукт, предлагаемый компаниями, становится некачественным: газировкой можно очищать сковородки, зубная паста не отбеливает зубы, бытовая техника постоянно выходит из строя, а сами производители товаров кое-как умудряются сравнять к концу года доходы и расходы. Причём повторяется это снова и снова, из года в год.

Изучение Дилеммы заключённого

Американский политолог Роберт Аксельрод в своей работе «Эволюция кооперации» провёл многочисленные исследования повторяющейся раз за разом Дилеммы заключённого, беря во внимание то, что в жизни одни и те же люди встают перед необходимостью постоянно разрешать эту дилемму, учитывая свой прошлый опыт, ошибки и победы, действия и результаты.

Исследователь привлёк работе коллег из разных стран мира, чтобы совместно разработать специальные компьютерные стратегии, направленные на разрешение представленной дилеммы. В результате был организован целый чемпионат по повторяющейся Дилемме заключённого. Итоги этих соревнований показали, что стратегии, в которых превалирует жадность, исходя из расчёта на долгосрочную перспективу, давали результаты значительно хуже, нежели те стратегии, которые можно назвать альтруистическими. Также Аксельродом была показана эволюция «жадных» стратегий в альтруистические посредством естественного отбора. Говоря другими словами, максимальная отдача и выгода исходила от тех стратегий, в которых выгода не являлась абсолютным приоритетом.

Согласно дынным, полученным Робертом Аксельродом, чтобы стратегия переговоров была эффективной, необходимо соблюдать следующие условия:

В результате Роберт Аксельрод рекомендует всем, кто сталкивается с Дилеммой заключённого, если он действительно желает выстроить эффективную стратегию и иметь больше шансов на победу, следовать этим рекомендациям, которые существенно увеличивают шансы на победу для всех сторон.

Резюме

В процессе разработки своей собственной стратегий переговоров, действий и поведения, обязательно учитывайте те научные данные, которые мы только что озвучили. Всегда помните о том, что изначальный план необходимо выстраивать на предположении о том, что ваш оппонент (партнёр по бизнесу, руководитель или коллега на работе, товарищ или член семьи) так же, как и вы, настроен на долгосрочное, взаимовыгодное и честное сотрудничество.

Но не теряйте из вида и то, что ситуация может выйти из-под контроля и всё может пойти не так, как вы первоначально предполагали. По этой причине всегда нужно разрабатывать и иметь в запасе страховку – ещё один вариант, если вдруг действовать придётся в условиях форс-мажора. И если уж пришлось отвечать такими же действиями, какие предпринял против вас ваш оппонент, то сразу же после того как «дали сдачи» возвращайте стратегию в её прежнее состояние – предлагайте мир, становитесь «добренькими», будьте готовы пойти на уступки и т.д. Причём такое поведение может повторяться столько раз, сколько вообще необходимо для того чтобы прийти к какому-то общему знаменателю и обоюдовыгодному решению.

Желаем вам успешно овладевать искусством переговоров, ведь этот навык обязательно пригодится вам как в профессиональной сфере деятельности, так и в личной жизни.

Источник

Дилемма заключенного. Что это такое и как она поможет в командной работе?

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенного

Возможно, процесс игры кажется Вам предельно простым и интуитивно понятным, однако существует целая методология, которая изучает оптимальные стратегии в играх. Ее называют теорией игр. Одна из основных проблем теории игр – дилемма заключенного. Она состоит в следующем. Если люди, работая в команде, выбирают личные бонусы, а не общую выгоду, то их командное дело неминуемо проседает, командная игра становится разобщенной и постепенно сходит на нет.

При чем тут заключенные?

Наверняка, Вы помните буквально хрестоматийную сцену почти из всех американских детективов: сообщников сажают в разные комнаты и допрашивают по отдельности, чтобы поймать на лжи или добиться правды, предложив сделку и дождавшись, что один «сдаст» другого.

Какие варианты есть, к примеру, у двух сообщников, которые совершили преступление?

1. Оба молчат. Тогда каждому грозит небольшой срок (ведь преступление не доказано, улик, скорее всего, нет, а домыслы к делу не прикрепишь) – к примеру, 1 год.

2. Первый говорит, второй молчит. Тогда первого отпустят за содействие расследованию, а второго отправят в тюрьму «по максимуму» – скажем, на 10 лет.

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенного

3. Первый молчит, второй говорит. Тогда ситуация противоположна: первый отправляется отбывать 10-летний срок заключения, а второй окажется на свободе.

4. Оба говорят. И каждый получит срок с учетом чистосердечного признания – скажем, 2 года.

Суть заключается в том, что каждый делает выбор, молчать ему или говорить, но при этом не знает, говорит или молчит другой. В подавляющем большинстве случаев люди выбирают личную выгоду (но такая свобода оборачивается муками совести, ведь пострадал другой человек). Хотя оптимальный результат (из нашего утрированного примера) достигается именно при командной работе, кооперации.

Как увязать это с командной работой в компании? Очень просто. Руководители рассчитывают на эффективную командную работу, но поощрения чаще всего ориентируют не на всю команду, а на конкретных людей. И это противоречие разобщает, создавая ситуацию классической дилеммы заключенного. И вот специалист думает: мне проявлять свое «я», идти до конца одному или работать сообща во имя общего дела? Риск в первом случае – провал: не все можно сделать в одиночку. Риск во втором случае – обезличение: команда победила, ну а как же я?

Как использовать это в работе, чтобы повысить продуктивность, но при этом не потерять личную заинтересованность, мотивацию сотрудников?

Бессрочность

В нашем примере с сообщниками все довольно просто, потому что оба наших гипотетических преступника знают, что маловероятно встретятся в дальнейшей жизни, то есть почти минимальны риски мести (а значит, и совестью можно не мучиться). На работе же все иначе: люди, которые работают в команде, могут сосуществовать бок о бок годами. И это и является решением дилеммы заключенного: как показывают исследования, люди охотнее сотрудничают друг с другом, если знают, что и потом им придется работать вместе.

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенного

Поэтому коучи и психологи советуют создавать не команды-«однодневки», а настоящие длительные кооперации. Работая вместе долгое время, члены команды расставляют приоритеты более осознанно (боятся подвести, не оправдать ожиданий «партнеров», причинить им вред) и больше дорожат своей репутацией.

Прозрачность

Еще одно решение дилеммы – полная прозрачность. Нужно достичь максимально честных обсуждений волнующих вопросов: если человек знает, что его решение, мнение будет известно другим членам команды, он много раз подумает, прежде чем сделать выбор, который может им навредить. Например, в некоторых компаниях приняты открытые обсуждения проблем, проектов, на которых каждый «берет слово». Также практикуются и групповые сессии с психологом.

Оценка работы команды с учетом индивидуального вклада каждого

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенного

Большинство компаний работает но неправильному принципу: чтобы человек в команде был эффективным, он должен чувствовать конкуренцию. Но конкуренция в рамках одной команды только вредит общему делу. Выход – делать ставку на успех группы в целом, но не забывать о личном вкладе каждого. Иначе работники потеряют мотивацию – команда распадется.

Яркий пример – спортсмены в командных видах спорта. Каждый должен быть суперпрофессионалом, чтобы выиграть могла команда. Если команда проиграет, то вряд ли внимание общественности привлекут достижения одного игрока.

Чтобы оценивать общее с позиции каждого, можно использовать разные инструменты. Например:

Проводить общие собрания в неформальной обстановке, допустим, в пятницу вечером и обсуждать идеи, достижения и поражения недели.

Креативно подводить итоги, отмечая успех каждого в общем деле. С этой задачей хорошо справляются небольшие презенты – например, шоколадки с забавными надписями (типа «автору идеи-прорыва» или «виртуозному воплотителю идеи-прорыва»). Презенты могут быть «подвязаны» к сфере деятельности (к примеру, художники всегда рады новым карандашам) или обобщенными (например, популярные книги, ежедневники, стильные перьевые ручки и проч.).

Проводить корпоративы в локациях, где каждый найдет что-то интересное. Допустим, на базе отдыха одни смогут покататься на тарзанке, пройти полосу препятствий и полазать в канатном городке, а другие спокойно почитают, удобно устроившись в кресле-груше, или посидят на причале, томно взирая на линию горизонта. Главное, чтобы каждый понимал, что он важен и нужен.

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенного

Таким образом, современная формула успешной работы команды строится на трех принципах, «выведенных» из дилеммы заключенного: длительное сотрудничество, прозрачное общение, оценка общего результата через результаты частные. Такой подход позволит добиться успеха – не только компании в целом, но и каждому ее сотруднику.

Источник

Дилемма заключенного

Что такое дилемма заключенного. Смотреть фото Что такое дилемма заключенного. Смотреть картинку Что такое дилемма заключенного. Картинка про Что такое дилемма заключенного. Фото Что такое дилемма заключенного

В теории игр дилемма заключённого (реже употребляется название «дилемма бандита») — некооперативная игра, в которой игроки стремятся получить выгоду, сотрудничая друг с другом или предавая. Как во всей теории игр, предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других.

В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Проще говоря, неважно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальному решению). В этом и заключается дилемма.

В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания (с ростом числа итераций равновесие Нэша стремится к Парето-оптимуму).

Содержание

Классическая дилемма заключённого

Во всех судебных системах кара за бандитизм (совершение преступлений в составе организованной группы) намного тяжелее, чем за те же преступления, совершённые в одиночку (отсюда альтернативное название — «дилемма бандита»).

Классическая формулировка дилеммы заключённого такова:

Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок (10 лет). Если оба молчат, дело проходит по другой статье, и они приговариваются к 6 месяцам. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?

Игру можно представить в виде следующей таблицы:

Заключённый Б хранит молчаниеЗаключённый Б даёт показания
Заключённый А хранит молчаниеОба получают полгода.А получает 10 лет,
Б освобождается
Заключённый А даёт показанияА освобождается,
Б получает 10 лет тюрьмы
Оба получают 2 года тюрьмы
«Дилемма заключённого» в нормальной форме.

Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.

Представим рассуждения одного из заключённых. Если партнёр молчит, то лучше его предать и выйти на свободу (иначе — полгода тюрьмы). Если партнёр свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе — 10 лет). Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу.

С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным. Это очень наглядно демонстрирует, что в игре с ненулевой суммой Парето-оптимум может быть противоположным равновесию Нэша.

Обобщённая форма

СотрудничатьПредать
СотрудничатьC, Cc, D
ПредатьD, cd, d
Каноническая матрица выигрышей ДЗ

Можно раскрыть скелет игры далее, абстрагировавшись от подтекста заключённых. Обобщённая форма игры часто используется в экспериментальной экономике. Следующие правила дают типичную реализацию игры.

Эти правила были установлены Дугласом Хофштадтером и образуют каноническое описание типичной дилеммы заключённого.

Похожая, но другая игра

Хофштадтер [2] предположил, что люди проще понимают задачи, как задача ДЗ, если она представлена в виде отдельной игры или процесса торговли. Один из примеров — «обмен закрытыми сумками»:

Два человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая — товар. Каждый игрок может уважать сделку и положить в сумку то, о чём договорились, либо обмануть партнёра, дав пустую сумку.

В этой игре обман всегда будет наилучшим решением, означая также, что рациональные игроки никогда не будут играть в неё, и что рынок обмена закрытыми сумками будет отсутствовать.

В вариации, популярной у программистов и хакеров, каждый агент этой игры помнит предыдущие результаты (или имеет доступ к общественному мнению, «коллективной памяти»), и множество обменов повторяются длительное время.

Как отмечено выше, без памяти эта игра имеет мало смысла, она мало что объясняет в поведении систем и групп людей, кроме описания взаимодействий, которые не будут происходить. Сложностей вводится больше, чем можно ожидать. Программист (особенно специализирующийся на функциональном программировании) сразу поймёт значимость времени и состояния (памяти). Но и без написания программ можно предположить, как поведут себя агенты. Насколько велика память каждого агента? Какова стратегия каждого из них? Как агенты с разными стратегиями распределены и что определяет, кто с кем взаимодействует и в каком порядке?

Сложность создания какой-то многозначной модели может обескураживать, но она поднимает некоторые интересные и ценные технические и философские вопросы.

Проделана некоторая работа по моделированию этого. Разные программисты и математики утверждают, что стратегия «око за око» (см. ниже) — наилучшая общая стратегия, однако не было сделано серьёзных академических усилий, чтобы классифицировать разные типы и распределения обучающихся агентов с разными стратегиями.

О потенциале этой задачи свидетельствует тот факт, что в этой дискуссии ещё не упоминались возможность формировать коалиции и рядиться коллективно. А как насчёт агентов, которые бы за плату организовывали переговоры? Или агентов, которые бы накапливали информацию о самих сделках?

Примеры из реальной жизни

Примеры с заключёнными, карточной игрой и обменом закрытыми сумками могут показаться надуманными, но на самом деле есть множество примеров взаимодействия людей и животных, имеющие такую же матрицу выигрышей. Поэтому ДЗ представляет интерес социальным наукам, таким как экономика, политика и социология, а также разделам биологии — этологии и эволюционной биологии. Многие природные процессы были обобщены в модели, в которых живые существа участвуют в бесконечных играх типа дилеммы заключённого. Такая широкая применимость ДЗ придаёт этой игре значительную важность.

В политологии, к примеру, сценарий ДЗ часто используется для иллюстрации проблемы двух стран, вовлечённых в гонку вооружений. Обе будут заявлять, что у них есть две возможности: либо увеличить расходы на военные нужды, либо сокращать вооружения. Ни одна из сторон не может быть уверена, что другая будет соблюдать договорённость, следовательно, обе будут стремиться к военной экспансии. Это можно считать теоретическим объяснением политики устрашения. Похожие явления наблюдаются и в автоспорте — «Формула-1», где последние 20 лет происходит гонка бюджетов команд. Из-за этого число машин-участников сократилось с 36 в 1990 году до 20 в 2003.

В велогонках дилемма заключённого возникает, когда два сильных гонщика оторвались от общей группы. Каждый из них может либо предоставить соседу слипстрим («сотрудничать»), либо ехать сзади («предать»). Для обоих идеалом будет, когда они по очереди «висят» друг у друга на хвосте — но всегда есть желание не дать соседу слипстрима (тогда тот постепенно устаёт и «скатывается» в пелотон, а ты финишируешь с большим отрывом).

Случай дилеммы заключённого может быть найден в бизнесе. Две конкурирующие фирмы должны определиться, сколько средств тратить на рекламу. Эффективность рекламы и прибыль каждой фирмы уменьшается с ростом расходов на рекламу у конкурента. Обе фирмы принимают решение увеличить расходы на рекламу, при этом их доли рынка и, возможно, объёмы продаж остаются неизменными, а прибыль сокращается. Предел гонки рекламных бюджетов — прибыль, впрочем, они могут пытаться некоторое время работать и в убыток. Фирмы могут пойти на соглашение о сокращении расходов на рекламу, но всегда есть стимул его нарушить.

В олигополистических рынках ценовая политика — это повторяющаяся ДЗ. Обычно олигополисты сотрудничают друг с другом и не доводят ситуацию до «ценовой войны».

Теоретическое заключение ДЗ — одна из причин, почему во многих странах сделка о признании вины запрещена. Часто сценарий ДЗ повторяется очень точно: в интересах обоих подозреваемых сознаться и свидетельствовать против другого подозреваемого, даже если оба невиновны. Возможно, наихудший случай — когда только один виноват, в этом случае невиновный вряд ли сознаётся в чём либо, а виновный пойдёт на это и даст показания против невиновного.

Многие дилеммы в реальной жизни включают множество игроков. Хотя и метафорическую, «трагедию общин» Ардена можно рассматривать как обобщение ДЗ для множества игроков. Каждый житель общины выбирает — пасти ли скот на общем пастбище и получить выгоду, истощая его ресурсы, либо ограничить свой доход. Коллективный результат от всеобщего (или частого) максимального использования пастбища — низкий доход (ведущий к разрушению общины). Однако такая игра не является формальной, поскольку может быть разбита на последовательность классических игр с 2 участниками.

Повторяющаяся дилемма заключённого

В книге «Эволюция кооперации» (1984) Роберт Аксельрод en:Robert Axelrod исследовал расширение сценария ДЗ, которое он назвал повторяющаяся дилемма заключённого (ПДЗ). В ней участники делают выбор снова раз за разом и помнят предыдущие результаты. Аксельрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по ПДЗ. Программы, вошедшие в него различались по алгоритмической сложности, начальной враждебности, способности к прощению и так далее.

Аксельрод открыл, что если игра повторялась долго среди множества игроков, каждый с разными стратегиями, «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально чисто эгоистические, через естественный отбор.

Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat ), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда в любом случае сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.

Анализируя стратегии, набравшие лучшие результаты, Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат:

Добрая важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника. Мстительная успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстительной стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим. Прощающая другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш. Не завистливая последнее качество — не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент (что в принципе невозможно для «доброй» стратегии, то есть добрая стратегия никогда не может набрать больше очков, чем оппонент).

Таким образом, Аксельрод пришёл к утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми и прощающими и не завистливыми.

Рассмотрим снова модель гонки вооружений. Был дан вывод, что единственная рациональная стратегия — вооружаться, даже если обе страны хотели бы тратить ВВП на масло, а не пушки [4] Интересно, что попытки продемонстрировать, что вывод ДЗ работает на практике (делая анализ «высоких» и «низких» военных расходов между периодами, на основе предположений ПДЗ), часто показывают, что такого поведения не происходит (например, греческие и турецкие военные расходы меняются не в соответствии со стратегией «око за око», а вероятнее всего следуют внутренней политике). Это может быть примером рационального поведения, отличающегося от одноразовой и многоходовой игр.

Если в одноходовой игре в любом случае доминирует стратегия предать, то в многоходовой оптимальная стратегия зависит от поведения других участников. К примеру, если среди населения все друг друга обманывают, а один ведёт себя по принципу «око за око», он оказывается в небольшом проигрыше из-за потери на первом ходе. В такой популяции оптимальная стратегия — всегда предавать. Если же число исповедующих принцип «око за око» больше, то результат уже зависит от их доли в обществе.

Определить оптимальную стратегию можно двумя путями:

Хотя стратегия «око за око» считалась самой удачной простой стратегией, команда Университета Саутгемптона из Англии (под руководством профессора Николаса Дженнингса [1]) представила новую стратегию на 20-ю годовщину Чемпионата по ПДЗ. Эта стратегия оказалась более успешной, чем «око за око». Она основывалась на взаимодействии между программами, чтобы получить максимальный счёт для одной из них. Университет выставил на чемпионат 60 программ, которые распознавали друг друга по ряду действий на первых 5-10 ходах. Узнав другую, одна программа всегда сотрудничала, а другая предавала, что давало максимум очков предателю. Если программа понимала, что оппонент — не саутгемптонский, она дальше всё время предавала его, чтобы минимизировать результат соперника. В результате [6] эта стратегия заняла первые три места в соревновании, как и несколько мест подряд ниже.

Хотя эта эволюционно стабильная стратегия оказалась более эффективной в соревновании, это было достигнуто за счёт того, что в этом конкретном соревновании команда могла участвовать несколькими агентами. Если игрок может контролировать только одного агента, «око за око» оказывается лучшей. Она также соблюдает правило запрета на коммуникации между игроками. То, что саутгемптонские программы исполняли «ритуальный танец» в первые 10 ходов, чтобы узнать друг друга, только подтверждает, насколько важна коммуникация в сдвиге баланса игры.

Если ПДЗ играется ровно N раз (некая известная константа N), есть ещё один интересный факт. Равновесие Нэша — всегда предавать. Доказываем по индукции: если оба сотрудничают, на последнем ходу выгодно предать, тогда у соперника не будет возможности отомстить. Поэтому оба предадут друг друга на последнем ходу. Раз соперник предаст на последнем ходу в любом случае, любой игрок захочет предать на предпоследнем ходу, и так далее. Чтобы сотрудничество оставалось выгодным, необходимо, чтобы будущее было неопределённым для обоих игроков. Одно из решений — делать число N случайным и подсчитывать результаты по среднему выигрышу за ход.

Дилемма заключённого — фундаментальная для некоторых теорий о взаимодействии людей и доверии. Из предположения модели ДЗ, что транзакция между двумя людьми требует доверия, доверительное поведение в популяциях может быть смоделировано при помощи многоигроковой повторяющейся версии игры. Это годами вдохновляло многих учёных. В 1975 году Грофман и Пул оценивали число работ, посвящённых этой теме, в количестве около 2000.

Психология обучения и теория игр

Если игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или плохо. Если они всё время будут действовать так, то проиграют из-за своей излишней агрессивности или излишней доброты. С получением большего опыта они реальнее оценивают вероятность предательства и добиваются лучших результатов. Ранние розыгрыши сильнее влияют на неопытных игроков, чем более поздние на опытных. Это пример, почему ранний опыт имеет такое влияние на молодых, и почему они особенно уязвимы к немотивированной агрессии, иногда сами становясь такими же.

Эти процессы — главное поле интереса взаимного альтруизма, группового отбора, семейного отбора и этики.

Восточная философия

В боевых искусствах изучается даосская пословица, которая говорит, что:

Второе и четвёртое утверждения кажутся спорными, особенно с позиций христианства, но дилемма заключённого объясняет их. В древнем Китае «добро» и «зло» считались непреложными истинами (например, их нельзя поменять местами), таким образом, эту пословицу можно прочитать ещё и как «плюс на минус даёт минус». Есть усиленный вариант этой пословицы, где в двух последних строках получается «двойное зло».

Генетика

Теория естественного отбора долго не публиковалась, так как в неё не укладывался генетический альтруизм, то есть генетически вложенная в организм программа заботиться о себе подобных даже в ущерб себе[2]. Так называемый ген любви.

Примечания

См. также

Ссылки

Литература

(источники, названные в английской статье)

Теория игр

ОпределенияНекооперативная игра · Кооперативная игра · Антагонистическая игра · Стохастическая игра · Дифференциальные игры · Игрок · Стратегия · Доминирование стратегий
Принципы оптимальностиРавновесие Нэша · Эффективность по Парето · Равновесие в доминирующих стратегиях · Решение по доминированию · Равновесие дрожащей руки · Равновесие, совершенное по под-играм · Собственное равновесие · Сильное равновесие · Эпсилон-равновесие · Коррелированное равновесие · Секвенциальное равновесие · Доминирование по риску
Примеры игрДилемма заключённого · Трагедия общин · Модель Бертрана · Модель Курно · Модель Штакельберга
Мысленные эксперименты
Главные статьиМысленный эксперимент ·
ЛюдиЗенон Элейский · Шрёдингер · Эйнштейн ·
ПерсонажиДемон Лапласа · Демон Максвелла · Кот Шрёдингера · Чайник Рассела · Ахиллес и черепаха ·
Физические мысленные экспериментыДемон Лапласа · Демон Максвелла · Квантовое бессмертие · Квантовое самоубийство · Кот Шрёдингера · Парадокс Белла · Парадокс субмарины · Парадокс Эйнштейна — Подольского — Розена · Парадокс близнецов · Микроскоп Гейзенберга · Пушечное ядро Ньютона · Парадокс Эренфеста ·
Апории ЗенонаАхиллес и черепаха · Дихотомия · Стадион · Стрела Зенона ·
Кибернетические мысленные экспериментыЗадача двух генералов · Китайская комната · Имитация реальности · Мозг в колбе ·
Другие мысленные экспериментыТеорема о бесконечных обезьянах · Парадокс Ньюкома · Парадокс заключённых · Комната Марии ·

Полезное

Смотреть что такое «Дилемма заключенного» в других словарях:

Дилемма заключенного — [prisoner s dilemma] объяснение того, что продавцы часто стремятся к сговору на рынке вместо конкуренции, которая была бы выгоднее для общества. Смысл ее в такой ситуации: двух заключенных А и Б обвинили в совместном убийстве, лишили возможности… … Экономико-математический словарь

дилемма заключенного — Объяснение того, что продавцы часто стремятся к сговору на рынке вместо конкуренции, которая была бы выгоднее для общества. Смысл ее в такой ситуации: двух заключенных А и Б обвинили в совместном убийстве, лишили возможности сговора и поставили… … Справочник технического переводчика

Дилемма Заключенного — метод, применяемый в теории игр, анализа задачи и определения результата ее решения путем его выбора двумя равноправными партнерами. Словарь бизнес терминов. Академик.ру. 2001 … Словарь бизнес-терминов

Дилемма заключенного — PRISONER’S DILEMMA Основополагающая концепция теории игр. Наилучшей иллюстрацией концепции является притча о двух заключенных, вместе совершивших преступление. Шериф помещает подозреваемых в разные камеры. Он предоставляет каждому из них… … Словарь-справочник по экономике

ДИЛЕММА ЗАКЛЮЧЕННОГО — в теории игр это метод анализа решений (выбора) и результатов, в ходе которого результат определяется выбором, осуществляемым двумя равноправными партнерами … Большой экономический словарь

ДИЛЕММА, ЗАКЛЮЧЕННОГО — Игра, основанная на классической детективной ситуации. В типичном варианте каждому игроку (заключенному) в отдельности сообщают, что, хотя имеются некоторые прямые доказательства его вины, у него есть два варианта: признаться или не признаться.… … Толковый словарь по психологии

Дилемма заключенного (prisoner’s dilemma) — Д. з. это название интерперсональной игры, широко использовавшейся в исследованиях соц. психологов, интересовавшихся природой и разрешением соц. конфликта. Под «игрой» в этом смысле понимается соц. ситуация с принятием взаимозависимых решений, т … Психологическая энциклопедия

ЗАКЛЮЧЕННОГО ДИЛЕММА — ЗАКЛЮЧЕННОГО ДИЛЕММА (дилемма узника; англ. prisoner s dilemma) интеллектуальная модель (предложенная А, У. Такером), позволяющая анализировать и демонстрировать различные варианты рациональности решений при необходимости кооперации частных… … Философская энциклопедия

ЗАКЛЮЧЕННОГО, ДИЛЕММА — См. дилемма заключенного … Толковый словарь по психологии

КОНФЛИКТ МЕЖЛИЧНОСТНЫЙ — – наиболее деструктивный способ развития и завершения значимых противоречий, возникающих в процессе межличностного взаимодействия. Для возникновения К. м. необходимо одновременное наличие трех условий: противоречия в межличностном взаимодействии … Энциклопедический словарь по психологии и педагогике

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *