Prisoner’s dilemma. Дилемма заключенного

Дилемма заключённого

Prisoner’s dilemma. Дилемма заключенного

Если вы по роду своей деятельности сталкиваетесь с ведением переговоров, например, занимаетесь собственным бизнесом, являетесь руководителем крупной организации или занимаете какую-то иную должность, которая требует владения навыком ведения переговоров, то, вероятнее всего, вас время от времени одолевает вопрос на тему того, в какой ситуации следует быть «мягким и пушистым», а когда нужно проявить стойкость и показать твёрдость своих намерений.

Ответ на представленный вопрос способен многократно повысить эффективность любых переговоров, но это лишь одна сторона «медали». Другая же заключается в том, что найти этот ответ не так-то просто, что нередко ставит в тупик. Однако существенную помощь в этом деле может оказать любому человеку решение так называемой Дилеммы заключённого.

Дилемма заключённого представляет собой одну из самых популярных концепций, относящихся к теории игр. Кстати говоря, иногда её ещё называют Дилеммой бандита.

Основывается Дилемма заключённого на идее о том, что законодательство большинства стран предполагает для группы людей, совершивших преступление в сговоре, больший срок заключения, нежели для преступника, который совершил преступление в одиночку. Исходя из этого, в Дилемме бандита двум сообщникам, которые не имеют возможности взаимодействовать друг с другом, общаться и договариваться, приходится решать дилемму, подразумевающую два варианта поведения:

  • Сохранять молчание и получить за совершённое преступление меньший срок, но только в том случае, если сообщник тоже будет сохранять молчание
  • Признать свою вину в совместном совершении преступления. Но тут вступают в силу три варианта развития событий: согласно первому, если первый сообщник «сдаст» второго, то первого освободят от уголовной ответственности и он выйдет на волю, а второй «получит по полной программе»; согласно второму, если первый сообщник будет молчать, а второй «сдаст» его, то второго освободят от наказания, а первый будет сидеть в тюрьме; согласно третьему, если оба подельника донесут друг на друга, то «мало не покажется» обоим, хотя срок всё равно будет меньше

Если изобразить суть Дилеммы заключённого схематически, то выглядеть она будет следующим образом:

Несмотря на то, что речь идёт о совершении преступления и наказании за него, данная дилемма касается вовсе не реальных уголовников, а каждого из нас с вами, ведь в процессе своей жизнедеятельности, без разницы – на работе мы находимся или дома – мы сталкиваемся с ней буквально каждый день.

Примеры Дилеммы заключённого

В качестве первого примера Дилеммы заключённого можно привести один из знакомых многим анекдотов, когда два коммерсанта подписывают договор о совершении сделки по купле/продаже вагона помидоров. После того как договор подписан, первый коммерсант начинает искать товар, а второй отправляется на поиски денег. По сути, представленный пример Дилеммы заключённого является «классикой жанра».

Вот смотрите: договор подписан, но что, если один из коммерсантов сможет найти помидоры и отправить целый вагон, как и договорено, но второй не отыщет денег? А что делать, если ситуация сложится наоборот? Какова вероятность, что партнёр по бизнесу не подведёт и можно ли ему доверять? Какие усилия нужно предпринимать, чтобы защитить свои интересы? Да и нужно ли вообще собирать деньги? Пускай этот неудачник ищет свои помидоры и отправляет их, а второй просто не станет платить, но какая в таком случае будет репутация у обязавшегося произвести оплату партнёра? Захочет ли кто-то иметь в перспективе дела с таким недобросовестным человеком?

А вот второй пример: две крупные корпорации должны определить размер своего бюджета, предусмотренного на создание телевизионной рекламы в следующем году. Качественная реклама по телевидению – дело довольно затратное.

Исходя из этого, чем большее количество рекламы будет запущено, тем меньшее количество чистой прибыли будет получено и, вполне вероятно, станет хуже качество товара, т.к. нужно экономить на формуле создаваемого продукта.

Однако в том случае, если один конкурент сможет разрекламироваться лучше, то второй потеряет репутацию, прибыль и часть потребителей. По этой причине обоим конкурентам необходимо, боясь друг другу не проиграть, каждый год вкладывать в рекламу невероятное количество средств.

Результатом такой погони становится то, что продукт, предлагаемый компаниями, становится некачественным: газировкой можно очищать сковородки, зубная паста не отбеливает зубы, бытовая техника постоянно выходит из строя, а сами производители товаров кое-как умудряются сравнять к концу года доходы и расходы.

Причём повторяется это снова и снова, из года в год.

Изучение Дилеммы заключённого

Американский политолог Роберт Аксельрод в своей работе «Эволюция кооперации» провёл многочисленные исследования повторяющейся раз за разом Дилеммы заключённого, беря во внимание то, что в жизни одни и те же люди встают перед необходимостью постоянно разрешать эту дилемму, учитывая свой прошлый опыт, ошибки и победы, действия и результаты.

Исследователь привлёк работе коллег из разных стран мира, чтобы совместно разработать специальные компьютерные стратегии, направленные на разрешение представленной дилеммы. В результате был организован целый чемпионат по повторяющейся Дилемме заключённого.

Итоги этих соревнований показали, что стратегии, в которых превалирует жадность, исходя из расчёта на долгосрочную перспективу, давали результаты значительно хуже, нежели те стратегии, которые можно назвать альтруистическими. Также Аксельродом была показана эволюция «жадных» стратегий в альтруистические посредством естественного отбора.

Говоря другими словами, максимальная отдача и выгода исходила от тех стратегий, в которых выгода не являлась абсолютным приоритетом.

Согласно дынным, полученным Робертом Аксельродом, чтобы стратегия переговоров была эффективной, необходимо соблюдать следующие условия:

  • Стратегия переговоров должна быть лояльной и исключать любые попытки предать оппонента, пока этого не сделает он сам (практически все стратегии, победившие в чемпионате, соответствовали этому условию)
  • В том случае, если один оппонент предаёт второго, то первый обязательно должен «отплатить той же монетой»
  • После того, как отмщение осуществлено, стратегия вновь должна настроиться на сотрудничество
  • Стратегия переговоров ни в коем случае не должна быть направлена на то, чтобы набрать больше «баллов», чем стратегия оппонента

В результате Роберт Аксельрод рекомендует всем, кто сталкивается с Дилеммой заключённого, если он действительно желает выстроить эффективную стратегию и иметь больше шансов на победу, следовать этим рекомендациям, которые существенно увеличивают шансы на победу для всех сторон.

Резюме

В процессе разработки своей собственной стратегий переговоров, действий и поведения, обязательно учитывайте те научные данные, которые мы только что озвучили.

Всегда помните о том, что изначальный план необходимо выстраивать на предположении о том, что ваш оппонент (партнёр по бизнесу, руководитель или коллега на работе, товарищ или член семьи) так же, как и вы, настроен на долгосрочное, взаимовыгодное и честное сотрудничество.

Но не теряйте из вида и то, что ситуация может выйти из-под контроля и всё может пойти не так, как вы первоначально предполагали. По этой причине всегда нужно разрабатывать и иметь в запасе страховку – ещё один вариант, если вдруг действовать придётся в условиях форс-мажора.

И если уж пришлось отвечать такими же действиями, какие предпринял против вас ваш оппонент, то сразу же после того как «дали сдачи» возвращайте стратегию в её прежнее состояние – предлагайте мир, становитесь «добренькими», будьте готовы пойти на уступки и т.д.

Причём такое поведение может повторяться столько раз, сколько вообще необходимо для того чтобы прийти к какому-то общему знаменателю и обоюдовыгодному решению.

Желаем вам успешно овладевать искусством переговоров, ведь этот навык обязательно пригодится вам как в профессиональной сфере деятельности, так и в личной жизни.

Источник: https://4brain.ru/blog/%D0%B4%D0%B8%D0%BB%D0%B5%D0%BC%D0%BC%D0%B0-%D0%B7%D0%B0%D0%BA%D0%BB%D1%8E%D1%87%D1%91%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE/

Доверие, эгоизм и Дилемма заключенного

Prisoner’s dilemma. Дилемма заключенного
В теории игр дилемма заключённого (далее ДЗ, реже употребляется название «дилемма бандита») — некооперативная игра, в которой игроки стремятся получить выгоду, сотрудничая друг с другом или предавая.

Как во всей теории игр, предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других.Например, один из вариантов:

В этой игре участвуют два игрока.

Каждый раунд оба игрока выбирают одно из двух действий: делиться или не делиться некоторой суммой денег (заранее договариваться нельзя). Если оба игрока делятся, оба получают по 3 условных доллара, если оба не хотят делиться — по 2 условных доллара.

Если же один делится, а другой делиться не хочет, первый получает всего 1 условный доллар, а второй получает целых 4 условных доллара.

В ДЗ предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Проще говоря, неважно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Но гораздо интереснее расширенный вариант.В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее.

В книге «Эволюция кооперации» (1984) Роберт Аксельрод (англ.) исследовал расширение сценария ДЗ, которое он назвал повторяющаяся дилемма заключённого (ПДЗ).

В ней участники делают выбор снова раз за разом и помнят предыдущие результаты. Аксельрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по ПДЗ. Программы, вошедшие в него, различались по алгоритмической сложности, начальной враждебности, способности к прощению и так далее.

Аксельрод открыл, что если игра повторялась долго среди множества игроков, каждый с разными стратегиями, «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально чисто эгоистические, через естественный отбор.

Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик.

Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда в любом случае сотрудничает с небольшой вероятностью (1-5 %).

Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.

Анализируя стратегии, набравшие лучшие результаты, Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат:

  • Добрая. Важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника.
  • Мстительная. Успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстительной стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим.
  • Прощающая. Другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.
  • Не завистливая. Последнее качество — не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент (что в принципе невозможно для «доброй» стратегии, то есть добрая стратегия никогда не может набрать больше очков, чем оппонент).

Таким образом, Аксельрод пришёл к утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми и прощающими и не завистливыми.

Если в одноходовой игре в любом случае доминирует стратегия предать, то в многоходовой оптимальная стратегия зависит от поведения других участников.

К примеру, если среди населения все друг друга обманывают, а один ведёт себя по принципу «око за око», он оказывается в небольшом проигрыше из-за потери на первом ходе. В такой популяции оптимальная стратегия — всегда предавать.

Если же число исповедующих принцип «око за око» больше, то результат уже зависит от их доли в обществе.

Хотя стратегия «око за око» считалась самой удачной простой стратегией, команда Университета Саутгемптона из Англии (под руководством профессора Николаса Дженнингса) представила новую стратегию на 20-ю годовщину Чемпионата по ПДЗ. Эта стратегия оказалась более успешной, чем «око за око».

Она основывалась на взаимодействии между программами, чтобы получить максимальный счёт для одной из них. Университет выставил на чемпионат 60 программ, которые распознавали друг друга по ряду действий на первых 5-10 ходах. Узнав другую, одна программа всегда сотрудничала, а другая предавала, что давало максимум очков предателю.

Если программа понимала, что оппонент — не саутгемптонский, она дальше всё время предавала его, чтобы минимизировать результат соперника. В результате эта стратегия заняла первые три места в соревновании, как и несколько мест подряд ниже.

Хотя эта эволюционно стабильная стратегия оказалась более эффективной в соревновании, это было достигнуто за счёт того, что в этом конкретном соревновании команда могла участвовать несколькими агентами. Если игрок может контролировать только одного агента, «око за око» оказывается лучшей.

Она также соблюдает правило запрета на коммуникации между игроками. То, что саутгемптонские программы исполняли «ритуальный танец» в первые 10 ходов, чтобы узнать друг друга, только подтверждает, насколько важна коммуникация в сдвиге баланса игры.Если ПДЗ играется ровно N раз (некая известная константа N), есть ещё один интересный факт.

Равновесие Нэша — всегда предавать. Доказываем по индукции: если оба сотрудничают, на последнем ходу выгодно предать, тогда у соперника не будет возможности отомстить. Поэтому оба предадут друг друга на последнем ходу. Раз соперник предаст на последнем ходу в любом случае, любой игрок захочет предать на предпоследнем ходу, и так далее.

Чтобы сотрудничество оставалось выгодным, необходимо, чтобы будущее было неопределённым для обоих игроков. Одно из решений — делать число N случайным и подсчитывать результаты по среднему выигрышу за ход.

Дилемма заключённого — фундаментальная для некоторых теорий о взаимодействии людей и доверии.

Из предположения модели ДЗ, что транзакция между двумя людьми требует доверия, доверительное поведение в популяциях может быть смоделировано при помощи многоигроковой повторяющейся версии игры. Это годами вдохновляло многих учёных. В 1975 году Грофман и Пул оценивали число работ, посвящённых этой теме, в количестве около 2000.

Источник: http://ru.wikipedia.org/wiki/Дилемма_заключенного

См. также:
http://ru.wikipedia.org/wiki/Трагедия_общин
http://ru.wikipedia.org/wiki/Трагедия_антиобщинLate For Work by 5secondfilms.com
Михаил Веллер. Нам некогда Нам некогда. Мы сдаем. Мы сдаем кровь и отчеты, взносы и ГТО, рапортыи корабли, экзамены и канализацию, пусковые объекты и жизненные позиции.Жены говорят, что мы сдаем. Сдаем к юбилеям и сверх плана, по частям исразу, в красные будни и черные субботы. Сдаем в гардероб и в поддержку,на подпись и на похороны, в ознаменование и в приемные пункты, сдаем навремя и на ученую степень, деньгами и зеленым горошком, в местком и вархив, сдаем раньше срока, стеклотару и билеты в театр, потому что в театрнекогда. У нас — своя трагедия. Нам некогда. Мы работаем. Труд краситчеловека. От этой краски за месяц отпуска еле отходишь. У нас слишком много начальников и лейкоцитов в крови, воды в сметанеи конкурентов в списке не жилье, проблем для голов и голов для ондатровыхшапок, поэтому мы плохо выглядим. Нам надо отдохнуть. Придти в себя. Полежать. Послушать тишину.Понюхать молодую травинку. А то некогда. Некогда читать книги и нотациидетям, писать жалобы и диссертации, ходить в гости и на лыжах, посещатьтеатр и дантиста, думать о жизни и рожать детей. А если не будет детей, то на черта нам вообще вся эта карусель?

Page 3

Общеизвестно крылатое выражение «В здоровом теле — здоровый дух». Т.е. типа тренируйся, занимайся спортом/физкультурой — будет здоровым тело, ну а заодно и дух будет на высоте. Типа «бытие определяет сознание» (кстати, Карл Генрих Маркс) и все такое. Инвалиды должны сильно обижаться, но не все так просто:

вики

«В здоровом теле здоровый дух» (лат.  «Mens sana in corpore sano») — крылатое латинское выражение. Традиционное понимание: сохраняя тело здоровым, человек сохраняет в себе и душевное здоровье.Выражение взято из Ювенала (Сатира Х, строка 356). Фраза вырвана из контекста, на самом деле ход мысли Ювенала был другим. Вот как звучит эта цитата в более развёрнутом варианте (перевод Ф. А. Петровского):Если ты просишь чего и святилищам жертвы приносишь — Там потроха, колбасу, что из белой свиньи приготовил, — Надо молить, чтобы ум был здравым в теле здоровом. Бодрого духа проси, что не знает страха пред смертью, Что почитает за дар природы предел своей жизни, Что в состоянье терпеть затрудненья какие угодно…

http://www.03www.ru/07-10-2.htm
Mens sana in corpore sano
Здоровый дух в здоровом теле.

Источник этого выражения — «Сатиры» древнеримского поэта Децима Юния Ювенала (ок.60-ок.127 г.н.э.). В книге X среди общих рассуждений о нравственности он говорит: Orandum est ut sit mens sana in corpore sano (Надо молить, чтобы ум был здравым в теле здоровом) Стих Ювенала был направлен против одностороннего увлечения телесными упражнениями.

Дальше поэт писал: «Бодрого духа проси, что не знает страха пред смертью, что почитает за дар природы предел своей жизни…». Интересно, что в разные эпохи афоризм Ювенала толковали по-разному, в том числе в противоположном смысле, против односторонности в обратном направлении, то есть преобладания духа над плотью.

В советское время, когда здравоохранение возглавлял Семашко, выражение «Mens sana» считалось реакционным и опровергалось примером Николая Островского, у которого при больном теле дух был здоровым. В 1988 году писатель Леонид Леонов в заметке «Искаженная истина» (Литературная газета, 16.03.

88) призвал пристальнее вглядеться в привычные аксиомы и отвергнуть в качестве констатации: «В здоровом теле здоровый дух», иначе духовное здоровье будет принадлежностью лишь спортсменов. У А.П.Чехова есть такое замечание: «Римляне говорили Mens sana in corpore sano. Не все то правда, что говорили римляне и греки».

Как бы то ни было, в какую бы сторону ни толковали бессмертный афоризм Ювенала,- в него заложена бесспорная идея гармонического развития человека: надо стремиться, чтобы и тело, и дух были здоровыми. Так вот и получается, что поэт сказал свое слово, а переводчики/толкователи легко обращают сказанное в любую сторону. P.S.

Забавна и история с фразой Ленина «Из всех искусств для нас важнейшим является кино». Какие только варианты не предлагали: Пока народ безграмотен, из всех искусств для нас важнейшими являются кино и цирк. Только полный идиот может думать, что из всех искусств для нас важнейшим является кино.

Из всех искусств для нас важнейшим является кино, вино и домино.

Оказывается нагло врут, со сканами первоисточника наперевес, обличают негодяев:
http://liveuser.livejournal.com/62878.html

http://oper.ru/news/read.php?t=1051601527

Источник: https://alik-ntu.livejournal.com/16744.html

Among us и дилемма заключенного — Игры на DTF

Prisoner’s dilemma. Дилемма заключенного

А что если попытаться рассмотреть простую на первый взгляд Among us с помощью теории, предназначенной в основном для изучения экономического поведения?

Игры и экономическая теория

Как и почему возможна кооперация? Что можно назвать рациональным поведением? Эти и другие вопросы являются ключевыми для теории игр (далее ТИ).

В случае с нашумевшей among us основу геймплея представляют, во-первых, доверие между игроками на стороне членов экипажа, и, во-вторых, способность предателей манипулировать этим доверием, обманывать и максимально незаметно устранять противоположную сторону. Несложно заметить, что область применения ТИ некоторым образом пересекается с базовыми элементами among us. На основании этого пересечения я собираюсь попытаться рассмотреть игру при помощи указанной методологии.

А чтобы не пугать незнакомых с ТИ читателей, горячо рекомендую прежде ознакомиться с браузерной игрой «эволюция доверия» которая создана на основе исследований Роберта Аксельрода в области ТИ и доверия, но и при нежелании дополнительной затраты умственных ресурсов, материал подготовлен в наиболее дружелюбной манере для незнакомого с темой читателя.

Однотипные рандомы

Как чаще всего развивается обычная партия в among us с рандомами? Хаотично, быстро и в большинстве случаев никаких взаимосвязей, способных привести к формированию доверительных отношений между игроками, не возникает. Так что обычно все решается либо уровнем мастерства предателей, либо зачастую случайными решениями игроков во время общего ания. Это в частности и послужило рождению такого большого числа мемов вокруг игры.

Вспомните, например, ситуации, когда предатель в течении ания начинает рьяно выдвигать чью-то кандидатуру, в результате чего еще стремительнее подбирается к победе, в случае если большинство игроков были склонны ему поверить. Так при чем здесь ТИ? Одной из классических моделей, вызвавших наибольшую сумятицу среди исследователей, является дилемма заключенного (именно она и разбирается в упомянутой ранее браузерной игре).

Дилемма заключенного

Если коротко, она показывает, что, несмотря на очевидную общую выгоду при кооперации игроков, они склонны получать куда меньшие выигрыши с целью избежать максимальных потерь. Главным её выводом, соответственно, является утверждение о невыгодности кооперации.

Чтобы не слишком уходить в психологические дебри, рассуждая о том, как игроки думают в рамках одной сессии с рандомами, просто скажем, что, как и в дилемме, каждый конкретный участник пытается максимизировать свой выигрыш, при этом ожидая обмана в равной степени от любого игрока, так как ему банально неизвестны их роли. «Но как же так, игроки же пытаются втереться в доверие друг к другу и действовать кооперативно?» — скажете вы. На что я отвечу: да, пытаются, но именно благодаря наличию предателей какая-либо возможность 100 процентного доверия пресекается на корню. Следовательно, мы и имеем кучу типичных партий с рандомами, протекающих примерно по одинаковому сценарию.

Бывшие друзья

Исходя из этого, многие игроки, в том числе и я, предпочитают заходить в among us и схожие проекты исключительно при наличии хотя бы некоторого количества друзей в лобби (а лучше, чтобы они полностью его заполнили).

Но по какой причине мы склонны предпочитать именно такую модель игры? Ответ также можно найти при помощи ТИ (и также с обращением к браузерной игре).

Для анализа игры с рандомами мы полноправно использовали дилемму заключенного, сыгранную единожды, но при добавлении такой переменной, как несменяемые каждую сессию игроки, следует изменить и принцип анализа.

В ходе исследований дилеммы заключенного и попыток выйти из состояния, в котором наиболее рациональная схема поведения сулит нам полное недоверие, Робертом Аксельродом было предложено проиграть дилемму некоторое конечное число раз с участием программ, имеющих разные паттерны поведения. Победителями этой схватки не на жизнь, а на доверие вышли стратегии, условно названные «око за око» (ты мне, я тебе) и “триггер» (только попробуй обмануть).

Теперь вернемся в among us.

Представим, что мы вместе с полным лобби наших друзей и знакомых решили провести вечер, обманывая друг друга ради собственного удовлетворения, и что же из этого выйдет? Фактором, который отличает эту ситуацию от рассматриваемой в начале, является (помимо повышенной коммуникации между участниками) несменяемость игроков в течение некоторого числа сессий и имеющееся еще до игры доверие к каждому из участников. Исходя из собственного опыта, я могу сказать, что чаще всего игроки были склонны либо повторять паттерны действие каждого из игроков в свою сторону, либо однозначно перестать пытаться нормально коммуницировать с теми, кто их однократно (или может многократно) обманул.

Это приводит нас к достаточно четкому соответствию с тем, к чему в своих исследованиях пришел Аксельрод, а также дополнительно легитимизирует использованные мною методы анализа.

Among us нельзя назвать оригинальной не только в силу того, что она базируется на классической «мафии», но и потому, что за последнее время выходило достаточное количество схожих игр (взять, например, project winter).

Популярность же её, на мой взгляд, базируется в первую очередь на крайне низком пороге вхождения (что подкрепляется мультиплатформенностью), и “удачное» время её актуализации благодаря стримерам и дополнительной рекламе. Нельзя не упомянуть и упрямство разработчиков, не сдавшихся после первых неудач, а продолжавших поддерживать игру.

Так или иначе, именно благодаря этим факторам among us рождает новые стимулы для исследования рационального поведения людей, и, что не менее важно, позволяет нам весело провести время с друзьями или без.

Источник: https://dtf.ru/games/241742-among-us-i-dilemma-zaklyuchennogo

Дилемма заключённых

Prisoner’s dilemma. Дилемма заключенного

Материал из Posmotre.li

« Ранее, на одном из их занятий, Гарри про неё уже рассказывал. Дилемма заключённого состоит в следующем: двое заключённых заперты в отдельных камерах. Против каждого из них есть улики, не слишком серьёзные, но достаточные, чтобы посадить их в тюрьму на два года. Каждый узник может выбрать сотрудничество с властями: предать другого и свидетельствовать против него в суде, в этом случае сам он получит только год тюрьмы, а другой получит на два года больше. Или узник может хранить молчание. Таким образом, если оба узника свидетельствуют друг против друга, оба получают по три года тюрьмы, если оба молчат — оба получают по два года. Но если один соглашается сотрудничать с властями, а второй молчит, то первый получает один год, а второй — четыре.И оба заключённых должны принять решение, не зная, что сделает другой, и изменить решение в дальнейшем нельзя.Драко тогда заметил, что будь заключённые Пожирателями Смерти времён Войны Волшебников, Тёмный Лорд убил бы предателя.»
— ГПиМРМ

Дилемма заключённых — задача из теории игр, условия — см. эпиграф.

Двое игроков и выбор: поступить кооперативно, что будет означать для обоих игроков большую общую выгоду, если второй игрок выберет то же самое, или минимальный выигрыш себе, максимальный — второму игроку, если он выберет предать, либо — предать, что будет означать максимальный выигрыш себе и минимальный — другому игроку, если тот поступит кооперативно, или небольшой (меньше, чем при обоюдной кооперации, но больше, чем для преданного кооператора) выигрыш для обоих, если и второй игрок предал.

проблема ситуации: если оба участника стараются вести себя, как разумные эгоисты, то есть, всегда максимизировать свою выгоду, не заботясь о чужой, они оба выберут предательство (ведь оно выгоднее при обоих вариантах поведения другого участника!) и окажутся в менее выигрышном положении, чем если оба были бы альтруистами и смогли взаимно скооперироваться.

Известна также повторяющаяся дилемма заключённых, в которой участники делают выбор несколько раз подряд, и предыдущий выбор второго игрока им известен. В таком варианте игры разумный эгоизм приобретает смысл: ты можешь предавать в ответ на предательство и кооперироваться в ответ на кооперацию, награждая оппонента за стремление к увеличению общей выгоды и наказывая за его отсутствие.

Дилемма заключённых в обобщённом виде описывает мир в целом.

Она показывает, почему теоретически общество способно быть справедливым и работать на благо каждого, а не только горстки избранных: ведь в реальности-то воплощается как раз продолженный вариант, в котором разумно-кооперирующиеся стратегии — выигрышные! Она же объясняет, откуда у человека и животных могло сформироваться инстинктивное понимание этики без вмешательства сверхъестественных сил: просто быть склонным к кооперации в обмен на кооперацию более выгодно в реальности, чем всегда выбирать вариант «предать».

При утоплении педали в пол может превратиться в садистский выбор.

Фольклор[править]

  • Притча о Рае и Аде. Есть котёл с обжигающе-горячим супом и длинные металлические ложки с деревянными рукоятками. Вокруг люди. Каждый пытается зачерпнуть и съесть, но ложка слишком длинная, чтоб поднести ко рту, и за середину не схватишь: горячо. Поэтому в основном суп проливается, едоки обжигаются. Это Ад. Тот же котёл с ложками, только люди разбились на группы и кормят друг друга. Все сыты. Это Рай.
    • Капитан Очевидность подсказывает, что в реальной жизни сформировалась бы прослойка «элиты», которую бы кормили остальные — не из желания взаимопомощи, а в добровольно-принудительном порядке. Остальным же доставалось бы изредка «от щедрот», чтобы не сдохли. То есть постановка вопроса изначально глупа.
      • Ну так в Рай как бы и попадают только люди, достойные Рая. При чём здесь реальная жизнь?..
      • Замечательно перекликается с эпиграфом: «Тебе лишь бы пожрать!».
    • Вообще сюжет можно встретить в волшебных сказках самых разных народов.

      Обычно сразу оговаривается, что бесплотные духи никак друг на друга физически воздействовать не могут, так что заставить другого себя кормить не выйдет — только кооперация, причём, если недодашь сотрапезнику еды, он спокойно может сделать то же самое.

Литература[править]

  • Рассказ «Первый контакт» Мюррея Лейнстера. Исследовательский звездолет наткнулся в Крабовидной туманности на корабль инопланетной расы, отличной от людей биологически, но с такой же психологией. Теперь корабль, который пойдет домой первым, рискует выдать местонахождение своей родной планеты, что может не повлиять ни на что, а может начать войну. Остается уничтожить оппонента — но это значит, навсегда лишиться возможности сотрудничать (не говоря уже о том, что экипажи успели частично сдружиться и сама мысль об уничтожении противна и людям, и чужим). Выход все же находят, причем опять симметрично: обменяться кораблями, предварительно сломав аппаратуру слежения, и разойтись по домам, договорившись о новой встрече на этом же месте.
  • «Квантовый вор»: Соборность, местная коллективистская технократия, создала тюрьму «Дилемма». Заключённые в ней разумы (тела в эпоху трансгуманизма мало кого заботят) должны регулярно играть друг с другом в продлённую дилемму заключённых, те, кто выигрывают, получают разные мелкие удобства в виртуальные камеры, а те, кто слишком много проигрывают — уничтожаются, при этом каждый заключённый многократно копируется. Таким образом отбираются те варианты личности, которые склонны к сотрудничеству (ведь только такие наиболее успешны в продлённой дилемме заключённых!), в теории — до полного исправления. На практике существуют Ле Фламбер и Абсолютный Предатель, на которых эта хитрая технология промывания мозгов обломала зубы.

Кино[править]

  • The Dark Knight — Джокер закладывает взрывчатку на двух паромах, пересекающих залив. На каждом пароме — радиовзрыватель от другого парома, у Джокера радиовзрыватель от обоих. Джокер выходит на связь и сообщает, что если один из паромов взорвет другой — он уцелеет, а если за полчаса не взорвется ни один паром, Джокер взорвет оба. На одном из паромов — простые граждане, на другом — заключенные, которых переправляют в Аркхэмскую тюрьму. Кто же окажется порядочнее? На самом деле те, кто нажали бы кнопку, взорвались бы сами. Испытание выдержали и те, и другие, а Джокеру помешал взорвать паромы Бэтмен.
  • Королевская битва — ошейники взрываются при попытке побега, в особых зонах, местоположение которых меняется, и в нашем случае — если за сутки никто не был убит.

Мультсериалы[править]

  • RWBY именно в такой ситуации оказались герои в 7 томе. Рассказать Айронвуду правду о Салем или нет. Да для дальнейшей защиты Атласа нужна вся информация о враге, но как он с ней поступит. С одной стороны Айронвуд хороший человек отец солдатам, готовый на все ради защиты своей страны. Но с другой защищать он умеет херова, а временами не очень адекватно. Да и вообще должен ли простой народ знать правду?

игры[править]

  • SWKOTOR — Кашиик, в качестве одной из задач, где терминал Предтеч испытывает героя с целью выяснить, достоин ли он получить доступ к Звёздной Карте.
  • The Talos Principle: Road to Gehenna — игрок может сыграть несколько раундов дилеммы, как часть побочного контента («форума»).
  • Streets of Rage (а также его ремейк) — в конце игры главзлодей Хорхе предлагает герою присоединиться к нему. Если игроков двое, то каждый делает свой выбор. Откажутся оба — будет финальная битва и хорошая концовка. Согласятся оба — будут отправлены на два уровня назад при помощи люка в полу. Если же разойдутся в выборе — придётся драться друг с другом насмерть, после чего концовка зависит от победившего: хорошая — для того, кто отказался изначально, плохая (если точнее, злодейская с поворотом) — для согласившегося.
  • Серия Zero Escape:
    • Virtue’s Last Reward — практически вся об этом: после каждой порции «way-out» идёт ание, в котором есть два выбора — довериться оппоненту и предать его. Очки начисляются/отнимаются в зависимости от выбора обоих сторон, получивший 9 и более очков может покинуть Игру, потерявший все очки — умирает.
    • Zero Time Dilemma: в одной из комнат с такой сталкивается команда C, точнее, Карлос и Дзюнпэй. Принцип такой же — при наборе определённого количества очков открывается дверь (из этой конкретной комнаты), при потере всех персонаж умирает. Пройти её сразу невозможно, потому что если Карлос выберет довериться, Дзюнпэй нажмёт «предать», и наоборот. Итоговый выход из комнаты происходит с помощью Аканэ и морфогенетического поля.
      • Отчасти по такому же принципу построены многие из садистских выборов. У каждой из команд есть возможность убить две другие кислотным душем, при этом это может сделать только тот, кто нажал на кнопку раньше остальных; нажимать, чтобы выжить самому, или понадеяться на гуманизм шести еле знакомых людей? Проать, как и было уговорено, рискуя, что против тебя объединятся две другие команды, или нанести превентивный удар по другой команде, спасая себя, но возможно, убивая при этом невинных людей?..

Источник: https://posmotre.li/%D0%94%D0%B8%D0%BB%D0%B5%D0%BC%D0%BC%D0%B0_%D0%B7%D0%B0%D0%BA%D0%BB%D1%8E%D1%87%D1%91%D0%BD%D0%BD%D1%8B%D1%85

Дилемма заключенных в теории игр: от абстракций к конкретике – SPRINTinvest.RU

Prisoner’s dilemma. Дилемма заключенного

Дилемма заключенных относится к типу экономической игры, в которой равновесие Нэша таково, что оба игрока оказываются в худшем положении, даже если они оба выбирают свои оптимальные стратегии.

Дилемма заключенных — это классический пример игры, в которой участвуют два подозреваемых, скажем P и Q, арестованные полицией и которые должны решить, признаваться им или нет.

Если один сознается, а другой нет, то заключенный, который сознается, получает более легкий тюремный срок, скажем, 1 год, а заключенный, который не сознается, получает очень суровый срок, скажем, 8 лет.

Если ни один из них не признается, они оба получают более легкие сроки, скажем, по 2 года каждый; но если оба признаются, то оба получают строгий срок, скажем, по 4 года каждый.

Игра может быть визуализирована с помощью следующей матрицы выплат:

Выплаты в тюрьмеЗаключенный Q
ПризнатьсяНе признаться
Заключенный PПризнаться-4, -4-1, -8
Не признаться-8, -1-2, -2

Комбинированная оптимальная стратегия для обоих заключенных — не признаваться в содеянном. Именно потому, что это привело бы к минимальному объединенному тюремному сроку для них.

Но поскольку они не могут общаться и сотрудничать, пытаясь сделать все возможное индивидуально, они выбирают стратегии, которые обрекают их обоих.

Давайте посмотрим на игру с точки зрения заключенного P. Если заключенный Q сознается, то заключенному Р тоже лучше признаться, потому что в противном случае он получил бы срок 8 лет вместо 4 лет.

Точно так же, если заключенный Q не сознается, то в интересах заключенного P сознаться, потому что, признавшись, он получит срок в 1 год вместо 2 лет. Следовательно, независимо от того, что делает заключенный Q, признание является доминирующей стратегией для заключенного P.

Теперь давайте рассмотрим точку зрения заключенного Q. Он знает, что признание является доминирующей стратегией заключенного P. Он не хочет не признаваться и получить 8-летний срок и признаться. Но когда он это делает, оба получают по 4 года тюремного заключения каждый.

В конечном счете и тот и другой находятся в худшем положении, потому что они получают по 4 года каждый вместо всего лишь 2 лет каждый.

Но они не могут избежать этого печального исхода, потому что не могут сотрудничать, и любая другая стратегия была бы худшей для каждого заключенного в отдельности.

Равновесие Нэша в дилемме заключенных

Результатом дилеммы заключенного является равновесие Нэша. Равновесие Нэша — это такая комбинация стратегий, при которой у фирмы-игрока есть какой-либо стимул в одностороннем порядке изменить свою стратегию.

Когда оба игрока в игре имеют доминирующие стратегии, результатом, который является пересечением доминирующих стратегий, является равновесие Нэша.

В дилемме заключенных, поскольку признание является доминирующей стратегией для каждого заключенного, равновесие Нэша возникает, когда оба признаются.

Это равновесие Нэша, потому что ни один заключенный не станет лучше, если в одностороннем порядке изменит свою стратегию.

Например, если заключенный Р решит не признаваться, в то время как заключенный Q действительно признается, то заключенный Р получит 8 лет вместо 4 лет. Следовательно, заключенному Р будет хуже, если он отойдет от равновесия Нэша.

Он не станет выбирать иной стратегии, кроме той, что диктует равновесие Нэша. Этот пример показывает, что равновесие Нэша является самоподкрепляющимся и стабильным.

Примеры

Хотя дилемма заключенных, рассмотренная выше, является абстрактной концепцией, многие реальные ситуации очень похожи на нее.

Пример 1. Фирмы знают, что если они не рекламируют, то могут сохранить свою существующую долю рынка и прикарманить сэкономленный рекламный бюджет в качестве дополнительной прибыли, но они все равно рекламируют, потому что каждая фирма боится, что если она не рекламирует, а другая фирма делает это, то она потеряет свою долю рынка.

Поскольку обе фирмы испытывают один и тот же страх, обе они рекламируют, обе имеют более низкую прибыль (из-за более высоких расходов на рекламу), и никто не получает никакой доли рынка.

Пример 2. Фирмы, принимающие решение о том, следует ли нанять адвоката, чтобы представлять их интересы в арбитраже, будут коллективно лучше, если они решат не нанимать адвоката.

Но каждая фирма нанимает адвоката из страха, что если другая фирма наймет адвоката, а они этого не сделают, вероятность того, что другая фирма выиграет в арбитраже, значительно возрастет.

Пример 3. Фирмы в олигополии находятся в лучшем положении, если они могут одновременно ограничивать свой выпуск и устанавливать монопольную цену.

Но так как сговор незаконен, то и то, и другое дает более высокую отдачу, что снижает отдачу каждой фирме. Модель Курно является иллюстрацией такой дилеммы заключенных.

Источник: https://sprintinvest.ru/dilemma-zaklyuchennyh-v-teorii-igr-ot-abstrakcij-k-konkretike

Дилемма заключенного – что это такое? Злая игра, в которую себя помещают люди (+ реалистичный пример)

Prisoner’s dilemma. Дилемма заключенного

Привет. В этой статье разбираем что такое Дилемма заключенных, когда двум лучше договориться бы, а они не могут и получают худший результат. В статье найдете определение, пример из реальной жизни + что такое повторяющаяся дилемма заключенных и как это проявляется вне тюремного контекста

Суть дилеммы заключенных простыми словами

Дилемма заключенного (Prisoner's dilemma) – это базовая проблема в теории игр. Суть проблемы заключается в том, что участники игры могут отказаться от сотрудничества друг с другом, игнорируя возможные выгоды. Такая модель поведения основана на том, что люди желают увеличить свой выигрыш, не пытаясь приумножить чужой выигрыш.

2 интересных личностей “взяли” и предложили каждому уникальное предложение (почти как Black Friday):

Вариант 1. Ты сдаешь 2’го, 2’й тебя не сдает, тогда отделаешься легким испугом – второму дадут 10 лет строгача и пиши пропало;

Вариант 2. Ты сдаешь 2’го, 2’й сдает тебя – на 2 года на перевоспитание оба;

Вариант 3. Ты молчишь, твой кентярик тоже молчит, по 6 месяцев в колонии поселении каждому чтобы не скучали…

Вариант 4. Ты молчишь, но если тебя сдаст 2’й, то мы тебе дарим путевку на 10 лет в санаторий строго режима.

Источник: https://1timer.ru/podruchnyj-material/dilemma-zakljuchennogo/

Все термины
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: