konstansa: (Default)
konstansa ([personal profile] konstansa) wrote2010-06-04 07:01 pm

Дилемма заключенного

http://polite.com.ua/uploads/posts/2009-04/thumbs/1239877278_5404.jpg
Почему люди не сотрудничают друг с другом? Ну или почему люди сотрудничают не всегда? Почему мы не всегда ладим друг с другом? Ведь если я помогу тебе, а потом ты мне, разве от этого не станет лучше нам обоим?

Для тех, кто нашел выложенную мной Даосскую пословицу спорной или даже "совершенно не имеющей смысла", предлагаю перейти от теории к практике. Давайте рассмотрим "Дилемму заключенного" и задумаемся о своем поведении в этой игре.


В теории игр есть игра "Дилемма заключенного". Само название Рrisoner’s dilemma дал игре 40 лет назад Альберт Такер, и он же сформулировал ее в виде выбора, который делают "арестованные". С тех пор эта игра занимает социологов и психологов, ее исследуют, осмысляют и видоизменяют.
Популярность игры состоит в том, что она описывает выбор, который встает перед всеми нами изо дня в день в течение всей нашей жизни. Это выбор между сотрудничеством с другими людьми и нашими личными интересами.

Как во всей теории игр, в "Дилемме заключенного" каждый игрок стремится максимизировать свой собственный выигрыш, не заботясь о выгоде других игроков. Здесь предательство доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Неважно, что сделает другой игрок. Каждый выиграет больше, если предаст другого. Поскольку предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.
Ведя себя рационально по отдельности, вместе участники приходят к нерациональному решению: если оба предадут, то в сумме получат меньший выигрыш, чем если бы сотрудничали. В этом и заключается дилемма.

Дилемма заключённого имеет место, когда оба заботятся только о минимизации собственного срока заключения, и когда между возможными исходами существуют следующие соотношения: искушение лучше, чем вознаграждение, вознаграждение лучше, чем наказание, наказание лучше, чем неудача.

Классическая дилемма заключённого
В основе дилеммы лежит история о двух подозреваемых, которых по отдельности допрашивает окружной прокурор (Rapoport, 1960). Оба они участвовали в преступлении, но у прокурора пока есть только доказательства их виновности в менее серьезном преступлении. Поэтому он по отдельности предлагает каждому из них сознаться. Если один сознается, а другой нет, прокурор гарантирует первому освобождение, а его признание использует для обвинения второго в более тяжком преступлении. Если сознаются оба, каждый получит умеренный срок. Если ни один не признается, наказание для обоих будет незначительным. У арестованных есть ночь на размышление.
Каждый заключённый сам решает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой.

Чтобы свести свой срок к минимуму, многие признаются, несмотря на то, что совместное признание ведет к более суровому приговору, чем обоюдное отрицание вины. Независимо от решения другого, для каждого из них лучше будет признаться. Если при этом признается и другой, он получит умеренный срок, а не максимальный. Если же тот, другой, не признается, то первый вообще выйдет на свободу. Разумеется, оба заключенных рассуждают одинаково.

Примерно в двух тысячах исследований студенты университетов сталкивались с различными вариантами "Дилеммы заключенного", где ценой игры был не срок заключения, а деньги или фишки. При заданных условиях в любом случае каждому игроку выгодней обособиться. Однако в том-то и вся загвоздка что, не сотрудничая, оба игрока получат гораздо меньше, чем если бы они доверились друг другу и извлекли взаимную выгоду. Дилемма загоняет участников в психологическую ловушку: оба понимают, что могли бы взаимно выгадать; но недоверие друг к другу делает сотрудничество невозможным.

ИТАК: Если оба подозреваемых признаются, каждый из них получит по пять лет. Если не признается ни один, оба получат по одному году. Если признается только один, его отпустят на свободу в благодарность за показания, которые позволят приговорить другого к десяти годам заключения. Будь вы одним из заключенных, вы признались бы?

Выбор предлагается сделать человеку, уже попавшему в беду, и единственное, что он может сделать – это минимизировать неизбежные потери. Сейчас он уже за решеткой и дальше может только проиграть. Страх включает инстинкт самосохранения, который зачастую сильнее моральных норм и обязательств.
Поставим себя на место одного из них, и, рассуждая исключительно рационально, попытаемся принять решение. Если мы испуганы, мы вероятнее всего будем думать только о себе.

Вот примерный ход мысли заключенного:
"Если я промолчу, а он расколется, я сяду на 10 лет. Этого допустить нельзя. Если я расколюсь, и он расколется, мы оба сядем на 5. Тоже плохо, но все-таки не 10 лет. Если он не расколется, то он сядет на 10 лет, но зато я выйду на волю. Есть, конечное, шанс, что он не расколется, и если я тоже не расколюсь, мы получим оба по несколько месяцев. Но риск сесть на 10 лет слишком велик. Значит, я не могу рисковать и дам на него показания. Вне зависимости от того, даст ли он показания на меня или нет, я смогу избежать самого страшного – десяти лет тюрьмы, а может – и вовсе выйду на свободу, если он промолчит".
Аналогично другой заключённый приходит к тому же выводу.

Действуя рационально в своих интересах, участники этой игры приходят к иррациональному результату: по крайней мере, один из них сядет, а возможно и оба, в то время как они могли бы отделаться шуточным сроком, если бы были уверены, что сообщник промолчит. Дилемма "молчать - давать показания" разрешается в пользу дачи показаний, хотя с точки зрения коллективного интереса это решение явно не оптимальное.
С точки зрения группы лучше сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным.

Дилемма заключенного - это повторяющаяся игра.
Игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. При повторной игре каждый игрок может "наказать" другого за несотрудничество в предыдущей партии.

Лучшая стратегия, которая обеспечивает лучшие результаты для играющего "Око за око". То есть сотрудничать на первой итерации игры, а каждым следующим шагом делать то же самое, что сделал оппонент на предыдущем шаге. Играющий по этой стратегии никогда не нападает первым и всегда мстит. Любой, напавший первым на такого игрока, заклинивает всю систему на бесконечную месть.
Чтобы получить больший выигрыш надо для проверки простить, и если программа ответит сотрудничеством, выиграют оба.

Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или чрезмерно плохо. Если они всё время будут действовать так, то проиграют из-за своей излишней агрессивности или излишней доброты. С получением опыта они реальнее оценивают вероятность предательства и добиваются лучших результатов.
Можно уменьшить вероятность предательства при помощи сотрудничества в ранних играх, укрепляя доверие. Тогда самопожертвование в некоторых ситуациях может усилить моральный дух группы. Если группа маленькая, на позитивное поведение с большей вероятностью ответят взаимностью, что поощрит играющих на дальнейшее сотрудничество. Это связано с ещё одной дилеммой, что хорошее отношение без причины— это потакание, которое может ухудшить моральные качества.

Приведенная в дилемме заключенного Даосская пословица может служить отправной точкой стратегии игр.
• Отвечать добром на добро — добро.
• Отвечать злом на зло — добро
• Отвечать злом на добро — зло
• Отвечать добром на зло — зло.

Исходя из этого, выводим правила:
- Игрок отвечает "добром" на первом шаге отношений в ожидании "добра", выгоды для себя.
- Последующие шаги - адекватное противодействие действию оппонента также с выгодой для себя.
Именно адекватное! Любое неадекватное действие в результате приводит к ущербу, как моральному, так и материальному. Обоснование этики в этих правилах индивидуалистично и не принимается априори, а выводится из теории игр как поведение, несущее игроку выгоду.


Анализируя стратегии, набравшие лучшие результаты, выявлено несколько условий, необходимых, чтобы стратегия получила высокий результат:
Добрая Не предавать, пока этого не сделает противник. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет "бить" первой.
Мстительная Всегда мстить, не позволяя себе быть слепым оптимистом. Всегда сотрудничать - это очень плохой выбор, поскольку "подлые" стратегии обязательно воспользуются этим.
Прощающая Уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент прекратил предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.
Независтливая Не быть завистливым и не пытаться набрать больше очков, чем оппонент, что в принципе невозможно для "доброй" стратегии, которая никогда не сможет набрать больше очков, чем оппонент.

Если в одноходовой игре в любом случае доминирует стратегия предать, то в многоходовой оптимальная стратегия зависит от поведения других участников. Дилемма заключённого предполагает, что транзакция между двумя людьми требует доверия, а доверительное поведение в группе может быть смоделировано при помощи повторяющейся версии игры с большим количеством участников.

PS Дилемму заключенного легко понять, представив ее в виде похожей, но другой игры — "Обмен закрытыми сумками":
Два человека встречаются и обмениваются закрытыми сумками, зная, что одна из них содержит деньги, другая — товар. Каждый игрок имеет выбор: уважать сделку и положить в сумку то, о чём договорились, или обмануть партнёра, отдав ему пустую сумку.
В этой игре обман всегда будет наилучшим решением, и рациональные игроки никогда не станут играть в неё, с учетом того, что игра повторяется, и каждый ее участник помнит предыдущие результаты или имеет доступ к «коллективной памяти» и множеству обменов повторяющихся длительное время. Без памяти эта игра просто не имела смысла и мало что объясняла бы в поведении людей.

Отсюда и отсюда

[identity profile] everlasting-cat.livejournal.com 2010-06-04 03:03 pm (UTC)(link)
"Это выбор между сотрудничеством с другими людьми и нашими личными интересами."

Выбор (в жизни, а не в логической игре) на самом деле не между этим и этим, а между доверием и недоверием.

[identity profile] konstansa.livejournal.com 2010-06-04 03:11 pm (UTC)(link)
Ну тк одно из другого вытекает))
Будет доверие - будет сотрудничество.

Ну вот скажи, как я могу довериться незнакомому мне человеку?
Никак. Там же не мой друг за решеткой в соседней камере.

[identity profile] everlasting-cat.livejournal.com 2010-06-04 03:43 pm (UTC)(link)
Ну да. Поэтому и применять условия этой игры к жЫзни никак нельзя :))



[identity profile] konstansa.livejournal.com 2010-06-04 04:01 pm (UTC)(link)
ну почему же))
все люди когда-то бывали нам незнакомыми...

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 16:57 (UTC) - Expand

[identity profile] ptica-gamayun.livejournal.com 2010-06-04 04:04 pm (UTC)(link)
Не видела раньше даосскую пословицу, так что отвечу тут.
По поводу "зла на зло" и "добра на зло" - есть вот такая притча: http://pritchi.ru/id_63
А без притчи скажу так: тот, кто сотворил зло, ответственен за свой поступок. Тот, кто ответил злом на зло, точно так же ответственен за свое зло. И потом, на небесах (или ночью наедине с собой) человек все равно останется с этим вот: я совершил зло. И уже неважно, что там было перед этим, важно только - я совершил зло.

Кстати, ты не задумывалась, почему во многих фильмах противостояние Доброго и Злого завершается смертью Злого, но не от руки Доброго, а как бы "случайно" - злой сам куда-то сваливается, натыкается на что-нибудь острое и т.п.?

[identity profile] konstansa.livejournal.com 2010-06-04 04:54 pm (UTC)(link)
Видишь ли, ты пропустила важное слово "адекватное действие".
так что притча не катит))
Зло возвращаемое должно быть адекватно злу причиненному.
Если меня обозвали дурой, а я мечом размахивать начну, это неадевтат.
Эта пословица для разумных людей.

Я за свое зло отвечаю. да. и должна дозировать его.
Но ответить на зло добром - значит поощрить его.

[identity profile] ptica-gamayun.livejournal.com 2010-06-04 06:17 pm (UTC)(link)
Притча вполне себе катит, потому что злодей убил 99 человек, а этот с ним еще и разговаривал вместо того, чтобы пулю в лоб убивцу. Избавить мир от такого урода было бы вполне адекватным действием. Но мудрец выбрал другой путь и, как видим, это оказалось более правильным.
ну а... "если тебя обозвали дурой", обозвать дураком будет адекватно? ;)
и как ты считаешь, из опыта общения в инете, что скорее остановит поток злости от того, кто обозвал первым: ответное обзывательство или комплимент?

если меня обзовут дурой

[identity profile] konstansa.livejournal.com 2010-06-04 06:35 pm (UTC)(link)
если меня тут обзовут дурой, адекватным действием будет бан.
только этим можно остановить поток злости)

ответное обзывательство не практикую) смайликов за это тоже не раздаю)

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 18:56 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-05 19:55 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-05 20:19 (UTC) - Expand

из личного опыта

[identity profile] konstansa.livejournal.com 2010-06-04 05:22 pm (UTC)(link)
Галь, вот что еще тебе скажу)
Я ночью наедине с собой ну ни малейших угрызений совести не испытываю от того, что дала мужику по голове бутылкой. А может и убила) не знаю) Если убила, еще лучше!
Если не читала, вот здесь про это http://konstansa.livejournal.com/115095.html

Это и есть злом на зло.
И не надо мне говорить о вынужденной защите))
Любое действие рассматривается, как отдельное.
Я ответила злом на зло. Я ему дала по голове, и это для него ЗЛО, потому что он, наверно, голову долго лечил...

Re: из личного опыта

[identity profile] ptica-gamayun.livejournal.com 2010-06-04 06:32 pm (UTC)(link)
Я по этому поводу скажу так. Носящий оружие в кармане неизбежно рано или поздно попадет в ситуацию, вынуждающую его это оружие применить. Или даже так: при возникновении ситуации, в которой можно было бы обойтись и без оружия, имеющий оружие обязательно его применит.
Вспомнила похожую ситуацию, знакомая рассказывала. В подъезде стояла она у почтовых ящиков и услышала сзади тяжелое дыхание. То есть еще секунда, и он бы напал. Бутылки у нее не было :) и она вдруг выпалила: "Товарищ! Где твоя комсомольская совесть?!?" Тот не вынес когнитивного диссонанса и сделал ноги.

Эл, я не к тому, что "убивать нехорошо" и пр. Мир многообразен, и наверняка существуют ситуации, в которых адекватным будет и такой способ их решения. Но. Надо помнить, что способов решения ВСЕГДА больше одного. И человек, пусть неосознанно, но выбирает. Что, конечно, не мешает ему потом говорить: "У меня не было выбора" :)

И я походу не верю тебе, когда ты говоришь: "Если убила, еще лучше!" К тому же, ты сама написала: "Вот до сих пор как вспомню, думаю, убила ли я мужика." Думается мне, что если бы ты точно знала, что убила, ты не писала бы об этом так бодренько. Ммм?

[identity profile] konstansa.livejournal.com 2010-06-04 06:43 pm (UTC)(link)
по прошествии времени, поняла, что не переживала бы, если бы сегодня мне вдруг сказали: "А помнишь того мужика, которого ты тогда бутылкой? так вот он того... умер!"
Я бы считала, что какую-нибудь менее прыткую девочку от насилия спасла.

Ты права, конечно)) однозначных рецептов нет.
Выбор есть всегда. И только мы за него отвечаем, сами.
Я стараюсь отвечать на зло так, чтобы потом не переживать за превышение.
Но отвечаю всегда! чтобы не повадно было))

PS на добро - вдвойне овечаю.

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 20:10 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 20:29 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 20:42 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 20:50 (UTC) - Expand

(no subject)

[personal profile] med_cat - 2010-11-12 19:23 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-11-12 19:26 (UTC) - Expand

(no subject)

[personal profile] med_cat - 2010-11-12 19:29 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-11-12 19:32 (UTC) - Expand

(no subject)

[personal profile] med_cat - 2010-11-12 19:36 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-11-12 19:40 (UTC) - Expand

(no subject)

[personal profile] med_cat - 2010-11-12 19:48 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-11-12 19:56 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 20:46 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 21:00 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 20:27 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-04 20:39 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-05 19:46 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-05 20:03 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-05 20:29 (UTC) - Expand

[identity profile] ptica-gamayun.livejournal.com 2010-06-04 04:08 pm (UTC)(link)
Да, и по поводу дилеммы. Далеко не все жизненные ситуации могут быть описаны через эту дилемму. Поэтому я бы не стала следовать ей всегда.

[identity profile] konstansa.livejournal.com 2010-06-04 04:55 pm (UTC)(link)
Это игра, для того чтобы задуматься.
Даже дети обучаются, играя.

[identity profile] kildishev.livejournal.com 2010-06-21 05:20 am (UTC)(link)
Эл, привет ) давно не захаживал - лето однако )))

из этой же серии "трагедию общин" посмотри, в принципе это все что нужно знать, чтобы понять Российскую действительность ;)

[identity profile] konstansa.livejournal.com 2010-06-21 10:35 am (UTC)(link)
ну не только...
есть еще эксперимент Милграма. тоже любопытно)

(no subject)

[identity profile] kildishev.livejournal.com - 2010-06-21 15:02 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-21 15:19 (UTC) - Expand

[identity profile] kildishev.livejournal.com 2010-06-21 05:16 am (UTC)(link)
Абсолютно любые где есть элемент игры т.е. выигрыш и проигрыш... причем не обязательно материальные - эмоциональный призы тоже катят )))

Впрочем если есть конкретный пример, который сюда не вписывается то с удовольствием послушаю ;)

[identity profile] middleaged.livejournal.com 2010-06-04 05:12 pm (UTC)(link)
Очень интересные рассуждения и выводы!
Возьмем на заметку :-)

[identity profile] konstansa.livejournal.com 2010-06-04 05:24 pm (UTC)(link)
)) ну да) это скорее информация к размышлению))

[identity profile] kildishev.livejournal.com 2010-06-21 05:28 am (UTC)(link)
а еще ты явно смягчила...))) вопрос - "почему (какие-то) люди не всегда сотрудничают друг с другом?" - уводит товарищей в сторону...

ведь речь не только о сотрудничестве, но и о предательстве? поэтому есть смысл поразмыслить - по какой причине близкие люди (которым казалось сам бог велел сотрудничать) сплошь и рядом предают друг друга?

[identity profile] konstansa.livejournal.com 2010-06-21 10:33 am (UTC)(link)
уводит тех, кто даже не хочет задуматься)
ничего дезориентирующего в этой фразе нет. это как-бы преамбула.
не только не сотрудничают, но еще и предают по полной.

(no subject)

[identity profile] kildishev.livejournal.com - 2010-06-21 15:04 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-06-21 15:06 (UTC) - Expand
med_cat: (Default)

[personal profile] med_cat 2010-11-12 07:18 pm (UTC)(link)
Mhm, I see...figures.
med_cat: (Default)

[personal profile] med_cat 2010-11-12 07:18 pm (UTC)(link)
There's smth somewhat connected with this--have you ever read about Milgram's studies of obedience? in the US, in the 1960s?

P.S. And crowd psychology experiment, with a smoke-filled room?

P.P.S. Ah yes, I see in comments above that you have...
Edited 2010-11-12 19:19 (UTC)

[identity profile] konstansa.livejournal.com 2010-11-12 07:23 pm (UTC)(link)
Да) у Милграма очень интересный эксперимент.
вот совсем недавно думала озвучить отдельным постом.

А что за эксперимент в прокуренной комнате? я такой не знаю.
med_cat: (Default)

[personal profile] med_cat 2010-11-12 07:28 pm (UTC)(link)
Like this:

the people experimented upon are told they have to fill out a questionnaire, that is the experiment. The room is divided into cubicles, they can't see each other.

As they fill out the questionnaire, the room begins to fill with smoke...

and THAT is the actual experiment: how long will it take the person to abandon the questionnaire and summon the person in charge of the experiment and say, "hey smth is on fire or what?"

The results are, when a person KNOWS there are others in the room with him/her, it takes him/her MUCH longer to summon the experimenter...we subconsciously rely on others...you see?

I can tell you an actual story pertaining to this, if you want...

[identity profile] konstansa.livejournal.com 2010-11-12 07:39 pm (UTC)(link)
Ооооо очень интересно. замечательный эксперимент.
недавно я унюхала дым этажом ниже, спустившись к мусоропроводу, и сразу метнулась в пожарку звонить. хотя и мелькнула мысль: Зачем я это делаю? Они ведь наверняка уже вызвали...
И оказалось, что так. вызвали) за пару минут до меня.

А Ваша какая история? очень любопытно)
только по-русски плиз)

(no subject)

[personal profile] med_cat - 2010-11-12 19:47 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-11-12 20:00 (UTC) - Expand

(no subject)

[personal profile] med_cat - 2010-11-12 21:47 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-11-12 21:50 (UTC) - Expand

(no subject)

[personal profile] med_cat - 2010-11-12 21:52 (UTC) - Expand

(no subject)

[identity profile] konstansa.livejournal.com - 2010-11-12 22:04 (UTC) - Expand

(no subject)

[personal profile] med_cat - 2010-11-12 22:08 (UTC) - Expand