konstansa: (Default)
konstansa ([personal profile] konstansa) wrote2010-06-04 07:01 pm

Дилемма заключенного

http://polite.com.ua/uploads/posts/2009-04/thumbs/1239877278_5404.jpg
Почему люди не сотрудничают друг с другом? Ну или почему люди сотрудничают не всегда? Почему мы не всегда ладим друг с другом? Ведь если я помогу тебе, а потом ты мне, разве от этого не станет лучше нам обоим?

Для тех, кто нашел выложенную мной Даосскую пословицу спорной или даже "совершенно не имеющей смысла", предлагаю перейти от теории к практике. Давайте рассмотрим "Дилемму заключенного" и задумаемся о своем поведении в этой игре.


В теории игр есть игра "Дилемма заключенного". Само название Рrisoner’s dilemma дал игре 40 лет назад Альберт Такер, и он же сформулировал ее в виде выбора, который делают "арестованные". С тех пор эта игра занимает социологов и психологов, ее исследуют, осмысляют и видоизменяют.
Популярность игры состоит в том, что она описывает выбор, который встает перед всеми нами изо дня в день в течение всей нашей жизни. Это выбор между сотрудничеством с другими людьми и нашими личными интересами.

Как во всей теории игр, в "Дилемме заключенного" каждый игрок стремится максимизировать свой собственный выигрыш, не заботясь о выгоде других игроков. Здесь предательство доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Неважно, что сделает другой игрок. Каждый выиграет больше, если предаст другого. Поскольку предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.
Ведя себя рационально по отдельности, вместе участники приходят к нерациональному решению: если оба предадут, то в сумме получат меньший выигрыш, чем если бы сотрудничали. В этом и заключается дилемма.

Дилемма заключённого имеет место, когда оба заботятся только о минимизации собственного срока заключения, и когда между возможными исходами существуют следующие соотношения: искушение лучше, чем вознаграждение, вознаграждение лучше, чем наказание, наказание лучше, чем неудача.

Классическая дилемма заключённого
В основе дилеммы лежит история о двух подозреваемых, которых по отдельности допрашивает окружной прокурор (Rapoport, 1960). Оба они участвовали в преступлении, но у прокурора пока есть только доказательства их виновности в менее серьезном преступлении. Поэтому он по отдельности предлагает каждому из них сознаться. Если один сознается, а другой нет, прокурор гарантирует первому освобождение, а его признание использует для обвинения второго в более тяжком преступлении. Если сознаются оба, каждый получит умеренный срок. Если ни один не признается, наказание для обоих будет незначительным. У арестованных есть ночь на размышление.
Каждый заключённый сам решает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой.

Чтобы свести свой срок к минимуму, многие признаются, несмотря на то, что совместное признание ведет к более суровому приговору, чем обоюдное отрицание вины. Независимо от решения другого, для каждого из них лучше будет признаться. Если при этом признается и другой, он получит умеренный срок, а не максимальный. Если же тот, другой, не признается, то первый вообще выйдет на свободу. Разумеется, оба заключенных рассуждают одинаково.

Примерно в двух тысячах исследований студенты университетов сталкивались с различными вариантами "Дилеммы заключенного", где ценой игры был не срок заключения, а деньги или фишки. При заданных условиях в любом случае каждому игроку выгодней обособиться. Однако в том-то и вся загвоздка что, не сотрудничая, оба игрока получат гораздо меньше, чем если бы они доверились друг другу и извлекли взаимную выгоду. Дилемма загоняет участников в психологическую ловушку: оба понимают, что могли бы взаимно выгадать; но недоверие друг к другу делает сотрудничество невозможным.

ИТАК: Если оба подозреваемых признаются, каждый из них получит по пять лет. Если не признается ни один, оба получат по одному году. Если признается только один, его отпустят на свободу в благодарность за показания, которые позволят приговорить другого к десяти годам заключения. Будь вы одним из заключенных, вы признались бы?

Выбор предлагается сделать человеку, уже попавшему в беду, и единственное, что он может сделать – это минимизировать неизбежные потери. Сейчас он уже за решеткой и дальше может только проиграть. Страх включает инстинкт самосохранения, который зачастую сильнее моральных норм и обязательств.
Поставим себя на место одного из них, и, рассуждая исключительно рационально, попытаемся принять решение. Если мы испуганы, мы вероятнее всего будем думать только о себе.

Вот примерный ход мысли заключенного:
"Если я промолчу, а он расколется, я сяду на 10 лет. Этого допустить нельзя. Если я расколюсь, и он расколется, мы оба сядем на 5. Тоже плохо, но все-таки не 10 лет. Если он не расколется, то он сядет на 10 лет, но зато я выйду на волю. Есть, конечное, шанс, что он не расколется, и если я тоже не расколюсь, мы получим оба по несколько месяцев. Но риск сесть на 10 лет слишком велик. Значит, я не могу рисковать и дам на него показания. Вне зависимости от того, даст ли он показания на меня или нет, я смогу избежать самого страшного – десяти лет тюрьмы, а может – и вовсе выйду на свободу, если он промолчит".
Аналогично другой заключённый приходит к тому же выводу.

Действуя рационально в своих интересах, участники этой игры приходят к иррациональному результату: по крайней мере, один из них сядет, а возможно и оба, в то время как они могли бы отделаться шуточным сроком, если бы были уверены, что сообщник промолчит. Дилемма "молчать - давать показания" разрешается в пользу дачи показаний, хотя с точки зрения коллективного интереса это решение явно не оптимальное.
С точки зрения группы лучше сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным.

Дилемма заключенного - это повторяющаяся игра.
Игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. При повторной игре каждый игрок может "наказать" другого за несотрудничество в предыдущей партии.

Лучшая стратегия, которая обеспечивает лучшие результаты для играющего "Око за око". То есть сотрудничать на первой итерации игры, а каждым следующим шагом делать то же самое, что сделал оппонент на предыдущем шаге. Играющий по этой стратегии никогда не нападает первым и всегда мстит. Любой, напавший первым на такого игрока, заклинивает всю систему на бесконечную месть.
Чтобы получить больший выигрыш надо для проверки простить, и если программа ответит сотрудничеством, выиграют оба.

Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или чрезмерно плохо. Если они всё время будут действовать так, то проиграют из-за своей излишней агрессивности или излишней доброты. С получением опыта они реальнее оценивают вероятность предательства и добиваются лучших результатов.
Можно уменьшить вероятность предательства при помощи сотрудничества в ранних играх, укрепляя доверие. Тогда самопожертвование в некоторых ситуациях может усилить моральный дух группы. Если группа маленькая, на позитивное поведение с большей вероятностью ответят взаимностью, что поощрит играющих на дальнейшее сотрудничество. Это связано с ещё одной дилеммой, что хорошее отношение без причины— это потакание, которое может ухудшить моральные качества.

Приведенная в дилемме заключенного Даосская пословица может служить отправной точкой стратегии игр.
• Отвечать добром на добро — добро.
• Отвечать злом на зло — добро
• Отвечать злом на добро — зло
• Отвечать добром на зло — зло.

Исходя из этого, выводим правила:
- Игрок отвечает "добром" на первом шаге отношений в ожидании "добра", выгоды для себя.
- Последующие шаги - адекватное противодействие действию оппонента также с выгодой для себя.
Именно адекватное! Любое неадекватное действие в результате приводит к ущербу, как моральному, так и материальному. Обоснование этики в этих правилах индивидуалистично и не принимается априори, а выводится из теории игр как поведение, несущее игроку выгоду.


Анализируя стратегии, набравшие лучшие результаты, выявлено несколько условий, необходимых, чтобы стратегия получила высокий результат:
Добрая Не предавать, пока этого не сделает противник. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет "бить" первой.
Мстительная Всегда мстить, не позволяя себе быть слепым оптимистом. Всегда сотрудничать - это очень плохой выбор, поскольку "подлые" стратегии обязательно воспользуются этим.
Прощающая Уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент прекратил предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.
Независтливая Не быть завистливым и не пытаться набрать больше очков, чем оппонент, что в принципе невозможно для "доброй" стратегии, которая никогда не сможет набрать больше очков, чем оппонент.

Если в одноходовой игре в любом случае доминирует стратегия предать, то в многоходовой оптимальная стратегия зависит от поведения других участников. Дилемма заключённого предполагает, что транзакция между двумя людьми требует доверия, а доверительное поведение в группе может быть смоделировано при помощи повторяющейся версии игры с большим количеством участников.

PS Дилемму заключенного легко понять, представив ее в виде похожей, но другой игры — "Обмен закрытыми сумками":
Два человека встречаются и обмениваются закрытыми сумками, зная, что одна из них содержит деньги, другая — товар. Каждый игрок имеет выбор: уважать сделку и положить в сумку то, о чём договорились, или обмануть партнёра, отдав ему пустую сумку.
В этой игре обман всегда будет наилучшим решением, и рациональные игроки никогда не станут играть в неё, с учетом того, что игра повторяется, и каждый ее участник помнит предыдущие результаты или имеет доступ к «коллективной памяти» и множеству обменов повторяющихся длительное время. Без памяти эта игра просто не имела смысла и мало что объясняла бы в поведении людей.

Отсюда и отсюда

[identity profile] konstansa.livejournal.com 2010-11-12 07:32 pm (UTC)(link)
))) тогда Родителям - Респект в кубе. или даже в большей степени)
med_cat: (Ad astra)

[personal profile] med_cat 2010-11-12 07:36 pm (UTC)(link)
В энной степени...;) (мама у меня--математик)

[identity profile] konstansa.livejournal.com 2010-11-12 07:40 pm (UTC)(link)
)) вот она. наследственность- как говорил проф. Преображенский - никуда от нее не деться)
med_cat: (Default)

[personal profile] med_cat 2010-11-12 07:48 pm (UTC)(link)
Воспитание более, чем наследственность ;)

[identity profile] konstansa.livejournal.com 2010-11-12 07:56 pm (UTC)(link)
и то и другое)
у меня вот дурное воспитание) меня мама очень давила.
а я смотрела, видела, как это нехорошо, потому что она одна у нас в семье такая невоспитанная, и никогда себе такого не позволяла. а на давление всегда пружинила)
Так что наследственность очень важна. воспитание всяко бывает)
Хотя, конечно, это ломает психику, когда ребенку приходится противостоять давлению кого-то из членов семьи, к кому он попадает уже сформированной личностью. (меня до 10 лет бабушка воспитывала, а потом мама взялась. и очень неудачно)