Эгоистичный ген - Ричард Докинз
Шрифт:
Интервал:
Закладка:
После десяти партий я теоретически мог бы выиграть 5000 долларов, но только в том случае, если вы необыкновенно глупы (или праведны) и всякий раз играли Кооперируюсь, несмотря на то, что я все время ходил Отказываюсь. Более реально допустить, что каждый из нас получит по 3 тысячи долларов за счет банкомета, если мы оба все 10 раз сыграли Кооперируюсь. Для этого нам не надо быть особенно праведными, так как мы оба можем убедиться на основании предшествующей игры противника, что ему можно доверять. Мы можем, в сущности, регулировать поведение друг друга. Вполне вероятен также и другой оборот: ни один из нас не вериг другому и мы оба играем Отказываюсь все десять раз, а банкомет получает от каждого из нас по 100 долларов в виде штрафов. Скорее всего мы частично доверимся друг другу, каждый будет играть вперемешку то Кооперируюсь, то Отказываюсь, и в результате получит некую промежуточную сумму денег.
Описанные в гл. 10 птицы, которые удаляли друг у друга клещей из перьев, играли в итерированный вариант Парадокса заключенных. Как это получается? Если вы помните, птице очень важно избавляться от клещей, однако она не может добраться до собственной макушки и ей нужно, чтобы кто-то сделал это за нее. Казалось бы, справедливость требует, чтобы она впоследствии отплатила за эту услугу тем же самым. Но на процедуру вытаскивания клещей надо затратить время и энергию, хотя и не слишком много. Если птица может безнаказанно сплутовать, т. е. если ей была оказана услуга, а она отказывается сделать то же самое, то она пожинает все плоды, не расплачиваясь за это. Расположите исходы в порядке их «цены» и вы убедитесь, что перед вами типичная игра Парадокс заключенных. Когда оба кооперируются (вытаскивают друг у друга клещей), то это дает достаточно хорошие результаты, однако остается соблазн добиться большего, отказавшись оплачивать стоимость ответной услуги. Если оба играют Отказываюсь (отказываются вытаскивать клещей), то ничего хорошего не получается, однако еще хуже затрачивать усилия на вытаскивание клещей из другого индивидуума, а самому оставаться зараженным клещами.
Но это всего лишь один пример. Чем больше думаешь об этом, тем больше понимаешь, что не только жизнь людей, но также жизнь животных и жизнь растений переполнена играми типа Итерированного Парадокса заключенных. Жизнь растений? А почему бы нет? Вспомните, что речь идет не об осознанных стратегиях (хотя иногда можно говорить и о них), а о стратегиях в «мэйнардсмитовском» смысле, стратегиях тех типов, которые могли бы программироваться генами. А пока займемся более глубоким изучением того, в чем же состоит важность итерации.
В отличие от простого варианта игры, которая довольно предсказуема в том смысле, что Отказываюсь — единственная разумная стратегия, итеративный вариант предлагает много разных стратегий. В простом варианте возможны лишь две стратегии: Кооперируюсь и Отказываюсь. Итерация, однако, допускает множество стратегий, и какая из них лучше всех — отнюдь не очевидно. Приведем в качестве примера одну из тысяч: «играй Кооперируюсь по большей части, но в выбранных случайным образом 10% партий играй Отказываюсь». Другие стратегии могут зависеть от того, как протекала игра перед этим. Примером служит мой «Злопамятный»: у него хорошая память на лица, и хотя в основном он склонен кооперироваться, он отказывается, если другой игрок отказывался когда-либо в прошлом. Другие стратегии могут быть более снисходительными и не такими злопамятными.
Число стратегий, возможных в итеративной игре, ограничено, очевидно, лишь нашей изобретательностью. Можно ли установить, какая из них лучше всех? Эту задачу поставил перед собой Аксельрод. У него возникла увлекательная идея провести конкурс и он пригласил специалистов по теории игр представить свои стратегии. В данном случае стратегии — это заранее составленные программы действия, и соответственно соперники представили свои заявки на языке программирования. Было предложено четырнадцать стратегий. Аксельрод добавил к ним пятнадцатую, назвав ее Случайной, которая просто без всякой системы играла то Кооперируюсь, то Отказываюсь и служила своего рода базовой «анти-стратегией»: стратегию, дававшую худшие результаты, чем Случайная, следовало признать очень плохой.
Аксельрод описал все 15 стратегий на одном общем языке программирования. Каждая стратегия сравнивалась по эффективности поочередно с каждой из остальных (в том числе и с собственной копией) в игре Итерированный Парадокс заключенных. Поскольку стратегий было 15, то компьютер сыграл 15 х 15, или 225, отдельных игр. После того, как каждая пара сделала по 200 ходов, все выигрыши были суммированы и был объявлен победитель.
Нас здесь не интересует, какая именно стратегия вышла победителем в игре против каждого отдельного противника. Нам важно установить, какая стратегия выиграла больше всего «денег» за все свои 15 вариантов. «Деньги» — это просто «очки», присуждаемые по следующей схеме: взаимное Кооперирование — 3 очка; Риск — 5 очков; Наказание за взаимный отказ — 1 очко (эквивалент небольшого штрафа в игре, описанной ранее); Штраф Простаку — 0 очков (эквивалент большого штрафа в игре, описанной ранее).
Максимально возможный выигрыш, который могла бы получить та или иная стратегия, составляет 15 000 очков (200 партий по 5 очков за партию с каждым из 15 противников). Минимальный результат составляет 0. Излишне говорить, что ни один из этих крайних результатов на самом деле не наблюдался. Наибольший выигрыш, на который может реально надеяться данная стратегия в среднем из своих 15 турниров, не может сколько-нибудь значительно превысить 600 очков. Это все, что мог бы получить каждый из двух игроков, если бы они оба все время играли Кооперируюсь, зарабатывая по 3 очка за каждую из 200 сыгранных партий. Если бы один из них поддался искушению отказаться, то число его очков, вероятно, оказалось бы меньше 600, так как другой игрок отплатил бы ему тем же (в большей части представленных стратегий было заложено в той или иной форме стремление к ответному удару). Мы можем использовать число 600 в качестве своего рода точки отсчета для данной игры и выражать результаты в процентах от этого числа. По такой шкале оценок теоретически можно довести выигрыш до 166% (1000 очков), но практически ни одна стратегия не заработала в среднем больше 600 очков.
Не забывайте, что «игроками» в турнире были не люди, а программы, точнее — запрограммированные стратегии. Их авторы, т. е. люди, выступали в той же роли, что и гены, программирующие тела (вспомните гл. 4 — компьютер, играющий в шахматы, и компьютер, созданный по инструкциям с Андромеды). Стратегии, о которых идет речь, можно рассматривать как доверенных лиц их авторов. На самом деле кто-то из авторов мог бы представить не одну, а несколько программ (хотя было бы жульничеством — которого Аксельрод, вероятно, не допустил бы, — если бы тот или другой автор «забил» весь турнир своими стратегиями, и одна из них воспользовалась бы плодами жертвенного кооперирования со стороны других).
Было предложено несколько очень хитроумных стратегий, хотя они были, конечно, далеко не столь хитроумными, как их авторы. Интересно, что победившая стратегия была проще всех других и на первый взгляд наименее хитроумной. Она называлась «Око за око» и была представлена проф. Анатолем Рапопортом (Anatol Rapoport), известным психологом и специалистом по теории игр из Торонто. По этой стратегии первым ходом должно быть Кооперируюсь, а в дальнейшем следует просто повторять предыдущий ход другого игрока.
Как проходит игра Око за око? Как всегда, развитие событий зависит от поведения второго игрока. Допустим для начала, что второй игрок — это тоже стратегия Око за око (напомним, что каждая стратегия играла не только против каждой из 14 других стратегий, но также против копии самой себя). Обе стратегии Око за око начинают с кооперирования. При следующем ходе каждый игрок повторяет предыдущий ход противника, т. е. кооперируется. Оба продолжают играть Кооперируюсь до конца игры, которую оба заканчивают, достигнув на 100% суммы очков, принятой за точку отсчета, т. е. заработав по 600 очков.
Допустим, что Око за око играет против стратегии, названной Наивный испытатель. На самом деле Наивный испытатель не участвовал в конкурсе Аксельрода, но тем не менее этот пример поучителен. Наивный испытатель в основном идентичен программе Око за око, с той разницей, что время от времени, скажем один раз за десять ходов, причем без всякой закономерности, он совершенно беспричинно играет Отказываюсь и требует 5 очков, причитающиеся ему за риск. До тех пор, пока Наивный испытатель не предпримет один из своих зондирующих отказов, оба игрока ведут себя в соответствии со стратегией Око за око. Однако внезапно, без предупреждения, скажем на восьмом ходу. Наивный испытатель отказывается. Око за око, разумеется, сыграла в этот раз Кооперируюсь, а поэтому получила 0 очков, как это положено Простаку. Наивный испытатель, казалось бы, добился успеха, заработав за этот ход 5 очков. Но своим следующим ходом Око за око «мстит». Она играет Отказываюсь, просто следуя заложенному в нее правилу копировать предыдущий ход противника. Тем временем стратегия Наивный испытатель, следуя правилу копировать противника, заложенному в нее самое, повторила ее ход — Кооперируюсь. В результате ей достается Штраф Простаку, т. е. 0 очков, тогда как Око за око получает высшую плату — 5 очков. Своим следующим ходом Наивный испытатель — довольно несправедливо, как можно подумать, — «мстит» за отказ стратегии Око за око. И такое чередование продолжается. При этом оба игрока получают в среднем по 2,5 очка за ход (среднее между 5 и 0). Это меньше, чем те верные 3 очка за ход, которые получают игроки, если они оба играют Кооперируюсь (кстати, это и есть причина введения того «дополнительного условия», которому не было дано объяснения на с. 188). Итак, когда Наивный испытатель играет против стратегии Око за око, оба выигрывают меньше, чем в игре Око за око против Ока за око. Если же игра идет между двумя Наивными испытателями, дела обоих обстоят еще хуже, так как серии взаимных отказов начинаются раньше.