Рациональность. Что это, почему нам ее не хватает и чем она важна - Стивен Пинкер
Шрифт:
Интервал:
Закладка:
С 1985 по 2006 г. Туркменистаном правил пожизненный президент Сапармурат Ниязов. К числу его свершений можно отнести требование изучать его собственную автобиографию для сдачи экзамена на водительские права, а также возведение огромной золотой статуи самого себя, которая поворачивалась на пьедестале и всегда была обращена лицом к солнцу. В 2004 г. он дал своим восхищенным слушателям такую рекомендацию:
В молодости я наблюдал за щенками. Им давали кости, чтобы они их глодали. Уверен: те из вас, у кого выпали зубы, не глодали костей. Слушайтесь моего совета[333].
Так как большинству из нас не грозит опасность оказаться в ашхабадской тюрьме, мы можем позволить себе обнаружить огрех в совете его превосходительства. Президент допустил в своем рассуждении чуть ли не самую прославленную ошибку, спутав корреляцию с причинностью. Даже если беззубые туркмены действительно не глодали костей, президент не имел права утверждать, будто глодание костей укрепляет зубы. Возможно, глодать кости под силу только людям с крепкими зубами — тогда перед нами пример обратной причинной зависимости. Возможно, существует некий третий фактор, например членство в Коммунистической партии, который обусловливает как желание туркменов глодать кости (чтобы продемонстрировать преданность своему лидеру), так и их крепкие зубы (если стоматологическое обслуживание является привилегией партийцев), — тогда перед нами пример мешающего параметра.
Концепция причинно-следственной зависимости и ее отличия от простой корреляции — плоть и кровь науки. Что вызывает рак? Или изменение климата? Или шизофрению? Идея причинности вплетена в повседневную речь, в мышление и юмор. Разница между «корабль затонул» и «корабль потопили» в том, что во втором случае говорящий подразумевает, что событие произошло не случайно, что за ним стоит причинный фактор. Мы обращаемся к причинности, раздумывая, что делать с протечкой, сквозняком, дискомфортом или болью. Мой дед обожал байку про человека, который объелся чолнта (мясо с бобами, которое в шаббат, когда готовить запрещено, двенадцать часов держат на медленном огне), запил его стаканом чая, а затем, страдая животом, утверждал, что чаем-то он и отравился. Может, чтобы шутка показалась вам такой же уморительной, как моему деду, нужно родиться в Польше в 1900 г., но если вы уловили ее общий смысл, то не станете спорить, что разница между корреляцией и причинностью — один из столпов здравого смысла.
Тем не менее ошибки в духе Ниязова встречаются в наших общественных дискуссиях в изобилии. В этой главе мы исследуем природу корреляции, природу причинности и то, как отличать одно от другого.
Что такое корреляция?
Корреляция — это зависимость одной переменной от другой: зная величину первой, можно предсказать и величину второй — хотя бы приблизительно. («Предсказать» в данном случае значит «предположить», а не «напророчить»; можно предсказать, каким окажется рост родителей, зная рост их детей, и наоборот.) Графически корреляцию часто отображают диаграммой рассеяния. В той, что приведена ниже, каждая точка — это страна: чем правее расположена точка, тем выше среднедушевой ВВП, а чем она выше — тем выше оценка жителями страны своей удовлетворенности жизнью. (Среднедушевой ВВП отмерен на логарифмической шкале, чтобы компенсировать убывающую предельную полезность денег, которую мы обсудили в главе 6.)[334]
Корреляция заметна невооруженным глазом: точки разбросаны вдоль диагонали — серой пунктирной линии, едва заметной за общим роем. Каждая точка насажена на стрелку, которая представляет собой микродиаграмму рассеяния для населения этой страны. Макро- и микродиаграммы показывают, что счастье коррелирует с доходом — как для жителей отдельных стран (стрелки), так и по всем странам в целом (точки). И я понимаю, что вас так и тянет предположить, как минимум предварительно, что богатство делает человека счастливым.
Откуда взялись стрелки, пронизывающие точки, и пунктирная серая линия? И как нам преобразовать зрительное впечатление, будто рой точек вытянулся вдоль диагонали, в нечто более объективное, чтобы мы по глупости не увидели закономерности в любой кучке рассыпанных зубочисток?
В таких случаях применяется математический метод под названием регрессия — безотказная рабочая лошадка эпидемиологии и социальных наук. Посмотрите на диаграмму рассеяния ниже. Представьте себе, что любая единица данных — это гвоздь и мы соединяем каждый из них с жестким стержнем, используя резиновые ленты.
Допустим, эти ленты растягиваются только строго вверх или вниз, но не по диагонали и чем сильнее вы их растягиваете, тем больше их сопротивление. Закрепив все ленты, отпустите стрежень, позволив ему успокоиться.
Стержень замрет в таком положении, при котором минимальна сумма квадратов расстояний от каждого гвоздя до той точки на стержне, с которой его связывает лента. Это положение и есть прямая регрессии, которая выражает линейную зависимость между двумя переменными — у, значения которой откладываются по вертикальной оси, и х, значения которой, соответственно, откладываются по оси горизонтальной. Длина ленты, связывающей каждый из гвоздей со стержнем, называется отклонением — это характерная для конкретного измерения упрямая доля значения величины у, которую невозможно предсказать на основании соответствующего значения величины х. Вернемся к графику, связывающему уровень счастья с уровнем дохода. Если бы доход точно предсказывал уровень счастья, каждая точка лежала бы строго на сером пунктире прямой регрессии, но с реальными данными такого никогда не происходит. Некоторые точки парят высоко над пунктирной линией (у них высокие положительные отклонения регрессии), например Ямайка, Венесуэла, Коста-Рика и Дания. Если не учитывать погрешность измерений и прочие источники шума, такое несовпадение демонстрирует, что в 2006 г. (когда собирались данные) люди в этих странах ощущали себя более счастливыми, чем можно было бы ожидать, исходя из их дохода, — может, благодаря какой-то другой благоприятной характеристике страны, например прекрасному климату или богатой культуре. Есть точки, лежащие ниже линии, например Того, Болгария и Гонконг, — видимо, что-то в этих странах делает людей немного более несчастными, чем мы могли бы предположить, если ориентироваться на их доход.
Кроме того, отклонения регрессии позволяют нам количественно выразить степень корреляции переменных: чем короче ленты (больше скошенность кластера вправо вверх или вправо вниз), тем ближе точки к прямой и тем выше корреляция. С помощью несложных вычислений отклонения можно перевести в число r — коэффициент корреляции, меняющийся от –1 до 1. При r = –1 (не показано на рисунке) точки выстроены строго по диагонали, протянувшейся