Категории
Самые читаемые
onlinekniga.com » Научные и научно-популярные книги » История » Методы статистического анализа исторических текстов (часть 1) - Анатолий Фоменко

Методы статистического анализа исторических текстов (часть 1) - Анатолий Фоменко

Читать онлайн Методы статистического анализа исторических текстов (часть 1) - Анатолий Фоменко

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 84 85 86 87 88 89 90 91 92 ... 145
Перейти на страницу:

Если потоки анкет-кодов двух династий «МАЛО» ОТЛИЧАЮТСЯ ДРУГ ОТ ДРУГА, то они изображают ОДНУ И ТУ ЖЕ РЕАЛЬНУЮ ДИНАСТИЮ. Если же два потока анкет-кодов изображают РАЗНЫЕ ДИНАСТИИ, то эти потоки анкет-кодов «ДАЛЕКИ» ДРУГ ОТ ДРУГА.

Как можно сравнивать потоки анкет-кодов двух династий и отвечать на вопрос: «похожи» они или нет? А если «похожи», то в какой степени? Пусть АК и АК' — анкет-коды двух правителей из разных династий, имеющих один и тот же порядковый номер в своей династии. Сравним эти два анкет-кода в каждом их пункте. Расхождение между пунктами будем оценивать в баллах. Для разных пунктов эти баллы следует установить различными, в зависимости от их важности и степени инвариантности сравниваемых «биографических фактов» относительно субъективных оценок летописцев. В результате экспериментирования с конкретными «летописными биографиями», мы выработали следующую систему оптимальную баллов, позволяющую быстрее обнаруживать возможные зависимости.

Для пунктов 1-10, за исключением пункта 3 (то есть длительности правления), будем использовать баллы 0,+1,-1.

Для пунктов 11–21 будем использовать баллы 0, +1/2, -1/2.

Для пунктов 22–33 — баллы 0, +1/3, -1/3.

При сравнении пунктов анкет-кодов возможны три случая. Проиллюстрируем их на примере пунктов с номером 5, то есть АК-5: «обстоятельства смерти правителя».

а) Сравниваемые сведения СОВПАДАЮТ. Например, и в АК, и в АК' сказано, что оба сравниваемых царя умерли естественной смертью. В этом случае этой паре пунктов мы придадим балл +1 (совпадение). Будем условно записывать это так: Е5=+1.

б) Сравниваемые сведения ЯВНО НЕ СОВПАДАЮТ, противоречат друг другу. Например, в АК сказано, что царь умер естественной смертью, а в АК' сообщено, что сравниваемый с ним царь убит в результате заговора. В этой ситуации мы дадим балл -1 (противоречие). Запишем: Е5=-1.

в) Сравниваемые сведения НЕЙТРАЛЬНЫ, то есть не совпадают, но и не противоречат друг другу. Например, в АК сказано, что «царь умер», а в АК' сообщено, что «царь был убит». Здесь дадим балл 0 (нейтральная ситуация), то есть напишем: Е5=0.

Итак, для каждой пары пунктов с номером i (сравниваемых анкет-кодов) мы получаем некоторое число Ei. Следовательно, для пары анкет-кодов АК и АК' двух сравниваемых царей можно подсчитать сумму всех получившихся чисел Ei:

f(AK,AK') = Е1 + E2 + E4 + E5 +… + E33.

Напомним, что коэффициент E3 мы здесь не рассматриваем, поскольку для сравнения длительностей правлений у нас разработана другая методика, изложенная выше.

Эксперименты с конкретными историческими анкет-кодами показали, что во многих случаях значение коэффициента Ei приходится полагать равным нулю, так как довольно часто сравниваемые сведения о двух царях и не совпадают, и не противоречат друг другу. Тем самым возрастает роль +1 и -1, когда они появляются. Далее, оказалось, что в подавляющем большинстве случаев приходится полагать E34 = 0. Дело в том, что обычно при сравнении «остатков биографий» двух царей обнаруживается, что сравниваемые второстепенные, не очень важные сведения настолько разнохарактерны, что их вообще трудно сопоставить. Например, про одного царя в «остатке биографии» АК-34 говорится, что он любил искусство и даже пел, а про другого царя сказано, что он у него были черные волосы. Эти сведения можно, конечно, принять к сведению, но сравнивать их бессмысленно. В таких случаях естественно приходилось полагать балл Е34 равным нулю.

Пусть теперь нам даны две летописные династии a и b, каждая из которых состоит из k последовательных царей. «Заполняя на каждого из них анкету», то есть составляя на каждого царя его анкет-код, мы получаем последовательность, поток анкет-кодов

АК1, АК2, АК3…, АКk для династии a, и другую последовательность, поток анкет-кодов

АК'1, АК'2, АК'3…, АК'k для династии b.

Последовательность анкет-кодов царей

(АК1, АК2, АК3…, АКk)

естественно назвать ПОТОКОМ АНКЕТ-КОДОВ ДИНАСТИИ a. Обозначим его через AK(a). Аналогично, последовательность «анкет царей»

(АК'1, АК'2, АК'3…, АК'k)

назовем ПОТОКОМ АНКЕТ-КОДОВ ДИНАСТИИ b и обозначим его через AK(b). Другими словами, поток анкет-код династии — это просто последовательность анкет-кодов составляющих ее царей, фактических правителей.

Теперь мы хотим сравнить между собой потоки анкет-кодов AK(a) и AK(b) двух династий a и b. Для каждой пары сравниваемых анкет-кодов царей мы вычисляем коэффициент f(AKi,AK'i). Наконец, можно определить число

f(AK1,AK'1) + f(AK2,AK'2) +… + f(AKk,AK'k) e(a,b) = —,

k

то есть попросту среднее арифметическое всех коэффициентов f(AKi,AK'i). Другими словами, шаг за шагом, мы сравниваем каждую пару последовательных царей двух сопоставляемых династий, подсчитываем для каждой такой пары «меру близости» f(AKi,AK'i), после чего берем среднее арифметическое по всем царям династии.

Таким образом, близость или удаленность друг от друга потоков анкет-кодов двух династий a и b можно оценивать парой чисел

(c(a,b), e(a,b)),

где коэффициент c(a,b)=ВССД описан выше.

Мы опускаем здесь описание численных экспериментов со сравнением потоков анкет-кодов летописных династий. Сообщим только результат: оказалось, что описанная выше методика позволяет довольно уверенно отделять «зависимые анкет-коды» от «независимых». Детали см. в [416], [438], [375]. Экспериментальная проверка подтвердила верность принципа малых искажений и в этом случае: оказалось, что потоки анкет-кодов, изображающие одну и ту же династию, отличаются друг от друга существенно меньше, чем потоки анкет-кодов разных реальных династий. Ясно, что это позволяет датировать потоки анкет-кодов династий, следуя схеме, описанной выше.

Ниже мы приведем конкретные примеры зависимых потоков анкет-кодов некоторых пар династий-дубликатов. Этот сравнительный материал очень полезен, так как показывает — насколько иногда ярко проявляется то обстоятельство, что перед нами два дубликата, попросту два разных летописных описания одной и той же реальной династии.

В заключении остановимся на одном важном обстоятельстве. Изложенная выше методика сравнения анкет-кодов является не просто «данью статистической моде», а чрезвычайно полезным орудием исследования. Важно, что методика нацелена на сравнение не просто какой-то пары отдельных летописных биографий, а на сравнение ДВУХ ДЛИННЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ТАКИХ БИОГРАФИЙ. Например, мы будем сравнивать двадцать последовательных биографий царей из одной династии с двадцатью последовательными биографиями царей из другой династии. Такие примеры см. ниже. Вывод о зависимости двух династий можно делать только на основе сравнения двух «длинных потоков биографий».

Напротив, близость, «похожесть» двух ОТДЕЛЬНЫХ ИЗОЛИРОВАННЫХ биографий каких-то персонажей ни о каком хронологическом дублировании может не говорить. Ведь не составляет особого труда подобрать пару «похожих биографий» двух разных исторических деятелей из современной нам эпохи, выдергивая из их жизни близкие, иногда поразительно похожие факты. Причем, таких «похожих фактов» можно иногда набрать довольно много. В то же время совершенно ясно, что делать отсюда какие-то «хронологические выводы» не следует. Все эти совпадения могут оказаться просто игрой случая. Но совсем другое дело, когда мы обнаруживаем две близкие ДЛИННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ, два ДЛИННЫХ «ПОТОКА» удивительно похожих биографий. Когда формальная статистическая методика «вылавливает» в огромном наборе древних документов пару «ПОХОЖИХ ДЛИННЫХ ПОТОКОВ БИОГРАФИЙ», — причем «похожесть» эта устанавливается не «на глазок», а формальным образом, становится ясно, что мы обнаружили нечто весьма серьезное. Тем более, что наши методы позволяют (хотя и грубо) оценивать вероятность того, насколько такая «близость» случайна. Если оказывается, что вероятность случайного совпадения мала, это усиливает подозрения, что мы действительно натолкнулись на «размножение» одной и той же реальной династии в разных летописях.

Подчеркнем далее, что во всех примерах пар зависимых династий a и b, которые мы вскоре продемонстрируем, однозначно прослеживается следующее обстоятельство. Пусть, например, a — это римская династия, b германская династия. Оказывается, что:

• Биография первого римского царя «похожа» на биографию первого германского царя.

• Биография второго римского царя «похожа» на биографию второго германского царя.

• Биография третьего римского царя «похожа» на биографию третьего германского царя.

И так далее, вплоть до конца всей династии, в которой пятнадцать или двадцать царей.

1 ... 84 85 86 87 88 89 90 91 92 ... 145
Перейти на страницу:
На этой странице вы можете бесплатно читать книгу Методы статистического анализа исторических текстов (часть 1) - Анатолий Фоменко.
Комментарии