Методы статистического анализа исторических текстов (часть 1) - Анатолий Фоменко
Шрифт:
Интервал:
Закладка:
12: 54-42-347-112
13: 312-172-43-42-132-324
14: 900-120-4420-26-22-20-20-26-28-3000
15: 150-120-300-500
16: 152-86-300-10-10-12-434
17: 264-675-863-92-90-90-92-94-1034
18: 325-75-50-44-32-46-122-430-86-35-140-20-20-110-1160
19: 441-99-150-152-54-54-189-1548-522-36-342-648-50-50-540
Все эти исторические тексты описываются, в основном, одни и те же события, следовательно, они зависимы, опираются на один и тот же фонд уцелевших сведений. Таблица 2 показывает, что имеется ярко выраженная корреляция между точками всплесков, то есть локальных максимумов функций объемов этих текстов. Почти все графики делают всплески практически одновременно, в частности, в годы 1584, 1587, 1591, 1598.
Приведем теперь результат второго численного эксперимента, в котором к предыдущим 19 текстам были добавлены еще три текста (см. выше), а также были расширены временные рамки — к интервалу 1584–1598 гг. н. э. были присоединены годы от 1598 до 1606. Была построена таблица, аналогичная предыдущей. Сейчас мы приведем таблицу, в которой символом Х отмечены положения локальных максимумов для всех 22 исторических текстов на интервале от 1584 года до 1606 года н. э.
ТАБЛИЦА 3
84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06
1: Х-Х-Х
2: Х-Х-Х-Х-Х-Х
3: Х-Х-Х-Х-Х-Х
4: Х-Х-Х-Х-Х
5: Х-Х-Х-Х-Х
6: Х-Х-Х-Х-Х
7: Х-Х-Х-Х-Х-Х
8: Х-Х-Х-Х-Х
9: Х-Х-Х-Х
10:Х-Х-Х-Х-Х-Х
11:Х-Х-Х-Х-Х-Х
12:Х-Х-Х-Х-Х-Х-Х
13:Х-Х-Х-Х
14:Х-Х-Х-Х-Х
15:Х-Х-Х-Х-Х-Х
16:Х-Х-Х-Х-Х-Х
17:Х-Х-Х-Х-Х
18:Х-Х-Х-Х-Х-Х-Х
19:Х-Х-Х-Х-Х-Х-Х-Х
20:Х-Х-Х-Х-Х-Х
21:Х-Х-Х-Х-Х-Х-Х-Х
22:Х-Х-Х-Х
Отчетливо видно, что все функции объема делают всплески практически одновременно, что объясняется зависимостью этих текстов. Следовательно, принцип корреляции точек всплесков функций объемов зависимых текстов здесь подтверждается.
Эту зависимость текстов можно выразить численно. Введем следующее «расстояние» между функциями объема vol X(t) и vol Y(t) для двух текстов X и Y, каждый из которых разбит в объединение отдельных погодных фрагментов X(t) и Y(t) соответственно. Напомним, что фрагменты X(t) и Y(t) описывают события лишь одного года t.
Пусть параметр t изменяется на отрезке времени от года A до года B. Обозначим через t(X,1), t(X,2)…, t(X,N) — те годы, где функция график объемов vol X(t) делает всплески (то есть достигает локальных максимумов). Соответственно, через t(Y,1), t(Y,2)…, t(Y,M) обозначим точки всплесков графика объемов vol Y(t).
Для каждой точки t(X,i) найдем БЛИЖАЙШУЮ К НЕЙ ТОЧКУ из последовательности t(Y,1), t(Y,2)…, t(Y,M). Пусть это будет некоторая точка t(Y,k). Обозначим через p(i) — расстояние между ними, измеренное в годах, то есть — абсолютную величину разности t(X,i)-t(Y,k). Другими словами, выясняем — какой локальный максимум Y ближе всего расположен к выбранному локальному максимуму X.
Совершенно аналогично, меняя ролями X и Y, для каждой точки t(Y,j) найдем БЛИЖАЙШУЮ К НЕЙ ТОЧКУ из последовательности t(X,1), t(X,2)…, t(X,N). Пусть это будет некоторая точка t(X,s). Обозначим через q(j) — расстояние между ними, измеренное в годах, то есть — абсолютную величину разности t(Y,j)-t(X,s).
Наконец, в качестве «расстояния между X и Y» мы возьмем следующую сумму:
R(X,Y) = p(1)+p(2)+…+p(N)+q(1)+q(2)+…+q(M).
Смысл расстояния R(X,Y) совершенно прозрачен. Для каждого локального максимума функции vol X(t) мы находим ближайший к нему локальный максимум функции vol Y(t), определяем расстояние между ними (в годах), после чего суммируем получившиеся числа. Затем повторяем ту же операцию, поменяв местами хроники X и Y. Складывая полученные числа, получаем R(X,Y). Ясно, что R(X,Y) = R(Y,X).
Если расстояние R(X,Y) равно нулю для некоторой пары текстов X и Y, следовательно, графики их функций объемов делают всплески ОДНОВРЕМЕННО. Чем больше это расстояние, тем хуже коррелируют их точки локальных максимумов. Можно рассматривать также и несимметричное расстояние от X до Y, положив
p(X,Y) = p(1)+p(2)+…+p(N).
Аналогично определяется и несимметричное расстояние от Y до X, а именно,
q(Y,X) = q(1)+q(2)+…+q(M).
Оценим численно степень зависимости между собой исторических текстов 1-22, перечисленных выше. Для этого подсчитаем квадратную матрицу размера 22×22 попарных расстояний R(X,Y), где X и Y независимо друг от друга пробегают все тексты 1-22. Далее подсчитаем гистограмму частот. Для этого рассмотрим горизонтальную ось, на которой отметим целые точки: 0,1,2,3…. и построим следующий график. Подсчитаем — сколько в получившейся ранее матрице {R(X,Y)} имеется нулей. Полученное число отложим по вертикали в точке с координатой 0. Затем подсчитаем — сколько в матрице {R(X,Y)} имеется единиц. Получившееся число отложим по вертикали в точке с координатой 1. И так далее. Получается график, который и называется гистограммой частот. Что можно сказать, изучая получившуюся гистограмму?
Если выбранные для анализа хроники ЗАВИСИМЫ, то большинство попарных расстояний между хрониками должно выражаться МАЛЫМИ ЧИСЛАМИ, то есть хроники должны «быть близки». Другими словами, большинство элементов матрицы {R(X,Y)} должно быть близко к нулю («быть мало»). Но в таком случае абсолютный максимум гистограммы частот должен смещаться ВЛЕВО, то есть должно быть много малых частот. И напротив, если среди исследуемых текстов много НЕЗАВИСИМЫХ, то максимум гистограммы частот смещается направо. См. рис. 3.26. Здесь увеличивается доля «больших» и «средних» попарных расстояний между хрониками.
Это наблюдение позволяет оценивать степень зависимости или независимости группы хроник путем построения соответствующей гистограммы частот по матрице {R(X,Y)}. А именно, смещение максимума влево указывает на возможную зависимость хроник, а смещение максимума направо, указывает на возможную независимость.
Эта идея была применена для оценки степени зависимости перечисленных выше текстов 1-22. На рис. 3.27 показана экспериментальная гистограмма матрицы {R(X,Y)} для текстов 1-22. В этой матрице оказалось много малых чисел, поэтому максимум гистограммы заметно смещен влево. Это указывает на зависимость текстов 1-22.
Для сравнения построим гистограмму для независимых текстов. В качестве примера мы решили сравнить указанные ниже три хроники А,В,С, с предыдущими текстами 1-22. Три дополнительные хроники таковы:
А: Повесть временных лет, якобы 850-1110 годы н. э.,
В: Академическая летопись, якобы 1336–1446 годы н. э.,
С: Никифоровская летопись, якобы 850-1430 годы н. э.
Для каждой из них была вычислена функция объемов и найдены все ее локальные максимумы. Вычислим все попарные расстояния R(X,Y), где X пробегает три хроники А, В, С, а Y пробегает тексты 1-22. В результате получается прямоугольная матрица {R(X,Y)} размера 3×22. Далее была подсчитана гистограмма частот. Результат показана на рис. 3.28. Отчетливо виден совершенно другой характер гистограммы — ее максимум переместился направо. Что указывает на независимость двух групп текстов: {А, В, С} и {тексты 1-22}. Конечно, внутри каждой из этих групп могут быть зависимые тексты.
2. Методика распознавания и датирования династий правителей
Принцип малых искажений
2.1. Формулировка принципа малых искажений
Принцип малых искажений и основанный на нем метод был предложен и разработан в [375], [376], [379], [381], [390], [398].
Пусть обнаружен исторический текст, описывающий неизвестную нам династию правителей с указанием длительностей их правлений. Возникает вопрос: является ли эта династия новой, ранее нам неизвестной и, следовательно, нуждающейся в датировке, или это одна из известных нам династий. Однако описанная в непривычных для нас терминах. Например, видоизменены имена правителей и т. п.? Ответ дается излагаемой ниже методикой [416], [438], [419], [376], [377].
Рассмотрим k любых последовательных реальных правителей (царей) в истории какого государства, области. Условно назовем эту последовательность РЕАЛЬНОЙ ДИНАСТИЕЙ. При этом ее члены отнюдь не обязаны быть родственниками. Часто одна и та же реальная династия описывается в разных документах и разными летописцами. При этом описывается с разных точек зрения. Например, по-разному оценивается деятельность правителей, их значение, их личные качества и т. д. Тем не менее, существуют «инвариантные» факты, описания которых в меньшей степени зависят от симпатий или антипатий летописцев. К таким более или менее «инвариантным фактам» относится, например, длительность правления царя. Обычно нет особых причин, по которым хронист значительно и намеренно исказил бы это число. Однако перед летописцами часто возникали трудности в подсчете длительности правления царя.
Эти естественные трудности — неполнота информации, искажения в документах и т. д., приводили иногда к тому, что разные летописцы приводят в своих хрониках или таблицах разные числа, являющиеся, по их мнению, длительностью правления одного и того же царя. Такие расхождения характерны, например, для фараонов в таблицах Г. Бругша [22] и в «Хронологических таблицах» Ж. Блера [20]. Например, в таблицах Ж. Блера, доведенных до начала XIX века, собраны все основные исторические династии, с датами правлений, сведения о которых дошли до нас. Таблицы Ж. Блера ценны для нас тем, что они были составлены в эпоху, достаточно близкую ко времени создания скалигеровской хронологии. Поэтому они несут в себе более явственные отпечатки «скалигеровской деятельности», позднее затушеванные историками XIX–XX веков.