Категории
Самые читаемые
onlinekniga.com » Научные и научно-популярные книги » История » Методы статистического анализа исторических текстов (часть 1) - Анатолий Фоменко

Методы статистического анализа исторических текстов (часть 1) - Анатолий Фоменко

Читать онлайн Методы статистического анализа исторических текстов (часть 1) - Анатолий Фоменко

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 70 71 72 73 74 75 76 77 78 ... 145
Перейти на страницу:

Вновь обратимся к «античной» истории Рима. В качестве сравниваемых текстов X и Y мы взяли следующие два фрагмента из книги В.С. Сергеева «Очерки по истории Древнего Рима» [188]. Первый фрагмент описывает период якобы 520–380 годы до н. э., а второй фрагмент — якобы 380–240 годы до н. э. Считается, что эти периоды независимы. Подсчет коэффициента p(X,Y) дает, что здесь он равен 1/5. Это значение разительно, на несколько порядков, отличается от типичных значений 10-12 — 10-6 для заведомо зависимых текстов, с аналогичным количеством локальных максимумов. Таким образом, эти два текста, «две половины» книги В.С. Сергеева оказываются действительно НЕЗАВИСИМЫМИ.

Выше мы использовали такую числовую характеристику «главы», как ее объем. Однако, как показали наши исследования, аналогичные статистические закономерности (для достаточно больших исторических текстов) обнаруживаются и при использовании других числовых характеристик. Например, можно рассматривать количество имен в каждой «главе», количество ссылок на другие летописи и т. п.

В нашем вычислительном эксперименте сравнивались:

а) древние тексты с древними,

б) древние с современными,

в) современные с современными.

Как мы уже сказали, наряду с графиками объема «глав» исследовались и другие количественные характеристики текстов. Например, графики числа упомянутых имен, графики числа упоминаний данного года в тексте, графики частот ссылок на какой-либо другой фиксированный текст, и т. п. [416], [438], [419], [375].

Оказалось, что для всех этих характеристик выполняется тот же ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ. А именно, графики зависимых текстов делают всплески практически одновременно, а для независимых текстов точки всплесков графиков никак не коррелируют.

Сформулируем еще одно следствие из нашей основной модели, статистической гипотезы.

А именно, если два исторических текста ЗАВЕДОМО ЗАВИСИМЫ, то есть описывают один и тот же «поток событий» на одном и том же интервале времени в истории одного и того же государства, то для любой пары указанных выше числовых характеристик соответствующие им графики делают всплески приблизительно в одни и те же годы. Другими словами, если какой-то год в обоих летописях описан подробнее, чем соседние годы, то увеличится (локально) число упоминаний этого года в обоих летописях, увеличится количество имен персонажей, упомянутых в этом году в обоих летописях и т. п. Напротив, если тексты ЗАВЕДОМО НЕЗАВИСИМЫ, то никакой корреляции между указанными числовыми характеристиками быть не должно.

Проверка этого «вторичного принципа корреляции максимумов» подтвердила его справедливость на конкретных заведомо зависимых исторических текстах. См. [375], с. 110–111.

1.5. Методика датирования исторических событий

Поскольку наша теоретическая модель подтвердилась на экспериментальном материале, мы можем теперь предложить новую методику датирования древних событий. Хотя она, конечно, не универсальна. Опишем идею метода.

Пусть Y — исторический текст, описывающий неизвестный нам «поток событий» с утраченными абсолютными датировками. Пусть годы t отсчитываются в тексте от какого-то события местного значения, например, от основания какого-то города или от момента воцарения какого-то царя, абсолютные датировки которых нам неизвестны. Подсчитаем для текста Y его график объема «глав» и сравним его с графиками объема других текстов, для которых абсолютная датировка событий, описанных в них, нам известна. Если среди этих текстов обнаружится текст X, для которого число p(X,Y) мало, то есть имеет такой же порядок, как и для пар зависимых текстов (не превосходит, например, числа 10-8 для соответствующего количества локальных максимумов), то можно с достаточно большой вероятностью сделать вывод о совпадении описываемых в этих текстах «потоков событий». Причем, эта вероятность тем больше, чем меньше число p(X,Y).

При этом оба сравниваемых текста могут быть внешне несхожи. Например, они могут быть двумя вариантами одной и той же летописи, но написанными в разных странах, разными летописцами, на разных языках.

Эта методика датирования была экспериментально проверена на средневековых текстах с заранее известной датировкой. Полученные даты совпали с этими датировками. Приведем типичные примеры.

Пример 6.

В качестве текста Y мы взяли русскую летопись, так называемую краткую редакцию Двинского летописца, описывающая события на 320-летнем интервале [166]. Попробуем датировать описанные в летописи события, используя указанную методику. Перебирая все летописи, опубликованные в «Полном собрании русских летописей», мы вскоре обнаруживаем текст X, график объема vol X(t) которого делает всплески практически в те же годы, что и график vol Y(t) летописи Y. См. рис. 3.14.

При сравнении графиков мы, конечно, предварительно совмещаем временнЫе интервалы (А,В) и (C,D), накладываем их друг на друга. Подсчет дает, что здесь p(X,Y) = 2×10-25. Следовательно, весьма вероятно, что эти две летописи описывают приблизительно одни и те же «потоки событий». Таким образом, нам удалось чисто формально, на основе сравнения лишь статистических характеристик текстов, датировать события, описанные в тексте Y. Оказывается, что летопись X — это пространная редакция Двинского летописца [166]. Считается, что эта летопись описывает «поток событий» 1390–1707 годов н. э. В результате, полученная нами датировка текста Y совпала с его стандартной датировкой, что подтверждает эффективность нашего метода.

Пример 7.

Возьмем в качестве «текста Y с неизвестной датировкой» русскую Академическую летопись [166]. Следуя приему, описанному выше, вскоре обнаруживаем текст X, а именно, часть Супрасльской летописи [166], описывающей, как считается, 1336–1374 годы н. э. Оказывается, график объема vol X(t) делает всплески практически в те же годы, что и график объема vol Y(t). См. рис. 3.15.

Подсчет дает, что здесь p(X,Y)=10-14. Такое малое значение коэффициента ясно указывает на зависимость этих двух текстов. Поскольку летопись X датирована, то мы датируем и летопись Y. Полученная нами датировка текста Y совпала с его датировкой, известной ранее.

Мы обработали несколько десятков аналогичных текстов эпохи XV–XIX веков, и во всех случаях полученная нами датировка «неизвестного текста Y» совпала с его обычной датировкой.

Конечно, во всех этих последних примерах мы ничего нового не узнали, поскольку датировка, например, краткой редакции Двинского летописца была и без того заранее известна, и особых оснований сомневаться в ее правильности у нас нет. Ведь это уже XIV–XVIII века, то есть эпоха более или менее надежной хронологии. Однако вскоре мы увидим, что наш метод даст интересные результаты для летописей, традиционно относимых к более ранним эпохам, то есть ранее XIV века н. э.

Принцип корреляции максимумов мы изложили выше огрубленно, не вникая в статистические детали, потому что преследовали одну цель — быть быстро понятыми читателями. В то же время строгое математическое изложение метода и его уточнений требует существенно бóльших подробностей. Мы отсылаем читателя, желающего глубже вникнуть в описанный метод, к научным публикациям [375], [386].

Коэффициент p(X,Y) можно условно назвать ВССД — вероятностью случайного совпадения лет, подробно описанных в летописях X и Y.

Дальнейшее развитие и уточнение идеи было дано в работах В.В. Федорова, А.Т. Фоменко [388] и В.В. Калашникова, С.Т. Рачева, А.Т. Фоменко [400]. Выяснилось далее, что наиболее ярко принцип корреляции максимумов проявляется при сравнении исторических текстов примерно одинакового объема, имеющих примерно одинаковую «плотность описания». Кроме того, обнаружилось, что в некоторых случаях для заведомо зависимых текстов коррелируют не только точки локальных максимумов, но даже и сами функции объема, то есть их амплитуды! Это достаточно удивительный и важный факт. Особо ярко корреляция амплитуд функций объема наблюдается при сравнении «достаточно бедных» текстов, то есть летописей, содержащих большие лакуны — значительные интервалы времени, не отраженные в хронике. Оказалось, что процесс написания хронистами «достаточно бедных» летописей подчиняется интересному принципу «уважения к информации», или принципу «сохранения раритетов». Эта закономерность была обнаружена С.Т. Рачевым и А.Т. Фоменко [410], [424]. Предварительные исследования в этом направлении и саму формулировку принципа уважения к информации см. как в работах [410], [424], так и ниже, в параграфе, написанном С.Т. Рачевым и А.Т. Фоменко.

Принцип корреляции максимумов был также успешно применен к анализу некоторых русских летописей периода «смуты» конца XVI — начала XVII веков н. э. См. на эту тему работы Л.Е. Морозовой и А.Т. Фоменко [399], [402]. В этом исследовании большое участие принимал также Н.С. Келлин. См. ниже раздел, написанный Н.С. Келлиным, Л.Е. Морозовой и А.Т. Фоменко.

1 ... 70 71 72 73 74 75 76 77 78 ... 145
Перейти на страницу:
На этой странице вы можете бесплатно читать книгу Методы статистического анализа исторических текстов (часть 1) - Анатолий Фоменко.
Комментарии