АКАДЕМИЯ НАУК СССР
ИНСТИТУТ ВОСТОКОВЕДЕНИЯ
На правах рукописи
А. М. Кондратов
СТАТИСТИЧЕСКИЕ МЕТОДЫ ДЕШИФРОВКИ
НЕКОТОРЫХ ПИСЬМЕН ДРЕВНЕГО ВОСТОКА
И СРЕДИЗЕМНОМОРЬЯ
|
Автореферат диссертации на соискание ученой степени кандидата филологических наук |
Москва 1969
Основной интерес в дешифровках прошлого века был направлен на содержание этих текстов, представленных, как, например, египетские или вавилонские, большим числом разнообразных юридических, астрономических, хозяйственных документов, литературных памятников и т. д. Однако после того, как эти письмена были расшифрованы, а оставшиеся нерасшифрованные письма были предоставлены отрывочными текстами, языковая принадлежность того или иного памятника стала представлять не меньший, а порой и больший интерес, чем содержание этих текстов (греческий язык кипрского силлабария и линейного письма Б; индоевропейский характер хеттского и других «анатолийских» языков).
Начиная со второй половины XX в. наметилось новое «смещение интереса» в дешифровке: он направлен не только и не столько на содержание или языковую принадлежность нерасшифрованных текстов, сколько на сами методы дешифровки. Вызвано это как внешними, так и внутренними причинами. Современная методика дешифровки древних письмен тесно связана о такими молодыми областями исследования, как грамматология (наука о письме), теория знаков, машинный перевод, структурное и статистическое моделирование языков. Но, кроме того, существуют и глубокие внутренние причины, обуславливающие перенос «центра тяжести» на сами методы дешифровки.
Почти все без исключения нерасшифрованные тексты не имеют билингв, а ведь именно с их помощью было дешифровано большинство письмен в XIX - начале XX вв. А это означает, что «билингвистический» метод дешифровки - безусловно самый надежный и эффективный - не подходит для решения задач, стоящих перед современными дешифровщиками. Правда, ряд успешных дешифровок в прошлом был осуществлен в без билингв, при помощи так называемого «этимологического» метода, основанного на том, что знакам неизвестного письма приписываются чтения сходных знаков, имеющихся в каком-либо известном письме (дешифровка южноарабского письма на основании его сходства с эфиопским и др.). Но в большинстве случаев прямое родство недешифрованного письма с известными системами письма либо спорно, либо отсутствует (письменности Нового Света, критская иероглифика и др.). Кроме того, отождествление звучаний знаков письма - даже в близкородственных системах - на основании их внешнего сходства очень часто может привести к ошибкам (ср. русские и латинские буквы «н», «р», «о»).
Наконец косвенные данные о большинстве нерасшифрованных письмен очень скудны; опираясь на них, нельзя успешно завершить дешифровку, как это имело место, например, при дешифровке орхоно-енисейских рун, угаритской клинописи, «хеттской» иероглифики.
Таким образом, единственным «ключом» к дешифровке оказывается изучение самих текстов, выявление их структуры, абстрактных «параметров языка» и сопоставление их с «параметрами» известных языков (будь это частота гласных и согласных, дистрибуция знаменательных и служебных морфем, парадигмы слов и т. д.). Именно на этом пути добились успехов в дешифровке Майкл Вентрис (линейное слоговое письмо класса B); Б. В. Кнорозов (иероглифика майя); В. В. Шеворошкин (карийский алфавит). Применение методов анализа внутренней структуры текста позволило достичь успехов и в определении языковой принадлежности киданьских и протоиндийских текстов, причем главная часть трудоемких подсчетов, неизбежно возникающих при таком анализе, была выполнена электронными вычислительными машинами.
Анализ структуры текстов основывается на статистическом и структурно-дистрибутивном описании этих текстов. Образец структурного анализа текста дает пионерская работа Гротефенда; применение статистики в дешифровке было начато Шампольоном (подсчет числа египетских иероглифов и числа слов в греческом тексте - на этой основе была определена система письма древних египтян). Примерно тогда же, около полутора-ста лет назад, были заложены основы дешифровки криптограмм на основе статистического анализа текста.
Но последовательное применение математических методов исследования текстов в дешифровке (о привлечением вычислительной техники) было начато недавно - в годы второй мировой войны для расшифровки криптограмм. Тогда же Клодом Шенноном была создана математическая теория дешифровки секретных систем связи, стоящая на надежном фундаменте теория информации. Однако теория Шеннона не применима к дешифровке исторических систем письма.
И дешифровка древних текстов, и дешифровка криптограмм могут быть рассмотрены в рамках теории игр как «игры», где средний объем работы, необходимый для дешифровки, является «ценой игры». Однако, если дешифровку секретных систем письма можно рассматривать, как показал Шеннон, в качества «игры двух лиц», то дешифровку исторических систем письма следует рассматривать как «игру с природой», т. е. игру с одним участником (ибо здесь нет сознательного стремления сделать текст непонятным, нет «противника»).
Криптограммы пишутся на языках, чья структура и систематические характеристики хорошо известны; в древних текстах мы имеем дело о неизвестными или плохо изученными языками. В криптограммах кодируется один «уровень» языка (графемы алфавита). В исторических системах письма знаки могут передавать единицы языка разных уровней (фонемы, слоги, морфемы, олова), причем один и тот же знак может иметь несколько значений.
Если рассматривать звуковую речь как «код», то любая историческая система письма, включая современные системы, является «кодом второго порядка», кодирующим код-язык; криптографические же системы являются «кодами третьего порядка», кодирующими какую-либо известную систему письма: в отличие от исторических систем письма они строятся по иным принципам кодирования.
Работы по статистическому и теоретико-информационному моделированию языка показывают, что на любой человеческий язык - на всех его уровнях - наложены вероятностные ограничения. Они должны налагаться и на знаки письма, этот язык кодирующий, хотя ограничения языка и письма могут быть я не строго идентичны друг другу (особенности системы письма, орфография, аббревиатуры и др.).
Общее число письменных знаков может служить достаточно достоверным показателем того, каким ив типов письма (алфавитным, слоговым и т. д.) написаны недешифрованные тексты. Однако объем многих дошедших до нас текстов невелик, и в силу этого нельзя считать, что в них представлены все знаки данной системы письма. Статистика позволяет воспользоваться другим существенным показателем, характеризующим тот или ивой тип письма: соотношением числа новых знаков к общему числу знаков в коротких отрезках текста (естественно, что в любом письма, передающем звуковую речь, по мере увеличения длины исследуемого текста число новых знаков будет прогрессивно убывать).
Недочеты, произведенные на материале различных письменностей (русский, греческий, самоанский алфавиты; кипрский, эфиопский силлабарии и линейное письмо Б, египетская иероглифика и др.) показывают, что каждый тип письма имеет равные кривые, характеризующие частоту убывания новых знаков в тексте, ибо знаки этих письмен кодируют, как правило, единицы языка разных уровней (частота убывания новых фонем характеризуется кривой, отличающейся от кривой убывания новых слогов и т. д.).
Определение системы письма на основании количественных показателей - первых этап дешифровки древних текстов о помощью методов статистического анализа. Следующий этап - недочет абсолютной частоты употребления знаков в тексте (правда, для ряда письмен приходится решать еще одну задачу: разделение текста на «блока», т. е. слова, устойчивые словосочетания и т. п.; если для большинства письмен оно имеется, то в таких текстах, как протоиндийские, египетские, острова Пасхи встает необходимость искусственного выделения «блоков» - деление это достигается путем выявления повторяющихся сочетаний знаков - «полиграмм», хотя на этом пути могут встретиться существенные трудности, ибо «полиграммы» могут образовывать в сочетания частых окончаний одного слова с частыми началами второго, и т. п.).
Поскольку знаки письма кодируют единицы языка, частота употребления того или иного знака может служить характеристикой функции знака в тексте: передает ли он, главным образом, «знаменательные» элементы или же служит для записи грамматических показателей. Подсчеты, проведенные на материале русских алфавитных текстов, кипрских слоговых и египетских иероглифических, показывают, что наиболее частыми (независимо от системы письма) являются знаки или сочетания знаков, служащие для передачи грамматических элементов.
Это позволяет, на основании частоты наиболее употребительных знаков, наметить возможные грамматические референты (знаки и сочетания знаков) в неизвестном письме. Более тонкое дифференцирование знаков на классы возможно при сочетании статистических данных с данными о их дистрибуции (в пределах «блока» или по отношению к соседним знакам, независимо от деления на «блоки»).
В алфавитном письме с помощью такого анализа возможно разделить знаки письма на «класс гласных» и «класс согласных» (как показывают работы Шеворошкина и Сухотина); в слоговом письме - на «класс знаков, передающих чистый гласный» и «класс знаков, передающих согласный плюс гласный» (работы Ктистопулоса и Вентриса); в иероглифическом письме - «класс переменных знаков» и «класс устойчивых знаков» (см. монографию Кнорозова и публикации, посвященные исследованию киданьского и протоиндийского письма).
Тот или иной тип позиции «грамматических» знаков или сочетаний знаков по отношению к «знаменательным» характеризует морфологическую структуру языка, на котором написан текст, хотя конкретное значение самих знаков остается неизвестным. Выявление абстрактной грамматики неизвестного языка возможно благодаря тому, что знаки письма кодируют этот язык с его морфологической (и синтаксической) структурой. Это делает возможным сопоставление полученной структуры со структурами конкретных языков. При этом возможны три исхода сопоставления:
- язык дешифруемых текстов идентичен какому-либо известному языку (как, например, это имело место при дешифровке линейного письма Б);
- язык дешифруемых текстов является потомком или предком какого-либо известного языка или входит в какую-либо известную семью языков (как это имело место при дешифровке карийского алфавита или иероглифики майя);
- язык дешифруемых текстов не имеет родства ни о одним известным языком мира (ситуация, о которой столкнулись исследователи после прочтения знаков линейного письма А, на основании их сходства со знаками линейного письма Б, знаков «этеокипрского» силлабария, этрусского и мероитского алфавита и др.).
Независимо от этих исходов, т. е. от языка, на котором написаны тексты, возможно проведение дальнейшего статистического и структурно-дистрибутивного анализа текстов: составление частотных словарей, отыскание связей и чередований грамматических конструкций друг о другом, обусловленное семантикой текста (повествование в прошлом и настоящем времени, «формула проклятия» и т. п.); важным подспорьем здесь является и типология текстов, т. е. соотнесение того или иного эпиграфического объекта о тем или иным типом надписей (надгробие, сосуд, печать, стекла и др; посвятительная, мемориальная, календарная надпись), а также экстраполяция семантики надписей определенного типа, содержание которых известно, на семантику надписей, относящихся к тому же типу, но выполненных неизвестным письмом.
Успешное решение заключительного этапа дешифровки отождествление конкретных знаков неизвестного письма о конкретными единицами языка зависит от степени изучения последнего (информация о частотности знаков, грамматических конструкциях и их частоте и др.), а также от наличия других «внешних» по отношению к текстам данных (культурно-исторических, ономастических, этнологических и т. п.).
Если язык текстов не имеет родства ни о одним известным языком мира, установление фонетического чтения знаков невозможно (при отсутствии билингв, данных ономастики и т. п. ср. высказывание Кобер о том, что «неизвестный язык, записанный неизвестным письмом, не может быть расшифрован даже вне зависимости от наличия билингв». В этом крайнем случае возможно, опираясь на универсалии лингвистики и науки о письме, установить лишь самые общие закономерности грамматики, лексики, семантики неизвестного языка, записанного неизвестным письмом. Здесь задачи дешифровки письма смыкаются с задачами дешифровки языка (фонетическое чтение этрусских текстов, если исключить толкования слов и имен, заимствованных из других языков, почти не продвинуло перевод этих текстов; результаты, достигнутые комбинаторным анализом, в принципе могли быть получены и в том случае, если этрусский алфавит не был бы дешифрован).
Боли задачи интерпретации языка, который имеет родство с какими-либо известными языками или семьями, могут решаться методами сравнительно-исторического языкознания, то интерпретация неизвестного языка, не имеющего родства о другими языками мира, является по существу задачей дешифровки, решаемой математическим анализом структуры языка.
Правомерность применения этой методики на разных этапах исследования текстов подтверждается обработкой текстов, написанных различными известными системами письма (русский алфавит, кипрский силлабарий и др.). Обращаясь к недешифрованным письменам Древнего Востока и Средиземноморья, следует отметить, что применение статистики ограничивается текстами, имеющими достаточно большой объем (предельно краткие «протоармянские», протосинайские и другие отрывочные тексты Ближнего Востока оказываются вне «досягаемости» статистического анализа).
Изучение корпуса протобиблских текстов (общим объемом около 1000 знаков) математическими методами исследования позволяет сделать ряд существенных выводов, подводящих дешифровку этого письма к заключительному этапу - отождествлению знаков письма о конкретными языковыми единицами.
Подсчет частоты появления новых знаков протобиблского письма и сопоставление их о данными по другим системам письма (финикийским, угаритским, эфиопским, линейным Б, кипрским и др.) и частотами появления новых знаков в одном из северноцентральных семитских языков древней ступени (а именно таким языком, судя по всем данным, должен быть язык протобиблских текстов) позволяет сделать вывод о том, что знаки протобиблского письма передают лишь открытые слоги (типа «ба», «бу» и т. п.) и не передают закрытых (типа «аб», «уб», не говоря уже о слогах типа «согласный + гласный + согласный», распространенных в аккадской, хеттской и др. клинописных системах письма). Это говорит о том, что вариант дешифровки протобиблского письма, предложенный Э. Дормом, неправомерен.
Следующий этап изучения структуры протобиблских текстов состоял в выявлении повторяющихся сочетаний знаков (полиграмм) и разделении текстов на отдельные «блоки». Сопоставление протобиблских «блоков» друг о другом и распределение их в текстах позволяет выявить ряд «грамматических» знаков, которые могут быть сопоставлены с грамматическими показателями известных северноцентральных языков древней стадии (угаритским, аморейским, древнеханаанским). Отождествление этих знаков о конкретными «грамматическими» слогами позволит в дальнейшем, производя их подстановку в контексты, определить чтение и остальных протобиблских знаков, служащих для записи знаменательных слов и морфем (завершение последнего этана дешифровки - определение чтения знаков - немыслимо без участия лингвиста, специализирующегося в области семитской филологии, и не может быть решено средствами математики; об ограниченности применения формального анализа см. ниже).
Математический анализ структуры текста диска из Феста интересен не только в практическом, но и в теоретическом отношении, ибо объем этого уникального памятника письма очень мал (241 знак, 61 «блок»). Несмотря на это, возможно определить систему письма фестского диска, подсчитав частоту появления новых знаков и сопоставив ее с частотами других систем письма (отрезки по 250 знаков кипрских текстов, текстов линейного Б и др.). Сопоставление частот говорит в пользу того, что письмо диска - слоговое (а не алфавитное, «морфемное» или «идеографическое», как предполагалось некоторыми исследователями). Причем знак письма диска из Феста передают, как и знаки протобиблского, кипрского, лилейного письма классов А и Б острова Крит только открытые слоги (ср. определение «агейских силлабариев», данное И. Гельбом).
Сопоставление «блоков» диска из Феста друг с другом позволяет выявить набор «грамматических» знаков. Однако малый объем текста не позволяет сделать вывод о том, что дистрибуция и частота употребления этих знаков отражает реальную структуру языка, на котором написан текст (ибо здесь мы не можем провести различие между случайностью и закономерностью). В силу этого более правомерно не сопоставление крайне гипотетической грамматики языка диска из Феста о грамматиками других языков, а сопоставление структуре «именных групп», имеющихся в тексте (в определении которых автор пришел к выводу, совпадающему о выводами других последователей структуры текста, основывающихся на иных предпосылках) со структурой имен собственных, известных из ономастического материала («минойские», «анатолийские» и другие антропонимы Восточного Средиземноморья). Сопоставление это должно отвечать отрогам и математически точным условиям; при соблюдении этих условий сопоставления (в случае положительного результата) возможно определить чтение почти половины всех слоговых знаков текста диска из Феста (затем, подставляя полученные чтения и контекст, можно прочитать значительное число «блоков» диска и, если язык окажется родственным или тождественным какому-либо из известных языков, возможно прочтение всего текста).
Дешифровка письмен кохау ронго-ронго острова Пасхи (объем около 12000 знаков) практически стоит на одном «уровне» с дешифровкой письмен Древнего Востока, не имеющих билингв, хотя еще в первой половине XIX в. на острове процветало искусство этого письма. В современной науке существуют самые различные точки зрения на систему письма, которой пользовались жители острова Пасхи: оно определялось как «идеографическое», «кириологическое», «иероглифическое», «эмбрио-письмо», как пиктография, мнемоника, декоративный орнамент, как письмо, в котором логография (знак = слову) сочеталось о фразеографией (знак = сообщению) и т. д. Сопоставление частот появления новых знаков в двух текстах кохау ронго-ронго с частотами появления новых знаков египетской иероглифики и новых единиц языка (фонем, силлабем, морфем, словоформ в рапануйском фольклорном тексте «Хоту Магуа» говорит о том, что тексты острова Пасхи не могут быть записаны ни фонетическим (алфавитным или слоговым), ни «пословным» (знак = словоформе) письмом (не говоря уже о мнемонике или пиктографии). Данные по кохау ронго-ронго лежат между частотами появления новых знаков в иероглифике и частотами появления новых морфем (в фольклорном тексте о. Пасхи).
Ряд других данных заставляет предпочесть гипотезу о иероглифическом характере текстов кохау ронго-ронго; подтверждает это и статистика распределения знаков, входящих в состав тетраграмм типа авав. Эти знаки должны быть либо фонограммами, (передающими удвоение корня, столь частое в полинезийских языках), либо же один из знаков должен передавать морфему или олово, а другой быть детерминативом к нему. В последнем случае нужно ожидать, что детерминатив должен занимать либо финальную, либо инициальную позицию в тетраграмме. Подсчеты показывают, что большая часть знаков, входящих в состав тетраграмм типа авав, может занимать как финальную, так и инициальную позиции, что свидетельствует о том, что знаки эти являются фонограммами, а не детерминативами при «идеограммах». Знаки, входящие в состав тетраграмм типа авав, можно трактовать как слоговые. Однако вопрос о том, существовал ли в письме о. Пасхи устойчивый репертуар слоговых знаков, т. е. силлабарий, требует особого рассмотрения. В состав тетраграмм типа авав, в принципе, могут входить и односложные слова или морфемы, использованные для «ребусной» записи других слов. В любом случае можно констатировать наличие фонографии в текстах кохау ронго-ронго (осуществляемой либо с помощью стандартных «силлабем», либо о помощью «ребусных» написаний).
Наибольшую частоту в текстах, записанных любой системой письма, имеют знаки, передающие грамматические показатели. Однако самые частые знаки текстов кохау ронго-ронго не могут считаться таковыми. В полинезийских языках удваиваются корневые, а не служебные морфемы (см., например, В. Крупа «Язык маори», М., 1967, стр. 37). Наиболее частые знаки кохау ронго-ронго входят в состав удвоений типа аа, т. е. передают корневые, а не грамматические морфемы. Сочетаемость грамматических показателей в полинезийских (как и в любых других) языках подчинена определенным правилам. Порядок следования наиболее частых знаков кохау ронго-ронго этим правилам не подчиняется.
Статистический анализ фольклорных текстов о. Пасхи, записанных латиницей, дает иную картину частотности и распределения грамматических и знаменательных слов и морфем, чем распределение знаков в текстах кохау ронго-ронго. Это свидетельствует либо об особом строе языка текстов о. Пасхи, либо же о специфической особенности орфографии - не исключена вероятность того, что тексты кохау ронго-ронго написаны системой письма, сходной с протошумерской, где написание грамматических показателей было факультативным. В этом случае расхождение статистических данных по текстам кохау ронго-ронго и известному нам языку острова Пасхи объясняется не только и не столько хронологическим разрывом, сколько специфическими особенностями самого письма, (что требует разработки особой методики статистического анализа).
Нетождественность языка кохау ронго-ронго и языка фольклорных текстов о. Пасхи не свидетельствует, однако, о том, что первые написаны на каком-либо ином, неполинезийском языке (в свое время высказывались гипотезы о перуанском, древнеиндийском, меланезийском происхождении письма и культуры о. Пасхи). Исключительно большое число удвоений знаков кохау ронго-ронго хорошо соответствует числу удвоений в рапануйском и других полинезийских языках.
Статистический анализ этрусских текстов, занимающих, по общему признанию, совершенно особое место в дешифровке древних письмен, стал возможен после публикации Фаулером и Вольфом «Материалов для исследования этрусского языка», составленных с помощью электронных вычислительных машин. Подсчет относительных частот этрусских букв, двухбуквенных сочетаний, трехбуквенных и т. д. (относительная частота характеризует употребление элемента в система, абсолютная - в тексте) позволяет выявить основной набор «грамматических» знаков и сочетаний знаков (предварительно методика подобного анализа была проверена на материале русского языка). Полученные данные совпадают с данными, известными из комбинаторного анализа этрусского языка. Это открывает возможность дальнейшего изучения этрусского языка о помощью математических методов исследования, а также анализа других недешифрованных языков («минойского», мероитского, «этеокипрского»).
Дешифровка языка о помощью аппарата математики по существу является одной из задач, решаемых так называемыми «дешифровочными моделями лингвистики», использующими в качестве исходной информации исключительно лишь данные текста, на основании которых извлекаются сведения о системе. По если для известных языков, исследуемых «дешифровочными моделями», материал практически неограничен, то в случае дешифровки неизвестного языка мы имеем дело о «закрытыми текстами», объем которых затрудняет исследование и делает гипотетическими выводы.
Работы по типологии, в особенности квантитативной, показывают, что влияние стилистических особенностей того или иного текста оказывается настолько сильным, что оно существенно «смещает» параметры языка - разные стили одного и того же языка могут дать расхождение в числах большее, чем между различными языками. Это означает, что задачи дешифровки языка, равно как и отождествления абстрактной структуры неизвестного языка со структурой известных языков, тесно связаны не только о типологическими, но и со стилистическими исследованиями, использующими структурные и статистические методы.
Тесная связь проблем дешифровки о прикладными вопросами лингвистики (машинным переводом, автоматическим реферированием, информационным поиском, обучением иностранным языкам, в особенности о иероглифической письменностью) очевидна. Не столь явна, но не менее интересна связь вопросов, решаемых при дешифровке древних текстов, со статистическим и теоретико-информационным изучением поэтических текстов. В принципе любой поэтический текст может быть рассмотрен как «недешифрованный» (исследователь не строит заранее никаких гипотез о задачах, стоящих перед автором, а содержательная интерпретация дается лишь после выявления статистической структуры этого текста - ср. «дешифровочные модели исследования» в лингвистике).
Статистическое изучение поэтических текстов может быть проведено на всех лингвистических уровнях: фонетическом, морфологическом, лексическом и т. д. Машинная программа составления «словаря рифм» совпадает с машинной программою составления «обратных словарей» в дешифровке; выделение повторяющихся сочетаний знаков (полиграмм) необходимо и для дешифровки и для статистического описания фоники стиха; аналогию о изучением дистрибуции «грамматических» знаков в древних текстах имеет анализ дистрибуции грамматических элементов в поэтических текстах. Наконец изучение поэтических (и - шире - художественных) текстов с помощью статистики смыкается с изучением недешифрованных текстов и в теоретико-информационном аспекте.
Методы теории информации имеют прямое отношение к проблематике дешифровки; зная энтропию знаков письма, можно определить минимальный объем текста, при котором возможно однозначная дешифровка («расстояние единственности» в терминологии К. Шеннона)) Для алфавитного письма этот объем равен 40-50 знакам (среднее число знаков в алфавитах, деленное на среднюю величину избыточности, равную 0.7-0.8). Для слогового и иероглифического письма он равен числу знаков письма, деленному на величину в пределах 0.5-0.75 (границы величины избыточности для слогового и иероглифического письма, вычисленные автором), что дает объем текста, равный около 150-200 знакам для слогового письма и равный примерно удвоенному числу общего количества знаков для письма иероглифического.
Проблемы дешифровки древних текстов тесно связаны ч вопросами фонограмматологии (термин С. Н. Завадского) и общей грамматологии (термин Е. Гельба), ибо методы дешифровки должны опираться не только на универсалии языка, но и на универсалии письма, этот язык кодирующий. Типология письма, опирающаяся на статистические и структурные методы исследования, в помощь которых можно проводить четкое разграничение типологического и генеалогического сходства письмен, еще не создана. Однако и в настоящее время возможно статистическое сопоставление систем письма друг с другом (процент общности сравниваемых систем письма), которое показывает, что дешифровка с помощью этимологического метода таких письмен, как протобиблское, кохау ронго-ронго, иберийские алфавиты, неправомерна.
Рассматривая методику дешифровки в рамках математических моделей языка, теории письма и в более широких рамках общей теории знаковых систем, следует помнить, что методика эта разрабатывается для ограниченного круга текстов, имеющих специфическую семантику и, как правило, сравнительно небольшой объем. В силу этого детальная разработка методики математического анализа структуры древних текстов имеет большее значение для лингвистики и семиотики, чем для решения конкретных задач дешифровки конкретных текстов, которая связана с привлечением всех возможных культурно-исторических, археологических, этнологических и других «внешних» данных, без помощи которых не была (и вряд ли будет) дешифрована ни одна из исторических систем письма (привлечение -этих данных отнюдь не делает дешифровку «ненаучной»: поскольку основной задачей дешифровки является прочтение текстов, то «научными» следует признавать лишь те исследования, с помощью которых удалось решить эту задачу, хотя в них могут и не применяться математические методы анализа).
В принципе любая система письма может быть дешифрована путем последовательной подстановки вариантов чтения знаков в контекст. Однако возможное число вариантов астрономически велико и практически такая подстановка невыполнима (не помогают здесь и быстродействующие вычислительные машины, ибо, как показал А. Н. Колмогоров, проблемы, решающиеся путем простого перебора, характеризуются большими числами, а числа, большие для человека, остаются большими и для машины).
Применение математических методов исследования текста в дешифровке вызывается отсутствием билингв, скудостью «внешних» данных и т. д. Но в принципе сущность этих методов анализа структуры текста сводится к созданию искусственной «билингвы», если понимать ее очень широко (данные о языках, топонимах и т. д.). Решение основного этапа дешифровки, определение конкретного чтения знаков письма, как показывает многовековая практика дешифровочной работы (начатой в эпоху Возрождения изучением этрусских текстов) всегда связана о привлечением всякого рода «билингв» будь это географические названия, давшие ход «цепной реакции» прочтения знаков в дешифровке Вентриса, частотность гласных в дошедших в греческой передаче карийских имен, послуживших для Шеворошкина опорным пунктом при отождествлении знаков карийского алфавита и т. д.
Статистический и структурно-дистрибутивный анализ протобиблских текстов, фестского диска и других нерасшифрованных письменностей Древнего Востока и Средиземноморья показывает, что и здесь успешная дешифровка возможна лишь при условии привлечения гуманитарных «билингв». Весьма вероятно, что это вызвано не только краткостью дошедших до нас текстов, но и ограничениями, имманентно присущими математическим методам исследования. Любая формализованная система, как показывают работы по основаниям математики, ограничена в своих доказательных выводах. Очевидно это положение сохраняет свою силу для теории языка, науки о письме, теории знаков и одной из прикладных дисциплин, возникших на «стыке» этих наук - теории дешифровки древних систем письма.
Моменты, опираясь на которые мы можем проникнуть в тайны забытых языков и письменностей, весьма разнообразны и не могут быть сведены к определенным правилам. Именно в умении нащупать и использовать такого рода возможности и проявляется мастерство дешифровщиков, причем каждая новая дешифровка таит новые неожиданности, пишет И. Фридрих в своей книге «Дешифровка забытых письменностей с языков». Статистические методы исследования, анализ текста «изнутри», выявление законов его структуры не заменяет или отрицает интуицию исследователя - напротив, они дают ему необходимую «точку опоры» при дешифровке текстов, не имеющих билингв, создавая те благоприятные «моменты», используя которые дешифровщик может добиться успеха в своей работе.
Диссертация состоит из введения, трех глав и приложений. Во введении кратко рассмотрена история дешифровок и методов дешифровки (§1), дана дифференцированная оценка степени трудности дешифровки различных систем письма (§2) и дано описание работы (§3).
Глава I рассматривает этапы статистического анализа текстов: определения системы письма на основании статистических показателей (§1), разделения текста на «блоки» (§2), интерпретации частотности знаков (§3), выявления абстрактной грамматики языка (§4), статистического изучения лексики (§5), отождествления знаков письма и «дешифровки языка» (§6).
Глава II анализирует ряд нерасшифрованных письмен и языков Древнего Востока и Средиземноморья, как иероглифических и логографических, типа протошумерского (§1), так и фонетических (иберийские алфавиты, кипро-минойское письмо, агванский алфавит; §2); дается подробный статистический и структурно-дистрибутивный анализ протобиблских текстов (§3), анализ текста диска из Феста (§4), текстов кохау ронго-ронго (§5), этрусского языка (§6).
Глава III рассматривает связь статистических методов дешифровки с теоретико-информационным моделированием языков и письмен (§1); с дешифровкой криптограмм и неязыковых графических систем типа пиктографии (§2); квантитативной и структурной типологией языков, квантитативной стилистикой и другими областями математической лингвистики (§3); с распределением роли и объема «ручной» и «машинной» обработки текстов (§4); с прикладными вопросами лингвистики (§5); со статистическим и теоретико-информационным анализом поэтических текстов (§6); со структурной типологией графических систем (§7) и грамматологией (§8); с проблематикой общей теории знаков и, в частности, с лингвистической семиотикой (§9). Заключительный раздел главы III отмечает специфические особенности дешифровки древних текстов и «прикладной» характер теории дешифровки (§10).
К диссертации приложены:
- Краткий словарь терминов, связанных с дешифровкой, которые употребляются в тексте диссертации;
- список литературы (около 200 названий);
- 65 статистических таблиц, для удобства пользования приложенных отдельно от основного текста диссертации. Все статистические подсчеты, приводимые в таблицах, выполнены автором диссертации. Ряд таблиц представляет обработку данных Белоногова и Фролова (русский алфавит), Оливье (линейное слоговое письмо класса Б), Фаулера и Вольфа (прямой, обратный и частотный словари этрусского языка), Бартеля (цифровая транскрипция текстов кохау ронго-ронго).
Прорисовка и нумерация знаков протобиблского, кипрского, египетского письма и письма фестского диска дана в таблицах. Нумерация знаков линейного письма Б дана по работе Emmett L. Bennett Jr. "The Pyloa Tablets", Princeton, 1955, p. 201, знаков письма кохау ронго-ронго по монографии T. Barthel "Grundlagen zur Entzifferung der Osterinsel schrift", Hamburg, 1958.
ПРИМЕЧАНИЯ:
К. Шеннон «Теория связи в секретных системах», в сб. «Работы по теории информации и кибернетике». М., ИЛ, 1963.
См. С. Голдман «Теория информации. М., 1957, стр. 39-40; Л. Р. Зиндер «О лингвистической вероятности», «Вопросы языкознания», 1958, №2; Р. Г. Пиотровский «Информационные измерения языка», М., 1968 и др.
Ю. В. Кнорозов «Письменность индейцев майя». М., 1963, стр. 223.
См. статьи М. А. Пробста и А. М. Кондратова в сб.«Предварительное сообщение об изучении протоиндийского письма». М., 1965; проблема членения древних текстов на «блоки» тесно связана о проблемой членения оплошного текста по морфемы и олова; см. Б. B. Сухотин «Алгоритмы лингвистической дешифровки», об. «Проблемы структурной лингвистики». М., 1963; Н. Д. Андреев «Статистико-комбинаторные методы в теоретическом и прикладном языкознании». М., 1967, стр. 28-33; Z. S. Harris "From Phoneme to Morpheme", LANGUAGE, vol. XXXI, no. 2, 1955.
Б. В. Сухотин, указ. соч.; В. В. Шеворошкин «Исследования по дешифровке карийских надписей», М., 1965.
М. Wentris, J. Chadwick "Documents in Myceneaen Greek", Cambridge, 1956; J. Chadwick "The Decipherement of Linear В", 1958.
Ю. В. Кнорозов, указ. соч.; «Предварительное сообщение о дешифровке киданьского письма». М., 1964; «Предварительное оообщение об изучении протоиндийских текстов». М., 1965.
A. E. Kober "The Minoan Scripts. Facts and Theory", AMERICAN JOURNAL of ARCHAEOLOGY, vol. 52 (1948).
E. Dhorme "Dechiffrement des inscriptions pseudo-hieroglyphiques de Byblos", SYRIA, XXV, 1-35.
М. А. Пробст определяет аго как «морфемное» (А. А. Пробст «О методах исследования протоиндийских текстов», в об. «Предварительное сообщение об изучении протоиндийских текстов», М., 1965, стр. 12-13); А. Эванс (A. Evans "Scripts Minoa", Oxford, 1909) как «идеографическое»; Аллен Маккей (MacKay, А. "On the type-fount of the Phaiestos Disc", SMIL, 4, 1965) как слоговое, М. Омэ (Homet M., "Die Sohne der Sonne", Olten, 1958), трактует как пиктографическую запись и т. д.
I. J. Gelb "A Study of Writing", Chicago, 1962, pp. 153-159.
В. П. Назаров «Некоторые закономерности надписи Фетского диска» (в Печати); В. Ipsen "Der Diskus von Phaistos", INDOGERMANISCHE FORSCHUNGEN, XLII, Berlin, 1929
См. В. А. Истрин «Возникновение и развитие письма». М., 1965, 123-126; Д. А. Ольдерогге «Параллельные тексты с острова Пасхи», «Советская этнография», 1947, №4; Б. Г. Кудрявцев «Письменность острова Пасхи», Сборник Музея антропологии и этнографии, т. XI, 1949; Н. А. Бутинов, Ю. В. Кнорозов «Предварительное сообщение об изучении письменности острова Пасхи», «Советская этнография», 1956, №4; И. Гельб, указ. соч., стр. 278; A. Metraux "Ethnology of Easter Island", Honolulu, 1940; T. Barthel "Grundlagen zur Entzifferung der Osterinselschrift".
Отличие письма кохау ронго-ронго от пиктографии было доказано, на основании статистически появления новых знаков, И. К. Федоровой в работе «К вопросу о характере языка текстов острова Пасхи», «Советская этнография», 1963, №2; письмо, на основании общего числа знаков, определяется как иероглифическое.
Ср. Ю. А. Шрейдер «Значение методов формального исследования исторических письменностей», «Проблемы передачи информации», том III, вып. 4, 1967, стр. 94.
"Materials for the Studies of the Etruscan Language", prepared by M. Fowler & R. G. Wolfe, Univ. Wisconcin Press, 1956.
Модели исследования структуры текста и выявления на его основе закономерностей системы разрабатываются в нашей стране Б. В. Сухотиным (указ. соч.), Н. Д. Андреевым (указ. соч.); см. также Ю. А. Шрейдер, указ. соч.
См. Т. Я. Елизаренкова «О классификации Дж. Гринберга», сб. «Лингвистическая типология и восточные языки». М., 1965.
См. Вяч. Вс. Иванов «Лингвистические вопросы стихотворного перевода», сб.«Машинный перевод», вып. II, М., 1961; А. М. Кондратов «Создание словарей поэтического языка и словарей рифм с помощью ЭВМ», «Симпозиум по комплексному изучению художественного творчества», Л., 1963; Р. О. Якобсон «Поэзия грамматики и грамматика поэзии», сб. "POETICS. РОЕТУКА. ПОЭТИКА", Варшава, 1961; А. М. Кондратов «Статистика типов русской рифмы», «Вопросы языкознания», 1964, №6.
А. Н. Колмогоров «Автоматы и жизнь», бюллетень «Машинный перевод и прикладная лингвистика», вып. 6, М., 1961.
И. Фридрих «Дешифровка забытых письменностей и языков», М., 1961, стр. 155.
Г. Г. Белоногов, Г. Д. Фролов «Эмпирические данные о распределении букв в русской письменной речи», «Проблемы кибернетики», выпуск 9, М., 1963; J.-P. Olivier "Lineaire B et ordinateur electronique", L’ANTIQUITE CLASSIQUE, XXIV, fasc. 2, 1965; T. Barthel "Grundlagen zur Entzifferung der Osterinselschrift", Hamburg, 1958; M. Fowler & R. G. Wolf ‘’Materials for the Studies of the Etruscan Language”, Univ. Wisconcin Press, 1965
По тематике диссертации автором опубликованы следующие работы:
- А. М. Кондратов. Позиционно-статистический анализ протоиндийских текстов, в об. «Предварительное сообщение об изучении протоиндийских текстов». М., ВИНИТИ, 1965.
- A. M. Kondratov. The Hieroglyphic signs and different lists in the manuscripts from Easter Island, Reports of the Norwegian Archaeological Expedition to Easter Island and East Pacific”, vol. II, Stockholm, 1965
- А. М. Кондратов. Машинный перевод. «ЭВМ и дешифровка древних письмен». М., 1967.
- A. M. Kondratov. "L’arbre qui parle" de l’ile de Pâques revelers-t-il un jour son secret? "LA PENSEE SCIENTIFIQUE", fascicule 8, Aout., 1968
- А. М. Кондратов. Протоиндийское письмо (совместно с Г. В. Алексеевым), в сб. «Проблемы дешифровки». М., 1969 (в печати).
- А. М. Кондратов. Порождающие модели графических систем, «Тезисы докладов. Межвузовская конференция по порождающим грамматикам», Тарту, 1967.
- А. М. Кондратов. Письменность острова Пасхи, в сб. «Проблемы дешифровки». М., 1969, (в печати).
- А. М. Кондратов. Грамматология и порождающие модели графических систем, в сб. «Труды конференции по порождающим грамматикам», Тарту, 1969 (в печати).
- А. М. Кондратов. Позиционно-статистический анализ протобиблских текстов, в сб. «Лингвистика и дешифровка» (в печати).
- А. М. Кондратов. Дешифровочные модели исследования знаковых систем, в сб. «Лингвистика и дешифровка» (в печати).
Ряд вопросов, затрагиваемых в диссертации, освещен автором в работах:
А. М. Кондратов «Теория информации и поэтика» (в сб. «Симпозиум по структурному изучению знаковых систем». М., 1962);
А. М. Кондратов «Статистика типов русской рифмы» («Вопросы языкознания», 1963, №6);
А. М. Кондратов «Теория информации и поэтика (энтропия ритма русской речи)» («Проблемы кибернетики», выпуск 9, М., 1963);
А. М. Кондратов «Математика и поэзия». М., 1962;
А. М. Кондратов «Создание словарей поэтического языка и словарей рифм посредством ЭВМ», «Симпозиум по комплексному изучению художественного творчества», Л., 1963;
Aleksander Kondratov "Czterostopowy jamb N. Zabolosckiego i niekotore zagadania statystiki wirsza", POETYKA i MATEMATYKA, PWN, Warszawa, 1965.
|