Начальная страница

Валентин Стецюк (Львов)

Персональный сайт

?

Математические методы в сравнительном языкознании


Считается, следуя за Л.С. Выготским, что первым, кто осознал тесную связь между языком и математикой, был Рене Декарт. Цитирование этого ученого-психолога в разных публикациях можно встретить неоднократно:


Первым, кто увидел в математике мышление, происходящее из языка, но преодолевающее его, был повидимому Декарт (Выготский Л.С. 1934, 273.


Однако мысль Декарта слишком обща для того, чтобы быть принятой как руководство к действию. Прошло 250 лет и только в 1904г. мнение о необходимости применения математических методов в языкознании четко выразил Бодуэн де Куртенэ. (Кондрашов Н.А., 1979, 170) и минуло еще достаточно много времени, пока начались первые серьезные попытки их использования. Но постепенно математические методы нашли в лингвистике самое разнообразное применение. Появилось даже целое направление языкознания – математическая лингвистика (Лесохин М.М., 1982 и др.). В фонетике и синтаксисе большую перспективу имеет использование известных в теории вероятности марковских процессов. В историческом и сравнительном языкознании, которое более всего нас интересует, развиваются методы глоттохронологии, один из которых был предложен Морисом Сводешем (Морис Сводеш, 1960-1). Он допустил, что определенная часть основного словарного фонда всех языков образует определенное лексическое ядро, которое относительно стабильно, ибо изменяется с постоянной, но очень медленной скоростью приблизительно так, как идет радиоактивный распад. Если нам будет известен процент слов, которые сохранились в языке в течение определенного времени, то мы можем вычислить константу скорости изменений лексического состава, которая, хоть и постоянная величина, но для разных языков и разных периодов их развития может несколько отличаться. Он составил список лексического ядра слов сначала в количестве 100, а позже 200 слов и, сравнивая процент слов этого ядра, которые сохранились в парах близко родственных языков, пытался вычислить время, прошедшее с того момента, когда эти языки отделились один от другого. Однако, темп изменений языка в действительности очень разный для разных языков и эпох. По мнению Вл. Георгиева, "при первобытном строе процесс изменений в общественной жизни и в языке происходят тем медленнее, чем дальше мы проникаем в глубь тысячелетий: для наименьших изменений нужны были тогда не века, а тысячелетия" (Георгиев Вл., 1958, 243). Поэтому, вероятно, полученные Сводешем результаты подсчетов противоречили очевидным фактам, и ученый пытался усовершенствовать свой метод, но безуспешно (Сводеш Моррис, 1960-2). Его идея была безусловно очень интересна, но реализация ее была невозможной по причине трудности определения константы скорости изменений лексического ядра, так и принципиальной невозможностью составить список слов этого ядра, который бы мог быть универсальным для всех без исключения языков мира. Невозможность решения этих проблем была доказана Гарри Хойером (Хойер Гарри, 1960) и В.А.Звегинцевим, который писал:


Когда М.Сводеш пытается составить "опытный список", пригодный ко всем языкам, и сформулировать универсальные правила его составления, он ставит перед собой задание, которое фактически не может быть выполнено" (Звегинцев В.А., 1960, 13).


Также интересную попытку определения возраста отдельных языков сделали М.В. Арапов и М.М. Херц. Они поставили себе задание "построить математическую модель изменений словаря и на основе этой модели теоретически получить зависимость между временем возникновения слова и его рангом в частотном словаре" (Арапов М.В., Херц М.М., 1974, 3). Получив эту модель, они надеялись высчитать возраст отдельных, родственных между собой языков. Для этого они предложили эмпирическую формулу, которая описывает вероятность появления слова к выбранному моменту времени. Ключевое место в этой формуле имеет определенная константа, которая сама может меняться для разных хронологических срезов и для разных языков, но скорость развития языка в разные периоды, как уже отмечалось, может быть очень разной, а об этих особенностях мы теперь не можем иметь ни малейшего представления. Авторы объективно оценили свой метод, отметив, что хотели только продемонстрировать его возможности, ибо для вычисления константы необходимо иметь частотные словари, составленные по единой методике, а историческая лексикография должна была бы быть разработанной настолько, что могла давать возможность фиксации момента появления нового слова с точностью хотя бы до столетия. "Поскольку оба этих требования не выполнены… данные о скорости изменений отдельных языков несопоставимы" (Арапов М.В., М.М. Херц, 1974, 56). Следовательно, метод еще ожидает своей реализации.

Однако первую попытку количественной оценки степени родства языков сделал Я.Чекановский еще в 1927 г. Он попытался использовать математический критерий независимости для оценки подобия двух ассоциаций, введенный в практику антропологических исследований Е.Б.Тейлором в 1888 г. Пользуясь этим методом, польский исследователь отобразил степень родства славянских языков, а позже некоторых индоевропейских (Czekanowski Jan, 1957, 71). Метод не был воспринят большинством языковедов по причине произвольного выбора признаков и необходимости двойного подсчета некоторых из них (Popowska-Taborska Hanna, 1991, 34). Есть еще и другие методы оценки подобия ассоциаций, которые учитывают наличие определенного признака в одном из двух объектов, отсутствующей в другом объекте.

Однако для исследования родства языков методом сравнения лексики они неприемлемы, потому что отсутствие признака в действительности может означать только его отсутствие в нашем распоряжении, но фактически он мог существовать раньше или существует и теперь, но не зафиксирован научными исследователями. В археологии и в антропологии подобные методы могут найти применение, ибо там мы имеем дело с материальными предметами, которые в достаточной мере дают представление о своем первоначальном виде, но в историческом языкознании мы никогда не можем быть уверены в отсутствии каких-то признаков у объекта исследований в далеком прошлом. Поэтому в лингвистике и действует правило: "Доказательную силу имеют только положительные факты".

Позже идеи Чекановского в определенном смысле продолжил другой польский исследователь В.Маньчак, который придерживается принципиальной концепции: между родством языков и их географическим расположением существует определенная связь (Mańczak Witold, 1981, 138). Он делает сравнение количества общих слов готского, староболгарского и литовского языков, используя исключительно тексты Библии, написанные этими языками, допуская, что они очень близки соответственно к германскому, славянскому и балтийскому языкам, исходя из второго своего принципа : подсчет того, что можно найти в грамматиках и словарях, может не раз привести к ложным выводам, тогда как подсчет того, что содержится в текстах, позволяет открыть истину. Рассматривать его языковедческие принципы здесь не место, тем более, что это уже сделала Поповска-Таборска (Popowska-Taborska Hanna, 1991, 35-35, 94-97), но математическая сторона исследований нуждается в определенных замечаниях. Связывать географическое расположение прародины славян на основании полученных данных трех языков невозможно вообще, ибо, фигурально выражаясь, здесь в одном уравнении неизвестных больше чем одно. Получив даже истинную схему расположения трех языков на плоскости, мы должны точно знать место формирования хотя бы одного из этих языков и быть уверенными, что ареал одного из оставшихся языков лежит в определенном направлении от него. Кроме того, нужно также как-то определиться со временем, ибо носители всех трех языков в течение времени могли не раз менять места своих поселений и оказываться в разных положениях одни относительно других. Приобщение к исследованиям отношений этих языков с латынью, как это делает Маньчак, тоже мало что меняет, ибо допускать а priori, что германский, славянский и балтийский язык формировались во времена существования Римской империи, тоже нет оснований.

Однако невзирая на методические просчеты, нужно признать, что В.Маньчак стал на принципиально правильный путь, но у него, кажется, не было последователей.

Несмотря на самое разнообразное применение математических методов в лингвистике, среди лингвистов существует к ним большое недоверие и это затрудняет развитие лингвистики в соответствии с велением времени, ведет к топтанию на месте и переливанию из пустого в порожнее в тех ее областях, где применение математических методов может решить проблему. Причина такого отношения объсняется так:


Главными причинами… являются широко распространенные среди лингвистов и других гуманитарных ученых ошибочные мнения: о принципиальном различии законов, господствующих в мире человеческого духа, от законов природы; о тождестве точных методов с математическими, о числе как главном предмете математики (Гладкий А.В., 2007, 22).


В статье цитируемого автора большое внимание уделяется вопросу к уточнению понятий и методов в лингвистики. Однако необходимо не только уточнение понятий, но и введение новых, подобных тем, которые имеются в математике, что уже и происходит (например появление в лингвистике таких понятий как множество, функция, изоморфизм). Диахроническое развитие языка можно представлять как переменное явления в духе переменной величине в математике. Любой язык в своем развитии следует рассматривать как единое переменное явление от своего зарождения до настоящего времени. Одни лингвисты могут считать, что какой-то язык в определенное время еще не существовал и появился значительно позже, а другие же будут оспаривать их утверждение тем, еще это был еще не язык а лишь говор, и обе стороны в своем понимании языка будут совершенно правы. Дифференциация сложной категории на отдельные понятия облегчает ее изучение, однако для этого категорию нужно сначала определить.


Такой категорией должен быть язык с того времени, когда его отличия от других близко родственных бесконечно малы настолько, что даже их носители этих отличий не замечают, и до настоящего времени. Правда, на всем этом временном протяжении категория должна иметь неизменный признак, который и есть условием ее существования. Это не могут быть єлементы ни фонетики, ни морфологии, ни синтаксиса, которые хоть и медленно, но все-таки изменяются. Неизменным остается ядро лексического фонда, которое не является общим для всех языков мира, как это считал Морис Сводеш, а присущим только одному отдельно взятому языку. Слова этого ядра не могут не быть наиболее древними в языке, что очевидно, и одновременно должны быть наиболее часто употребляемыми, что менее очевидно. К примеру, В. Пизани этот факт игнорировал и считал возможным говорить о родстве английского с французским, а румынского со славянскими на основании присутствии в указанных языках общих (подобных) слов позднего происхождения, но менее употребительных (Пизани В., 1966, 11). В отличие от Пизани Витольд Маньчак обращал внимание на частотность употребления слова и утверждал, что о происхождение языка говорят наиболее часто употребляемые слова. Признавая то, что в румынском языке больше всего имеется славянских по происхождению слов, за котороми идут латинские, турецкие, новогреческие, он обращал внимание на то, что и живой румынский язык, и тексты, писаные на этом языке, все равно производят впечатление романского, а не славянского (Mańczak Witold,1981, 99).

Таким образом, категорию языка можно в первом приближении уподобить ряду Фурье с постоянной составляющей, к которой с течением времени прибавляются слова все с меньшей частотой употребления. Правда, некоторые неологизмы могут стать более употребительными, чем слова более раннего происхождения, это усложняет картину. Однако никакие неологизмы не становятся более употребительными, чем слова языкового ядра, а иногда они могут вообще выйти из широкого употребления как устаревшие в связи с изменением социально-политического уклада общества (например "комсомол", "колхоз", "пятилетка", "соцсоревнование", "стахановец" и другие под.)

На основании такого представлении любого языка как переменного явления можно построить его математическую модель для более точного воссоздания процесса его развития. Собственно, предлагаемый для исследований графоаналитический метод и покоится на таком понимании, но успешно используемый вот уже более тридцати лет, он до сих пор не находит признания среди лингвистов.






Free counter and web stats