Початкова сторінка

Валентин Стецюк (Львів)

Персональний сайт

?

Математичні методи
в порівняльному мовознавсті


Вважається слідом за Л.С. Виготським, що першим, хто усвідомив тісний зв'язок між мовою і математикою, був Рене Декарт. Цитування цього вченого-психолога можна зустріти в різних публікаціях неодноразово:


Первым, кто увидел в математике мышление, происходящее из языка, но преодолевающее его, был повидимому Декарт (Выготский Л.С. 1934, 273.


Однак думка Декарта занадто загально для того, щоб бути прийнятою як керівництво до дій. Минуло 250 років і тільки в 1904р. думку про необхідність застосування в мовознавстві математичних методів чітко висловив Бодуен де Куртене (Кондрашов Н.А., 1979, 170) і минуло досить багато часу, поки почалися перші серйозні спроби їх використання. Але поступово математичні методи в лінгвістиці знайшли найрізноманітніше застосування. З’явився навіть цілий напрямок мовознавства – математична лінгвістика (Лесохин М.М., 1982 та ін.). В фонетиці та синтаксисі велику перспективу має використання відомих в теорії ймовірності марковських процесів. В історичному та порівняльному мовознавстві, котре найбільше нас цікавить, розвиваються методи глоттохронології, один з яких був запропонований Морисом Сводешем (Моррис Сводеш, 1960-1). Він припустив, що певна частина основного словникового фонду всіх мов утворює певне лексичне ядро, яке є відносно стабільне, бо змінюється з постійною, але дуже повільною швидкістю приблизно так, як іде радіоактивний розпад. Якщо нам буде відомий процент слів, котрі збереглися в мові на протязі певного часу, то ми можемо вичислити константу швидкості змін лексичного складу, котра, хоч і є постійна, але для різних мов і різних періодів їх розвитку може дещо відрізнятися. Він склав список лексичного ядра слів спочатку в кількості 100, а пізніше 200 слів і, порівнюючи процент слів цього ядра, які збереглися в парах близько споріднених мов, намагався вичислити час, який пройшов від того моменту, коли ці мови відокремилися одна від одної. Однак, темп змін мови насправді дуже різний для різних мов і епох. На думку Вл.Георгиева, "при первісному ладі процес змін в суспільному житті та в мові стаються тим повільніше, чим далі ми проникаємо вглиб тисячоліть : для найменших змін потрібні були тоді не століття, а тисячоліття" (Георгиев Вл., 1958, 243). Тому, певно, отримані Сводешем результати підрахунків суперечили очевидним фактам, і вчений намагався вдосконалити свій метод, але безуспішно (Сводеш Моррис, 1960-2). Його ідея була безумовно дуже цікава, але реалізація її була унеможливлена як труднощами визначення константи швидкості змін лексичного ядра, так і принциповою неможливістю скласти список слів цього ядра, який би міг бути універсальним для всіх без винятку мов світу. Неможливість вирішення цих проблем була доведена Гаррі Гойером (Хойер Гарри, 1960) та В.А.Звегінцевим, котрий писав :


"Коли М.Сводеш намагається скласти "дослідний список", придатний до усіх мов, і сформулювати універсальні правила його складання, він ставить перед собою завдання, яке фактично не може бути виконане" (Звегинцев В.А., 1960, 13).


Також цікаву спробу визначення віку окремих мов зробили М.В.Арапов і М.М.Херц. Вони поставили собі завдання "побудувати математичну модель змін словника і на основі цієї моделі теоретично отримати залежність між часом виникнення слова та його рангом в частотному словнику" (Арапов М.В., Херц М.М., 1974, 3). Отримавши цю модель, вони сподівалися вирахувати вік окремих, споріднених між собою мов. Для цього вони запропонували емпіричну формулу, котра описує ймовірність появи слова до вибраного моменту часу. Ключове місце в цій формулі має певна константа, котра сама може мінятися для різних часових зрізів і для різних мов, але швидкість розвитку мови в різні періоди, як вже зазначалося, може бути дуже різною, а про ці особливості ми тепер не можемо мати жодної уяви. Автори об’єктивно оцінили свій метод, зазначивши, що хотіли тільки продемонструвати його можливості, бо для обчислення константи необхідно мати частотні словники, складені за єдиною методикою, а історична лексикографія мала би бути розробленою настільки, що могла давати можливість фіксації моменту появи нового слова з точністю хоча би до століття. "Оскільки обидві ці вимоги не виконані… дані про швидкість змін окремих мов незіставлювані" (Арапов М.В., М.М. Херц, 1974, 56). Отже, метод ще чекає на свою реалізацію.

Однак першу спробу кількісної оцінки споріденості мов зробив Я.Чекановський ще в 1927 р., котрий спробував використати математичний критерій незалежності для оцінки подібності двох асоціацій, введений в практику антропологічних досліджень Е.Б.Тейлором в 1888 р. Користуючись цим методом, польський дослідник відобразив ступінь спорідненості слов’янських мов, а пізніше деяких індоєвропейських (Czekanowski Jan, 1957, 71). Метод не був сприйнятий більшістю мовознавців через довільний вибір рис і необхідність подвійного рахування деяких з них (Popowska-Taborska Hanna, 1991, 34). Є ще інші методи оцінки подібності асоціацій, котрі враховують наявність якоїсь ознаки одного з двох об’єктів, відсутньої в іншому, але для дослідження спорідненості мов методом порівняння лексики вони неприйнятні тому, що відсутність ознаки насправді може означати тільки її відсутність у нашому розпорядженні, але фактично вона могла існувати раніше або існує і тепер, але не зафіксована науковцями. В археології та в антропології подібні методи можуть знайти застосування, бо там ми маємо справу з матеріальними предметами, які в достатній мірі дають уяву про свій первісний вигляд, але в історичному мовознавстві ми ніколи не можемо бути певні у відсутності якихось ознак у об’єкта досліджень в далекому минулому. Тому в лінгвістиці і діє правило : "Доказову силу мають тільки позитивні факти".

Пізніше ідеї Чекановського продовжив в певному сенсі інший польський дослідник В.Маньчак, котрий притримується принципової концепції : між спорідненістю мов та їхнім географічним розташуванням існує певний зв’якок (Mańczak Witold, 1981, 138). Він робить порівняння кількості спільних слів готської, давньоболгарської та литовської мов, використовуючи виключно тексти Біблії, написані цими мовами, припускаючи, що вони дуже близькі відповідно до германської, слов’янської і балтійської мов, виходячи з іншого свого принципу : рахування того, що можна знайти в граматиках і словниках, може не раз привести до хибних висновків, натомість рахування того, що міститься в текстах, дозволяє відкрити істину. Розглядати його мовознавчі принципи тут не місце, тим більше, що це вже зробила Поповська-Таборська (Popowska-Taborska Hanna, 1991, 35-35, 94-97), але математичний бік досліджень потребує певних зауважень. Пов’язувати географічне розташування прабатьківщини слов’ян на підставі отриманих даних трьох мов неможливо взагалі, бо, фігурально кажучи, тут в одному рівнянні більше ніж одне невідоме. Отримавши навіть істинну схему розташування трьох мов на площині, ми мусимо точно знати місце формування хоча б однієї з цих мов і бути впевненими, що ареал однієї з решти мов лежить в певному напрямку від неї. Крім того, треба також якось визначитися з часом, бо носії всіх трьох мов на протязі часу могли не раз міняти місця своїх поселень і опинятися в різних положеннях одні відносно других. Долучення до досліджень стосунків цих мов з латиною, як це робить Маньчак, теж мало що міняє, бо допускати a priori, що германська, слов’янська та балтійська мова формувалися в часи існування Римської імперії, теж нема підстав.

Однак незважаючи на методичні прорахунки, треба визнати, що В.Маньчак став на принципово правильний шлях, але у нього, здається, не було послідовників.

Незважаючи на найрізноманітніше застосування математичних методів в лінгвістиці, серед лінгвістів існує до них велика недовіра і це ускладнює розвиток лінгвістики відповідно до велінням часу, веде до топтання на місці та переливання з пустого в порожнє в тих її областях, де застосування математичних методів може вирішити проблему. Причина такого ставлення пояснюється так:


Головними причинами… є широко поширені серед лінгвістів та інших гуманітарних вчених помилкові думки: про принципову різницю законів, які панують в світі людського духу, від законів природи; про тотожність точних методів з математичними; про число як головний предмет математики (Гладкий А.В., 2007, 22).


У статті цитованого автора велика увага приділяється питанню до уточнення понять і методів у лінгвістики. Однак необхідно не тільки уточнення понять, але і введення нових, подібних тим, які є в математиці, що вже і відбувається (наприклад поява в лінгвістиці таких понять як множина, функція, ізоморфізм). Діахронічний розвиток мови можна представляти як змінне явище в дусі змінної величини в математиці. Будь-яку мову в своєму розвитку слід розглядати як єдине змінне явище від свого зародження до теперішнього часу. Одні лінгвісти можуть вважати, що якась мова в певний час ще не існувала і з'явився значно пізніше, а інші ж будуть заперечувати їм тим, що це була ще не мова а лише говірка, і обидві сторони в своєму розумінні мови будуть абсолютно праві. Диференціація складної категорії на окремі поняття полегшує її вивчення, однак для цього категорію треба спочатку визначити.


Такою категорією має бути мова з того часу, коли його відмінності від інших близько споріднених нескінченно малі настільки, що навіть їх носії цих відмінностей не помічають, і до теперішнього часу. Правда, на цьому часовому протязі категорія повинна мати незмінну ознаку, який і є умовою її існування. Це не можуть бути елементи ані фонетики, ні морфологіі, ні синтаксису, які хоч і повільно, але все-таки змінюються. Незмінним залишається ядро ​​лексичного фонду, яке не є загальним для всіх мов світу, як це вважав Моріс Сводеш, а властивим тільки одній окремо взятій мові. Слова цього ядра не можуть не бути найбільш древніми в мові, що очевидно, і одночасно мають бути найбільш часто вживаними, що менш очевидно. Наприклад, В. Пізані цей факт ігнорував і вважав за можливе говорити про спорідненість англійської з французькою, а румунської зі слов'янськими на підставі присутності в зазначених мовах спільних (подібних) слів пізнього походження, але менш уживаних(Пизани В., 1966, 11). На відміну від Пізані Вітольд Маньчак звертав увагу на частотність вживання слова і стверджував, що про походження мови говорять найуживаніші слова. Визнаючи те, що в румунській мові найбільше є слов'янських за походженням слів, за якими йдуть латинські, турецькі, новогрецькі, він звертав увагу на те, що і жива румунська мова, і тексти, писані на цій мові, все одно справляють враження романської, а не слов'янської (Mańczak Witold,1981, 99).

Таким чином, категорію мови можна в першому наближенні уподібнити ряду Фур'є з постійною складовою, до якої з плином часу додаються слова у з меншою частотою вживання. Правда, деякі неологізми можуть стати більш вживаними, ніж слова більш раннього походження, це ускладнює картину. Однак ніякі неологізми не стають більш вживаними, ніж слова мовного ядра, а іноді вони можуть взагалі вийти з широкого вжитку як застарілі в зв'язку зі зміною соціально-політичного устрою суспільства (наприклад "комсомол", "колгосп", "п'ятирічка", "соцзмагання", "стахановець" та інші под.)

На підставі такої уяви будь-якої мови як змінного явища можна побудувати її математичну модель для більш точного відтворення процесу її розвитку. Власне, пропонований для досліджень графоаналітичний метод і покоїться на такому розумінні, але з успіхом використовуваний ось уже більше тридцяти років, він до цих пір не знаходить визнання серед лінгвістів.