Відбір лексичного матеріалу
Відбір лексичного матеріалу для досліджень перший час робився автором самостійно зважаючи на відсутність або недоступність етимологічних словників. Однак і при використанні етимологічних словників для дослідження етногенетичних процесів у передісторичні часи відбір повинен проводитися за певними правилами, які автор засвоїв в процесі своєї роботи. Основні з них викладаються нижче.
Методи математичної статистики застосовються для випадкової вибірки з "генеральної сукупності" як моделі джерела даних. Випадкова вибірка статистично віддзеркалює генеральну сукупність, але при цьому повинні бути усунені всі суб’єктивні, невипадкові фактори утворення вибірки. В наших дослідженнях без повної певності про випадковий характер вибірки свідомо планувалося взяти більше елементів, щоб запобігти хибності кінцевих результатів. Однак особливість застосовуваного графоаналітичного методу така, що випадковість і об’єм вибірки визначаються її достатністю для віддзеркалення внутрішньої структури генеральної сукупності, чого не можна зробити при малому об’ємі випадкових даних. Ось тому дані збиралися в об’ємі "довірчого рівня", який забезпечував побудову графічної схеми взаємин споріднених мов.
Поширена думка про велику нестабільність лексики може бути спричиненою тією обставиною, що в багатьох мовах є досить багато запозичених слів. Однак спостереження показують, що запозичення здебільшого стосуються більш "культурного" шару слів, а найдавніші слова, які відповідають станові етносу більш нижчого культурного рівня, все-таки в мові лишаються. Ці найдавніші слова в мові найбільш вживані. На думку А.В.Десницької споконвічна лексика "включає в себе значну частину найбільш вживаних слів, які передають елементарні поняття та утворюють найбільшу кількість словотворчих гнізд" (Десницкая А.В., 1966, 9). Про залежність частоти вживання слова від його віку говорять в своїй роботі Арапов і Херц :
"Існує зв’язок між частотою слова і часом виникнення його в мові…Більшість слів з великою частотою вживання – це давні слова, і навпаки – чим менше частота слова, тем більше шансів, що це слово є новотвором" (Арапов М.В., Херц М.М., 1974, 3).
Автори зазначають, що вперше цей зв’язок зауважив Дж. Ципф в 1947 році і оцінив його значення для кількісного аналізу фактів, які стосуються історії мови. Слід, однак, мати на увазі, що деякі слова з малою частотою можуть бути давніми, і є багато слів-новотворів, котрі мають велику частоту вживання, але ці новотвори дуже легко вилучити при лексико-статистичних дослідженнях за їх змістом.
Відомо, що бувають такі мови, в словнику яких більшість слів є іншомовного походження, але в загальному обігу все-таки більше вживається власних слів, і тому навіть такі мови і за своєю лексикою не справляють враження належності до іншої мовної групи. В такому стані є румунська мова, в якій за походженням найбільше слів є слов’янські, за котрими йдуть латинські, турецькі, новогрецькі (Mańczak Witold, 1981, 99), але і жива румунська мова, і тексти, писані цією мовою, все одно справляють враження романської, а не слов’янської. Ігнорування або нерозуміння факту залежності давності слова від його частоти вживання в мові заплутує мовознавців у питанні первинної спорідненості мов, ускладнює розрізнення одвічної і запозиченої лексики, що кінець-кінцем заводить науковців у глухий кут. Прикладом може бути формальний і догматичний підхід В. Пізані до питання походження англійської і румунської мов, коли цей вчений вважав можливим говорити про спорідненість англійської і французької, з одного боку, та румунської і слов’янських, з другого (Пізані В., 1966, 11). Такий підхід ускладнював італійському мовознавцю відтворення історії розвитку мов, особливо якщо прийняти до уваги, що він не виключав можливості спорідненості індоєвропейських мов з мовами інших мовних груп при тому, що виключав можливість існування прабатьківської мови (Там же, 21).
Проблема розділення слів спільного походження і пізніх запозичень в споріднених мовах одна з найскладніших у історичному мовознавстві. Її добре розуміють всі компаративісти, бо вона зразу повстає при порівняльному аналізі будь-яких мов різного ступеню спорідненості (Фортунатов Ф.Ф., 1956, 72; Menges Karl H., 1990, 117 та ін.). Вибираючи для досліджень навіть найбільш вживані слова для лексико-статистичного аналізу з урахуванням їх значень, ми завжди наражаємося на певний ризик включити в списки якусь частку давніх слів іншомовного походження. Однак для більшості мов їх буває відносно небагато, і якщо провести спеціальний аналіз відібраного лексичного матеріалу з метою вилучення запозичених слів, то цей ризик істотно зменшується, і можливі помилки вже суттєво не впливають на результати досліджень. Вилучення пізніших запозичень полегшується тим, що інколи є відомим, з яких мов є в досліджуваній мові найбільше запозичень. Наприклад, в тюркських мовах є багато запозичень з арабської та іранських, в іранських – з арабської та тюркських, в слов’янських – з германських, тюркських, балтійських, в германських – з латини, в албанській – із слов’янських і турецької і т. д. Щоправда, мова йде про пізніші запозичення, часів, коли носії мов вже розійшлися із своїх прабатьківських ареалів. До тих часів запозичення з одної групи мов в іншу важко відрізнити від слів власного походження. Але при визначенні ареалів первісного поселення, як ми побачимо далі, це не має великого значення.
В принципі, самий відбір даних міг би вимагати мінімуму професійних знань і був би чисто технічною роботою при наявності, доступності і повноті етимологічних словників. На жаль, всі ці три умови не виконуються. Для деяких мов етимологічні словники все ще не складені, для інших вони тільки складаються і повністю не вийшли з друку. Не всі етимологічні словники, котрі вже вийшли в світ, були наявні в публічних бібліотеках колишнього Радянського Союзу. Наприклад, авторові не вдалося попрацювати з етимологічними словниками давньоіндійської, албанської, фінської, угорської, англійської, чуваської та деяких інших мов, котрі вже в свій час були опубліковані. Систематизації матеріалу в певній мірі заважала і неповнота даних в етимологічних словниках. В них дуже рідко дається повний набір відповідників з інших споріднених мов, частіше автори обмежуються прикладами з найбільш досліджених, а часом деякі помилкові етимології кочують із словника в словник. Всі ці обставини змушували більшу частину роботи з пошуку і відбору даних вести уважним переглядом двомовних словників, в котрих в більшості випадків можна знайти дуже багатий матеріал. Однак і тут забракло деяких словників. Відповідно до теми роботи необхідно було б обробити словники самодійських мов, але через їх брак ця робота не проводилася взагалі. Однак найбільш негативно на результати роботи вплинула відсутність або неповнота словників деяких іранських мов, через це, скажімо, лишається загадкою походження белуджської, мазендеранської, бахтіарської, татської та деяких інших мов, хоча вони очевидно почали формуватися на території Східної Європи. Так само через брак повних даних лишається дещо гіпотетичним походження деяких слов’янських мов : македонської, кашубської, та мов полабських і поморських слов’ян. Однак вже самий перелік всього того, що лишилося незробленим, говорить за те, що для одної людини все це не під силу.
Робота із словниками мов різних мовних сімей не вимагає особливого знання всіх цих мов, необхідне знання їх фонетичних особливостей та закономірностей їх історичних змін відповідно до вимог і відомих принципів порівняльно-історичного мовознавства (Фортунатов Ф.Ф., 1956; Мейе А., 1938; Мейе А., 1954; Гамкрелидзе Т.В., Иванов В.В., 1982; Мельничук О.С., 1966 та ін.). Для оцінки звукових відповідностей при підборі та систематизації слів індоєвропейських мов використовувалася робота Г.Краге (Krahe Hans, 1966). При роботі з фінно-угорськими мовами використовувалися дані з праці В.І.Литкіна і Є.С.Гуляєва (А. Лыткин В.И., Гуляев Е.С., 1970), а в тюркських мовах звукові відповідності оцінювалися за Н.А.Баскаковим (Баскаков Н.А., 1960). Не слід забувати також і про досвід, котрий набувається в процесі багатолітньої роботи. Крім практичного засвоєння методів порівняльно-історичного мовознавства цей досвід доводить, що їх застосування безумовно необхідне в межах одного мовного роду для мови нижчого і мов вищого рівня в процесі дивергентного розвитку. Однак при взаємовпливах мов різних мовних сімей фонетичні закономірності часом порушуються, тому в певних випадках до уваги бралися також слова тотожного змісту різних мовних сімей, котрі не зовсім вкладалися в рамки фонетичних відповідностей, коли було очевидно, що їх збіжність не могла бути випадковою. Особливо це мало підстави тоді, коли такі слова знаходилися в мовах різних сімей, але в сусідніх ареалах поселення їх носіїв.
Дослідження проводилися на лексичному рівні без урахування граматичних форм з порівнянням лексичних одиниць у двох планах – звуковому і змістовому. Пристайність звукових форм без впевненості у пристайності змісту беззастережно відкидалося. При оцінці змістової сторони ізоглос відповідність ототожнювалася від максимального значення – синонімії через більшу або меншу подібність семантики до антонімії, котра інколи буває просто наслідком специфічності поняття (класичний приклад – первісне значення "край" може в різних мовах отримати значення "початок" і "кінець"). Синонімія тут розуміється як пристайність хоча би одного значення слова в різних мовах (найчастіше домінуючого), але не повна пристайність змістових полів. Щоправда, найчастіше в досліджуваному матеріалі переважали не синоніми, а слова подібного значення спільного походження, навіть не обов’язково тої самої граматичної категорії. Кількісна оцінка фонетичного і змістового ступеню подібності ізоглос не робилася, хоча є слова більшої або меншої подібності значення і фонетично подібні в більшому або в меншому ступеню. Відбір проводився за правилом : факт або є, або його нема. При обробці великих масивів лексики одного рівня, кількісна оцінка окремих фактів стає несуттєвою, бо її можливий діапазон не може йти ні в яке порівняння з самою кількістю фактів, і в таких умовах вона все одно б достатньо рівномірно розподілилася серед цих фактів за законом великих чисел.
В переважній більшості випадків підбір ізоглос в мовах не справляв великих труднощів, і закономірності взаємин між групою споріднених мов встановлювалися вже на первинному матеріалі. Коли ці взаємини ставали достатньо очевидними, в ряді випадків було добре видно, в яких мовах бракує відповідників для тої чи іншої ізоглоси. Це бувало тоді, коли ізоглоса належала віддаленим ареалам і була відсутня в тих, що лежали між ними. В таких випадках як для поповнення матеріалу, так і для перевірки правильності встановлених зв’язків вівся цілеспрямований пошук відповідників в мовах проміжних ареалів. Це була найцікавіша форма роботи, бо дуже часто відповідники знаходилися, але розвиток семантики в них інколи бував несподіваним, хоча і достатньо обґрунтованим.
Наприклад, в фінно-угорських мовах були знайдені фонетично подібні слова із значенням "сирота" – фін. orpo, ест. orb, вепс. armatoi, уг. arva, хант. urvi, котрі, можливо, вважаються запозиченими з індоєвропейських мов, бо ні В.М.Ілліч-Світич в списку ностратичних, ні Н.Д.Андреєв в списку бореальних слів фінно-угорські аналоги не подають. Коли в результаті досліджень стало відомо, що, дійсно, як і вважалося раніше, фінська, естонська та вепська мови належать до західної частини загальної фінно-угорської області, а угорська та хантийська – до східної, то повстало питання причин відсутності цього слова в мовах комі, удмуртській, марійській, мордовській, ареали яких знаходяться між західно-фінськими та угорськими мовами. Отже, був проведений цілеспрямований пошук відповідника в зазначених мовах. В комі та удмуртській нічого схожого не було знайдено, а от у мордовській мові було знайдене слово урьва – "невістка" (рос. сноха). Семантичний зв’язок стане зрозумілим, якщо згадати, що у давніх народів був звичай, або навіть закон брати жінок з іншого роду. В таких умовах і сама жінка, і все її нове оточення мали всі підстави вважати її за сироту. Тут все ясно. В марійській же мові був знайдений можливий дериват арваты "молодиця". Семантично це слово наближене до мордовського, і його можна було б поставити в цей же ряд ізоглос, якби не неясний формант -ты, котрий у фінно-угорських мовах не зустрічається і може бути тюркського походження, хоча б його можна було б порівняти з подібним вепським -toi, але в тюркських мовах є подібне слово із значенням "жінка" : гаг. аврад, азер. арвад, є воно і в іранських мовах : тадж. аврат, язг. – awrat, шугн. – awrat, сарик. ewrat. В словнику Е.В. Севортяна (А. Севортян Э. В., 1974) слово відсутнє, отже воно іранського, арабського або ще іншого походження. В арабсько-російському словнику (А. Баранов Х.К., 1989) нічого подібного не було знайдено, і сумніви щодо етимології слова лишилися. В решті-решт заглиблення в цю проблему було визнано зайвим, і слова з коренем arvat/avrat з широким значенням "жінка" були вилучені з усіх таблиць. Але той факт, що мордовське урьва поєднало дві області фінно-угорських мов, дає підстави вважати, що воно могло бути поширене також і в марійській, удмуртській та комі. В таких умовах його запозичення з індоєвропейських мов стає сумнівним. Тоді ми мусимо залучити його до ностратичного фонду і припускати можливість існування парного шлюбу вже на дуже ранній стадії розвитку людини.
Ми довго зупинилися на цьому прикладі для того, щоб, по-перше, проілюструвати методику роботи в умовах відсутності етимологічних словників, бо загальний опис не дасть доброї про неї уяви, по-друге, в даному випадку видно, що відповідно до специфіки досліджень особливе заглиблення в часткову проблему є зайвим, бо зусилля не варті результату в умовах, коли є безліч безсумнівних фактів. Однак вирішення подібних проблем є надзвичайно важливим для вивчення історії культури наших далеких предків. Але це мало би робитися в дослідженнях іншого спрямування. В процесі ж проведених досліджень було виявлено досить багато подібних випадків, але їх навіть побіжне розглядання займе надто багато місця. Втім, в процесі подальшого викладання деякі приклади ще будуть наводитися. Хронологічно першими були зроблені дослідження слов’янських мов на підставі вибірки, складеної на матеріалах двомовних словників знову ж таки з урахуванням звукових відповідностей (Мейе А., 1951; Bräuer Herbert, 1961; Бернштейн С.Б., 1961). Зразу після отримання підтвердження дієвості графоаналітичного методу дослідження були повторені на матеріалах етимологічних словників О.Н.Трубачова і Ф.Славського (A. Sławski F., 1974; А. Трубачев О.Н., 1974), доповнених даними словників Фасмера, Безлая, Мельничука, Шустера-Шевця та ін. (А. Фасмер М., 1964; А. Bezlaj France, 1976; А. Мельничук О.С., 1982). На підставі всіх цих досліджень був складений список спільнослов’янських слів, котрий практично збігається з даними словника основного словникового фонду Ф.Копечного (A. Kopečný František, 1981), за винятком того, що в список вносилося переважно тільки одне слово певного слов’янського кореня, а у Ф.Копечного подаються багато однокореневих слів. На основі цього списку після узгодження його із частотними словниками російської мови (А. Засорина Л.Н., 1972; Штейнфельдт Э.А., 1973) був складений список сем, котрий в подальшому використовувався при дослідженні мов фінно-угорської, тюркської та іранської груп. Індоєвропейські мови досліджувалися тільки на основі даних етимологічних словників, при чому три чверті даних було взято із словника Ю. Покорни (A. Pokorny J., 1949-1959), которые после были дополнены матеріалами из других словарей (А. Boisaq E., 1923; А. Fraenkel E., 1955-1965; А. Walde A., 1965; А. Frisk H., 1970; А. Hübschmann Heinrich, 1972; А. Kluge Friedrich, 1989).
Як вже було зазначено, при дослідженні фінно-угорських, тюркських, іранських та германських мов використовувався список сем, складений на базі списку спільних слов’янських слів. В процесі дослідження кожної з груп споріднених мов використовувалися два типи таблиць-словників. Спочатку для групи мов складалася своя таблиця-словник першого типу, в крайню ліву колонку якої вписувався список сем, а в подальших колонках для кожної позиції списку виписувалися із словників всі наявні синоніми для кожної з досліджуваних мов. Після цього проводився аналіз отриманих наборів синонімів на фонетичну відповідність, що давало можливість відбирати ізоглоси, котрі потім доповнювалися додатковими словами при аналізі інших наборів синонімів із подібним змістом. Наприклад, завжди порівнювалися набори синонімів із значеннями : "високий", "гора", "верх" або "плести", "в’язати", "ткати" і т. д. В процесі роботи із словниками досить часто траплялися нові ізоглоси, відкриті випадково, вони теж включалися в список. Врешті-решт складалася таблиця-словник другого типу, в якій в крайній лівій колонці давався повний набір ідентифікаторів ізоглос (для лексичних ізоглос – гадані праформи коренів), а в подальших колонках – наявні відповідники в окремих мовах. Тоді вже кожна ізоглоса наново перевірялася по всіх словниках і при цьому доводилося включати в таблицю досить багато нових слів. Доповнень і уточнень бувало настільки багато, що таблиці приходилося переписувати по п’ять-сім разів. Таким чином були складені зведені Етимологічні словники-таблиці для різних мовних сімей і груп і за ними велися усі підрахунки.