В.Т. Титов, Воронежский государственный университет
Суть квантитативной лексикологии видится в следующем.
Квантитативная лексикология - не самоцель, а средство обнаружения факторов порядка в лексике, способ ранжирования ее по системной и функциональной значимости. Большинство современных лингвистов признает полевую организацию языка, предполагающую наличие ядра и периферии. В связи с этим важнейшим аспектом квантитативной лингвистики является количественно и качественно обоснованная стратификация словаря на ядро и периферию.
Как показала в своей докторской диссертации А.И. Кузнецова [2], наиболее реалистичным подходом к лексике является многомерный, полипараметрический подход, при котором каждый из параметров формирует своё ядро и свою периферию. Количество же параметров, существенных для лексико-семантической системы, конечно и хорошо известно:
1) функциональная активность (употребительность),
2) деривационная активность (межсловная и внутрисловная продуктивность),
3) синтагматическая активность (широкая сочетаемость),
4) парадигматическая поддержанность (вхождение в многочленные синонимические ряды).
Именно эти параметры испанского языка и исследуются в данной статье. Источником данных является компьютерная база данных (БД), созданная по инициативе и при участии автора статьи в Научно-методическом центре по компьютерной лингвистике факультета романо-германской филологии ВГУ (директор - проф. А.А. Кретов). БД содержит испанско-русскую часть словаря "Испанско-русский и русско-испанский словарь для школьников. - Киев: Логос, 1998. - 768 с. - (Серия "Словари для школьников"). ISBN 966-509-051-8 (11.000 слов в испанской части). Редактор В.П. Ховхун, отв. за выпуск. - В.В. Орехов, С. 15 - 409". Принципы отбора источников обсуждались в указанной выше публикации.
Целью нашего исследования является выделение на основании каждого из параметров лексических множеств мощностью около 1000 единиц каждое. Перемножение этих множеств дает два ядра: большое, представленное единицами, входящими не менее чем в одно из ядер, и малое, представленное единицами, входящими во все ядра. Выделение малого ядра испанской лексики и является конечным и самым главным результатом, получаемым квантитативной лексикологией испанского языка. На этом последняя слагает свои полномочия, предоставляя квалитативной лексикологии готовый к дальнейшему анализу материал.
§ 1. ФУНКЦИОНАЛЬНАЯ АКТИВНОСТЬ. Индикатором функциональной активности является длина слова в буквах. По этому параметру испанская лексика организована следующим образом. (См. таблицу 1).
Рис. 1. Соотношение между длиной слова и количеством слов данной длины по данным "Испанско-русского словаря"
Как и предполагалось, все 5 однобук-венных слов в испанском языке оказались служебными: а - в; у; на; к; за; по; до; е - и; о - или (перед о и ho принимает форму и); и - или; у -и, а (перед i и hi принимает форму е). Среди слов из двух букв уже встретилось 6 полнозначных лексем :fefl) вера; 2) доверие; ir vi 1) идти; ходить; 2) ехать; si II adv да; si III m согласие; te m чай; ya adv 1) уже, уж, прежде; 2) в настоящее время; 3) потом; 4) сию минуту, сейчас.
Кроме служебных слов, из дальнейшего рассмотрения исключим местоимения, включая личные, и числительные, ибо они составляют отдельную относительно замкнутую подсистему, обладая особыми функциями, а также слова, имеющие пометы -стилистические или терминологические.
Ядерная лексика, как известно, стилистически нейтральна - и в силу этого - универсальна, любая специализация слова ведет к ограничению сферы его употребления и уходу на периферию. Названия нот (do, re, mi, fa, la, si) - яркое тому подтверждение. Все они сопровождаются пометой (музыкальный термин). Поэтому, несмотря на свою краткость и номинативность, претендовать на статус ядерной лексики они не могут.
Еще одно ограничение, которое мы вводим при отборе ядерной лексики состоит в том, что из дальнейшего рассмотрения исключаются междометия - опять-таки в силу их особого статуса в языке - это не слово, не морфема, не предложение, а нечто предшествовавшее членораздельной речи - остатки архаичной пра-речи в современных индоевропейских (и не только) языках.
Именно поэтому из дальнейшего рассмотрения исключаются, в частности, междометия ha! ах!, аи! уа! inter] 1) да! 2) так! 3) наконец-то!
Под большим вопросом - правомерность включения в ядро лексической системы языка наречий, которые, как известно, являются разного рода "лингвистическими окаменелостями" морфологических форм, предложно-падежных конструкций и словосочетаний, выполняющих в предложении функцию разного рода обстоятельств.
Трехбуквенные слова, после исключения указанных выше категорий лексики дали 100 ядерных слов.
Четырехбуквенные слова дали еще 558 слов.
Таким образом, в сумме мы получили первое ядро в 664 слова. Это меньше 1000, но привлекать слова из пяти букв нет смысла, ибо только этих слов - 1256: 664 ближе к 1000, чем 664+1256.
§ 2. Деривационная активностьКак сказано выше, одним из индикаторов деривационной активности является количество значений у слова. Распределение слов в испанском словаре в зависимости от числа значений представлено в таблице 2.
Таблица 1.
Число значений | Число слов |
1 | 8762 |
2 | 2128 |
3 | 413 |
4 | 51 |
5 | 16 |
6 | 4 |
7 | 1 |
Как следует из таблицы 2, индекс многозначности испанских слов в словаре -1,28, но включать слова с двумя значениями в ядро мы не можем, ибо одних только слов с двумя значениями - 2128. Если мы намерены оставаться в пределах 1000 лексико-семантических единиц (а это единственный способ справиться с обилием материала), у нас есть только один вариант - включить в ядро все слова с количеством значений 3 и более.
Рассмотрим ядро продуктивности в порядке убывания числа значений.
7 ЗНАЧЕНИЙ
Максимальное количество значений в обследованном словаре имеет глагол pasar vt 1) перевозить, переносить; 2) переходить; переезжать; 3) передавать ~ aviso сообщать; 4) опережать; 5) миновать; 6) выносить, терпеть; 7) проводить (время).
... романских языков. Тем самым на новый уровень переходит решение проблемы лексико-семантической дифференциации романских языков [3; 4], исследованной — по сравнению с фонетической и морфологической дифференциацией — явно недостаточно. Реализация проекта "Квантитативная лексикология романских языков" сделает не просто возможным, а внутренне необходимым переход к "Квалитативной лексикологии романских ...
... выяснилось, что точно очерченные границы диалектов нередко довольно трудно выявить. Мало того, отдельные отличительные особенности одного диалекта могут наличествовать и у других диалектов. Глава 2. Дифференциация итальянского языка по территориальному признаку 2.1 История и причины возникновения диалектов итальянского языка Итальянский язык относится к романской группе индоевропейских ...
... контакты", "Многоязычие в социологическом аспекте". Их исследованием занимаются социолингвистика (социальная лингвистика), возникшая на стыке языкознания и социологии, а также этнолингвистика, этнография речи, стилистика, риторика, прагматика, теория языкового общения, теория массовой коммуникации и т.д. Язык выполняет в обществе следующие социальные функции: коммуникативная / иформативная ( ...
... весь собранный материал нашел отражение в этой работе, в которую вошли лишь наиболее интересные, с нашей точки зрения, новообразования, демонстрирующие наиболее активные словообразовательные процессы современного словопроизводства. Глава 1. Факторы обогащения номинативного фонда русского языка. §1. Экстралингвистические факторы. Одним из основных вопросов неологии является вопрос о факторах, ...
0 комментариев