6 Синтез.
Важно осознать, что в системе MITalk не используются готовые речевые волны даже в параметрическом представлении. Система не хранит параметрические представления множества морфов или слов. Вместо этого были разработаны правила контроля параметров, так что можно реализовать любую желаемую речевую волну на выходе.
Просодическая рамка.
Первый шаг в создании выходной речевой волны - создание временного контура и частоты основного тона ( основные корреляты интонации ), на основе которых строится детальная артикуляция отдельных фонетических элементов. Распределение ударения, которое было вычислено на стадии анализа, во многом ответственно за контур временного распределения и тональный контур. Часто интенсивность принимают за коррелят ударения, тогда как главными ключами являются длительность и изменения в тональном контуре. Согласные мало меняются по длительности, в то время как гласные более пластичны и могут легко сжиматься или растягиваться. Существует также тенденция растягивать слова на границе основных абзацев предложения, и наоборот, сжимать интервалы на относительно невыделенных участках. Кроме того, на основе временной рамки задается частота основного тона (или тональный контур). В утвердительных предложениях обычно высота тона резко поднимается на первом ударном слоге, затем плавно снижается до последнего ударного слога, где она резко падает. Вопросительные и повелительные предложения имеют различные тональные контуры. Кроме целостного контура предложения существуют еще локальные ударения. Большее ударение получают слова, выражающие отрицание или сомнение ( например, слово might ), значение частоты основного тона на них возрастает; новая информация в предложении также больше выделяется ударением. С другой стороны, высота тона используется в семантических и эмоциональных целях, что не может быть выведено из письменного текста. Необходимо лишний раз подчеркнуть важность составления правильного просодического контура, т.к. неправильный просодический контур может привести к трудностям в восприятии.
Синтез фонетических сегментов.
Когда завершено создание просодической рамки, создаются параметры, соответствующие модели речевого тракта. Обычно таких параметров 25, которые изменяются с интервалом 5 - 10 мсек. В настоящее время используются около 100 контекстных правил описания траектории изменения параметров. Когда значения параметров вычислены, они должны быть перенесены на соответствующую модель речевого тракта (обычно это формантная модель или LPC-модель). Выходная дискретная модель создается обычно на частоте 10 Кгц.
7 Оценка синтетической речи.
С точки зрения понятности, разборчивости качество синтезированной речи достаточно хорошее. Был проведен тест, где одна группа испытуемых прослушивала синтезированную речь с письменным вариантом перед глазами, а другая - без. Выяснилось, что результаты прослушивания мало отличаются друг от друга. Тем не менее, синтезированной речи не хватает живости и естественности, поэтому воспринимать ее на протяжении длительного времени трудно. Исследования показали, что фрикативные и назальные звуки требуют дальнейшего улучшения качества.
2
Билет 12
1. Типы лингвистических моделей; основные требования к ним и критерии их оценки.
Модель в лингвистике - искусственно создаваемое лингвистом реальное или мысленное устройство, воспроизводящее, имитирующее своим поведением (обычно в упрощенном виде) поведение оригинала в лингвистических целях.
Типы лингвистических моделей:
1. по охвату структуры языка:
· общие (глобальные) стремятся охватить весь язык: (vocabulary, grammar)
· частные: фонетическая модель русского языка, модель системы гласных
2. по типологическому статусу:
· универсальные стремятся охватить все языки мира:
· специфические характерны для определенного языка или группы языков: мягкость - твердость согласных рус. языка (не действует в англ., франц.)
3. по гносеологическому статусу:
· модели языка
· модели лингвистических знаний различные фонетические школы
· модели деятельности лингвиста
4. по отраженному аспекту языка и речевой деятельности:
Модели различаются не только по направленности на определенный объект, но и по используемым средствам моделирования (алгоритму или исчислению)
Алгоритм - строгая последовательность предписывающих правил
Исчисление - множество разрешающих правил (порядок выполнения не важен)
· анализирующие модели моделируют процесс понимания, используют логическое средство алгоритм
· синтезирующие модели моделируют процесс вербализации, смысла речевого отрезка
· порождающие модели автор Хомский объект моделирования - множество правильных речевых отрезков составляются правила различения приемлемого и неприемлемого; логический средство - исчисление
; не служат выражением смысла; на выходе - цепочки элементов (грамм. правильных предложений)
· собственно структурные модели основа всех остальных объект моделирования - структура языка как таковая; логический аппарат - логика отношений и классов. Пример: грамматический словарь Железняка
5. по конечной цели исследования
· теоретические
· описательные
· прикладные
6. по используемым методам
· математические модели
· психологические модели
· социологические модели
7. по функциональному статусу
· абстрактно обобщающие модели
· действующие
8. по используемым материальным средствам
· графические
· символьные
· компьютерные
Частная модель обычно входит в набор частных моделей, описывающий определенный уровень языка:
1. фонологический уровень
2. морфологический уровень
3. синтаксический
4. лексико-семантический
Основные теоретические требования к модели:
1. полнота модели - способность отражать все факты, на которые она рассчитана, на охват которых она претендует
2. простота - удобство, использования как можно меньшего числа средств (символов, правил) для достижения поставленной научной цели
3. объяснительная сила - способность модели вскрывать причины наблюдаемых фактов и предсказывать новые факты (например. модели исторического изменения слова; системы машинного перевода в очень малой степени объяснительные)
4. адекватность - свойство максимальной похожести на моделируемый объект, на оригинал, можно свести к объяснительной силе или теоретико-множественному соответствию
5. экономность - экономичное использование энергетических и временных ресурсов при применении модели
6. точность - возможность выполнения операций представляемым моделью формальным аппаратом
7. эстетические свойства - красота модели
Прикладные критерий: главное - удобство модели. Для моделирования языка очень важны логические средства реализации модели (компьютерное воплощение модели).
Синтаксический анализ. При использовании синтаксического анализа происходит интерпретация отдельных частей высказывания, а не всего высказывания в целом. Обычно сначала производится полный синтаксический анализ, а затем строится внутренне представление введенного текста, либо производится интерпретация.
Деревья анализа и свободно-контекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев. Одна из простейших разновидностей - свободно-контекстная грамматика, состоящая из правил типа S=NP+VP или VP=V+NP и полагающая, что левая часть правила может быть заменена на правую без учета контекста. Свободно-контекстная грамматика широко используется в машинных языках, и с ее помощью созданы высокоэффективные методы анализа. Недостаток этого метода - отсутствие запрета на грамматически неправильные фразы, где, например, подлежащее не согласовано со сказуемым в числе. Для решения этой проблемы необходимо наличие двух отдельных, параллельно работающих грамматик: одной - для единственного, другой - для множественного числа. Кроме того, необходима своя грамматика для пассивных предложений и т.д. Семантически неправильное предложение может породить огромное количество вариантов разбора, из которых один будет превращен в семантическую запись. Всё это делает количество правил огромным и, в свою очередь, свободно-контекстные грамматики непригодными для NLP.
Трансформационная грамматика. Трансформационная грамматика была создана с учетом упомянутых выше недостатков и более рационального использования правил ЕЯ, но оказалась непригодной для NLP. Трансформационная грамматика создавалась Хомским как порождающая, что, следовательно, делало очень затруднительным обратное действие, т.е. анализ.
Расширенная сеть переходов. Расширенная сеть переходов была разработана Бобровым (Bobrow), Фрейзером (Fraser) и во многом Вудсом (Woods) как продолжение идей синтаксического анализа и свободно-контекстных грамматик в частности. Она представляет собой узлы и направленные стрелки, “расширенные” (т.е. дополненные) рядом тестов (правил), на основании которых выбирается путь для дальнейшего анализа. Промежуточные результаты записываются в ячейки (регистры). Ниже приводится пример такой сети, позволяющей анализировать простые предложения всех типов (включая пассив), состоящие из подлежащего, сказуемого и прямого дополнения, таких, как The rabbit nibbles the carrot (Кролик грызет морковь). Обозначения у стрелок означают номер теста, а также либо признаки, аналогичные применяемым в свободно-контекстных грамматиках (NP), либо конкретные слова (by). Тесты написаны на языке LISP и представляют собой правила типа если условие=истина, то присвоить анализируемому слову признак Х и записать его в соответствующую ячейку.
Разберем алгоритм работы сети на вышеприведенном примере. Анализ начинается слева, т. е. с первого слова в предложении. Словосочетание the rabbit проходит тест, который выясняет, что оно не является вспомогательным глаголом (Aux, стрелка 1), но является именной группой (NP, стрелка 2). Поэтому the rabbit кладется в ячейку Subj, и предложение получает признак TypeDeclarative, т.е. повествовательное, и система переходит ко второму узлу. Здесь дополнительный тест не требуется, поскольку он отсутствует в списке тестов, записанных на LISP. Следовательно, слово, стоящее после the rabbit - т. е. nibbles - глагол-сказуемое (обозначение V на стрелке), и nibbles записывается в ячейку с именем V. Перечеркнутый узел означает, что в нем анализ предложения может в принципе закончиться. Но в нашем примере имеется еще и дополнение the carrot, так что анализ продолжается по стрелке 6 (выбор между стрелками 5 и 6 осуществляется снова с помощью специального теста), и словосочетание the carrot кладется в ячейку с именем Obj. На этом анализ заканчивается (последний узел был бы использован в случае анализа такого пассивного предложения, как The carrot was nibbled by the rabbit). Таким образом, в результате заполнены регистры (ячейки) Subj, Type, V и Obj, используя которые, можно получить какое-либо представление (например, дерево).
Расширенная сеть переходов имеет свои недостатки:
немодульность;
сложность при модификации, вызывающая непредвиденные побочные эффекты;
хрупкость (когда единственная неграмматичность в предложении делает невозможным дальнейший правильный анализ);
неэффективность при переборе с возвратами, т.к. ошибки на промежуточных стадиях анализа не сохраняются;
неэффективность с точки зрения смысла, когда с помощью полученного синтаксического представления оказывается невозможным создать правильное семантическое представление.
3
Билет 13
1. Метаязыки формального описания семантических структур.
Семантические метаязыки различаются:
по объекту, который они описывают (морфема, лексема, словосочетание, предложение, текст в целом).
по аспекту языковой структуры, который они отражают: (парадигматический аспект
синтагматический аспект)
Сходимость МЯ - возможность переводить с одного МЯ на другой.
По описываемому объекту:
1. значение морфем МЯ
· МЯ компонентного анализа (Найда, Апресян, Катс)
· МЯ пресуппазиционного анализа (прототипический анализ): если высказывание подвергнуть отрицанию, то отрицается только имплицитно выраженная часть, то, что не отрицается - ассерция
2. значение лексем исследуется
в синтагматичсеком аспекте - сочетаемость лексем:
· теория семантической валентности, понятие модели управления (Апресян)
в парадигматическом аспекте:
· глубинные падежи (агенс, интсрументалис ...), падежная рамка Филлмора
3. значение словосочетаний исследуется
в парадигматическом аспекте при помощи тех же МЯ описания, что и лексемы,
в синтагматическом плане:
· язык лексических параметров и функций (Апресян), понятие лекс. параметра связано с понятием устойчивой сочетаемости слов в словосочетании
... и единицах текста, о законах связности, о средствах реализации связности (к их числу относятся замещения и коннекторы), о статусе предложения и актуального членения и др. Популярности исследований по лингвистике текста в указанный период способствовало также широко распространенное ощущение, в соответствии с которым эти исследования рассматривались как вносящие вклад в преодоление разделения ...
... ". Примечательно, что и на последней встрече когнитологов в Стокгольме летом 1999 г. Б. Петере подчеркивал необходимость решения этой задачи - разъяснения семантики термина "когнитивный", - хотя ему и кажется, что в сочетании "когнитивная лингвистика" прилагательное имеет скорее идентифицирующее, нежели дескриптивное значение (Peeters 1999: 52). Хотела бы отметить также, что в момент составления и ...
... с другом, создавая новую лингвистическую единицу; они могут «приклеиваться» к глагольной или именной основе в виде аугментов, будущих флексий, будущих расширителей. Таким образом, «непарадигматическая» лингвистика, в нашем понимании, это некая лингвистическая дисциплина, пытающаяся приблизиться к описаниям протоязыка Стадии I и проследить механизм возникновения словоформ, имеющих флексию, через ...
... широкого спектра знаний. Основному же термину «юрислингвистика» 10 лет – он был введён в 1999 году Н.Д. Голевым, доктором филологических наук, профессором, академиком СО РАН ВШ. §2 Проблемы становления современной юридической лингвистики Социальные функции языка исключительно широки. В литературе по социальной лингвистике регулярно отмечаются выходы языка в культуру, религию, этногенез, ...
0 комментариев