2.2.2. Информационный критерий оценки фонетической неопреде­ленности. При распознавании устной речи необходимо стремиться к тому, чтобы все фонемы классифицировались правильно, поэтому нас интересует распознавание полной последовательности фонетических единиц, составляющих высказывание. При этом основным источником неопределенности при распознавании речи является сам акустичес­кий сигнал. Еще большую неопределенность представляет параметри­ческое описание речевой волны. Рассмотрим неопределенности аку­стического сигнала и приведем меру оценки фонетической неопре­деленности. Используя эти мерь, можно оценить лексическую и фра­зеологическую неопределенности. Слитная речь расчленяется на пос­ледовательность сегментов по признакам способа образования зву­ков. К этим признакам добавляются признаки места образования, ко­торые изменяются непрерывно как внутри сегментов, так и через их границы [91,97]. С некоторыми дискретными единицами-звуками ре­чи - фонемами или квазифонемами сегменты связаны таким образом, что смысловые единицы речи (слова) представляются цепочкой фонем.

Большинство систем автоматического распознавания речи [79] преобразует речевой сигнал в такую фонемную цепочку, которая за­тем сравнивается с ожидаемыми в слове звуками. Процесс преобразования речевого сигнала в последовательность фонем включает нахождение признаков, сегментацию и маркировку сегментов.

Опишем модель фонетической неопределенности, позволяющую оце­нивать результаты неправильного распознавания фонем. Далее будем использовать матрицу ошибок распознавания фонем и фонетическую структуру слов словаря при оценке лексической неопределенности.

Лексическая неопределенность будет иметь место тогда, когда слова неверно классифицируются из-за близости их фонетической структуры, т.е. последовательности параметров, определяющих эту структуру, на конкурирующих словах. Например, в словах "слезать" и "срезать" первичные параметры звуков, входящих в эти слова, сходны. Когда оба эти слова входят в один и тот же словарь, их точ­ная классификация затруднена, поэтому их можно считать лекси­чески неопределенными. В реальных системах, если позволяет зада­ча, следует подбирать слова, чтобы такой ситуации не возникло. При­ведем критерии сложности словаря для того, чтобы можно было оце­нить степень различимости словарей [63].

Рассмотрим распознавание речи как процесс передачи речевой информации через канал с шумом и оценим информацию, теряющуюся в канале. Потерянная информация является мерой неопределенности или сложности распознавания фонем. В идеальном канале число вход­ных идеальных, полученных после сегментации высказывания экспер­тами-фонетистами, и выходных фонетических единиц должно быть оди­наковым, а последовательность фонем на выходе должна соответ­ствовать входной последовательности. Если же это условие не соб­людается, в канале теряется информация, и в зависимости от величины потерь можно говорить о большей или меньшей неопределенно­сти классификации фонем. При практической оценке фонетической не­определенности в данной работе использовались система призна­ков [73] и алгоритм сегментации речи на семь типов сегментов:

V - гласный, Т - переходный, М - сонорный, L - низкоча­стотный, Н - высокочастотный, R - шумный, П - пауза. Затем алгоритм маркировки ставил в соответствие каждому сегменту не­который фонетический символ, используя априорно полученные гисто­граммы параметров. От надежности маркировки сегментов во многом зависит точность работы CPP.

Так как СРР рассматривается здесь как канал передачи инфор­мации, предположим, что имеются R возможных входных символов алфавита А и s возможных выходов алфавита В . Таким об­разом, СРР описывается канальной матрицей.

Канал передачи информации, используемой для описания сис­темы распознавания речи, представленной цепочкой фонем, преобразу­ет не зашумленную последовательность звуков в выходную последова­тельность "машинных " фонем, содержащую ошибки пропуска, вставки слияния и замены звуков.

Пусть элемента входного фонетического алфавита {Ai} появля­ются на входе с некоторой априорной вероятностью p(A1 ),р(A2 ),.,p(Ar), а элементы алфавита {Bj} на выходе - с вероятностью P(B1,), p(B2),..., р(Bs). Как отмечено ранее, работу канала пере­дачи входного алфавита {Ai} характеризует канальная матрица, поэтому

P{Bj}=∑ri=1P(Ai)*P(Bj/Ai)

Символ А О И
А 0,89 0,1 0,01
O 0,15 0,75 0,1
И 0,01 0,1 0,89

Информация о работе «Информационный критерий оценки фонетической неопределенности»
Раздел: Информатика, программирование
Количество знаков с пробелами: 20461
Количество таблиц: 1
Количество изображений: 0

Похожие работы

Скачать
154174
8
2

... чем приступить к изложению методики формирования грамматических и лексических навыков, необходимо рассмотреть два общих вопроса, касающихся работы на данном этапе. Формирование навыка со всеми присущими ему качествами, особенно автоматизированности, устойчивости, гибкости и относительной сложности, требует определенных условий. Поскольку условия создаются в упражнениях, становятся ясными, что для ...

Скачать
181133
0
8

... с отрицательной оценкой как в немецком, так и в русском языке. ЗАКЛЮЧЕНИЕ Теоретическое обобщение научного материала, посвященного рассмотрению категории оценки и метафоры как средства выражения оценки в современном немецком и русском языках, ее природы, функций и видов, а также практическое исследование и дальнейший сопоставительный анализ оценочных метафор немецкого и русского языков на ...

Скачать
899509
4
0

... и устойчивых требований, которые определяют характер и особенности организации коррекционно-образовательного процесса и управления познавательной деятельностью лиц с особыми образовательными потребностями. Специальная педагогика опирается на соответствующие обще- педагогические принципы организации образования и управления познавательной деятельностью, однако их реализация в системе специального ...

Скачать
543469
4
1

... различных форм так называемого аргумента к человеку - включения слов или свойств говорящего в систему доводов: "Вы утверждаете то-то и то-то, потому что это вам выгодно". В традиционной риторике эристическая аргументация отождествляется с софистической и отвергается (Аристотель. О софистических опровержениях. Соч. Т. 2. С. 535-537). Это неразличение эристики и софистики, восходящее к Платону и ...

0 комментариев


Наверх