7.2 Алгоритм ELVIRCOS для розпізнавання злитого мовлення

 

Архітектура

Після отримання списків транскрипцій використовується додаткова процедура формування графа слів для злитого мовлення, яка створює мережу слів для другого проходу алгоритму.

Формування графа слів

Процес створення графа слів показаний на мал. 5. Мережа слів починається з вершини S і закінчується у вершині F. Кожна трійка фонем з відповіді фонетичного стенографа породжує проміжну вершину з номером синхронним до часу появи цієї трійки фонем. З іншого боку кожна трійка фонем стає запитом до індексу бази даних, який повертає список транскрипцій. Транскрипції вставляються між проміжними вершинами так, щоб трійки фонем опинилися в одній колонці по вертикалі.

У випадку, коли відбувається перетин транскрипцій одного слова, породженими різними трійками фонем, тоді ранги цих транскрипцій збільшуються на одиницю. Для кожного моменту часу можна підрахувати число транскрипцій тих, що входять у цей проміжок часу.

Для зменшення складності графа слів використовується обмеження N для кількості слів в кожен момент часу. При цьому віддаляються слова з малими рангами.

Оскільки граф слів формується зліва направо можна проводити його формування у реальному часі із затримкою, яка дорівнює максимальній довжині транскрипції.

Відповідь фонетичного стенографа

 # с г в а + с н , ъ й е #

мал. 5. Формування графа слів для злитого мовлення


Алгоритм ELVIRCOS

Алгоритм ELVIRCOS складається з двох частин. Підготовчий етап такої ж, як і в алгоритмі ELVIRS. Етап розпізнавання:

• Застосувати фонетичний стенограф до вхідного сигналу для отримання послідовності фонем.

• Поділити послідовність фонем на трійки фонем із зрушенням в одну фонему.

• Створити запити до БД з трійок фонем

• Одержати списки транскрипцій за допомогою запитів до індексу бази даних.

• Створити граф слів для злитого мовлення.

• Упорядкувати транскрипції до їх рангу.

• Вибрати перші N транскрипцій з найвищими рангами як підсловник для розпізнавання.

• Розпізнати вхідний мовний сигнал для графа злитої мови в умовах обмеженого підсловника.[5]


8. Експериментальні результати

Для того, щоб ввести перший прохід алгоритму ELVIRCOS в базову систему розпізнавання мови були зроблені необхідні зміни в інструментарії і проведені декілька експериментів.

Для окремо вимовлених слів досліджувався вплив обмеження N на середній час і надійність розпізнавання мовлення для словників різного об'єму, що наведені в таблиці 4. Результати показують корисність обмеження N для словників великих об'ємів, що дозволяє додатково скоротити час розпізнавання при незначному погіршенні надійності.

В цілому одержано значне скорочення часу розпізнавання в сотні разів при відносно невеликому (близько 5%) погіршенні надійності в порівнянні з базовою системою розпізнавання. Погіршення надійності має хороший збіг з оцінкою імовірності правильного формування підсловника.

Таблиця 4: Результати алгоритму ELVIRS

Об'єм словника, тис

Обмеження N на розмір підсловника

15 95 1987
Надійн. % Час, сек. Надійн. % Час, сек. Надійн. % Час, сек.
50 92.2 1.4 81.0 1.4 69.2 1.6
200 94.6 1.6 87.6 2.1 76.0 1.9
500 95.5 1.9 90.1 2.5 80.0 3.3
1000 96.0 2.1 90.7 3.1 82.7 4.4
2000 96.0 4.4 92.0 4.5 84.8 6.8
5000 96.0 4.6 92.9 8.3 86.4 12.0

Для злитого мовлення були проведені попередні експерименти, в яких розглядався випадок, коли обмеження N співпадало з розміром словника. У таблиці 5 наведені показники надійності для різних розмірів словника.


Таблиця 5: Результати алгоритму ELVIRCOS

Об'єм словника, тис 15 95 1987
Надійність, % 85.3 84.9 83
Час, сек 2.3 9.4 160

Зменшення середнього часу розпізнавання не настільки значне, як у випадку окремо вимовлених слів, оскільки деякі послідовності фонем від фонетичного стенографа породжують графи слів дуже великої розмірності. Сподіваємося, що введення обмеження N істотно зменшить час розпізнавання.[5]

Слід підкреслити важливість підходів вибірки інформації з баз даних для процесу розпізнавання мови. Показано, що додаткове джерело інформації, одержане з аналізу послідовності фонем від фонетичного стенографа, дозволило значно скоротити простір пошуку в алгоритмі розпізнавання мови. Це дозволило створити системи розпізнавання мови, що охоплюють практично всі слова мови.


Список використаної літератури

1. http://www.genetics.wustl.edu/eddy

2. http://www.lib.ua-ru.net/diss/cont/9307.html

3. http://www.nbuv.gov.ua/e-journals/VNTU/2007-1/ukr/07gtvmco.pdf

4. http://www.ru.wikibooks.org/wiki/

5. http://www.teormin.ifmo.ru/education/machine-learning/notes-06-hmm.pdf

6. http://www.uk.wikipedia.org


Информация о работе «Приховані марківські процеси»
Раздел: Информатика, программирование
Количество знаков с пробелами: 35454
Количество таблиц: 5
Количество изображений: 4

Похожие работы

Скачать
350134
0
0

... культурною діяльністю для добра українського народу.[220,С.9] Значення постатей Митрополита А.Шептицького та Патріарха Й.Сліпого важко переоцінити. Яскравим свідченням цього є розпочатий Українською Греко-Католицькою Церквою процес беатифікації Митрополита Андрея Шептицького. Після розвалу тоталітарно-імперського СРСР Україна стала незалежною, самостійною державою, на території якої проживають ...

Скачать
366107
13
2

... депозитну угоду і документи з відкриття депозитного рахунку. 5.2. Самостійно повторити матеріал та розглянути інформаційні джерела, рекомендовані до тем 4, 6 з 1-го та 2-го модулів дисципліни „Банківські операції”. Практичне заняття-тренінг 6 Розрахунково-касове обслуговування фізичних осіб Питання для опрацювання 1. Правила надання консультацій клієнтам з питань оформлення розрахунково ...

Скачать
198170
3
16

... будь-який громадянин в Україні, якщо в нього є стабільний дохід, може отримати “кредитку” без заставного майна та будь-яких гарантій, як це відбувається в розвинутих країнах світу. 3.3 Місце операцій з пластиковим картками в Інтернет-просторі України Лідери провідних держав та широкі кола ділового світу сприймають нову економіку не лише як сучасну модель ведення бізнесу, а й як стратегічну ...

Скачать
895789
0
0

... Дотримання цих умов обов’язкове для покупця жінки. Спробуємо тепер перевірити правильність наших висновків. Звернемося до історії, оскільки вона зберегла до нас дані щодо правового становища заміжньої жінки, заснованого в стародавності на викраденні, давнині, купівлі й інших способах. Найдавніша історія скупа у своїх свідченнях. Дещо зберегла вона для нас із глибокої давнини. Але і це дещо часто ...

0 комментариев


Наверх