Введение


Вокодер (английские voice+coder –буквально кодировщик голоса) это устройство,позволяющее синтезировать речь на основе минимальной информации, некоторого кода. Так же под Вокодером подразумевается устройство,преобразующее живую речь в такой код-сжимающее ее. Вокодер позволяет существенно (примерно в 10 раз) уплотнить линию связи при незначительном ухудшении качества передачи.

Попытки создать “говорящую машину” предпринимались и в прошлом веке и в нынешнем.Основывались они на том обстоятельстве что человеческая речь состоит из незначительного числа частотных составляющих –формант.Тогда эти составляющие получали и суммировали механическим путем (с помощью системы мехов ).При известной сноровке удавалось ”произносить” несложные звуки и даже слова и фразы.

Естественно ни о каком машинном синтезе речевых потоков а тем более о передачи минимальной информации необходимой для синтеза по каналам связи тогда не могло быть и речи.

С появлением аналоговых электронных устройств ( усилителей,фильтров ) реализация вокодера стала возможной.Но такой вокодер был достаточно громоздким (до появления интегральных микросхем) и кроме того ообого выигыша в сокращении избыточности при передачи по каналам связи не получалось,так как передавать номера формант или еще какую нибудь нформацию в аналоговой форме затруднительно.

Аналоговые вокодеры позволяли скремблировать речь (поменять ее форманты местами ) из-за чего ранее их пременяли в системах передачи конфиденциальной информации.

Сейчас аналоговые вокодеры применяют в основном для спец-эффектов в концертной практике:речь обработанная ими приобретает характерное роботизированное звучание.

С появлением цифровых БИС а так же универсальных ЭВМ стало возможным построение ЦИФРОВЫХ аппаратных и программных вокодеров . На входе такого вокодера речь с помощью аналогово-цифрового преобразователя преобразовывается в

цифровую форму.Далее выполняется ее спектральный или иной анализ с помощью определенных алгоритмов обработки.Этот анализ позволяет существенно сжать цифровой поток получаемый с АЦП.Кроме того возможно шифрование данных (имеющий подобный вокодер не сможет услышать исходную речь не зная определенного ключа) что весьма бывает важно.а приемном конце цифровой поток преобразуется обратно в речь с помощью определнных алгоритмов синтеза.


1 Классификация вокодеров по способу анализа и синтеза речи.


По способу анализа и синтеза речи вокодеры можно разделить на речеэлементные и параметрические.
В речеэлементных вокодерах при кодировании распознаются произносимые элементы речи (например, фонема) и на выход кодера подаются только их номера. В декодере эти элементы создаются по правилам речеобразования или берутся из памяти декодера. Фонемные вокодеры предназначены для получения предельной компрессии речевых сигналов. Область применения фонемных вокодеров - линии командной связи, управление и говорящие автоматы информационно-справочной службы. В таких вокодерах происходит автоматическое распознавание слуховых образов, а не определение параметров речи и, соответственно, теряются все индивидуальные особенности диктора.
Параметрический вокодер представляет собой устройство, которое совершает так называемое параметрическое компандирование речевых сигналов. Компрессия речевых сигналов в кодере осуществляется в анализаторе, который выделяет с речевого сигнала медленно меняющиеся параметры. В декодере при помощи местных источников сигналов, которые управляются принятыми параметрами, синтезируется речевой сигнал.
В параметрических вокодерах с речевого сигнала выделяют два типа параметров и по этим параметрам в декодере синтезируют речь:
- Параметры, которые характеризуют источник речевых колебаний (генераторную функцию) - частота основного тона, ее изменение во времени, моменты появления и исчезновения основного тона (огласованные или гортанные звуки), шумового сигнала (шипящие и свистящие звуки);
- Параметры, которые характеризуют огибающую спектра речевого сигнала.
В декодере, соответственно, по заданным параметрам генерируются основной тон, шум, а затем пропускаются через гребенку полосовых фильтров для восстановления огибающей спектраречевогосигнала.

По принципу определения параметров фильтровой функции различают_вокодеры:
-полосные(канальные);
-формантные;
-ортогональные.
В полосных вокодерах спектр речи делится на 7 - 20 полос (каналов) аналоговыми или цифровыми полосовыми фильтрами. Большее число каналов в вокодере дает большую натуральность и разборчивость. С каждого полосового фильтра сигнал поступает на детектор для определения среднего уровня.
В формантных вокодерах огибающая спектра речи описывается комбинацией формант (резонансных частот голосового тракта). Основные параметры формант - центральная частота, амплитуда и ширина спектра. В ортогональных вокодерах огибающая мгновенного спектра разлагается на составные части в ряд по выбранной системе ортогональных базисных функций. Рассчитанные коэффициенты этого разложения передаются на приемную сторону. Распространение получили гармонические вокодеры, которые используют разложение в ряд Фурье.
Рассмотренные вокодеры обеспечивают сжатие сигнала до 1200-4800 Бит/с, позволяя восстановить в декодере частоту основного тона с дискретностью в несколько герц и с невысокой точностью огибающую спектра сигнала с периодом изменения 16-40 мс.Из-за сложности определения параметров генераторной функции появились полувокодеры (Voice Excited Vocoder, VEV), в которых вместо сигналов основного тона используется полоса речевого сигнала до 800 - 1000 Гц, которая кодируется, например, АДИКМ, и вместо характеристик основного тона передается на выход кодера. Такой алгоритм позволяет сжать речь до 4800-9600 бит/с, сохраняя генераторную функцию гортани (частоту и закон изменения основного тона) диктора.



Информация о работе «Вокодеры и их применение»
Раздел: Информатика, программирование
Количество знаков с пробелами: 10948
Количество таблиц: 0
Количество изображений: 2

Похожие работы

Скачать
126444
13
5

...  – для каждого из четырех подсегментов. В табл. 5.2 приведено содержание выходной информации кодера с указа­нием числа бит, используемых для ко­дирования. Таблица 5.2 Кодирование выходной информации кодера речи стандарта D-AMPS Передаваемые параметры Число бит Примечание Параметры кратковременного предсказания (коэффициенты частичной корреляции , ) 38  – 6 бит;  – по 5 бит; ...

Скачать
18925
3
0

... и в устройствах запоминания речи, криптографии речевых сигналов, в устройствах автоматического распознавания речи и т. п. Повысить приблизительно в 2 раза эффективность использования каналов связи в многоканальных системах, по которым передаются сигналы речи, возможно и более простыми методами, без применения в каждом канале вокодеров. Этого можно достичь, используя то обстоятельство, что каждый ...

Скачать
212314
0
3

... октав, содержащая схему пpеобpазования воздействий в MIDI-сообщения и адаптеp с выходом MIDI Out. MIDI-клавиатура не способна звучать самостоятельно, она использует в качестве синтезатора звуковую карту компьютера. Иногда на MIDI-клавиатуре размещены некоторые дополнительные переключатели, например, глиссандо или вибрато. Большинство MIDI-клавиатур производится фирмой Fatar (под своей маркой их ...

Скачать
21288
0
9

... основного тона и значении периода, для вынесения окончательного решения можно привлечь дополнительную информацию о виде функции среднего числа переходов через нуль, энергии сигнала. 4. Гомоморфный вокодер Гомоморфная обработка речевого сигнала приводит к весьма удобному описанию, где основные параметры сигнала отделены друг от друга, т. е. информация о сигнале возбуждения расположена в ...

0 комментариев


Наверх