Введение
Вокодер (английские voice+coder –буквально кодировщик голоса) это устройство,позволяющее синтезировать речь на основе минимальной информации, некоторого кода. Так же под Вокодером подразумевается устройство,преобразующее живую речь в такой код-сжимающее ее. Вокодер позволяет существенно (примерно в 10 раз) уплотнить линию связи при незначительном ухудшении качества передачи.
Попытки создать “говорящую машину” предпринимались и в прошлом веке и в нынешнем.Основывались они на том обстоятельстве что человеческая речь состоит из незначительного числа частотных составляющих –формант.Тогда эти составляющие получали и суммировали механическим путем (с помощью системы мехов ).При известной сноровке удавалось ”произносить” несложные звуки и даже слова и фразы.
Естественно ни о каком машинном синтезе речевых потоков а тем более о передачи минимальной информации необходимой для синтеза по каналам связи тогда не могло быть и речи.
С появлением аналоговых электронных устройств ( усилителей,фильтров ) реализация вокодера стала возможной.Но такой вокодер был достаточно громоздким (до появления интегральных микросхем) и кроме того ообого выигыша в сокращении избыточности при передачи по каналам связи не получалось,так как передавать номера формант или еще какую нибудь нформацию в аналоговой форме затруднительно.
Аналоговые вокодеры позволяли скремблировать речь (поменять ее форманты местами ) из-за чего ранее их пременяли в системах передачи конфиденциальной информации.
Сейчас аналоговые вокодеры применяют в основном для спец-эффектов в концертной практике:речь обработанная ими приобретает характерное роботизированное звучание.
С появлением цифровых БИС а так же универсальных ЭВМ стало возможным построение ЦИФРОВЫХ аппаратных и программных вокодеров . На входе такого вокодера речь с помощью аналогово-цифрового преобразователя преобразовывается в
цифровую форму.Далее выполняется ее спектральный или иной анализ с помощью определенных алгоритмов обработки.Этот анализ позволяет существенно сжать цифровой поток получаемый с АЦП.Кроме того возможно шифрование данных (имеющий подобный вокодер не сможет услышать исходную речь не зная определенного ключа) что весьма бывает важно.а приемном конце цифровой поток преобразуется обратно в речь с помощью определнных алгоритмов синтеза.
1 Классификация вокодеров по способу анализа и синтеза речи.
По
способу анализа
и синтеза речи
вокодеры
можно
разделить
на
речеэлементные
и параметрические.
В
речеэлементных
вокодерах при
кодировании
распознаются
произносимые
элементы речи
(например, фонема)
и на выход кодера
подаются только
их номера. В
декодере эти
элементы создаются
по правилам
речеобразования
или берутся
из памяти декодера.
Фонемные вокодеры
предназначены
для получения
предельной
компрессии
речевых сигналов.
Область применения
фонемных вокодеров
- линии командной
связи, управление
и говорящие
автоматы
информационно-справочной
службы. В таких
вокодерах
происходит
автоматическое
распознавание
слуховых образов,
а не определение
параметров
речи и, соответственно,
теряются все
индивидуальные
особенности
диктора.
Параметрический вокодер представляет
собой устройство,
которое совершает
так
называемое
параметрическое
компандирование
речевых сигналов.
Компрессия
речевых сигналов
в кодере осуществляется
в анализаторе,
который выделяет
с речевого
сигнала медленно
меняющиеся
параметры. В
декодере при
помощи местных
источников
сигналов, которые
управляются
принятыми
параметрами,
синтезируется
речевой сигнал.
В
параметрических
вокодерах с
речевого сигнала
выделяют два
типа параметров
и по этим параметрам
в декодере
синтезируют
речь:
- Параметры,
которые характеризуют
источник речевых
колебаний
(генераторную
функцию) - частота
основного тона,
ее изменение
во времени,
моменты появления
и исчезновения
основного тона
(огласованные
или гортанные
звуки), шумового
сигнала (шипящие
и свистящие
звуки);
- Параметры,
которые характеризуют
огибающую
спектра речевого
сигнала.
В
декодере,
соответственно,
по заданным
параметрам
генерируются
основной тон,
шум, а затем
пропускаются
через гребенку
полосовых
фильтров для
восстановления
огибающей
спектраречевогосигнала.
По
принципу определения
параметров
фильтровой
функции
различают_вокодеры:
-полосные(канальные);
-формантные;
-ортогональные.
В полосных
вокодерах
спектр речи
делится на 7 -
20 полос (каналов)
аналоговыми
или цифровыми
полосовыми
фильтрами.
Большее число
каналов в вокодере
дает большую
натуральность
и разборчивость.
С каждого полосового
фильтра сигнал
поступает на
детектор для
определения
среднего уровня.
В
формантных
вокодерах
огибающая
спектра речи
описывается
комбинацией
формант (резонансных
частот голосового
тракта). Основные
параметры
формант - центральная
частота, амплитуда
и ширина спектра.
В ортогональных
вокодерах
огибающая
мгновенного
спектра разлагается
на составные
части в ряд по
выбранной
системе ортогональных
базисных функций.
Рассчитанные
коэффициенты
этого разложения
передаются
на приемную
сторону. Распространение
получили
гармонические
вокодеры, которые
используют
разложение
в ряд Фурье.
Рассмотренные
вокодеры обеспечивают
сжатие сигнала
до 1200-4800 Бит/с, позволяя
восстановить
в декодере
частоту основного
тона с дискретностью
в несколько
герц и с невысокой
точностью
огибающую
спектра сигнала
с периодом
изменения 16-40
мс.Из-за сложности
определения
параметров
генераторной
функции появились
полувокодеры
(Voice Excited Vocoder, VEV), в которых
вместо сигналов
основного тона
используется
полоса речевого
сигнала до 800
- 1000 Гц, которая
кодируется,
например, АДИКМ,
и вместо характеристик
основного тона
передается
на выход кодера.
Такой алгоритм
позволяет сжать
речь до 4800-9600 бит/с,
сохраняя генераторную
функцию гортани
(частоту и закон
изменения
основного тона)
диктора.
... – для каждого из четырех подсегментов. В табл. 5.2 приведено содержание выходной информации кодера с указанием числа бит, используемых для кодирования. Таблица 5.2 Кодирование выходной информации кодера речи стандарта D-AMPS Передаваемые параметры Число бит Примечание Параметры кратковременного предсказания (коэффициенты частичной корреляции , ) 38 – 6 бит; – по 5 бит; ...
... и в устройствах запоминания речи, криптографии речевых сигналов, в устройствах автоматического распознавания речи и т. п. Повысить приблизительно в 2 раза эффективность использования каналов связи в многоканальных системах, по которым передаются сигналы речи, возможно и более простыми методами, без применения в каждом канале вокодеров. Этого можно достичь, используя то обстоятельство, что каждый ...
... октав, содержащая схему пpеобpазования воздействий в MIDI-сообщения и адаптеp с выходом MIDI Out. MIDI-клавиатура не способна звучать самостоятельно, она использует в качестве синтезатора звуковую карту компьютера. Иногда на MIDI-клавиатуре размещены некоторые дополнительные переключатели, например, глиссандо или вибрато. Большинство MIDI-клавиатур производится фирмой Fatar (под своей маркой их ...
... основного тона и значении периода, для вынесения окончательного решения можно привлечь дополнительную информацию о виде функции среднего числа переходов через нуль, энергии сигнала. 4. Гомоморфный вокодер Гомоморфная обработка речевого сигнала приводит к весьма удобному описанию, где основные параметры сигнала отделены друг от друга, т. е. информация о сигнале возбуждения расположена в ...
0 комментариев