2. Комплексный кепстр речи
Модели сигналов, с одной стороны, и методы анализа во временной области – с другой, можно объединить и эффективно использовать в теории гомоморфной фильтрации речи. Вспомним, что модель речеобразования обязательно состоит из линейной системы с медленно изменяющимися во времени параметрами и сигнала возбуждения в виде последовательности импульсов или белого шума. Поэтому короткий сегмент вокализованного речевого сигнала целесообразно рассматривать как результат воздействия сигнала возбуждения в виде последовательности импульсов на линейную систему с постоянными параметрами. Аналогично короткий сегмент невокализованного сигнала можно представить как результат возбуждения линейной системы с постоянными параметрами случайным шумом.
Короткий сегмент вокализованной речи можно представить в виде
(13)
где – периодическая импульсная последовательность с периодом Np отсчетов; – импульсная характеристика линейной системы, отражающая эффект формы источника возбуждения g(n), импульсную характеристику речевого тракта и импульсную характеристику
Короткий сегмент невокализованной речи можно представить в виде
(14)
где – сигнал возбуждения в виде случайного шума; – импульсная реакция системы, объединяющая воздействие речевого тракта и излучения.
Для случая вокализованной речи передаточная функция линейной системы имеет вид
(15)
Для невокализованной речи получаем
(16)
Комплексный кепстр быстро затухает с ростом п. Кроме того, отметим, что вклад в комплексный кепстр от периодического возбуждения проявится в наличии импульсов в точках, кратных периоду возбуждения. Пример анализа (рис.6) иллюстрирует основные особенности вокализованного речевого сигнала.
а) б)
в) г)
д) е)
Рис. 6. Гоморфный анализ вокализованный речи: а) взвешенный речевой сигнал; б) логарифм модуля кратковременного Фурье; в) значение фазы; г) «развернутая» фаза; д) комплексный кепстр; е) кепстр
На рис. 6,а показан сегмент вокализованного сигнала, взвешенный с окном Хемминга. На рис.6,б представлен логарифм модуля дискретного преобразования Фурье. В этой функции имеется периодическая компонента, обусловленная периодическим характером входного сигнала. На рис.6,в представлен разрывной характер главного значения фазы, а на рис. 6,г – фазовая кривая, лишенная разрывов. Результат преобразования Фурье в комплексный кепстр кривых на рис.6,б и 6,г представлен на рис.6,д.
Отметим наличие пиков в положительном и отрицательном времени и быстрое затухание компонент в области малых времен, что обусловлено совместным воздействием речевого тракта, источника возбуждения и излучением. Кепстр, являющийся обратным преобразованием Фурье логарифма амплитуды модуля спектра, показан на рис.6,е. В данном случае сохранены все основные особенности комплексного кепстра, поскольку он является четной частью комплексного кепстра.
Последовательность графиков на рис.6 показывает, как можно использовать гомоморфную фильтрацию для анализа речевого сигнала. Прежде всего отметим, что импульс в кепстре, обусловленный квазипериодическим возбуждением, оказывается отделенным от остальных компонент. Это приводит к соответствующей системе гомоморфной фильтрации речевого сигнала, представленной на рис. 7.
Рис. 7. Реализация системы гомоморфной фильтрации речи
Сегмент речевого сигнала взвешивается с некоторым окном и требуемые компоненты кепстра выделяются с использованием «окна по кепстру» . Если выбрать в соответствии ссотношением
(17)
где выбрано меньшим, чем период основного тона , то выходной сигнал аппроксимирует импульсную реакцию, определяемую (13). Этот вид фильтрации иногда называют «частотно-инвариантной линейной фильтрацией».
Если выбрать 1{п) таким образом, чтобы восстановить компоненты возбуждения, т. е.
(18).
то выходной сигнал аппроксимирует импульсную последовательность возбуждения, амплитуды которой затухают в соответствии с весами окна Хемминга, примененного при взвешивании входного сигнала.
В результате взвешенный комплексный кепстр подвергается обратному преобразованию для получения требуемых компонент.
Таким образом, с помощью гомоморфной фильтрации можно выделить ряд важных компонент речевого сигнала. Чаще сталкиваются с необходимостью оценки таких параметров, как период основного тона и частоты формант. Для этих целей кепстральный анализ весьма эффективен. Для вокализованного сегмента речи пик в кепстре возникает при задержке, соответствующей периоду основного тона. Для невокализованного сегмента такие пики в кепстре не возникают. Это свойство кепстра может быть использовано для классификации вокализованный/невокализованный и для периода основного тона на вокализованной речи.
Частоты формант также можно определить с использованием логарифма модуля передаточной функции речевого тракта, которая вычисляется по кепстру с помощью кепстрального окна (17).
... на другом или утверждения о реализации идеи человеко-машинного общения. Поэтому исследования в этой области являются весьма актуальными. 3. Разработка программного обеспечения для распознавания команд управления промышленным роботом 3.1 Реализация интерфейса записи и воспроизведения звукового сигнала в операционной системе Microsoft Windows 3.1.1 Основные сведения Звуковые данные хранятся ...
... – для каждого из четырех подсегментов. В табл. 5.2 приведено содержание выходной информации кодера с указанием числа бит, используемых для кодирования. Таблица 5.2 Кодирование выходной информации кодера речи стандарта D-AMPS Передаваемые параметры Число бит Примечание Параметры кратковременного предсказания (коэффициенты частичной корреляции , ) 38 – 6 бит; – по 5 бит; ...
... Интересным примером применения спецпроцессора СПФ СМ явилась обработка радиолокационных сигналов зондирования поверхности планеты Венера, которое проводилось со спутника. Глава 3. Применение цифровой обработки сигналов. 3.1 Шумоподавление для звука Звуковой сигнал, записываемый в реальных акустических условиях, часто содержит нежелательные шумы, которые могут порождаться окружающей средой ...
... учесть введением в блок-схему дополнительного .источника шума [11]. Расстояние между отсчетами должно удовлетворять теореме Найквиста для двумерных колебаний [1]. Устройства для дискретизации и квантования изображений основаны на технике микроденситометрии. В подобных системах на пленку проектируется луч света с интенсивностью I1. Интенсивность I2 света, прошедшего сквозь пленку (или отраженного ...
0 комментариев