13. Психоакустические компрессоры

Сжимают цифровое представление звуковой фонограммы примерно на порядок посредством так называемого кодирования воспринимаемого, или распознаваемого (perceptual coding). Из психоакустических исследований известно, что отчетливо слухом воспринимаются лишь достаточно яркие и обособленные частотные компоненты, если же из нескольких тонов близкой высоты один имеет значительно большую интенсивность, то он маскирует для слуха менее интенсивные, находящиеся рядом с ним. При удалении маскируемых компонентов подавляющее большинство слушателей, особенно при воспроизведении на аппаратуре среднего класса, не замечает различий с исходным сигналом. Объем маскируемых компонентов весьма значителен, вдобавок при сжатии применяется адаптивное экономичное кодирование. Благодаря всему этому современные компрессоры уменьшают объем звуковых данных примерно на порядок без явно ощутимой потери качества звучания.

В отношении сжатых этими методами фонограмм применяется понятие скорости битового потока (bitrate), достаточной для воспроизведения сжатой фонограммы. Скорость потока является относительным показателем степени сохранения качества звучания при сжатии - на высоких скоростях оно обычно выше, чем на низких, однако во многом это зависит от глубины и точности анализа исходной фонограммы.

Наибольшее распространение получил метод Audio MPEG-1 Layer 3, именуемый чаще всего MPEG-3 или MP3. Менее популярны форматы MPEG-2 AAC (Advanced Audio Coding), VQF (Vector Quantization Format) и MPEG-4.

Надо заметить, что при оценке качества сжатых фонограмм допустимо исключительно тестовое прослушивание. Поскольку эти методы сжатия ориентированы только на человеческое восприятие, никакие объективные показатели - полоса частот, амплитудные, частотные, фазовые и иные характеристики не могут служить критериями качества преобразования.

Подробнее с работой псиакустических компрессоров ознакомимся на примере следующих прграмм:

1. BladeEnc

(Разработчик - Tord Jansson Последняя выпущенная версия - 0.82).

Небольшой и достаточно качественный компрессор с запуском из командной строки, один из самых скоростных. Существует под множество платформ и ОС: x86, Alpha, M68k, Windows 95/98/NT, Linux, Solaris, SCO и др.

Поддерживает скорости от 32 до 320 Кбит/с и частоты дискретизации 32, 44,1 и 48 кГц. Входной и выходной файлы могут быть стандартными потоками StdIn и StdOut.

Для удобства использования BladeEnc создано несколько оконных графических интерфейсов под Windows 95/NT - AutoBlade, BEShell, BFree, BladeBatch и т.п. Процессор BladeEnc выпускается также в виде независимого DLL-модуля (plugin), который может подключаться к другим программам обработки звука.

Автор рекомендует применять BladeEnc при скоростях потока 160 Кбит/с и выше, признавая, что при низких скоростях более высокое качество обеспечивают продукты Fraunhofer IIS.

2. SoundVQ Encoder

(Разработчик - Yamaha . Последняя выпущенная версия - 2.54 b4).

Компрессор в формат VQF. При скорости потока 96 Кбит/с обеспечивает качество звучания, примерно равное хорошему компрессору MP3 при скорости потока 128 Кбит/с (степень сжатия около 1:14). При меньших скоростях обеспечивается сжатие до 20 раз.

Поддерживаются входные форматы от 8 кГц/8 разрядов/моно до 44,1 кГц/16 разрядов/стерео.

В состав входит пакетный процессор SoundVQ Batch Encoder для групповой обработки файлов.

14. Проигрыватели

Задачей проигрывателя является простое воспроизведение звукового или музыкального потока. Можно выделить четыре основных класса проигрывателей:

* Auduo - для воспроизведения аудиофайлов. Сюда относятся простые проигрыватели форматов WAV, VOC, AU, а также сжатых потоковых форматов - MP3/VQF/AAC, ADPCM, GSM и т.п.

* MIDI - для воспроизведения MIDI-файлов. В функцию проигрывателя входит только объединение виртуальных "дорожек" файла и отправка MIDI-событий на заданный MIDI-порт. Собственно интерпретацией данных занимается MIDI-устройство - аппаратный или программный синтезатор.

* Трекерные - для воспроизведения трекерных модулей. Такой проигрыватель фактически содержит в себе всю звуковую систему трекера для интерпретации нот и команд модуля.

* Сетевые - для воспроизведения широковещательных сетевых потоков в реальном времени. При помощи специальных протоколов (RealAudio, AudioActive, StreamWorks, NetShow) организуются вещательные серверы, которые в реальном времени передают звуковую и видеоинформацию всем подключившимся к серверу клиентам. В задачу сетевого проигрывателя входит расшифровка сжатого формата звука и его воспроизведение через аудиопорт.

Существуют универсальные проигрыватели, сочетающие в себе свойства нескольких классов.

Расшифровка и интерпретация проигрываемого файла может выполняться как самим проигрывателем, так и системными службами или подключаемыми модулями (plugins). Если результирующий звук создается и выводится самим проигрывателем, возможна его обработка (акцентировка басов, расширение стереоэффекта, эквалайзер) и индикация (осциллограмма, спектрограмма).

Многие проигрыватели поддерживают список проигрываемых файлов (playlist).

Полезной функцией ряда MIDI-проигрывателей является посылка команды инициализации синтезатора в режимах GM, GS или XG перед проигрыванием файла, так как многие MIDI-файлы не содержат таких команд ни в начале, ни в конце, из-за чего состояние синтезатора может стать неопределенным.

Подробнее с работой проигрывателей ознакомимся на примере следующих прграмм:


Информация о работе «Управление звуковой картой компьютера»
Раздел: Информатика, программирование
Количество знаков с пробелами: 212314
Количество таблиц: 0
Количество изображений: 3

Похожие работы

Скачать
180330
0
3

... работающих с мультимедиа и сопроцессором, эффективность процессора Pentium MMX меньше, чем у процессора Pentium с той же тактовой частотой [10]. Выпуск процессоров Pentium MMX возвестил о победе мультимедиа на персональных компьютерах. Кстати, MMX является сокращением от MultiMedia eXtensions (расширения для мультимедиа). В мае 1997 г. фирма Intel объявила о начале выпуска процессоров Pentium II. ...

Скачать
19789
0
0

... 'ами - так же, как и обычные звуковые - Sound Blaster'ами. Установка дочерней платы позволяет получить на простой карте таблично-волновой синтез, а при его наличии - расширить возможности и палитру базового синтезатора. Система Dolby Digital Dolby Digital (AC-3, ATSC A/52) - система пространственного звуковоспроизведения, разработанная фирмой "Dolby Laboratories, Inc." ("Dolby Labs"), ...

Скачать
326231
12
0

... рисунков в формате А0-А1 со скоростью 10-30 мм/с. Фотонаборный аппарат Фотонаборный аппарат можно увидеть только в солидной полиграфической фирме. Он отличается своим высоким разрешением. Для обработки информации фотонаборный аппарат оборудуется процессором растрового изображения RIP, который функционирует как интерпретатор PostScript в растровое изображение. В отличие от лазерного принтера в ...

Скачать
509004
6
0

... ? 8. Какими программами можно воспользоваться для устранения проблем и ошибок, обнаруженных программой Sandra? Раздел 3. Автономная и комплексная проверка функционирования и диагностика СВТ, АПС и АПК Некоторые из достаточно интеллектуальных средств вычислительной техники, такие как принтеры, плоттеры, могут иметь режимы автономного тестировании. Так, автономный тест принтера запускается без ...

0 комментариев


Наверх