2.3.3. Оптимизация нульдеревьев по критерию скорость - искажение
В рассмотренных кодерах нульдеревья порождались только на основе анализируемых данных. Однако рассмотрим следующий гипотетический пример. Пусть изображение имеет большую равномерную область. Соответствующие ей вейвлет - будут малы, будет генерироваться нульдерево, и на кодирование тратится малое число бит. Предположим теперь, что среди этой области имеется один резко отличающийся по значению пиксель. Этот пиксель приведет к появлению большого вейвлет и нульдерево порождаться не будет.
Неточное кодирование одного пиксела не приведет к большому искажению изображения. В нашем примере эффективность кодера может быть существенно повышена путем игнорирования соответствующего коэффициента и построения нульдерева. Возникает вопрос: каким образом определять, стоит ли отбрасывать коэффициенты, «мешающие» построению нульдерева.
Введение нульдерева для группы вейвлет является, по сути, разновидностью квантования. Значения коэффициентов, которые мы кодируем посредством нульдерева, не являются в общем случае нулевыми. Значимые коэффициенты также подвергаются квантованию. Если сэкономить часть бит путем порождения больших нульдеревьев, высвободившийся ресурс бит можно направить на более точное квантование значимых коэффициентов. Задачей является оптимальное распределение ограниченного ресурса бит между двумя видами квантователей для достижения меньшего искажения.
Эта задача решена с использованием хорошо известного метода распределения бит. Основным утверждением является то, что для случая оптимального распределения бит наклоны касательных к кривым скорость для всех квантователей равны. Наклон показывает, насколько искажение увеличивается/уменьшается при обнулении/передаче данного узла. Если один из квантователей имеет меньший наклон, это означает, что при его передаче искажение уменьшится меньше, чем при передаче других узлов. Следовательно, можно передать часть бит от этого квантователя другим. Таким образом, при повторении этой процедуры наклоны всех квантователей будут выровнены.
Ясно, что нульдеревья влияют на уровни квантования ненулевых коэффициентов, так как общий ресурс бит ограничен. Верно и обратное. Поэтому возможен итеративный алгоритм для оптимизации этих двух режимов квантования по критерию скорость Вначале фиксируется скалярный квантователь, и ищется оптимальное нульдерево. Затем оно фиксируется, и ищется оптимальный скалярный квантователь. З.Ксионг было доказано, что эта процедура сходится к локальному оптимуму.
Данный алгоритм незначительно превосходит по эффективности SPIHT, но обладает серьезными недостатками. Во-первых он намного более сложен. Во-вторых и, наверное, самое главное, он не порождает иерархический поток бит.
2.4. Современные направления исследований
Исследования в области сжатия изображений ведутся по разным направлениям. Так, появилась новая интерпретация вейвлет – преобразования – лифтинговая схема, не основанная на преобразовании Фурье. С использованием этой схемы появилась возможность конструирования новых неразделимых базисов вейвлетов, которые потенциально могут привести к повышению эффективности кодеров. Интересным направлением исследований является изучение нелинейных аналогов вейвлет – преобразования, которые философия лифтинга делает возможным. Активные исследования проводятся в области кодеров, основанных на классификации и оценивании по прошлому.
Одним из наиболее интересных направлений является разработка кодеров изображения, робастных к ошибкам, возникающим в каналах связи. При этом используется идея совместной оптимизации кодеров источника и канала, а также оптимального сочетания раздельно оптимизированных кодеров.
Особый интерес представляет адаптация вейвлет – кодирования изображения для кодирования видео. Здесь можно сочетать внутрикадровое кодирование с межкадровым предсказанием, как это заложено в стандарте MPEG-4. Можно также рассматривать видеопоследовательность как трехмерный массив и применять трехмерный вейвлет - анализ. Однако этот метод наталкивается на трудности, связанные с фундаментальными особенностями вейвлет – преобразования, как и любого субполосного кодирования. Вейвлет – преобразование не является пространственно – инвариантным в силу присутствия децимации и интерполяции. Эта изменчивость в пространстве мешает компактному представлению видеосигналов.
Видеосигналы состоят из кадров. От кадра к кадру информация меняется незначительно. Поэтому существует возможность достичь хороших результатов сжатия, передав одинаковую информацию лишь однажды. Однако вейвлет - преобразование не является инвариантным к сдвигу, следовательно, подобное кодирование невозможно. Аналогичные доводы против трехмерного вейвлет – преобразования приводят и в частотной области.
Итак, в настоящей главе рассмотрено применение вейвлет – преобразования для сжатия изображений. Во всем мире в данном направлении ведутся интенсивные работы. Разработано большое число алгоритмов и кодеров, некоторые из которых стандартизированы.
Современные вейвлет – кодеры основаны на предположении, что изображение порождается источником с флюктуирующей дисперсией. Каждый кодер реализует определенный механизм для отображения локальной дисперсии вейвлет - и квантует их оптимальным или субоптимальным образом в соответствии с дисперсией. Кодеры отличаются друг от друга стратегиями квантования коэффициентов и тем, каким образом происходит оценка и передача значения дисперсии декодеру.
Кодеры, основанные на алгоритме нульдерева, предполагают у дисперсии наличие двух состояний: нуль или нет. Декодеру передается дополнительная информация о местоположении значимых коэффициентов. Этот процесс приводит к нелинейной аппроксимации изображения. Множества нулевых коэффициентов выражаются в терминах деревьев вейвлетов (Льюис и Ноулес, Шапиро и др.) или комбинаций этих деревьев (Саид и Перельман). Нули передаются декодеру как дополнительная информация, так же как и квантованные данные. Кодеры, основанные на нульдеревьях, учитывают межполосные зависимости вейвлет – коэффициентов.
В частотно-адаптивных кодерах применяются ортогональные адаптивные преобразования – метод вейвлет – пакетов. Локальные флюктуации корреляционных связей используют пространственно кодеры.
Другие вейвлет учитывают внутриполосные зависимости между вейвлет - коэффициентами (иногда одновременно и межполосные). Кодеры, основанные на решетчатом квантовании, делят коэффициенты на группы в соответствии с их энергией. Для каждого коэффициента они оценивают и (или) передают информацию о группе и значение квантованного в соответствие с номинальной дисперсией группы коэффициента. Другой новый класс кодеров передает незначительное количество информации о дисперсии. Это показывает, что, возможно, информация о дисперсии имеет большую избыточность, чем считалось раньше.
ЗАКЛЮЧЕНИЕ
Интенсивность исследований, ведущихся в данной области такова, что для подробного освещения всего обширного круга вопросов, касающихся данной темы, потребовалось бы издание, сопоставимое по масштабам с БСЭ.
Преимущество вейвлетов по сравнению с JPEG?
Во-первых, вейвлет-алгоритмы работают с целым изображением, а не с его частью. Во-вторых, с их помощью легко анализировать прерывистые сигналы и сигналы с острыми всплесками, поскольку вейвлет-алгоритмы используют принципиально иной математический аппарат. В-третьих, даже при 100 кратном вейвлет-сжатии изображения его качество почти не изменяется.
Основная идея вейвлет-преобразования состоит в представлении некоторой случайной функции (в нашем случае - исследуемого сигнала) как суперпозиции определенных базисных негармонических функций - вейвлетов.
вейвлет WAVE | вейвлет MHAT - "мексиканская шляпа" | вейвлет Морле |
Для того чтобы вейвлеты хорошо аппроксимировали исходный сигнал, они подвергаются масштабированию (сжатию или растяжению) и сдвигу (смещению).
Результат вейвлет-преобразования - обычный массив числовых коэффициентов. Такая форма представления информации об изображении очень удобна, поскольку числовые данные легко обрабатывать.
После этого наступает очень важный этап - пороговое преобразование. Нужно отбросить коэффициенты, значение которых близко к нулю. Следует помнить, что при этом происходит необратимая потеря информации, ведь отброшенные коэффициенты участвуют в формировании изображения. Поэтому выбранное пороговое значение коэффициентов сильно влияет на качество изображения - задание слишком высокого порога повлечет за собой падение качества.
Итак, видеокомпрессия происходит в два этапа - на первом осуществляется сжатие с потерей информации (вейвлет-преобразование), на втором - обычная архивация данных.
Для восстановления изображения необходимо повторить все действия в обратном порядке. Сначала восстанавливаются значения коэффициентов, а затем по ним, применяя обратное вейвлет-преобразование, получают изображение (сигнал).
В качестве практического применения вейвлет – приобразования рассмотрены современные подходы к сжатию изображений. Вейвлет – приобразование легло в основу международного стандарта MPEG-4, стандарта на сжатие отпечатков пальцев ФБР, видеокодеков фирмы Analog Devices. В настоящее время ведется разработка стандарта JPEG-2000, где вейвлет – приобразования вероятно, также найдут себе применение.
Вейвлет-анализ нашел широкое применение во множестве приложений - в медицине, в биологии, в нефтегазовой отрасли, в телекоммуникациях. ФБР активно использует вейвлеты для оптимизации алгоритмов хранения дактилоскопических баз данных, а NASA разрабатывает технологию применения вейвлет-анализа к задачам освоения космического пространства.
В странах Западной Европы и США вейвлеты уверенно вытесняют JPEG-технологии. В России же только ISS - одна из немногих компаний, предлагающих программные продукты, использующие вейвлет-идеологию.
Между тем, во многих областях можно ожидать существенно лучших результатов за счет использования вейвлетов. Перечислим некоторые из них. Задачи, связанные с предсказанием. Это - предсказание курса ценных бумаг на рынке, предсказание землетрясений, прогноз погоды.
Вейвлеты успешно применяются в квантовой физике, при изучении строения атома, в лазерной технике.
Очистка от шума зашумленных сигналов. Так, ученые Стэнфорда с успехом применили вейвлеты для улучшения звучания старых грампластинок.
Задачи, связанные с обнаружением сигнала на фоне помехи, его распознаванием, классификации. Сотрудниками Исследовательской лаборатории ВМС США вейвлеты применялись для обнаружения подводных лодок, для оценки разрушений, произведенных бомбардировками, и для многих других важных военно-прикладных задач.
В заключение можно отметить, что вейвлеты и сопутствующие им идеи внесли неоценимый вклад в теорию и практику кодирования изображений и, будут оставаться основным направлением исследований в этой области в ближайшем будущем.
Список литературы
Воробьев В.И., Грибунин В.Г. «Теория и практика вейвлет преобразования» ВУС, 1999. С.1 -204.
Intenet.
... ів у буферний ЗП контролера клавіатури та дисплея. Але під час виконання роботи був знайдений більш ефективний метод для аналізу пульсової хвилі – вейвлет-аналіз, якому і присвячений наступний розділ. 3. СУТНІСТЬ ВЕЙВЛЕТ-АНАЛІЗУ Вейвлет-перетвореня сигналів є узагальненням спектрального аналізу, типовий представник якого - класичне перетворення Фур'є. Застосовувані для цієї мети базиси ...
... для выявления нестационарных составляющих сигнала, что крайне полезно при подборе способов фильтрования сигнала с помощью структурной индексации. В результате построения подсистемы вейвлет-анализа система многомасштабного анализа дискретных сигналов (МАДС) дополнит свои функциональные возможности способностью выделения из исходного сигнала наиболее четких его составляющих, что должно быть учтено ...
... JPEG. Новые технологии, такие как фрактальные должны рассматриваться не только как конкуренты, но и как союзники в установлении новых стандартов. Алгоритм SPIHT (Пространственно Упорядоченные Иерархические Деревья) представляет собой метод сжатия изображений с потерями и обладает высокой чувствительностью. Его легко реализовывать, он работает быстро и дает прекрасные результаты при сжатии любых ...
... або напрямоку камери, то параметр повинен бути GL_PROJECTІON. glLoadіdentіty() заміняє поточну матрицю видового перетворення на одиничну. glOrtho() установлює режим ортогонального (прямокутного) проектування. Це значить, що зображення буде рисуватися як в ізометрії. 6 параметрів типу GLdouble (або просто double): left, rіght, bottom, top, near, far визначають координати відповідно лівої, право ...
0 комментариев