2. Компрессия изображений в MPEG-2.
2.1 Процесс сокращения избыточности
С информационной точки зрения, каждое изображение представляет собой три прямоугольных матрицы отсчетов изображений: яркостную Y и две цветности Св и Сr. Стандарт MPEG-2 допускает различные структуры матриц (4:2:0; 4:2:2; 4:4:4).
Каждое изображение делится на срезы, которые состоят из макроблоков. Макроблок содержит блоки размером 8х8 элементов изображения (реже 16х16 элементов); группу из четырех блоков с отсчетами яркости и группы блоков с отсчетами цветности, число которых зависит от формата (по 1, по 2, по 4). Группа следующих друг за другом макроблоков называется слайсом .Число макроблоков в слайсе может быть произвольным, главное, чтобы слайсы в изображении не перекрывались. Все структурные элементы потока видеоданных, полученных в результате внутрикадрового и межкадрового кодирования (кроме блока и макроблока), дополняются специальными и уникальными стартовыми кодами («Заголовок – элементы»). В заголовке приводится разнообразная дополнительная информация, например, размеры и соотношение сторон изображения, частота, кодирование, скорости потока, матрица квантования, формат дискретизации цветного изображения, координаты основных цветов и белого цвета, параметры матрицы для формирования яркости и цветоразностных сигналов и др.
Сокращение пространственной избыточности выполняется в изображении типа I и достигается на уровне блока. Набор операций такого кодирования – дискретное косинусное преобразование; взвешенное квантование; энтропийное квантование (кодирование серии коэффициентов косинусного преобразования, полученного в результате диагонального сканирования матрицы). Для повышения точности предсказания используется компенсация движения: оценивается скорость перемещения движения объектов от кадров и при определенных предсказаниях производится коррекция в положении опорного изображения, по отношению к которому находится ошибка предсказания. Определение величины и направления смещения (вектор движения) производится на уровне макроблоков. Оценка вектора – сложная процедура, именно она определяет асимметрию кодека MPEG-2, однако в этом направлении ведутся работы, т.к. эта процедура не определена жестко. Стандарт предполагает сокращение не только пространственной, но и временной избыточности. После компрессии объем изображения Р типичных телевизионных сюжетов составляет 35% от I, В – 25% от I. Т.о., в три раза уменьшается скорость потока данных при приблизительно тех же искажениях. Артефакты же связанные с движением (в отличие от JPEG и DV) замечаемы тем меньше, чем быстрее движутся изображения.
В случае чересстрочной развертки каждый кадр состоит из двух полей. Первое поле содержит нечетные строки кадра, а второе поле – четные строки. При этом возможно два варианта кодирования всего кадра, выбор одного из которых осуществляется на основе оценки движения в нем.
В случае кадрового кодирования кодируемым изображением является полный кадр, который целиком хранится в запоминающем устройстве кодера. Кадровое кодирование выбирается в случаях, когда изменения во втором поле кадра относительно первого поля того же кадра незначительны.
В случае полевого кодирования кодируемым изображением является каждое поле по отдельности. Первое поле кадра может использоваться для предсказания макроблоков второго поля и наоборот.
2.2 Процесс кодирования
Возможно два основных режима работы кодера компрессии – с постоянной скоростью потока и с постоянным уровнем качества декодируемого изображения.
Управление степенью компрессии возможно изменением параметров матрицы квантования (более грубое квантования). Однако растут и необратимые искажения изображения из-за шумов квантования. Осуществляется непрерывное изменение коэффициентов матрицы квантования. Чем мельче детали и чем более активно изображение, тем более грубое квантование. Поэтому будет больше искажений и артефактов. Такой режим используется при передачи по каналам связи с фиксированной пропускной способностью (цифровые спутниковые, кабельные, наземное телевизионное вещание).
В режиме с постоянным качеством используется фиксированная матрица квантования, но при этом скорость потока компрессированных данных является переменной. Соответственно, чем больше деталей, выше активность изображения, тем больше скорость потока. Такой режим можно использовать при записи на дисковые носители в условиях отсутствия ограничении на объем, однако возможны ограничения на скорость воспроизведения – она не может быть произвольно большой.
Если запись компрессионного потока производится не в условиях реального времени, то можно использовать и другие способы управления скоростью. Например, выполнять компрессию в два прохода. На первом подбираются параметры, обеспечивающие максимальное качество; на втором – производится компрессия с найденными параметрами. Есть и другие способы: возможно выделение заранее кадров с большим количеством детальных быстродвижущихся объектов и поместить их для принудительного кодирования типа I – используется в DVD.
Т.к. стандарт MPEG не регламентирует сам процесс кодирования, а изображения (блоки представления) рассматриваются как результат декодирования блоков доступа, то декодер может приступить к декодированию изображения типа В только после того, как получены предыдущие и последующие блоки. Во избежание установки буферов, кодирование изображений выстраивается в порядке декодирования, т.е. вместо I-B-B-P формируют I-Р-В-В, что и было продемонстрировано на Рис 1.1.
... Передатчики и приемники сигнала по оптоволокну. Отсутствие токовых петель. Максимальная защищенность от наводок Из всех перечисленных типов кабелей оптоволокно наилучшим образом подходит для использования в системах цифрового видеонаблюдения как при передаче сигнала от камер к концентратору, так и при объединении видеосерверов, рабочих мест операторов видеонаблюдения и серверов резервного ...
... отправке пакетов и повторной отправки пакета в случае ошибки. UDP (user datagram protocol) такими средствами контроля над ошибками и повторной отправки пакета не обладает. Настольные системы видеоконференций, работающие по сетям Internet, используют протокол UDP для передачи аудио- и видеосигнала. Протокол TCP используется для передачи данных, таких, например, как данные с "настенной доски" или ...
... необходимо загрузить весь файл целиком. Другим, не принципиальным, но существенным ограничением формата является большой объем полученных файлов. Таким образом, на телефонах появился формат видео, способный обеспечить высокое качество изображения при практически кинематографической частоте кадров. Качество воспроизведения зависит лишь от объема доступной памяти. Видеоролик проигрывается на полный ...
... и в устройствах запоминания речи, криптографии речевых сигналов, в устройствах автоматического распознавания речи и т. п. Повысить приблизительно в 2 раза эффективность использования каналов связи в многоканальных системах, по которым передаются сигналы речи, возможно и более простыми методами, без применения в каждом канале вокодеров. Этого можно достичь, используя то обстоятельство, что каждый ...
0 комментариев