3.2.14. S(X)VCD
Формат SVCD расшифровывается как Super Video CD. На таком компакт-диске можно разместить вдвое больше информации чем на обычном Video CD. До сих пор эти диски наиболее широко распространены в Китае.
Стандарт SVCD был разработан в Китае в конце 1998 года и в настоящее время проходит процедуру регистрации как международный. Проигрыватели и диски SVCD сейчас довольно активно продаются в Китае, Гонк-Конге, Тайване, Малайзии, Сингапуре и Индии. Для воспроизведения таких дисков используются специальные SVCD проигрыватели, поддерживающие также VCD 3.0, VCD 2.0, CD-DA и иногда MP3 форматы. Некоторые проигрыватели DVD также могут воспроизводить SuperVCD, даже если об этом не сказано в инструкции, другие требуют лишь модификации внутренней программы (замены или пере-программирования одной микросхемы - некоторые модели JVC, Philips, Pioneer, Samsung). И конечно такие диски могут воспроизводиться на компьютере с 2х скоростным или более быстрым дисководом CD-ROM и аппаратным или программным (Pentium-II 350 МГц или лучше) декодером MPEG2.
Формат XVCD уступает SVCD по таким показателям, как поток данных и разрешение.
3.3. Сравнение форматов записи Глава 4. Методы сжатияЦифровые технологии обеспечивают неоспоримые преимущества по сравнению с аналоговыми. Преобразованный в цифровую форму сигнал может сохранять всю информацию, заложенную в аналоговой форме. Современные технологии передачи, записи и хранения цифровых данных практически не подвергают сигнал искажениям.
Одно из неоспоримых преимуществ цифровых технологий - возможность применения к оцифрованному сигналу мощного математического аппарата сжатия видео и аудио информации. В отличие от "аналога", "цифра" в любой момент может быть воспроизведена со 100%-ной повторяемостью. Соответственно, для оцифрованного сигнала открываются удобные возможности последующей обработки, анализа и моделирования.
Основные методы сжатия видео сводятся к компрессии данных внутри отдельного кадра и оптимизации в передаче изменений между кадрами. Даже при рассмотрении статичного изображения видно, что в нем много однотипной и дублирующейся информации. Например, интенсивность фона чаще всего имеет постоянное значение; многие отдельные участки изображения, занимающие значительные размеры кадра, тоже имеют одинаковый уровень цифрового сигнала. Естественно, передавать всю эту информацию без компрессии не имеет смысла. С применением специализированных методов сжатия видео, плавно меняющегося по кадрам, возможно еще больше снизить результирующую плотность передачи информации по сети.
В отличие от универсальных архиваторов (вроде WinRar или WinZip), сжатие видео может происходить с некоторыми потерями, величина которых зависит от выбранного кодека. Современные алгоритмы сжатия прибегают к всестороннему логическому анализу видеоролика с целью извлечь повторяющиеся куски между кадрами и уменьшить размер конечного файла. При воспроизведении сжатая информация «раскрывается», и уже после этого демонстрируется пользователю. Раскрытие изображений, сжатых некоторыми кодеками, может потребовать большого времени от маломощного компьютера.
4.1. Технологии сжатия цифрового видеоСуществует множество технологий сжатия цифрового видео. Некоторые из рассматриваемых компрессоров используют не одну технологию сжатия, а некоторую их совокупность. Например, и Indeo 3.2, и Cinepak используют векторную квантизацию. Международные стандарты MPEG-1, MPEG-2, MPEG-4, H.261 и H.263 используют комбинированную технологию БДКП и компенсацию движения. Некоторые современные алгоритмы используют технологию ДВП (Discrete Wavelet Transform, или DWT). Другие технологии включают Фрактальное сжатие изображений (Fractal Image Compression).
Сжатие без потерь качества
Сжатие изображений может осуществляться без потерь качества лишь в том случае, если в процессе сжатия не было потерь данных. В результате полученное после декомпрессии изображение будет в точности (побитно) совпадать с оригиналом. Примером такого сжатия может служить формат GIF для статической графики и GIF89a для видео.
Сжатие с потерями качества
Сжатие может происходить с потерями качества, если в процессе сжатия информация была потеряна. Однако с точки зрения человеческого восприятия сжатием с потерями следует считать лишь такое сжатие, при котором возможно на глаз отличить результат сжатия от оригинала. Таким образом, несмотря на то что два изображения - оригинал и результат сжатия с использованием того или иного компрессора - побитно могут не совпадать, тем не менее разница между ними может быть совсем незаметной. Примером может служить алгоритм JPEG для сжатия статической графики и алгоритм M-JPEG для сжатия видео.
Сжатие без потерь с точки зрения восприятия
Формально являясь сжатием с потерями качества, схема сжатия может в то же время казаться сжатием без потерь с точки зрения восприятия ее человеком. Большинство технологий сжатия с формальной потерей качества имеют так называемый Фактор Качества Сжатия (ФКС), характеризующий именно воспринимаемую сторону качества и варьирующийся в пределах от 0 до 100. При факторе качества сжатия равном 100 воспринимаемые характеристики качества сжатого видео неотличимы от оригинала.
Сжатие с естественной потерей качества
JPEG и MPEG и другие технологии сжатия с потерей качества иногда сжимают, без потерь переступая за грань сжатия с точки зрения восприятия видеоинформации. Тем не менее сжатые видео и статические изображения вполне приемлемы для адекватного восприятия их человеком. Иными словами, в данном случае наблюдается так называемая естественная деградация изображения, при которой теряются некоторые мелкие детали сцены. Похожее может происходить и в естественных условиях, например при дожде или тумане. Изображение в таких условиях, как правило, различимо, однако детализация его уменьшается.
Сжатие с неестественными потерями качества
Низкое качество сжатия, в значительной степени искажающее изображение и вносящее в него искусственные (не существующие в оригинале) детали сцены, называется неестественным сжатием с потерей качества. Примером тому может служить некоторая «блочность» в сильно сжатом MPEG-е и в других компрессорах, использующих технологию БДКП. Неестественность заключается в первую очередь в нарушении самых важных с точки зрения восприятия человеком характеристик изображения - контуров. Опыт показывает, что именно контуры позволяют воспринимающему аппарату человека правильно идентифицировать тот или иной визуальный объект.
Все широко используемые видеокомпрессоры используют технологии сжатия с потерями качества. При достаточно высоких коэффициентах сжатия все они будут сжимать с неестественной потерей качества.
Таким образом, выбирая тот или иной компрессор для сжатия цифрового видео, необходимо достичь сжатия, по крайней мере с естественными потерями качества.
Для сжатия видео используют различные кодеки
4.2. Технологии и алгоритмы сжатия видеоRun Length Encoding
Компрессорами, использующими технологию RLE, являются:
Microsoft RLE (MRLE) RLE используется также для кодирования коэффициентов в БДКП, применяющемся в MPEG-1234, H.261, H.263 и JPEG.
Достоинства и недостатки
1. Работает исключительно с 8-битовыми изображениями.
2. Не подходит для сжатия полноцветного видео.
Обзор
RLE кодирует последовательность повторяющихся элементов изображения или одноцветных элементов одним кодовым словом. Например, последовательность элементов изображения 77 77 77 77 77 77 77 может быть закодирована как 7 77 (для семи 77-рок). RLE хорошо сжимает изображения, в которых наблюдается повторение контуров или цветов отдельных элементов. В полноцветных изображениях повторений цвета значительно меньше, поэтому сжатие полноцветного видео с использованием технологии RLE лишено всякого смысла.
Векторная квантизация (Vector Quantization,VQ)
Компрессорами, использующими технологию VQ, являются Indeo 3.2 и Cinepak. Оба они применяют цветовую схему YUV (а не RGB).
Достоинства и недостатки
1. Процесс кодирования очень трудоемок и практически неосуществим без специального дополнительного оборудования.
2. Процесс декодирования очень быстр.
3. Блоковые искажения при высоких коэффициентах сжатия.
4. Технологии, использующие алгоритмы БДКП, ДВП могут достигать более высоких уровней сжатия.
Обзор
Основная идея векторной квантизации заключается в разбиении изображения на блоки (размером 4x4 пиксела в цветовой схеме YUV для компрессоров Indeo и Cinepak). Как правило, некоторые блоки оказываются похожими друг на друга. В этом случае компрессор идентифицирует класс похожих блоков и заменяет их одним общим блоком. Кроме того, генерируется двоичная таблица (карта) таких общих блоков из самых коротких кодовых слов. VQ-декодер затем, используя таблицу, собирает изображение поблочно из общих блоков. Ясно, что данный способ кодирования с потерями качества, так как, строго говоря, схожесть блоков весьма относительна. Здесь допускается аппроксимация реальных блоков изображения к общему, их объединяющему. Процесс кодирования длителен и трудоемок, так как кодеру необходимо выявлять принадлежность каждого блока изображения к какому-нибудь общему блоку. Однако задача декодирования в этом случае сводится к задаче построения изображения по заданной карте из общих блоков и не занимает много аппаратных и временных ресурсов. Таблицу или карту также называют еще и кодовой книгой, а двоичные коды, входящие в нее, - кодовыми словами, соответственно. Наибольшее сжатие с использованием алгоритма VQ достигается путем уменьшения числа классов общих блоков, то есть предположением о схожести относительно большего числа блоков изображения, и, как следствие, уменьшением кодовой книги. По мере уменьшения размеров кодовой книги качество воспроизводимого видео ухудшается. В результате на изображении появляется искусственная «блочность».
Простой пример: сравним три следующих блока 4 x 4.
(Блок 1) 128 128 128 128 128 128 128 128 128 128 128 128 128 128 128 128 | (Блок 2) 128 127 128 128 128 128 128 128 128 128 127 128 128 128 128 128 | (Блок 3) 128 127 126 128 128 128 128 128 127 128 128 128 128 128 128 128 |
Эти три блока для человеческого глаза неотличимы. Таким образом, 2-ой и 3-ий блоки можно спокойно заменить первым. Тогда кодовая книга будет иметь следующий вид:
Кодовая Книга[1] = 128 128 128 128
128 128 128 128
128 128 128 128
128 128 128 128
Важной особенностью технологии VQ является то, что при сжатии видео одна и та же кодовая книга может использоваться для нескольких кадров изображения.
Дискретное Косинусное Преобразование (ДКП)
Компрессоры, использующие ДКП: Motion JPEG; Editable MPEG; MPEG-1; MPEG-2; MPEG-4.
Достоинства и недостатки
1. «Блочность» при высокой компрессии.
2. Закругление острых углов изображения. Случайное «размывание» острых краев изображений.
3. Кодирование очень трудоемко. Только в последнее время удалось осуществить процесс кодирования программно, а не аппаратно.
Обзор
ДКП является широко используемым при сжатии изображений преобразованием. Стандарт сжатия статической графики JPEG, используемый в видеоконференциях стандарт H.263, цифровые видеостандарты MPEG (MPEG-1, MPEG-2 и MPEG-4) — все они используют ДКП. В этих стандартах используется, в частности, 2-мерное ДКП, применяемое последовательно к блокам изображения размерностью 8 x 8 пикселов. ДКП вычисляет 64 (8x8 = 64) коэффициента, которые затем квантизуются, обеспечивая тем самым реально сжатие. В большинстве изображений большинство ДКП-коэффициентов в силу своей малости после квантизации обнуляется. Это свойство ДКП и лежит в основе множества алгоритмов сжатия, использующих ДКП.
Вдобавок известно, что человеческий глаз гораздо менее чувствителен к высокочастотным компонентам изображения, представляемым большими коэффициентами ДКП. К этим большим значениям коэффициентов может быть применен (и, как правило, применяется) больший фактор квантизации. В частности, матрица 64 факторов квантизации для каждого из 64 коэффициентов ДКП, применяемая в алгоритме JPEG, имеет большие факторы квантизации для коэффициентов ДКП, соответственно, большей частоты. После квантизации коэффициенты подвергаются алгоритму RLE. Далее для частых комбинаций используются короткие кодовые слова, для более редких - относительно длинные. Осуществляется вероятностное кодирование.
ДКП, в свою очередь, лучше всего объяснять на примере одномерного ДКП. Двухмерное ДКП представляет собой одномерное ДКП, применяемое последовательно для каждого ряда (строки) блока пикселов и каждой колонки блока пикселов, полученного от одномерного ДКП строк. Одномерное ДКП, применяемое к N выборкам (пикселам в изображении или выборкам в звуковом файле). ДКП есть матрица размерности NxN, строки которой представляют собой косинусные функции:
ДКП(m,n) = sqrt( (1 - delta(m,1) ) / N ) * cos( (pi/N) * (n - 1/2) * (m-1) )
, где
ДКП (m,n) есть одномерная матрица ДКП
m, n = 1,...,N
pi = 3.14159267...
N = число выборок в блоке
delta(m,1) = 1 если m = 1 и 0 в противном случае
cos(x) = косинус x, измеряемый в радианах.
Естественно, применение ДКП на блоке из N выборок потребует N*N операций умножения и суммирования. Однако благодаря рекурсивной структуре матрицы ДКП реально потребуется гораздо меньшее количество математических операций, а именно N log(N). Это свойство делает ДКП реально применимым на современных математических процессорах персональных ЭВМ.
Дискретное Wavelet-преобразование (DWT)
Компрессоры, использующие DWT (Discrete Wavelet Transform): Intel Indeo 5.x; Intel Indeo 4.x
Достоинства и недостатки
1. Большинство как статических, так и динамических изображений, сжатых при помощи алгоритма DWT, не имеет характерной для алгоритма ДКП блочной структуры.
2. Относительное качество изображений, сжатых с использованием DWT, превосходит качество изображений, сжатых при помощи ДКП, при тех же коэффициентах сжатия.
3. DWT несколько размазывает, закругляет острые контуры изображения. Так называемый контурный шум или эффект Гиббса.
Обзор
DWT-алгоритм основан на передаче сигнала, например изображения, через пару фильтров: низкочастотный и высокочастотный. Низкочастотный фильтр выдает грубую форму исходного сигнала. Высокочастотный фильтр выдает сигнал разности или дополнительной детализации.
В свою очередь, результат на выходе высокочастотного фильтра (добавочный сигнал детализации) может быть подвернут той же процедуре и так далее.
Простым примером DWT является DWT Хара:
Входной сигнал x[n] есть множество выборок с индексом n. Низкочастотный фильтр Хара (Haar Low Pass Filter) есть арифметическое среднее двух удачных выборок:
g[n] = 1/2 * ( x[n] + x[n+1] )
Высокочастотный фильтр Хара (Haar High Pass Filter) есть средняя разность двух удачных выборок:
h[n] = 1/2 * ( x[n+1] - x[n] )
Заметьте, что:
x[n] = g[n] - h[n] x[n+1] = g[n] + h[n]
Выходные последовательности g[n] и h[n] содержат избыточную информацию. Таким образом, ясно, что для воспроизведения исходного сигнала x[n] достаточно взять только четные или только нечетные его выборки. Как правило, берутся четные выборки. Таким образом, исходный сигнал x[n] получается только из: g[0], g[2], g[4], .... h[0], h[2], h[4], .....
x[0] = g[0] - h[0]
x[1] = g[0] + h[0] x[2] = g[2] - h[2] x[3] = g[2] + h[2] и так далее...
Выход низкочастотного фильтра представляет собой грубую аналогию исходного сигнала. Если исходным сигналом является изображение, то на выходе низкочастотного фильтра получится расплывчатое, размытое изображение с низким разрешением. Выход высокочастотного сигнала добавляет детали к изображению. В сочетании с выходом низкочастотного фильтра может быть воспроизведено, таким образом, исходное изображение. Грубая форма исходного сигнала (сигнал на выходе низкочастотного фильтра) иногда называют основным уровнем (base layer), а дополнительный сигнал детализации - уровнем улучшения (enhancement layer). Сигнал на выходе высокочастотного фильтра h[n] может быть пропущен снова через пару фильтров, и процесс, таким образом, может быть повторен, пока не будет достигнута достаточная степень детализации исходного сигнала x[n]. Однако ясно, что никакого сжатия здесь не достигается. Преобразование попросту воспроизводит то же количество битов, которое было в исходном сигнале. Выходные значения называются коэффициентами преобразования, или коэффициентами wavelet-преобразования.
Преобразование Хара используется в основном в области сжатия изображений. Для других целей используются более сложные фильтры преобразований. Сжатие же достигается в основном за счет применения некоторой формы квантизации (скалярной или векторной) к добавочному сигналу детализации. Далее к полученным коэффициентам преобразования применяется техника вероятностного (энтропийного) кодирования.
Допустим, что в приведенном выше примере входной сигнал x[n] представляет собой последовательность 8-битных выборок растра полутонового изображения. Для выхода низкочастотного фильтра g[n] теперь можно использовать те же 8 бит, а для высокочастотного h[n] — уже меньше, например 4. Это, по сути, скалярная квантизация. Далее выход высокочастотного фильтра будет стремиться к нулю, так как коэффициенты преобразования будут убывать по мере применения алгоритма. Таким образом, возможно применить вероятностное кодирование к сигналу детализации h[n].
На самом деле для большинства реальных изображений сигнал g[n] на выходе низкочастотного фильтра будет похож на предыдущие g[n-1] выборок за исключением граней контуров. g[n] будет стремиться, таким образом, к g[n-1], вследствие того, что реальные объекты имеют относительно постоянный коэффициент отражения поверхностей.
Разница кадров
Компрессорами, использующими технологию разницы кадров, являются: Cinepak
Достоинства и недостатки
1. В целом может обеспечивать сжатие, лучшее, чем независимое сжатие отдельных кадров.
2. Возникающие в ходе кодирования ошибки накапливаясь, требуют наличия дополнительного ключевого кадра.
Обзор
Алгоритм разницы кадров использует то обстоятельство, что во многих видео изображение от кадра к кадру мало чем различается. По мере применения алгоритма векторной квантизации для кодирования каждого следующего кадра и получения при этом малых коэффициентов, которые трудно кодируются, в кадры постепенно вкрадывается ошибка. Это требует включения в видеоряд так называемых ключевых кадров, которые кодируются без учета предыдущих и являются так называемыми «опорными точками» в видео.
Компенсация движения
Компрессорами, использующими технологию компенсации движения, являются: MPEG-1,2 и 4.
Достоинства и недостатки
1. По сравнению с механизмом разницы кадров механизм компенсации движения позволяет достигать большей степени сжатия.
2. Кодирование весьма трудоемко и требует специальной аппаратуры.
3. Технология компенсации движения используется в таких международных стандартах сжатия цифрового видео, как: MPEG, H.261 и H.263.
4. Наибольшее сжатие достигается в сценах с пониженным движением.
Обзор
Компенсация движения основана на использовании ряда сложных алгоритмов. Сфера, где данная технология сжатия эффективна, как правило, сводится к видеоряду, в котором объект изменяет свое местоположение относительно неподвижного фона. Объекты, изменяющиеся по форме, приближающиеся или удаляющиеся (движущаяся камера), не подлежат эффективному сжатию посредством алгоритма компенсации движения. Сжатие возможно заданием вектора смешения элементов изображения вместо хранения больших значений новых координат данных элементов изображения. Основным блоком (относительно которого задается вектор смещения остальных блоков) может являться любой блок изображения размером 16x16 пикселов, максимально похожий на кодируемый (предсказываемый) блок. Ясно, что кадр, на который ссылаются таким образом другие кадры, должен быть декодирован ранее. Однако совсем не обязательно, чтобы опорный кадр предшествовал предсказываемому кадру. MPEG позволяет производить предсказание в обоих направлениях путем введения так называемых B- (bi-directionally predicted) кадров.
4.3. MPEG (MPEG-1, MPEG-2, MPEG-3, MPEG-4)MPEG - это аббревиатура от Moving Picture Experts Group. Эта экспертная группа работает под совместным руководством двух организаций - ISO (Организация по международным стандартам) и IEC (Международная электротехническая комиссия). Официальное название группы - ISO/IEC JTC1 SC29 WG11. Ее задача - разработка единых норм кодирования аудио- и видеосигналов. Стандарты MPEG используются в технологиях CD-i и CD-Video, являются частью стандарта DVD, активно применяются в цифровом радиовещании, в кабельном и спутниковом ТВ, Интернет-радио, мультимедийных компьютерных продуктах, в коммуникациях по каналам ISDN и многих других электронных информационных системах.
MPEG-1
Очень популярный формат во всём мире, с основой, взятой от кодека JPG. Сжатие в нем производится сериями по три кадра. Это один из самых старых кодеков, так что, практически на любых, даже самых «слабых» машинах можно просмотреть видео со стереозвуком в этом формате. Однако и качество изображения невысокое: оно сравнимо с привычным аналоговым форматом VHS. Картинка имеет разрешение 352х288 точек, да и качество ее оставляет желать лучшего. И хотя MPEG-1 не требователен к ресурсам, его судьба предрешена: с развитием ёмкости и скорости передачи данных в компьютерах и интернете формат будет постепенно забываться.
Как происходит сжатие информации в этом формате? Предположим, что у нас есть следующая сцена: автомобиль движется из пункта "А" в пункт "Б". Перемещение машины можно описать двумя параметрами: вектором перемещения из точки "А" в точку "Б" и углом поворота вокруг своей оси. Задний план при этом остается неизменным или почти неизменным - зритель вряд ли обратит внимание на колебания мелких веток у дальних деревьев. Следовательно, можно разбить кадр на две составные части - задний план, который сохраняется один раз, а затем подставляется при воспроизведении всех кадров, и область, где движется машина, - ее придется записывать отдельно для каждого кадра.
В формате MPEG-1 все кадры видеоролика подразделяются на три типа: I-, P- и B-кадры. К первому типу (I-кадры, Intra Frames) относятся опорные кадры. Их изображения сохраняются в полном объеме в формате JPEG. Для P-кадров (Predicted Frames) записываются только отличия от предыдущего i-кадра, что требует намного меньше дискового пространства. Для B-кадров (Bi-DirectiOnally Interpolated Frames) сохраняются отличия от предыдущего и следующего I- или P-кадра.
В итоге размер сжатого файла составляет примерно 1/35 от исходного. Это значит, что полуторачасовой фильм с качеством, эквивалентным аналоговой записи на кассете VHS, в формате MPEG-1 поместится на два компакт-диска. Для передачи через Internet или в сетях спутникового вещания этот стандарт, конечно же, не подходит.
MPEG-2
MPEG-2 представляет собой дальнейшее расширение MPEG-1. В нем увеличен рекомендуемый размер кадра - теперь он составляет 1920 x 1080 точек, добавлена поддержка шестиканального звука. Однако для воспроизведения видео в этом формате требуется более высокая вычислительная мощность компьютера.
Следует отметить, что велась работа над созданием стандарта MPEG-3 (не нужно путать с популярным форматом сжатия звука - MPEG-1 Audio Layer 3). Он должен был стать базовым для систем цифрового телевидения высокой четкости HDTV. Но работа над ним была прервана, поскольку нужные для HDTV требования удалось реализовать в виде небольших расширений к MPEG-2.
Доминирующий формат на сегодня это MPEG-2 с разрешением 720х576 точек. Все DVD-video диски работают в формате MPEG-2. Трансляции со спутников в несколько каналов на одной частоте, эфирная трансляция, в том числе ТВ высокой четкости, разнообразные плееры DVD, microMV-видеокамеры используют этот формат сжатия. И это не удивительно. После триумфального успеха MPEG-1, новый формат, обеспечивающий практически профессиональное качество картинки, утверждался довольно долго, и получился очень удачным. MPEG-2 подходит для записи полуторачасового фильма отличного качества на стандартный диск DVD (4,7 Гб). Кроме того, в этом формате можно записывать на двойные DVD (9 Гб) фильмы повышенного качества с использованием нескольких разных дорожек звука (дубляж), разных форматов многоканального звучания, субтитров, разных углов обзора видеоматериала (несколько синхронных дорожек видео) и других цифровых новшеств. Среди них, например, присутствует произвольный мгновенный доступ к любой части видеоматериала на диске и отсутствие перемотки при достижении конца видеоматериала, что раньше являлось довольно большой проблемой.
MPEG-2 позволяет использовать разрешения вплоть до 1920х1080 пикселов (25 кадров в секунду, с полями и без полей, с прогрессивной разверткой) и поддерживает 6-канальный звук.
Особенности этого формата широко использует компания Sony в своем расширенном стандарте microMV, хотя поток информации там повышен до 12 Мбит/с (по сравнению с максимальным стандартом DVD 9,8 Мбит/с), а размер кассеты уменьшен (по сравнению с DV). И всё же стандарт DV отличается большей устойчивостью и большим распространением по всему миру.
Недавно появились камеры, которые пишут сразу на miniDVD диски в формате MPEG-2. Они имеют несколько важных достоинств - перезапись дисков до 1000 раз без потери качества, доступность материала и некоторые другие преимущества. Но очевиден и недостаток - ограниченный объем записанного материала (до 30 минут на 1 miniDVD диск). Хотя для любительских съемок это очень подходящий вариант: миниDVD диски прекрасно воспроизводятся на бытовых плеерах и ПК, а программы идущие с такими камерами позволяют проводить монтаж на любом компьютере, оснащенном DVD-приводом.
MPEG-3
Предназначался для использования в системах телевидения высокой чёткости (high-defenition television, HDTV) со скоростью потока данных 20-40 Мбит/с, но позже стал частью стандарта MPEG-2 и отдельно теперь не упоминается. Кстати, формат MP3 , который иногда путают с MPEG-3, предназначен только для сжатия аудиоинформации и полное название MP3 звучит как MPEG Audio Layer III.
MPEG-4
Форматы MPEG-1 и MPEG-2 не обеспечивали реальной возможности трансляции видео по сети Internet и создания интерактивного телевидения на их основе - слишком уж большим был размер файлов. Для его радикального уменьшения, а также реализации других функций, необходимых для передачи потокового видео, была начата работа над спецификациями нового формата - MPEG-4. По сути, он ориентирован не столько на сжатие видео, сколько на создание так называемого "мультимедийного контента" - слияния интерактивного телевидения, 3D-графики, текста и т. д.
Формат MPEG-4 сочетает отличный звук и максимальное уплотнение видеосигнала (до 30-40% лучше чем у предшественника). Разница заключается в том, что кодируется последовательность более чем из трех кадров (обычно до 250 кадров). Тем самым достигается большее сжатие и возможность смотреть в режиме реального времени качественное потоковое видео в интернет. Динамическое сжатие также эффективно использует ресурсы, и на обычный компакт-диск помещается 1,5 часа видео в достаточно хорошем качестве. Однако, в большинстве случаев, внимательный зритель сможет увидеть на хорошем экране разницу между изображением, закодированном в MPEG2 и MPEG4.
Интересной особенностью формата является то, что для типовых объектов даже разработаны отдельные алгоритмы предсказания и описания их движений - это касается, в частности, походки людей, наиболее распространенных жестов, мимики. Теперь такие изменения в кадрах нет нужды записывать вообще - их можно рассчитать программно.
В MPEG-4 поддерживается отображение текста различными шрифтами поверх видеоизображения. Более того, этот текст может быть озвучен с помощью синтезатора речи с возможностью имитации мужских и женских голосов. При необходимости голос синхронизируется с движениями лица диктора в соответствии с произносимыми фонемами. Также может синтезироваться звучание некоторых музыкальных инструментов. Сжатие оцифрованных звукозаписей осуществляется более эффективно с помощью специально разработанного кодека AAC (Advanced Audio Codec).
Некоторые видеокамеры позволяют записывать в формате MPEG-4 видео на собственную карту памяти или работать как web-камера, передавая по USB кабелю видео со звуком в формате MPEG-4.
Кроме того, современные технологии позволяют даже воспроизводить цифровое телевидение (сжатое в формате MPEG-4 или MPEG-2) с помощью мобильных телефонов, используя GPRS.
На сегодня, MPEG-4 - это наиболее популярный формат распространения видео в интернете и на персональных компьютерах. Рациональное использование памяти при хорошем качестве видео дают о себе знать. Каждая последующая версия кодека MPEG-4 (на сегодня используются 3.хх, 4.хх и 5.хх версии) привносит всё новые и новые прогрессивные улучшения. Большое количество бытовых плееров, КПК и прочих устройств без проблем работают с этим форматом. MPEG-4 будет актуален еще, как минимум, лет десять, пока ему на смену не придёт что-то принципиально новое.
4.4. MJPEGMPEG-компрессия использует следующие основные идеи:
1. Устранение временной избыточности видео, учитывающее тот факт, что в пределах коротких интервалов времени большинство фрагментов сцены оказываются неподвижными или незначительно смещаются по полю.
2. Устранение пространственной избыточности изображений подавлением мелких деталей сцены, несущественных для визуального восприятия человеком;
3. Использование более низкого цветового разрешения при yuv-представлении изображений (y - яркость, u и v - цветоразностные сигналы) - установлено, что глаз менее чувствителен к пространственным изменениям оттенков цвета по сравнению с изменениями яркости.
4. Повышение информационной плотности результирующего цифрового потока путем выбора оптимального математического кода для его описания (например, использование более коротких кодовых слов для наиболее часто повторяемых значений).
5. Изображения в Mpeg-последовательности подразделяются на следующие типы:
· I (intra), играющие роль опорных при восстановлении остальных изображений по их разностям;
· P (predicted), содержащие разность текущего изображения с предыдущим I или P с учетом смещений отдельных фрагментов;
· B (bidirectionally predicted), содержащие разность текущего изображения с предыдущим и последующим изображениями типов I или P с учетом смещений отдельных фрагментов.
Изображения объединяются в группы (GOP - Group Of Pictures), представляющие собой минимальный повторяемый набор последовательных изображений, которые могут быть декодированы независимо от других изображений в последовательности. Типичной является группа вида (I0 B1 B2 P3 B4 B5 P6 B7 B8 P9 B10 B11) (I12 B13 B14 P15 B16 B17 P18…), в которой I тип повторяется каждые полсекунды. Обратим внимание, что в изображении P3 основная часть фрагментов сцены предсказывается на основании соответствующих смещенных фрагментов изображения I0. Собственно кодированию подвергаются только разности этих пар фрагментов. Аналогично P6 «строится» на базе P3, P9 - на базе P6 и т.д. В то же время большинство фрагментов B1 и B2 предсказываются как полусумма смещенных фрагментов из I0 и P3, B4 и B5 - из P3 и P6, B7 и B8 - из P6 и P9 и т.д. Наряду с этим B-изображения не используются для предсказания никаких других изображений. В силу зависимости изображений в процессе их кодирования меняется порядок следования. Для вышеприведенной последовательности он будет следующим: I0 P3 B1 B2 P6 B4 B5 P9 B7 B8 I12 B10 B11 P15 B13 B14 P18 B16 B17…
Ясно, что точность кодирования должна быть максимальной для I, ниже - для P, минимальной - для B. Установлено, что для типичных сцен хорошие результаты достигаются при отведении числа бит для I в 3 раза больше, чем для P , и для P в 2-5 раз больше, чем для B. Эти отношения уменьшаются для динамичных сцен и увеличиваются для статичных.
Отдельные изображения состоят из макроблоков. Макроблок - это основная структурная единица фрагментации изображения. Он соответствует участку изображения размером 16*16 пикселов. Именно для них определяются вектора смещения относительно I- или P-изображений. Общее число макроблоков в изображении - 396. Для повышения устойчивости процесса восстановления изображений к возможным ошибкам передачи данных последовательные макроблоки объединяют в независимые друг от друга разделы (slices), максимальным числом 396. В предельном случае «чистой» передачи на изображение приходится всего один раздел из 396 макроблоков. В свою очередь каждый макроблок состоит из шести блоков, четыре из которых несут информацию о яркости Y, а по одному определяют цветовые U- и V-компоненты. Каждый блок представляет собой матрицу 8*8 элементов. Блоки являются базовыми структурными единицами, над которыми осуществляются основные операции кодирования, в том числе выполняется дискретное косинусное преобразование (DCT - Discrete Cosine Transform) и квантование полученных коэффициентов.
Таким образом, компрессия MJPEG [Motion JPEG] основывается на независимом кодировании каждого кадра и объединении полученной последовательности в файл. Сжатие видео осуществляется по JPEG-алгоритму: каждое изображение разбивается на квадраты 8x8 точек и представляется в векторной форме путем дискретного преобразования и высокочастотной фильтрации полученного спектра. По сути, сжатое видео представляет собой последовательность независимых JPEG-изображений.
Поскольку каждый кадр кодируется отдельно от других, возможно последующее покадровое редактирование изображения. Существенным преимуществом этого алгоритма сжатия видео является его симметричность, то есть для кодирования и декодирования необходимы одни и те же вычислительные затраты.
Применительно к MJPEG степень сжатия видео до 1:15 позволяет сохранять видеоинформацию практически без потери качества, от 1:15 до 1:25 приводит к небольшой потере разрешения. При большом коэффициенте компрессии [1:30 и выше] сжатие видео по алгоритму MJPEG сопровождается характерными для формата JPEG искажениями: на границах сетки разбиения [квадраты 8x8 точек] нарушается гладкость изображения, что приводит к уже известному "мозаичному" эффекту.
Из других недостатков формата сжатия MJPEG можно отметить не очень большую эффективность сжатия, а также невозможность создания видеофрагментов размером более 2 Гб, - структура файла не позволяет увеличить его размер. В настоящее время применяются программные методы "склейки" MJPEG-файлов, позволяющие переключаться между ними практически незаметно.
Несколько лет назад компрессия MJPEG стала стандартом в области мультимедиа, что побудило разработчиков аппаратного и программного обеспечения к созданию собственных MJPEG-кодеков.
Формат использует простую обработку кодированного аналогового видеосигнала по стандарту JPG (с разрешением 768х576 точек). Расшифровывается как Motion-JPEG (движущийся JPEG). На сегодняшний день этот формат практически не используется, т.к. качественно сжатые ролики занимают достаточно много места. В некоторых моделях устройств (например, фотокамерах с функцией видео) встречается упрощенный вариант M-JPEG с разрешением 320х240 точек.
4.5. WaveletОтносительно новый алгоритм сжатия видео при котором, в отличие от JPEG, изображение обрабатывается без разбиения на квадраты. После того, как фирма Analogue Devices выпустила специализированную микросхему аппаратного wavelet-сжатия видео, данный формат стал базисом многоканальных цифровых систем видеонаблюдения и цифровых видеорегистраторов.
Как и в случае формата JPEG, в Wavelet сжатие осуществляется с необратимыми потерями информации, но изображение не имеет "мозаичных" дефектов даже при очень больших степенях компрессии. Достоинство - отсутствие видимых дефектов даже при большом коэффициенте сжатия видео, - снижается резкость, и изображение просто становится менее четким.
С математической точки зрения основной особенностью wavelet-преобразования является возможность разложить изображение на две компоненты - низкочастотную часть, содержащую основную информацию, и высокочастотную часть, содержащую лишь малую долю информации. Низкочастотную часть можно опять разложить на две части, и т.д. Оставшаяся часть изображения содержит лишь малые высокочастотные компоненты. В результате последовательного применения wavelet-преобразований получается изображение, занимающее небольшой объем места на диске.
4.6. JPEG
JPEG [ Joint Photographic Experts Group ] - алгоритм сжатия неподвижного изображения. Формат JPEG изначально предусматривает контролируемое, но необратимое ухудшение качества. Основная идея этого алгоритма сжатия заключается в том, что вся "картинка" разбивается на квадраты 8x8 точек, а изображение в каждом квадрате раскладывается на гармоники [преобразование Фурье]. Сохраняются только основные гармоники, а значения остальных грубо округляются. Особенностью формата сжатия JPEG является действительно быстрая [полный кадр за 1/50 секунды] и высокая компрессия [в 10 … 100 раз].
Традиционно формат JPEG применяется для компрессии полноцветных изображений и изображений в градациях серого без резких переходов яркости, обеспечивая, пожалуй, наилучшее цифровое сжатие. Переход от монохромного изображения к цветному RGB увеличивает объем картинки всего в полтора раза, а не в три.
Формат JPEG используют web-камеры и web-видеосерверы, - видеонаблюдение в этом случае возможно вести в окне стандартного браузера. Необходимо иметь в виду, что "живая" полноформатная картинка в формате JPEG может передаваться по каналам связи не менее 64К.
При сжатии видео по алгоритму JPEG теряется часть информации, но достигаются большие коэффициенты компрессии. В некоторых случаях проявляется эффект Гиббса - "ореол" вокруг резких горизонтальных и вертикальных границ изображения. Программное обеспечение решает, является ли конкретный квадрат 8х8 существенным в данном изображении или же его можно интерполировать. По мере повышения степени компрессии число выброшенных блоков возрастает, и на изображении начинают проступать артефакты - характерные прямоугольные дефекты.
4.7. Apple QuickTimeФормат файлов с расширением MOV был разработан Apple для компьютеров Macintosh и позже перенесен на платформу PC. С 1993 по 1995 г. этот формат был доминирующим. Последняя его версия за номером 4.1 позволяет передавать данные в потоковом режиме. Это значит, что нет необходимости полностью загружать файл, чтобы начать просмотр видеоролика. Однако с появлением спецификаций MPEG данный формат постепенно теряет популярность. Основная его проблема заключается в том, что стандарт QuickTime - закрытый. Способы, с помощью которых кодируется видео, Apple держит в секрете. Следовательно, сторонние программисты не могут написать программ, сжимающих видео в этот формат.
4.8. Intel IndeoДанный формат был разработан корпорацией Intel для сжатия видеоданных с использованием новых возможностей процессоров Intel Pentium MMX. Кроме поддержки потоковой передачи данных и функций защиты авторских прав, этот стандарт реализует несколько новаторских на момент его появления функций. Он позволяет применять к видеопоследовательности различные эффекты (например, изменять яркость или контрастность) в реальном времени, декодировать не весь кадр, а, к примеру, центральный фрагмент, делать часть кадра одного видеоролика прозрачной и накладывать две видеозаписи друг на друга. Последний эффект часто используют в программах телевизионных новостей, когда комментатор изображается на фоне видеорепортажа с места событий.
Однако формат Indeo не получил большого распространения. А с выходом MPEG-4, в котором также присутствуют все эти возможности, данный стандарт вообще оказался не у дел.
4.9. CCIR 601
CCIR-601 - стандарт, описывающий формат цифрового видео с разрешением 720x576 (PAL) и 720x480 (NTSC).
Стандарт цифрового телевидения, опубликованный ITU-R (CCIR) в 1990 г. Определяет форматы кадра (например CIF, QCIF), правила преобразования стандартного аналогового видеосигнала (NTSC, PAL, SECAM) в цифровые компонентные сигналы и методы кодирования цифрового видеосигнала.
4.10. H.261Рекомендация ITU-T H.261 - Video codec for audiovisual services at p x 64 kbit/s. Данная рекомендация описывает метод кодирования/декодирования видеоизображения для использования в системах видеоконференций при скоростях передачи данных p x 64 Кбит/с, где p может принимать значение от 1 до 30. H.261 определяет использование форматов кадра CIF и QCIF (при p < 3).
H.263 - это видеокодек, ITU-T, предназначенный для передачи видео по каналам с довольно низкой пропускной способностью (обычно ниже 128 кбит/с). Применяется в программном обеспечении для видеоконференций.
Стандарт H.263 был первоначально разработан для использования в системах, базирующихся на H.324 (PSTN и другие системы видеоконференций и голосовой связи), но впоследствии нашёл применение в H.323 (видеоконференции, основанные на RTP/IP), H.320 (видеоконференции, основанные на ISDN), RTSP (потоковое аудио и видео) и SIP (Интернет-конференции).
H.263 представляет собой развитие стандарта H.261, предыдущей разработки ITU-T - стандарта видеосжатия, и алгоритмов MPEG-1 и MPEG-2. Первая версия была завершена в 1995 году и представляла собой хорошую замену для устаревшего H.261 на каналах с любой пропускной способностью. Дальнейшим развитием проекта является H.263v2 (также известный как H.263+ или H.263 1998) и H.263v3 (известный как H.263++ или H.263 2000).
Новый расширенный кодек от ITU-T (в партнёрстве MPEG) после H.263 - это стандарт H.264, также известный как AVC и MPEG-4, часть 10. Поскольку H.264 имеет существенно расширенные возможности по сравнению с H.263, он стал основным при разработке программного обеспечения для видеоконференций. Большинство современного программного обеспечения этого направления поддерживает H.264, также как и H.263 или H.261.
Ogg – это контейнер метаданных, обеспечивающий хранение в одном файле нескольких дорожек данных, позволяющий обнаруживать ошибки потока и искать неповрежденные места.
Кодек Theora разработан Фондом Xiph.org.. Его алгоритм основан на коде свободного кодека VP3, созданного компанией On2 Technologies и распространяемого под лицензией, позволяющей пользоваться им на безвозвратной основе (т.е. бесплатно) и не требующей каких-либо патентных отчислений за использование как самого VP3, так и производных от него кодеков. Theora - это высокоэффективный видеокодек, составляющий реальную конкуренцию формату MPEG-4 и другим технологиям видеосжатия, использующим узкую полосу канала передачи данных.
4.13. AVIAVI-файлы - особый случай файлов RIFF. (сокращенно от Resource Interchange File Format). Этот формат, изначально предназначавшийся для обмена мультимедийными данными, был Microsoft совместно с IBM. Данный формат является наиболее распространенной формой представления видео на персональных компьютерах. В зависимости от формы представления видеоданных файлы AVI бывают различных стандартов.
4.14. Editable MPEGEditable MPEG, так же как и M-JPEG, используется для редактирования цифрового видео представляет собой AVI-файл, состоящий только из кадров MPEG типа i. Однако все другие механизмы сжатия MPEG тут задействованы. Входит в стандартную поставку Microsoft Video for Windows 1.1. и используется такой настольной системой редактирования цифрового видео, как, например, Adobe Premiere.
Хотя вышеперечисленные компрессоры достаточно популярны, тем не менее это далеко не все стандарты сжатия AVI-файлов. Характеризуя эту группу компрессоров, можно отметить, что они проектировались и создавались в первую очередь как средства сжатия видео- и аудиоданных, хранящихся на жестких дисках и компакт-дисках, а это, в свою очередь, свидетельствует об их небольших возможностях при сжатии и относительно высоком качестве при воспроизведении.
С приходом Интернета все большую популярность получают методы и средства сжатия видео- и аудиоданных, позволяющих, применяя передовые технологии (sophisticated motion estimation and compensation, wavelets, fractals и другие), достичь наименьших соотношений «килобит/секунда», позволивших проводить, например, сеансы видеоконференций средствами Интернета. Ясно, что такие методы сжатия обеспечивают существенно большую степень сжатия, при относительно низком качестве.
4.15. VDOWaveVDONet выпускает wavelet-основанный видеокомпрессор, включенный в комплект реализации 32-битной версии Video for Windows. Microsoft использует VDOWave как часть NetShow. В настоящее время существуют две версии компрессора VDOWave:
VDOWave 2.0 is a fixed rate video codec.
VDOWave 3.0 is a "scalable" video codec.
Стандартный набор NetShow 2.0 устанавливает только декодер VDOWave. Средство разработки NetShow 2.0 устанавливает как кодер, так и декодер VDONet VDOWave. По некоторым тестам, VDOWave существенно превосходит по сжатию MPEG-1 и другие компрессоры, базирующиеся на алгоритме блокового ДКП (block Discrete Cosine Transform), но лишь при низких отношениях «килобит/секунда».
4.16. CinepakОдин из наиболее распространенных и используемых компрессоров Video for Windows. Обеспечивает наиболее быстрое воспроизведение видео. В отличие от Indeo 32, которая обеспечивает чуть лучшее качество, однако заметно отягощает процессор при декомпрессии, Cinepak максимально разгружает процессорный ресурс.
На сегодняшний день существует по крайней мере три стандарта для Cinepak.
· Cinepak SuperMac (изначальный, 16-битный компрессор);
· Cinepak Radius (новый, улучшенный 16-битный компрессор);
· Cinepak Radius[32] (32-битная версия Radius Cinepak, поставляемая совместно с Windows 95).
Особенностью метода является использование алгоритма векторной квантизации изображений совместно с алгоритмом разницы кадров (см. ниже).
4.17. Microsoft Video (MSVC)Microsoft Video 1 поддерживает только 8- или 16-битную цветовую палитру.
Глава 5. Современные мобильные видеоформатыЕстественным и логическим этапом развития мобильной связи является возможность передачи и просмотра видео на мобильных телефонах. В сетях GSM в настоящее время возможен достаточно комфортный просмотр видеоинформации, предварительно скачанной из сети, или приготовленной собственноручно.
В настоящее время практически все вендоры мобильного рынка оснащают свои аппараты встроенными камерами с возможностью записи и воспроизведения видеофайлов. Используемый при этом видео-формат основан на протоколе MP4/3gp, однако это совсем не значит, что современные телефоны не умеют понимать и другие форматы представления видеоданных.
5.1. 3GPP3GPP является частным случаем MP4 Video. Этот стандарт вошел в обиход сравнительно недавно, благодаря компании Philips, приложившей немало усилий для адаптации стандарта MPEG-4 для потокового вещания.
Сандарт 3GPP стал основным в камерофонах с возможностью записи видео. Изначально он являлся базовым в смартфонах SonyEricsson, для них был даже разработан специальный софт для просмотра компанией PacketVideo - PVPlayer, позволяющий проигрывать видео на полный экран. В настоящее время этот проигрыватель доступен практически для всех смартфонов на базе операционных систем Symbian, Windows Mobile, а также для КПК класса PocketPC.
К достоинствам формата можно отнести то, что при несовпадении размеров изначальной картинки, она автоматически преобразуется в размер, поддерживаемый телефоном. Однако качество видеороликов очень низкое, т.к. изначально этот формат предназначался для оперативной записи видеоматериала с помощью встроенной камеры, последующего просмотра и отправки в качестве вложения в MMS (ограничение в 100 Кб).
Низкое качество видео обусловлено низким разрешением картинки, которое может быть либо QCIF (176x144), либо sub-QCIF (128x96), низкой частотой кадров - не более 15 в секунду, и особенностями записи звука. Звук, сопровождающий видеофрагмент, может быть записан в формате AMR (максимальный поток 12.2 кбит/c), либо WB AMR (поток 23.05 кбит/с).
5.2. Real VideoReal Video - самый распространенный сетевой потоковый аудио/видео стандарт, предложенный фирмой RealOne, широко используемый для представления в Интернете и кабельных сетях музыки и видео. Стандарт завоевал огромную популярность во всем мире как средство размещения в Интернете аудио/видео контента с малым размером файлов и вполне приличным качеством. Небольшой размер выходного файла позволяет существенно экономить трафик при трансляции по каналам связи, в том числе и в GSM-сетях. Файлы RealVideo обычно имеют расширение ".rm", ".ram" или ".rmvb".
Для воспроизведения на телефоне файл должен иметь геометрию изображения не больше 208x176 точек и содержать общий поток данных не выше 340 кБит/с.
5.3. VICS VideoVICS Video - формат, успешно применяемый в европейских беспроводных сетях TV-вещания.
Формат является потоковым и предназначен для просмотра он-лайн видео. Файлы этого стандарта имеют расширение .vic . Плеер для просмотра такого видео (под названием VICS NanoPlayer) существует для различных платформ, в том числе и для Symbian S60. Особого интереса формат не представляет.
5.4. MobiClip VideoMobiClip Video - классический MPEG-1. В октябре 2003 компания MobiClip представила очень интересный формат. Формат является по сути универсальным. Файлы, сконвертированные в этом формате, имеют расширение *.mo и могут нести в себе звук, видео и flash-анимацию.
На сайте производителя этот формат рекламируется как мобильное полноэкранное видео без тормозов. Существенным его ограничением является его непотоковый характер, то есть для просмотра необходимо загрузить весь файл целиком. Другим, не принципиальным, но существенным ограничением формата является большой объем полученных файлов. Таким образом, на телефонах появился формат видео, способный обеспечить высокое качество изображения при практически кинематографической частоте кадров. Качество воспроизведения зависит лишь от объема доступной памяти. Видеоролик проигрывается на полный экран.
В современных устройствах возможен также просмотр видео в форматах DivX и AVI.
Глава 6. Программы, необходимые для воспроизведения видеоПроигрыватели мультимедиа
Для воспроизведения видео- и аудиофайлов можно пользоваться стандартным средством Microsoft - программой Проигрыватель Widows Media, входящей в состав операционной системы Windows. Основное достоинство этой программы - наличие большого количества кодеков. Однако ей присущ и ряд недостатков: она требует значительных системных ресурсов и долго загружается. Описание других наиболее популярных проигрывателей приводится далее.
Можно выделить несколько общих особенностей этих программ.
1. Основное окно подобно панели управления обычного проигрывателя (например, видеомагнитофона) и содержит кнопки для управления процессом воспроизведения. Название каждой из них отображается в виде подсказки, возникающей при наведении на кнопку указателя мыши.
2. Помимо основного окна, доступно окно списка воспроизведения. В нем можно устанавливать очередность воспроизведения файлов (последовательно или в произвольном порядке).
3. При просмотре видеофайлов изображение выводится в отдельном окне.
4. Отсутствует стандартное для Windows-программ меню. Функции, недоступные из основного окна приложения, можно вызвать с помощью команд контекстного меню, которое открывается щелчком правой кнопкой мыши в основном окне.
Winamp
Одной из самых популярных программ воспроизведения файлов в аудиоформатах является Winamp. В последних версиях этого проигрывателя появилась также возможность воспроизводить видеофайлы. Модульная архитектура Winamp позволяет легко превратить компьютер в устройство, ничем не уступающее по эргономике управления стационарному музыкальному центру.
Этот универсальный проигрыватель распознает практически все аудио- и видеоформаты, поддерживает списки воспроизведения, имеет встроенный эквалайзер, с помощью которого можно точно отрегулировать качество звучания, и даже минибраузер. Для Winamp разработано множество обложек (причем не только компанией-производителем), позволяющих изменить его интерфейс до неузнаваемости, а также большое количество дополнительных модулей, как визуальных (зрительных образов), так и аудио (допускающих различные манипуляции со звуком).
Проигрыватель Winamp имеет понятный интерфейс, элементы управления которого напоминают кнопки обычного магнитофона. Помимо этих стандартных кнопок здесь предусмотрен также ползунок воспроизведения (вместо кнопок ускоренной перемотки). Все это делает работу с Winamp простой и удобной.
Кроме того, в программе предусмотрена возможность без прерывания процесса проигрывания пополнять список воспроизведения новыми файлами, удалять и менять их местами.
QCD Player
Проигрыватель QCD Player ориентирован в основном на воспроизведение музыки, хотя и позволяет открывать видеофайлы. Он имеет удобный интерфейс, обеспечивает все возможности, которые могут понадобиться при воспроизведении аудиофайлов, и позволяет производить большое число различных настроек. Кроме того, можно использовать дополнительные модули, расширяющие возможности программы.
LightAlloy
Программа LightAlloy используется относительно небольшим количеством пользователей, поскольку ее интерфейс не слишком удобен. Основное преимущество программы заключается в функциональности. Проигрыватель LightAlloy позволяет работать с внешней аудиодорожкой (в форматах WAV или MP3), может автоматически воспроизводить находящийся в одной папке с фильмом одноименный аудиофайл. Кроме того, этот проигрыватель совместим с программой WinLIRC, поддерживает внешние субтитры (SSA, SUB, SRT, форматированный текст), позволяет делать скриншоты (фотографии экрана), создавать списки проигрываемых файлов и настраивать фильтры.
В программе предусмотрена интересная функция тестирования видеокодека - LightAlloy воспроизводит фильм с максимально возможной скоростью и параллельно выстраивает график производительности (количество кадров в секунду). Программа поддерживает многие форматы файлов, а также позволяет использовать большое количество «горячих» клавиш. Однако следует отметить, что далеко не все они привычны для тех, кто использует другие проигрыватели.
Кроме непривычного интерфейса неудобство вызывает то, что программа требует набора компонентов DirectX 8.0 и выше, так что некоторые пользователи вынуждены будут обновить DirectX.
PowerDVD
Одним из самых популярных программных DVD-проигрывателей является PowerDVD. К его основным достоинствам относятся высокое качество изображения, удобный интерфейс с обложками и гибкие средства настройки. Кроме просмотра фильмов с компакт-дисков и DVD-дисков PowerDVD позволяет воспроизводить файлы форматов, поддерживаемых Windows MediaPlayer.
Программа обладает всеми присущими аппаратному DVD-проигрывателю цифровыми функциями, такими как масштабирование изображения, непрерывное проигрывание выбранного эпизода, установка маркеров для быстрого нахождения нужной сцены, ускоренный просмотр и т. п. Предусмотрена даже такая возможность, как одновременный показ субтитров на двух языках. В том случае, если изображение выводится не на широкоэкранный, а на простой телевизор или монитор компьютера, очень удобно пользоваться функцией преобразования широкоэкранного формата кинофильма в полноэкранный с соотношением ширины к высоте 4:3 (при этом исчезают черные полосы внизу и вверху экрана).
WinDVD
Данная программа предназначена для воспроизведения файлов в формате DVD. Она является коммерческим продуктом. Ее особенности -отсутствие поддержки смены интерфейса и вызов основного меню из окна с воспроизводимым видео. Проигрыватель предоставляет все функции, необходимые для полноценной работы с DVD-дисками.
BSplayer
Проигрыватель BSPlayer способен работать с программой WinLIRC для дистанционного управления ПК, что позволяет при наличии инфракрасного пульта дистанционного управления превратить компьютер в полноценный телевизор. В программе также предусмотрено большое количество «горячих клавиш» и поддержка внешних субтитров трех форматов: SUB, SRT и STF.
Программа позволяет настраивать все используемые фильтры, поскольку для проигрывателя такого уровня это условие является обязательным. А вот воспроизведение видеофайлов с несколькими звуковыми дорожками (с выбором любой из них) и система закладок (с возможностью их преобразования в разделы фильма), получение копии изображения на экране - это прекрасные дополнительные возможности программы.
Глава 7. Современные видеокамерыВек аналоговых видеокамер уже заканчивается. Поэтому сейчас это самые дешевые видеокамеры. Недостатки таких камер следующие: невысокая четкость изображения, снижение качества изображения при создании уже первой копии, запись монозвука, большие размеры и вес, высокое энергопотребление. Для подключения аналоговых видеокамер к компьютеру требуется специальный TV-тюнер или карта видеозахвата. Дополнительно будет нужна специальная программа, преобразующая сигнал в цифровой режим. Форматы, которые используются в аналоговых видеокамерах: VHS, VHS-C, S-VHS, S-VHS-C.
Но если вы хотите получить лучшее из возможного в домашних условиях, то ваш выбор – современная цифровая видеокамера.
Существует ошибочное мнение о том, что выбрать цифровую видеокамеру можно по тем же критериям, что и цифровой фотоаппарат. Но это далеко не так. При выборе цифрового фотоаппарата одним из основных критериев является количество пикселей в матрице (чем больше, тем лучше и дороже), а у цифровой видеокамеры «больше» зачастую не означает «лучше». Это связано с тем, что разрешение видеокамеры ограничено стандартом телевидения (для PAL - 720x576), а цифровая фотокамера ограничений по разрешению не имеет. Поэтому, каковы же главные критерии выбора цифровой видеокамеры.
Для любительского класса сейчас существует три формата цифровых видеокамер - Digital 8, microMV, miniDV.
Формат Digital 8 предлагается только фирмой Sony. Плюсами являются: большая продолжительность записи на одну кассету (до 120 минут SP и 240 минут LP), доступная цена, возможность длительного хранения отснятого материала без перезаписи на специальную дорогую кассету. Недостатки: воспроизведение записей возможно только с самой видеокамеры или дорогого видеоплеера/видеомагнитофона Video 8 (обычный VHS плеер для этого не подходит), малая четкость изображения, качество которого при создании первой копии сильно ухудшается.
MicroMV предлагается опять же только фирмой Sony и является полной противоположностью камерам Digital 8. MicroMV-камеры очень малы, даже, миниатюрны, но эту особенность с трудом можно отнести к преимуществам, поскольку снимать в обычных условиях такими камерами очень неудобно, т.к. рука практически не чувствует веса камеры, держать и управлять microMV-камерой не очень удобно. Кроме того, самый большой недостаток microMV-камер заключается в нестандартном формате записи видео на ленту. Записанное на такой видеокамере видео понимает только специальная программа от Sony. К тому же кассеты microMV стоят в два раза дороже других кассет для цифровых камер.
Формат miniDV сейчас стал самым распространенным для любительских цифровых видеокамер. Абсолютно все производители выпускают камеры в этом формате. Камеры с таким форматом легкие, компактные, с хорошим качеством картинки. Цифровое видео записывается на кассету с хорошей вмещаемостью - 60 минут SP (90 минут LP). Разрешение изображения приближено к профессиональному – до 540 линий по горизонтали; стереозвук качества CD. Ценовой диапазон очень широк, поэтому вы легко сможете выбрать подходящую видеокамеру.
На сегодняшний день самыми популярными являются два вида - это кассета с магнитной лентой (MiniDV) и диск DVD (MiniDVD диаметром 8 см).
Формат miniDV обеспечивает высокое качество видео и удобство для редактирования на компьютере. Запись ведется на 6-мм ленту. На стандартной кассете умещается 60 минут записи с нормальной скоростью. MiniDV-камеры снабжаются инфракрасным освещением, позволяющим вести видеосъемку в темноте. Помимо видеосъемки формат miniDV-камер позволяет делать фотографии. Но основной недостаток – это огромный размер несжатого видео, который на жестком диске занимает около 12 ГБ для часового фильма.
Видеокамеры формата DVD позволяют записывать видео сразу на DVD-Video-диск (он же miniDVD: DVD-R, DVD-RAM и DVD-RW), который можно просто вынуть из камеры, вставить в DVD-плеер и сразу же посмотреть результат съемки. Что касается звука, то здесь предусмотрен формат, создающий эффект домашнего кинотеатра. При покупке выбирайте видеокамеру, которая записывает видео на диски того формата, который поддерживает ваш DVD-плеер: DVD-RAM или DVD-RW. К особенностям DVD-видеокамер следует также отнести то, что эти камеры более чувствительны к тряске и вибрации, чем видеокамеры, снимающие на пленку.
Не так давно появились видеокамеры, использующие в качестве носителя флэш-память и HDD. Камеры, использующие в качестве носителя флэш-память по качеству съемки пока уступают miniDV, зато они компактные, обладают незначительным энергопотреблением и повышенной надежностью. Запись ведется в формате MPEG4. В таком формате видео занимает мало места. Отснятые клипы легко копируются с флэш-карты на компьютер при помощи порта USB 2.0. HDD - пожалуй, наиболее перспективное направление. Пока таких камер немного и стоят они дорого. С помощью такой видеокамеры есть возможность записывать видео 21 час без перерыва, примером может служить Sony DCR-SR100.
Глава 8. Носители цифрового видеоОбъединение кассеты с камерой было первым шагом по замене любительских кинокамер. Однако их размеры из-за используемой кассеты VHS были очень большими. Первым существенным шагом на пути миниатюризации видеоаппаратуры было создание кассеты формата VHS-C, а затем и Video8 (1985). Кассета Video8, например, имеющая габариты 95х62,5х15 мм, более чем в пять раз меньше по объему стандартной кассеты VHS. Но это были еще аналоговые форматы.
Первый бытовой цифровой формат DV появился в 1995 году. Поскольку кассета DV с лентой меньше, чем кассеты формата VHS-C или Video8, цифровые камкордеры меньше и легче, чем их аналоговые двойники.
В 1999 году корпорация Sony модернизировала свой аналоговый формат Video8 в цифровой Digital8. При использовании магнитной ленты категории Hi8 качество записи изображения и звука сопоставимо с качеством формата DV. Специалисты Sony на этом не остановились и в 2001 году разработали новый формат MICROMV. Кассета имеет габариты всего 46х30,2х8,5 мм, то есть ее объем на 30% меньше, чем у DV-кассеты. В режиме SP на кассету можно записать до 60 минут высококачественного видео.
Еще один вариант цифровой видеозаписи Digital HD на DV-кассете представила в марте прошлого года компания JVC. Камкордер GR-DH1 может записывать видео в формате MPEG с эффективным числом строк до 720.
Популярность цифровых камкордеров в мире очень велика, хотя и существенно разнится по регионам. Так, в Японии до 95% всех видеокамер цифровые, в то время как в Европе они составляют 60%, а в США - вообще только 30%.
Сегодня магнитный носитель (лента в кассете) уже не является единственным для записи цифрового видео. Все больше фирм предлагают модели, в которых видеозапись осуществляется на оптический носитель. Записываемые DVD в качестве носителя в камкордерах стали использоваться в 2001 году. Первую камеру с использованием диска DVD-RAM диаметром 8 см разработала фирма Hitachi. Эта камера также позволяет делать записи на одноразовые DVD-R. Камкордеры с аналогичными носителями сегодня производит и Panasonic. Sony в своих последних дисковых видеокамерах использует в качестве носителя диски DVD-R/RW такого же диаметра. Поскольку запись на DVD ведется в формате MPEG-2, то свое видео можно сразу воспроизвести на DVD-проигрывателе. И здесь можно только приветствовать выбор Sony, поскольку число бытовых проигрывателей, понимающих DVD-RAM, ограничено, а DVD-R/RW - родные почти для всех.
Совершенствование цифровых методов обработки изображений (появление алгоритмов сжатия MPEG-4 и WMV) привело к существенному снижению объема данных, которые нужно записать без заметной потери качества. Поэтому естественным было появление моделей камкордеров с использованием жесткого диска в качестве носителя видеоинформации. Корпорация Toshiba уже разработала прототип цифрового камкордера с микровинчестером размером с PC-карту. Samsung Electronics планирует выпускать цифровой камкордер с записью на встроенный жесткий диск в формате MPEG-4 и позволяет переносить изображения на компьютер. Мы уже писали о разработке фирмой Philips привода для малогабаритных (диаметром 30 мм) дисков Blu-ray, которые фирма рассматривает в качестве носителя для будущих моделей цифровых камкордеров.
Использование полупроводниковой памяти началось с фотокамер: поскольку емкость флэш-карт была мала, ее хватало только на неподвижные изображения. Удобство сменного носителя быстро оценили не только фотолюбители, но и изготовители видео. И практически сразу в цифровых камкордерах формата DV появились слоты для флэш-карт, на которые можно было записывать фотоизображения. Однако с увеличением емкости положение изменилось. И вот уже Panasonic предлагает модели, которые позволяют записывать видео в формате MPEG-4 на карточки памяти Security Digital (SD). Сейчас происходит сближение и взаимное проникновение фотокамер и камкордеров. Не только последние цифровые фотокамеры, но и мобильные телефоны и карманные персональные компьютеры (КПК или «наладонники») имеют функцию записи цифрового видео. КПК компании Sony могут записать до 120 минут видео на Memory Stick емкостью 128 МБ. Конечно, для записи цифрового видео хорошего качества и достаточной продолжительности при современных методах сжатия требуется емкость не менее 1 ГБ.
Характерный последний пример: карманная комбинированная фотовидеокамера Sanyo FVD-C1 - самый легкий в мире камкордер с записью MPEG-4 высокого разрешения на флэш-карту SD. Фото записываются с максимальным разрешением 3,2 мегапикселя, а информация хранится на SD-карте емкостью 512 МБ (входит в комплект). Если выбрано максимальное качество, соответствующее, по мнению фирмы, DVD (разрешение VGA 640х480, частота 30 кадров секунду), то на карту помещается до получаса видео. Если устраивает VHS-качество, то на карте умещается уже 80 минут видеозаписи. В режиме фотосъемки можно сделать 491 снимок в режиме 3,2 мегапикселя (2048х1536) или до 3931 снимка в режиме 0,3 мегапикселя (640х480).
Сменные флэш-карты удобны и еще по одной причине. Уже сегодня многие производители предлагают телевизоры и DVD-проигрыватели со слотами для флэш-карт, что позволяет осуществить просмотр слайдов или видеозаписи без копирования на другой носитель.
Вместе с тем необходимо отметить, что именно цифровой характер записи позволяет копировать ее и редактировать, используя компьютер и сохраняя при этом исходное качество. Практически все современные камкордеры с записью на DV оборудованы портами i.Link для передачи информации в компьютер или на DVD-рекордер. В случае использования в качестве носителя видео записываемых DVD или сменной флэш-карты осуществить его перенос в компьютер еще проще.
Запись на флэш-карту фото или видео в формате MPEG-4 или WMV уже практически реализована во многих моделях, основным препятствием их распространения остается ограниченная емкость памяти и высокая цена. Сегодня за сотню-другую долларов можно купить карту емкостью 512 МБ. Технологически уже возможно создание флэш-карты емкостью 4 ГБ и даже вдвое большей путем объединения чипов в одном корпусе, вопрос только в приемлемой для рынка цене.
Тем не менее создается впечатление, что производители искусственно сдерживают снижение цен на флэшки. Ведь появление малогабаритного дешевого твердотельного носителя ставит под сомнение дальнейшее существование и DV, и записываемых DVD. Значит — прощай, прибыли. И гиганты мировой индустрии заранее подготавливают плацдарм для отступления — HD-DVD. Причем пока даже не важно, будет ли это диск Blu-ray или какой-то другой. Важно, что это даст новое качество изображения, недоступное другим носителям.
Глава 9. Системы спутникового телевиденияКатегории систем СТВ
Системы спутникового телевидения (СТВ) могут рассматриваться с двух точек зрения: используемой технологии и оборудования, а также организационной структуры.
С технической точки зрения удобно разделить системы спутникового телевидения по типу пользователей. Большая часть телевизионных программ распределяется по спутниковым каналам следующим категориям пользователей:
Вещательные компании, принимающие передачи крупных телекомпаний и формирующие на их основе пакеты программ для распределения по наземным эфирным сетям. Электронный сбор новостей и передача готовых пакетов программ для эфирной ретрансляции также попадают в эту категорию.
- Головные станции систем кабельного телевидения, распределяющие принимаемые со спутника пакеты программ по кабельным сетям.
- Приемные станции коллективного пользования TV Receive Only или TVRO, обслуживающие небольшие группы зрителей.
- Индивидуальные (домашние) приемные системы Direct To Home (DTH), рассчитанные на использование одним лицом или семьей.
Три последние группы пользователей заинтересованы в использовании минимального количества антенн для приема максимального количества телевизионных каналов. Поэтому они всегда отдают предпочтение многопрограммным системам СТВ, позволяющим принимать на одну антенну, т.е. с одного спутника, не менее 10-15 программ.
С организационной точки зрения системы СТВ удобно подразделять в зависимости от участия оператора спутниковой системы в формировании пакета транслируемых программ. В этом случае основными категориями систем будут следующие:
- Оператор сдает в аренду или продает ресурсы спутниковой системы и не принимает никакого участия в формировании программ. Т.е. он просто транслирует чьи-то другие программы. В качестве примера можно привести системы "Астра", "Хьюз Галакси", "Евтелсат Хот Берд".
- Оператор также формирует программные пакеты и получает доход от размещения в них рекламы и платежей от операторов кабельных сетей за использование этих программ. Непосредственно со зрителей плата не взимается. Примером такой системы СТВ является "СтарТВ" на спутнике "АзияСат".
- Оператор спутниковой системы полностью формирует программный пакет и транслирует его в закодированном виде. Плата за пользование каналами взимается со зрителей напрямую с использованием оборудования авторизации доступа к сети. Зачастую также взимается плата с рекламодателей за размещение рекламы в каналах сети. В качестве примера можно назвать системы "ДирекТВ", "Би-Скай-Би" и НТВ+.
Методы формирования сигналов
Качество телевизионного изображения во многом определяется методами его формирования и передачи. В середине семидесятых, когда спутниковые системы передачи телевизионных программ только создавались, в них использовался аналоговый телевизионный сигнал, как и в наземном вещании. До настоящего времени большое число спутниковых систем по-прежнему продолжают использовать этот метод при передаче телевизионных сигналов. Однако, такой тип сигнала не очень хорош для спутниковых систем, и активизировались поиски новых, более совершенных методов трансляции. Весьма привлекательным было бы использование цифровых методов передачи, но из-за технических сложностей, в первую очередь из-за огромной полосы частот, требуемой для передачи стандартного телевизионного сигнала в цифровом виде, в то время это не представлялось возможным.
В связи с этим в начале восьмидесятых годов в Европе был разработан и принят комбинированный цифро-аналоговый стандарт, получивший название МАС (Multiplexing Analogue Components, т.е. мультиплексирование аналоговых компонент). Стандарт МАС нашел достаточно широкое распространение в европейских системах спутникового телевизионного вещания, но так и не смог завоевать серьезную нишу на рынке. Наконец, в конце восьмидесятых были разработаны алгоритмы сжатия цифрового видеосигнала, т.н. видеокомпрессии, на основе которого был принят широко используемый в настоящее время в спутниковом вещании стандарт MPEG-2 (Motion Picture Expert Group). Именно этот стандарт цифровой видеокомпрессии стал в последние несколько лет главной движущей силой бурного развития непосредственного спутникового вещания. На цифровое телевизионное вещание с использованием этого стандарта планируется постепенно перевести не только спутниковые, но и наземные эфирные и кабельные системы.
Таким образом, в настоящее время используются три вида передачи телевизионного сигнала: аналоговый, цифро-аналоговый и цифровой со сжатием.
Аналоговый метод
Стандартный телевизионный сигнал представляет собой электрический ток, изменяющийся во времени. Форма этих изменений повторяет распределение яркости и цвета на пути развертки изображения по строкам. Он также включает в себя различные синхронизирующие и управляющие сигналы, а также сигнал звукового сопровождения. Такой сигнал является аналогом изображения и называется комплексным телевизионным сигналом. Поступая на вход телевизионного приемника этот сигнал с помощью кинескопа и громкоговорителя, а также электронных систем, которые ими управляют, преобразуется в изображение и звук.
Телевизионный сигнал характеризует совокупность его параметров: число кадров в секунду, количество строк в кадре, длительность и форма синхронизирующих и гасящих импульсов, полярность сигнала, частота поднесущей звука, метод кодирования сигнала цветности совместно с сигналом яркости. Совокупность значений этих параметров составляет стандарт телевизионного сигнала.
Наиболее широко распространены стандарты с числом строк в кадре 625, частотой смены кадров 25 (50 полукадров) в секунду и частотой строчной развертки 15625 Гц. Однако в нескольких системах число кадров в строке составляет 525, а число кадров - 30 (60 полукадров) в секунду. Звуковое сопровождение обычно передается на частоте 5,5 - 6,5 МГц.
С появлением цветного телевидения возникла необходимость создания стандартов на передачу в дополнение к сигналам яркости и звука сигналов цветности. В настоящее время используются три системы цветного телевидения, различающиеся способом кодирования сигналов цветности: PAL, SECAM и NTSC. Все они совместимы с ранее действующими стандартами черно-белого телевидения и сигнал цветности добавлен к основному сигналу яркости. При этом черно-белый телевизор просто не воспринимает сигнала цветности.
Стандарт SECAM используется в странах Восточной Европы, России и во Франции. Система PAL - в странах Западной Европы и Ближнего Востока. Система NTSC распространена главным образом на американском континенте.
Цифро-аналоговый метод
Компромиссом между аналоговыми и цифровыми методами передачи телевизионного сигнала по спутниковым каналам стала цифро-аналоговая система МАС (Multiplexed Analogue Components - мультиплексирование аналоговых компонент).
Разработка и внедрение стандарта МАС явилось частью глобального европейского проекта EUREKA-95, который ставил своей целью формирование концепции единого стандарта для телевидения высокой четкости (ТВВЧ) и разработку полного комплекта оборудования для производства, обработки, передачи, приема и воспроизведения видеопрограмм как для профессиональных, так и для бытовых целей. Было предложено несколько модификаций этого стандарта, включая версии для телевидения повышенного качества (ТВПК) и ТВВЧ.
Во всех ныне используемых вариантах системы МАС применяется временное разделение аналоговых составляющих сигналов яркости и цветности. Это позволяет не только свести практически к нулю фазовые и перекрестные искажения видеосигнала, но и добиться сокращения спектра сигнала за счет применения систем его частичного сжатия.
Эти системы обеспечивают следующие, улучшенные по сравнению с традиционными аналоговыми системами, характеристики телевизионного вещания:
- Отсутствие перекрестных искажений сигналов яркости и цветности.
- Значительное снижение шумов в канале цветности.
- Передачу сигналов звукового сопровождения, синхронизации, телетекста и другой служебной и дополнительной информации в цифровой форме.
- Повышение разрешения (четкости изображения) за счет большей полосы частот сигналов яркости и цветности.
На основании базового стандарта МАС в различных странах было разработано несколько его версий для систем спутникового телевизионного вещания. Они различаются главным образом способами передачи цифровых и аналоговых сигналов.
Несмотря на заметное преимущество перед аналоговыми методами передачи телевизионной информации, стандарт МАС так и не смог завоевать значительной доли на рынке спутникового телевидения.
Во-первых, он по сути своей является компромиссным и не в состоянии полностью устранить все недостатки аналоговых систем. Качество изображения оказалось не намного лучше, чем в хорошо отлаженных аналоговых системах. А внедрение систем ТВПК и ТВВЧ, где стандарт МАС заметно выигрывал, сильно затянулось.
Во-вторых, установка декодеров МАС в приемники СТВ и обычные телевизионные приемники приводило к заметному повышению их стоимости, что отрицательно сказалось на спросе на них.
В-третьих, появление в каждой из стран своей версии стандарта МАС привело к появлению проблем несовместимости оборудования различных фирм. В результате, попытка создания единого стандарта привела к противоположному - появлению нескольких новых. В-четвертых, серьезный удар по стандарту МАС был нанесен весьма успешным выходом на европейский рынок системы многоканального СТВ "Астра", отказавшейся от использования технологии МАС. В результате, более дешевые приемники для этой системы стали весьма популярными и очень быстро система "Астра" смогла завоевать до 90% зрительской аудитории спутникового телевидения в Европе.
Существенный перелом на рынке спутникового телевидения произошел лишь после разработки чисто цифровой системы вещания, использующей технологию видеокомпрессии.
Цифровой метод
Возрастающие требования к качеству телевизионного вещания, подготовки программ и их сохранения, а также необходимость снижения расходов на всех этапах производства и трансляции, требуют разработки новых эффективных методов обработки и передачи телевизионных сигналов. Всем этим требованиям отвечает использование цифровых методов в телевидении.
Цифровое телевидение - область телевидения, в которой операции обработки, записи и передачи телевизионного сигнала связаны с его преобразованием в цифровую форму. Системы цифрового телевидения можно условно разделить на два основных типа:
1. Аналоговый телевизионный сигнал преобразуется в цифровую форму только для его цифровой обработки, сохранения телевизионной программы (видеозапись) или передачи их по каналам связи, а затем трансформируется назад в аналоговую форму. При этом используются существующие телевизионные передающие и ретрансляционные станции, и приемное оборудование.
2. Преобразование передаваемого изображения в цифровой сигнал производится непосредственно в преобразователе свет-сигнал (обычно видеокамера), а обратное преобразование - в преобразователе сигнал-цвет (телевизионном приемнике). Во всех остальных звеньях тракта телевизионная информация обрабатывается и передается в цифровой форме.
В настоящее время в основном применяются системы цифрового телевидения первого типа. Цифровые методы уже достаточно давно используются в профессиональном телевидении. Это, в первую очередь, цифровая обработка изображений, создание специальных эффектов, цифровая видеозапись и так далее. Цифровые методы начали также применяться в бытовой видеоаппаратуре.
А несколько лет назад, наконец, появилась цифровая система спутникового телевидения. Единственным аналоговым прибором в тракте остался телевизионный приемник. Однако внедрение цифровых методов в телевидении идет настолько быстро, что недалеко то время, когда весь телевизионный тракт станет цифровым. Главными факторами, влияющими на темпы перехода от аналогового телевидения к цифровому, являются время и средства, необходимые на модернизацию распределительных и вещательных сетей и замену огромного парка аналоговых телевизионных приемников цифровыми.
Глава 10. Телевидение высокой четкости (HDTV: High-Definition Television)Под телевидением высокой четкости (ТВЧ) понимают передача изображения с числом строк, приблизительно вдвое превышающим показатель у существующих стандартов, и форматом кадра (отношение ширины кадра к его высоте) 16:9. Объем информации содержащийся в каждом кадре ТВЧ изображения, возрастает в пять-шесть раз по сравнению с обычным телевидением. На ТВЧ изображении отсутствуют дефекты, свойственные принятым сегодня стандартам ТВ вещания, - недостаточная разрешающая способность, заметность поднесущей, перекрестные искажения сигналов яркости и цветности, мерцание изображения из-за недостаточно высокой частоты кадров, дрожание строк и т.д. ТВЧ обеспечивает существенное повышение качества ТВ изображения, приближая его восприятие к зрительному восприятию естественных, натуральных сцен и сюжетов. Такое радикальное улучшение качества изображения не может быть достигнуто ни модификацией существующих стандартных систем цветного ТВ, ни ТВ системами повышенного качества.
В США, Японии, европейских странах в последние пять-семь лет ведутся многочисленные разработки новых ТВ стандартов с улучшенным качеством изображения. Разработаны совместимые системы телевидения повышенного качества (ТВПК), в которых устранены наиболее характерные искажения ТВ сигнала, несколько увеличена разрешающая способность, введен формат изображения 16:9 (стандарты МАС, PAL-плюс).
HDTV (High Definition Television - Телевидение Высокой Четкости) - сегодня это самая передовая и высокотехнологичная область цифрового телевидения, сравнимая по своему значению с появлением цветного телевидения в 60-х годах 20 века. В буквальном смысле англоязычных аббревиатур - HDTV (High Definition Television) - это часть DTV (Digital Television).
HDTV поддерживает стандарты 1080i и 720p, обладает широкоэкранным 16:9 изображением, звуком Dolby Digital 5.1., соответственно, является наивысшей точкой развития телевизионных технологий.
Посредством HDTV обеспечивается доставка в каждый дом необыкновенно чистого, яркого и четкого изображения, практически совпадающего по качеству с 35-мм кинопленкой, и с многоканальным звуковым сопровождением.
Высокая четкость (HD) означает, что число линий и число пикселей в каждой линии телевизионной картинки существенно увеличены по сравнению с телевидением стандартной четкости (SD). В то время, как телевизионное SD-изображение передается с разрешением 720х576 пикселей, HD-изображение имеет разрешение 1920х1080 пикселей. Число элементов изображения, передаваемых за одну секунду, увеличено в 5 раз. Это позволяет существенно увеличить чистоту, четкость и детализацию изображения и объясняет тот восторг, который вызывает просмотр HDTV-картинки на высококачественных плоскопанельных дисплеях или на проекторах в домашних кинотеатрах.
Преимущества цифрового кодирования в телевидении очевидны: даже при приеме «цифры» на обычный телевизор качество изображения повышается из-за отсутствия искажений на различных этапах телевизионного тракта. При этом развертка луча остается чересстрочной и разрешающая способность экрана не возрастает. Для существенного повышения качества телеизображения необходимо ввести новые стандарты для формирования и приема видеосигнала, такой системой является телевидение высокой четкости (ТВЧ). Американский стандарт (ATSC) рассчитан на просмотр передачи как на телеэкране, так и на мониторе компьютера. При этом высокое качество картинки можно получить лишь на экране специального широкоформатного телевизора с 1080 активными строками, чересстрочной разверткой.
Для ТВ-приемников
Число активных строк – 1080;
Полевая частота, Гц. – 60;
Перемежение в развертке - (2:1) интерлейсинг;
Формат кадра - 16:9.
Для мониторов ПК
Число активных строк – 720;
Полевая частота, Гц. – 60;
Перемежение в развертке - (1:1) прогрессивная развертка луча;
Формат кадра - 16:9.
Согласно ATSC-стандарту, каждый ТВ-приемник должен декодировать любой из многочисленных (а всего их 18 разновидностей) ATSC-форматов и выводить его точно в соответствии с возможностями конкретного подключенного приемника.
Внешне цифровой приемник ТВЧ отличается от аналогового более широким экраном: если соотношение сторон обычного телевизора составляет 4:3 (ширина к высоте), то в цифровом варианте - 16:9. Качество телевизионного изображения заметно повышается за счет двукратного увеличения строк разложения и прогрессивной развертки (впрочем, развертка может быть и чересстрочной). При прогрессивной развертке яркость экрана может быть повышена на 40% . Количество воспроизводимых деталей на экране возрастает в несколько раз. В новой системе расширена частота сигнала яркости и цветоразностных сигналов, поэтому оптимизирована цветопередача. Многоканальная система передачи звука позволяет добиться эффекта присутствия, так как аудиоинформация поступает к зрителю с разных сторон.
Внедрение ТВЧ требует дорогостоящей модернизации аппаратно-студийного комплекса, но практика вещания в США показала, что уже сегодня число программ ТВЧ в общем времени цифрового ТВ постоянно растет.
Для просмотра телевидения высокой четкости потребуется цифровой спутниковый HDTV ресивер или HD-DVD плеер, а также телевизор у которого есть логотип HD TV или HD Ready. Такая техника появилось на российском рынке совсем недавно.
На российском рынке пока немного ТВ устройств, отображающих HDTV картинку полностью, без уменьшения разрешения. Одним из интересных вариантов как в плане цены, так и в плане возможности отображения картинки Full HD является телевизор ACER AT3705-MGW. MGW в названии означает MediaGateway - "ворота в мир медиа". Право так называться ему дает встроенный сетевой плеер.
Глава 11. Справочная информация и термины
Aspect Ratio - отношение ширины к высоте экрана. Соотношение 4:3 означает, что размеры по горизонтали на треть больше размеров по вертикали. Стандартный телевизионный размер 4:3 (или 1.33:1). Широкоформатные (widescreen) DVD и HTDV имеют соотношение 16:9 (или 1.78:1).
Bitrate - количество бит - характеристика скорости потока видео и/или аудио информации. Измеряется в тысячах килобит за секунду. Чем больше bitrate, тем больше места на диске занимает данная информация и, как правило, при этом улучшается качество изображения. Bitrate в 8000 kbit/s соответствует 1 мегабайту в секунду. Например, 60 секунд видео, закодированного с bitrate 8000 kbit/s, займет на диске 60 мегабайт.
Capture - Процесс захвата видео или ТВ сигнала на жесткий диск компьютера. Может выглядеть как захват с DV камеры через порт Firewire.
CBR - Constant Bit Rate. Постоянная скорость при кодировании - термин, применяемый для описания параметров кодирования в ряде вариантов MPEG формата и означает, что при кодировании в MPEG формат скорость получаемого на выходе кодера MPEG потока всегда постоянна и не зависит от вида кодируемой видеоинформации.
Codec – Сокращение от "compression/deccompression" (компрессия/декомпрессия). Кодеком называют алгоритм или специальную компьютерную программу позволяющую обработать (применить компрессию) и уменьшить размеры большого файла. Файл закодированный (компрессия) каким-либо кодеком, требует тот же кодек для декопмпрессии.
Component Video - компонентный видеосигнал. Метод обработки изображения, при котором сигнал цветности и сигнал яркости обрабатываются отдельно, в аналоговой или цифровой форме. Качество такой обработки выше, чем при композитном сигнале. Betacam - это аналоговый компонентный формат, D1 - это цифровой компонентный формат. Видео стандарт США - NTSC - это аналоговый композитный видео сигнал, D2 - это цифровой композитный формат.
Composite Video - композитный видео сигнал. Метод обработки изображения, при котором сигнал цветности и сигнал яркости обрабатываются вместе, в аналоговой или цифровой форме. Качество такой обработки ниже, чем при компонентном сигнале. Форматы S-VHS и VHS - это аналоговые композитные аппараты, D2 - это цифровой компрозитный метод. Формат Betacam - это аналоговый компонентный видео сигнал, D1 - это цифровой компонентный метод.
Compositing - композиция. Этот термин обозначает процесс сборки готовой графики или анимации из различных элементов, путем монтажа с видео магнитофонов, видео дисков или на цифровых композиционных аппаратах.
Compression - Процесс удаления избыточной информации для уменьшения занимаемого файлами места. Компрессия без потери качества позволяет восстановить оригинальные (первоначальные) данные, компрессия с потерей качества удаляет часть полезной информации для наилучшего сжатия размеров файлов и не позволяет восстановить оригинальные данные.
Convert - Преобразование одного формата в другой. Например DivX в MPEG, QuickTime в AVI, и т.д.
CSS - Content Scrambling System. В DVD-Video система шифрования предназначенная для защиты информации от копирования.
Deinterlace - Процесс объединения двух "половинчатых" полей кадра в одно поле. Применяется, например, для убирания артефактов черестрочного видео ("гребенка") при создании неподвижных изображений.
Encoding - Процесс перевода (кодирование) данных из одного формата в другой с помощью специальных кодеков. Данные - обычно файл содержащий аудио, видео или слайды (неподвижные изображения). Чаще всего применяется для достижения совместимости с различным оборудованием, например DVD плеерами, или для уменьшения места занимаемого файлами.
Field - В черестрочном видео половина полного кадра (Frame) называется полем (field), называемым также Field A или Field B. При работе с черестрочным видео, особенно при кодировании, очень важно знать порядок следования полей, т.е. какое поле идет первым A или B. Если указать неправильный порядок следования полей, то полученное видео будет мерцать. В стандарте NTSC развертка осуществляется с частотой 60 полукадров в секунду, а в формате PAL - с частотой 50 полукадров.
fps - (frames per second) - кадры в секунду.
Frame - кадр. Единица видео изображения. Если видео чересстрочное (Interlace) кадр состоит из двух чересстрочных полей (полукадров), если видео с прогрессивной разверткой, то кадр формируется построчной разверткой. Количество линий в кадре зависит от TV системы - в системе PAL используется 625 строк, а в NTSC 525 строк.
High Definition Television - High Definition Television, телевидение высокой четкости в сочетании со звуком Dolby Digital Surround (AC-3). Для HDTV необходимо новое оборудование как для передачи, так и для приема пользователями. Более высокое разрешение является изюминкой HDTV. Изображение в 720 или 1080 линий не идет ни в какое сравнение с изображением в 525 (NTSC) или 625 (PAL) линий!
Форматы используемые в HDTV:
720p - 1280x720 точек. прогрессивная развертка
1080i - 1920x1080 точек. чересстрочная развертка
1080p - 1920x1080 точек. прогрессивная развертка
Interlace - Черестрочное изображение. Т.е. каждый кадр такого изображения формируется из двух полей. Сначала на экран выводятся нечетные линии изображения, затем четные. Каждый набор нечетных/четных линий называется полем.
Lossless Compression - Технология сжатия позволяющая восстанавливать исходные данные без потерь.
Lossy Compression - Технология сжатия позволяющая получить высокую компрессию за счет полного удаления части информации, сохраняя при этом как можно больше полезной информации. Использует особенности человеческого восприятия, при котором часть информации может быть утрачена без заметного на глаз ухудшения качества.
Noise - Шум. Ошибочная информация в сигнале приводящая к ухудшению изображения. Преимущество цифровых форматов перед аналоговыми заключается в том, что такие помехи можно полностью удалить, между тем появление шума возможно при компрессии.
Progressive Scan - Система развертки которая показывает все линии кадра за один проход.
Quantisation - Процесс удаления избыточной информации из видеопотока и управления компрессией.
Resolution - Размер изображения. Обычно указывается как размер ширины и высоты.
RGB - (Red, Green, Blue) - сокращение, обозначающее цветовую схему видеосигнала. Реально видимый оттенок на экране определяется соотношением трех основных цветов Красного, Зеленого и Синего.
Список литературы
Источники интернета:
http://ru.wikipedia.org - Википедиа - проект свободной многоязычной энциклопедии;
http://www.ixbt.com/divideo/codex-psnr.shtml - Сравнение видеокодеков при помощи метрики PSNR;
http://www.compression.ru/video/codec_comparison/ - Проведенные в МГУ сравнения видеокодеков;
http://zoom.cnews.ru/ru/publication/index.php?art_id80=343 - Разбираемся с форматами цифрового видео;
http://www.techdeal.ru/ - Системы безопасности;
http://www.stereo.ru/whatiswhat.php?article_id=225 -Носители цифрового видео;
http://www.compress.ru/Archive/CP/1999/10/16/#01 - Методы сжатия цифрового видео;
http://www.bhv.kiev.ua/books/book.php?id=8&book_id=225&content=2 – Краткий самоучитель работы на персональном компьютере (Глава 8: Звук, видео и графика);
http://broadcasting.ru/wiki/index.php - Энциклопедия@Broadcasting.ru;
http://www.mteleport.ru/print.aspx?id=19&tb=1 - Системы спутникового телевидения;
http://www.refodrom.ru/satellite_tv_the_author_marchuk_av/s/44439/1.7.html – Спутниковое телевидение;
http://www.diapaz.kz/source/tv_format.html – Форматы видеозаписи;
http://www.svcd.ru/docs/glossary/ - Глоссарий;
http://www.ovideo.ru/articles.htm – Статьи о видео;
http://itc.ua/article.phtml?ID=6185&IDw=45&pid=20 – Цифровое видео: обзор форматов;
http://rus.625-net.ru/625/1993/03/videom.htm – Видеомонтаж;
http://www.stereo.ru/whatiswhat.php?article_id=342 - Остановись, мгновенье! Ты прекрасно! (Часть вторая);
http://www.stereo.ru – Stereo&Video.
... 1 Общая характеристика программно-аппаратного комплекса записи видео MIRO VIDEO DC30. Плата MIRO VIDEO DC30 при цене менее чем в 1,500 долларов эта система позволяет уже вполне профессионально работать с видео даже в студийных условиях. Благодаря использованию режима PCI Bus Master достигается пропускная способность до 6 Мбайт/с, что позволяет работать с коэффициентом сжатия 3,5:1 для полного ...
... съемкой и т.д. Во-вторых, съемка не требует никакого программного обеспечения, а аппаратных вопросов, и тем более творческих, я в рамках статьи даже начинать не собираюсь. 1.3. Программы обработки видео Начнем с конца, поговорим о плеерах. В систему Windows уже встроен мощный проигрыватель, но требовательные пользователи предпочитают использовать другие, которые либо имеют больше настроек, ...
... курсовой работы достигнуты такие результаты: 1. Разработана информационная система «Архив online видео». 2. Получены практические навыки в создании Web‑сайтов средствами скриптового языка PHP. 3. Получены практические навыки самостоятельной постановки и решения задачи разработки архива flv файлов. 4. Усвоены методики формализации данного типа задач. ...
... компаний начал разработку нового телевизионного стандарта HDTV, а сегодня уже несколько телевизионных станций в Нью-Йорке вещают в этом современном формате. Рассмотрим, что это такое. Итак, аббревиатура HDTV означает High Definition Television, то есть, в переводе на русский, телевидение высокой четкости. Тот, кто хотя бы один раз увидит отрывок какой-либо телепрограммы в формате HDTV, сразу ...
0 комментариев