К вопросу оценки ПЭМИН аналогово-цифровых сигналов. Видеоинформация.

К вопросу оценки ПЭМИН аналогово-цифровых сигналов. Видеоинформация.

К вопросу оценки ПЭМИН аналогово-цифровых сигналов. Видеоинформация.

Автор: Кондратьев А.В.

С этой формой существования информации положение дел во многом такое же, как и с аудиоинформацией. В том числе – для аналоговой форма телевизионного сигнала существуют (хотя и прилично «забытые») и нормы и методики. Из обращения они не выведены и действуют по сей день.

Рассмотрим, кратко, формы существования видеосигнала, их особенности, существенные для проведения СИ технических средств, такую информацию обрабатывающих.

Сразу отметим, что в аналоговой форме видеосигнал, в настоящее время, существует разве что в ограниченном числе цепей в видеокамерах. Причём и там – максимум, на «материнской плате» (ПЗС матрица и первичное усиление сигнала) и нигде более. Фактически – только при съёме сигнала с матрицы и его первичном усилении. После этого он немедленно оцифровывается, сжимается (компрессируется) одним из типовых кодеков и, далее, вся обработку ведётся уже в цифровой форме.

Поэтому сами по себе знания об аналоговом «полном телевизионном сигнале» носят уже чисто базовый характер. Тем не менее – это полезно.

Итак, термин «полный телевизионный сигнал» - ПТС обозначает собственно видеосигнал для каждой из строк телевизионного кадра в аналоговой форме смикшированный со строчными и кадровыми синхроимпульсами. Собственно, для классического аналогового телевидения выглядит это так (рис. 16.1):

ris16-1.jpg

Для нас наиболее важным является следующее. Если принять максимальный уровень синхросмеси (амплитуды синхроимпульсов) за – 100 %, то максимальный уровень видеосигналов (уровень чёрного), соответствующий минимуму синхросмеси – 75 %; минимальный уровень видеосигналов изображения (уровень белого) составляет от 10 до 12 % полной амплитуды.

Как указывалось выше, в огромном разнообразии моделей современных телекамер транспортировка видеосигнала в аналоговой форме (по линиям, как основным источникам ПЭМИН) практически не применяется. Сигнал немедленно оцифровывается, компрессируется одним из видеокодеков и транспортируется уже только в такой форме.

Однако, для полноты картины рассмотрим аналоговый ПТС с точки зрения его возможного ПЭМИН.

Итак, имеем строго линейчатый спектр, обусловленный частотой следования строчных и кадровых импульсов и сплошной спектр, в общем случае стохастического видеосигнала в промежутке между ними (для тест-режима видеосигнал статичный). Если рассматривать одну строку, то всё так и есть. Как только мы начнём рассматривать несколько строк (в пределе – полный кадр) придётся учитывать, что видеосигнал двух соседних строк отличается мало (как правило, хотя для некоторых видов изображения. это совсем неверно. Для неподвижного изображения существует однозначный его повтор с частотой кадров). Тем не менее, в среднем, такое допущение может существовать. Следствием этого является «сдвиг» общего вида составляющих спектра в сторону более «линейчатого» его характера.

Таким образом, при измерениях по утверждённой методике, то есть узкополосным приёмником с большим периодом измерения и статичным тест-сигналом, спектр должен иметь линейчатый или сплошной характер только в зависимости от установленной полосы пропускания приёмника (более это ни от чего не зависит принципиально).

Отдельные частотные составляющие спектра должны быть кратны кадровой и строчной частотам (зависит от применённого видеоформата). Причём если начать рассматривать цветное изображение, то есть с наличием цветовых «поднесущих», то учитывая их «размещение» между гармониками строчной частоты, спектр становиться ещё «более сплошным». Причём это справедливо для PAL, SEKAM и NTFS систем передачи цвета. В общем и целом следует ожидать спектра, приведённого на рисунке 16.2

ris16-2.jpg

Несложно видеть, что сплошной или линейчатый спектры будут регистрироваться средством измерения, зависит только от полосы пропускания приёмника.

Тест-сигнал для типового случая – горизонтальная «зебра» из чёрных (максимальная амплитуда видео компонент) и белых (минимальная амплитуда видео компонент) полос. Для лучшего опознавания – разной ширины (высоты). Соответственно, уровни (точнее – разность уровней) ПЭМИН на «тёмных» и «белых» полосах и будет представлять собою информативную часть общей энергии ПЭМИН (поскольку энергия ПЭМИН «синхросмеси» постоянна и не зависит от собственно видеосигнала).

«Шаг» гармоник строчной частоты (как, впрочем, и кадровой) будет зависеть от выбранного видео формата и должен уточняться конкретно.

Учёт повторяемости изображения уже заложен в «нормах защищённости», так что об этом уже можно не думать (в отличии от «компьютерных устройств отображения информации).

Собственно, это всё, что можно (и допустимо) сказать об особенностях СИ аналогового видеосигнала. Если где-то по ходу тракта передачи используется «посадка» ПТС на некую ВЧ-несущую, то такой сигнал и исследуется и измеряется как сигнал радиочастотный с модуляцией (амплитудной или угловой). Рассмотрение такого сигнала достаточно тривиально и описано в соответствующей методике.

Рассмотрим, далее, заметно более распространённую сегодня форму существования видеоинформации в цифровом, скомпрессированном виде.

Можно было бы довольно долго рассматривать различные видеокодеки, их преимущества или недостатки. Но к рассматриваемой нами проблематике это не имеет, фактически, никакого отношения. Но вот что, пожалуй, сказать нужно.

Как показывает практика, вокруг обозначений MPEG-4 и DivX (и аналогичных) всегда образуется много путаницы. Наиболее часто встречающееся заблуждение, то что Avi, DivX и MPEG-4 — это одно и то же.

Так вот, истина заключается в том, что существуют кодеки и существуют «контейнеры»
*.AVI и *.MKV — это контейнеры (форматы файлов), или другими словами хранилище и упаковка данных. В то время как DivX или XviD — это кодеки, то есть способы и реализация сжатия для записи видеоданных в файл, и расшифровки информации, соответственно, для воспроизведения уже записанных файлов. MPEG в свою очередь описывает и кодеки и способы хранения.

Контейнер позволяет объединять различные мультимедийные потоки (в большинстве случаев аудио и видео) в один файл. Примеры известных мультимедийных контейнеров:

  • AVI (*.avi);
  • MPEG (*.mpg, *.mpeg);
  • OGM (*.ogm);
  • MP4 (*.mp4);
  • Realmedia (*.rm, *.rmvb);
  • Matroska (*.mkv).

Таким образом, получается, что для того, чтобы вести СИ именно видеоинформации и при этом пользоваться контейнером, как тест-сигналом, необходимо позаботится, чтобы в нём отсутствовал аудиопоток. В принципе, в любом редакторе для нелинейного видеомонтажа это выполняется без проблем, но не забыть это – необходимо (теоретически возможно и «обратное» заполнение контейнера для отдельного СИ некого видеотракта, только аудио без видео).

Приведём краткие сведения об основных применяемых форматах – контейнерах (источник – сеть интернет):

Контейнер Audio Video Interleave (AVI)

Во времена широкого распространения Windows 3.1x компанией Microsoft был создан контейнер AVI для хранения синхронных аудио-видео данных. AVI — это аббревиатура от Audio Video Interleave (чередование аудио и видео). AVI является формат-контейнером, который может содержать видео/аудио данные, сжатые с использованием разных комбинаций кодеков. Так, если файлы MP3 и JPG получены с использованием только одного вида компрессии данных (MPEG Audio Layer 3 и JPEG), то AVI-файл может содержать различные виды компрессированных данных (например, DivX для видео и MP3 для аудио). Все AVI файлы выглядят одинаково «снаружи» (имеют расширение .AVI), но «внутри» они могут существенно отличаться. С момента создания AVI прошло много времени, и сегодня это наиболее общеизвестный формат для представления видео. Все программные плееры умеют с ним работать. И если не предъявлять к нему жестких требований, он и сейчас еще справляется со своими функциями. Однако он не поддерживает VBR аудио-потоки (т.е. с переменным битрейтом, дающим лучшее качество). Переменный битрейт MP3 несколько лет назад удалось втиснуть в AVI с некоторыми ухищрениями (требуется избыточное место для синхронизации, плюс иногда возникают проблемы), однако звук в формате Ogg Vorbis он не поддерживает.
С контейнепом AVI могут работать все Windows-программы для кодирования.

Контейнер Ogg Media Streams (OGM)

Является частью проекта Ogg по созданию полностью открытой системы мультимедиа. Позволяет разместить любой видео поток (например, сжатый кодеком DivX или XviD), и звук в формате Ogg Vorbis. Также OGM может содержать и MP3 трэки.
У контейнера OGM есть 2 основных преимущества по отношению к стандартному AVI: 
Первое - это перемотка. Она стала мгновенной. Не нужно больше ждать, глядя на черный экран, пока снова не начнется проигрывание видео, или наблюдать убыстренное видео, пытающееся синхронизироваться с аудио потоком.

Второе - меньшие потери мультиплексирования. Например, для двухчасового фильма с аудио дорожкой VBR MP3, контейнер AVI требует ~6,7Mb на синхронизацию аудио и видео. При использовании контейнера OGM эти потери составят ~2,4Mb. Это означает, что более 4Mb пойдет на увеличение битрейта видеопотока. И, что интересно, при добавлении второго аудиотрэка в формате Ogg, дополнительные потери на микширование составят 0Kb. 
Также среди достоинств формата - встроенная коррекция ошибок, что дает возможность без особого риска записывать видео в этом формате на CD, используя Mode 2 (в этом режиме на стандартную 700Мб болванку влезает 795Мб). (m2cdmgui doom9.org).
В контейнер OGM может упаковывать, например, VirtualDubMod.


Контейнер Matroska (MKV)

Проект Matroska (Матрёшка) - это открытый формат контейнера, стремящийся предложить множество передовых возможностей, с которыми такие старые форматы как AVI не могут справиться. Например, Matroska поддерживает хранение аудио содержимого с переменным битрейтом (Variable Bitrate - VBR), переменную частоту смены кадров (Variable Framerate - VFR), субтитры, главы, прикрепление файлов, обнаружение ошибок (EDC) и современные аудио-видео кодеки, такие как "Advanced Audio Coding" (AAC), "Ogg Vorbis" или "Realvideo 9/10" (RV9/10), которые AVI не поддерживает.

Файлы matroska имеют следующие расширения:

*.mkv: как правило, видео файлы (с аудио или без);

*.mka: только аудио файлы, может содержать любой из поддерживаемых аудио форматов, такие как MP2, MP3, Vorbis, AAC, AC3, DTS...;

*.mks: так называемые «элементарные» matroska потоки, содержащие потоки субтитров в форматах SRT, SSA, ASS и Vobsub.

Для проигрывания файлов, упакованных в Матрёшку, необходимо установить в систему Matroska Splitter - фильтр, который делит содержимое контейнера на потоки (аудио, видео, субтитры) во время воспроизведения.

Для упаковки видео в контейнер MKV можно использовать:

  • VirtualDubMod
  • MkvToolnix
  • Avi-Mux GUI

Контейнер MPEG-4 (MP4)

Формат контейнера, разработанный группой MPEG. Предусматривает не только хранение аудио и видео, а ещё и анимированного/интерактивного содержимого (так же известного как BIFS). Не вдаваясь в технические детали, стандарт MPEG-4 системы определяет широкий ряд мощных инструментов, которые делают возможными различные виды анимации (не только схожие с flash анимацией, но и подобные тем, что были использованы в фильмах «Toy Story» и «Finding Nemo») или интерактивность (например, DVD меню и интерактивные потоковые меню). Всё это может быть сделано в 2D и 3D. Для воспроизведения системных файлов, содержащих интерактивное содержимое, Вам понадобится специальный проигрыватель. Самые популярные для 2D систем: GPAC's Osmo4 и EnvivioTV. Для 3D систем посмотрите здесь. Однако все они пока находится в стадии разработки и не особенно пригодны для широкого использования. Для проигрывания mp4 файлов, содержащих лишь аудио и видео потоки, можно воспользоваться почти любым медиапроигрывателем. Однако, для проигрывания mp4 файлов необходимо установить в систему mp4-сплиттер. Он, также как и Mpeg4 видео декодер для mp4, входит в состав пакета Nero версий 6.6 и выше. Поэтому, если Nero установлен на Вашей машине, Вы вполне можете смотреть видео в mp4.
Звуковая дорожка в MP4 может быть моно, стерео и многоканальной, аналогично используемым в DVD. Поддерживаются форматы звука: MP3, Ogg Vorbis, WMA, AAC, VQF, AC3 и другие.

Файлы mp4 имеют следующие расширения:

  • *.mp4: единственное официальное расширение, как для аудио, так и видео файлов (а также интерактивного содержимого).
  • *.m4a: предложено Apple для аудиофайлов, закодированных кодеками aac/alac. Может быть без проблем переименован в .mp4.

Также встречаются:

  • *.m4p: файлы, имеющие DRM защиту, разработанную Apple, и продаваемые через сервис iTunes;
  • *.m4e: переименованные .sdp файлы, используемые Envivio для потокового воспроизведения.
  • *.m4v, *.mp4v, *.cmp, *.divx, *.xvid: так называемые raw файлы, содержащие видео, не находящееся ни в каком контейнере.
  • *.3gp, *.3g2: используются в мобильных телефонах, могут содержать контент, не декларированный для mp4.

Для упаковки медиапотоков в контейнер mp4 можно воспользоваться программами:

- MP4Box (рекомендуется использовать GUI Yamb) Для установки просто распакуйте MP4Box и Yamb в одну папку. Запускающим файлом является Yamb.exe. 

Для кодирования видео в контейнер mp4 можно воспользоваться программами:

- Nero Recode 2 (входит в пакет Nero Vision Express, так же как и медиаплеер Nero Show Time2, хорошо работающий с контейнером mp4).

Что же важно, какой вывод должен сделать специалист в области СИ, ознакомившись с приведённой информацией по видеоформатам и их «носителям».

Пока существует такое изобилие видеокодеков и контейнеров мала вероятность, что удастся как-то стандартизовать требования «под СИ» для разнообразных средств видео. А ведь есть ещё несколько весьма специфичных кодеков, которые применяются только в системах видеоконтроля, причём с IP трактами передачи.

Пользуясь теми же принципами, которые декларировались при рассмотрении аудиотрактов, постулируем, что компрессированный видеосигнал становится, практически, безизбыточным. Тогда появляется основание рассматривать его точно так же, как «цифровой» сигнал вообще (алфавитно-цифровой). Значит, точно так же можно рассматривать его как рассматриваются такие сигналы в методике для универсальных цифровых сигналов.

Понятно, что необходимо учитывать повторяемость информации (для статичных и большей части динамичных кадров это вполне справедливое допущение). И не остаётся иного выхода (до появления специализированных НМД), как делать это так же, как это делается для устройств видеоотображения ПЭВМ (в соответствующей методике).

Соответственно, точно так же, как для аудиотрактов, перед проведением СИ необходимо выделить участки с последовательным кодированием, как наиболее «опасные» с точки зрения возникновения ПЭМИН. Выяснить ожидаемую тактовую частоту кодовых посылок (импульсов, потенциалов или переходов тока. Последнее – наиболее вероятно). И выявлять, измерять ПЭМИН этих сигналов, рассчитывая результаты по методике 2005 года. Лишний раз напомним, что спектры сигналов и ожидаемые области частот их обнаружения никак не зависят от того, что это видеосигнал, зато всецело зависят от типа интерфейса, по которому они передаются.

Несколько иначе нужно рассматривать ситуацию при наличии в тракте современных скоростных внешних интерфейсов, например – HDMI. Это может встретиться на участках тракта перед устройством отображения (монитор, телевизор, видеопроектор), там, где сигнал уже не компрессирован, где он аналогичен ПТС, но в «цифре». Именно при передаче видеосигнала этот интерфейс сейчас используется наиболее широко и его стоит рассмотреть несколько подробнее. Указанный интерфейс базируется на протоколе передачи данных TDMS. Этот же протокол является основой для дисплейного интерфейса DVI.

В протоколе TMDS, на каждый цветовой канал отводится по восемь битов, что позволяет получить 256 уровней яркости каждого базового цвета. Если перемножить 256 уровней у трёх цветов, то мы получим 16,7 миллиона оттенков.

Графический чип создаёт информацию о цвете для каждого пикселя в 24-битном потоке (8 битов на цвет). Поток параллельных данных поступает на передатчик протокола TMDS, который преобразует его в три последовательных потока, передающихся по трём физическим симметричным парам одновременно. Когда сигнал поступает на приёмник (в мониторе), то его последовательный код вновь преобразуется в параллельный. Преобразование в последовательный сигнал для передачи по кабелю необходимо, поскольку последовательная передача менее подвержена помехам, чем параллельная, особенно на больших расстояниях. Таким образом, данный цифровой поток, являясь «трёхразрядным», в силу полной синхронности фронтов в каждом цветовом канале (формируется в одном кристалле, от одного тактового генератора), рассматривается как последовательный одноразрядный.

TMDS-передатчик (Transition Minimized Differential Signaling) отсылает последовательный сигнал по четырём разным каналам (проводникам) кабеля: один для тактового сигнала, а три - для цветовой информации. Восемь битов информации для каждого цвета передаются в последовательном 10-битном сигнале: восемь битов для цветовых данных, а также два служебных. Данные передаются в 10 раз быстрее тактового генератора из-за использования ФАПЧ-чипа (ФАПЧ – фазовая автоподстройка частоты), работающего как умножитель частоты. Таким образом, скорость 1,65 Гбайт/с достигается при номинальной тактовой частоте 165 МГц.

ris16-3.jpg

Протокол TMDS построен на минимизации числа переходов от «0» к «1» (и наоборот), что позволяет надёжнее передавать информацию по медному кабелю. Минимизация числа переходов делает тракт менее чувствительным к внешним помехам и снижает уровень ПЭМИН.

ris16-3-2.jpg

Такое построение (кодирование) информации в линии передачи (кабеле к монитору) усложняет задачу создания тест-режима с постоянной тактовой частотой переходов от «0» к «1» в кабеле. Для теста, априори, исходя из структуры интерфейса, необходимо либо кодировать цвет в каждом пикселе последовательностью «10101010», либо применять иные методы. В противном случае из-за непостоянной частоты следования переходов нельзя будет применять установленный метод расчёта результатов.

При использовании типовой программы «Сигурд-Тест» возможен один такой вариант, не требующий изменения этой тест-программы. Учитывая, что в стандартном тесте чередуются белые и чёрные пиксели, а белый пиксель это код RGB 255-255-255 (FF;FF;FF), то в цифровом потоке передаётся три байта единиц. Для кодирования TDMS это 30 тактов без переходов тока. В этом протоколе такой случай рассматривается особо.

Если к проводу долгое время подводится ток (относительно долго, поскольку скорости передачи очень высоки), то перед его спадом должно пройти определённое время. В таких случаях могут возникнуть проблемы передачи, к примеру, если длительное время будут передаваться одни единицы (состояние "1" = есть ток, одно направление), а затем поток данных прервётся одним нулём (состояние "0" = нет тока). В зависимости от качества медного кабеля, этот нуль можно потерять. В результате один из пикселей будет отображён неверно. Специально вводимый для такого случая бит DC-Balancing указывает на обычную инверсию значений восьми битов, чтобы предотвратить длительную передачу одинаковых данных по кабелю.

Таким образом, мы получаем для такой информации (сплошные единицы или сплошные «нули») передачу «пакетов» нулей и единиц с одним переходом от «0» к «1» или наоборот на границе пакета (то есть инверсию каждого второго пакета). Следовательно, получается постоянная тактовая частота сигнала в кабеле интерфейса, близкая к значению 130÷165 МГц (то есть к максимальной частоте передачи пикселей-пакетов). Следует отметить, что за счёт некоторых особенностей протокола частоты режима «пиксель через пиксель» и просто «белый экран» отличаются приблизительно на 4-6%, оставаясь постоянными.

ris16-4.jpg

Один из наших коллег, разбираясь с интерфейсом DVI, предложил использовать для «заливки» экрана (тест-символ) комбинацию RGB 170-85-170. По результатам его разбирательства с кодированием в TDMS получалась физическая последовательность 0011001100110011..... Таким образом, тактовая частота токовых переходов в физической линии оказывается постоянной и вдвое ниже, чем скорость передачи данных. Данное утверждение требует дополнительной проверки, однако является хорошей «отправной точкой» :) .

Расчёт результатов СИ от DVI интерфейса при таком тест-режиме уже не вызывает никаких трудностей (подробное рассмотрение расчёта и значений всех параметров расчётного соотношения выходит за рамки данной публикации). Уровень ПЭМИН от образца к образцу довольно сильно разнится, что связано, по всей видимости, с качеством и симметрией пар в интерфейсном кабеле.

Разрешение монитора (или любого иного средства отображения в видеотракте) во время проведения СИ рекомендуется устанавливать не выше 1600*1280 (при 60 Гц кадровой частоты), чтобы не включался второй канал интерфейса. Процедура СИ в режиме параллельной работы двух каналов дополнительно усложняет интерпретацию результатов СИ.

Вот то, что можно сформулировать на сегодняшний день в отношении спецсвойств разнообразных трактов передачи видеоинформации и подходов к их специальным исследованиям.

ПОСМОТРЕТЬ
КАТАЛОГ