Внедрение информационных технологий в начале XXI века в основном опреде-
ляется научными и практическими результатами развития техники цифровой
обработки сигналов, обеспечивающей решение задач обработки, сокращения из-
быточности сигнала и передачи и приема информации в реальном масштабе
времени.
Целью данной книги является подробное изложение современных достиже-
ний теории и практики видеоинформационных систем, реализующих цифровое
кодирование и передачу динамических изображений, речи, звука, иных данных
по каналам с различной пропускной способностью (видеотелефон, стационарная
и мобильная видеоконференцсвязь, многофункциональные интерактивные теле-
визионные системы, радиолокационные системы и пр.).
Авторы книги - доктор технических наук, профессор Дворкович Виктор Пав-
лович и его сын, доктор технических наук, профессор Дворкович Александр
Викторович - хорошо известны специалистам большим вкладом в разработку
систем и средств цифровой и компьютерной обработки изображений, а также
метрологического обеспечения аналогового и цифрового телевизионного вещания.
С 2000 г. деятельность авторов связана с созданием принципиально новой
системы мультимедийного вещания, получившей название РАВИС (RAVIS
Realtime AudioVisual Information System). Результаты разработки системы РАВИС
отражены во многих научных статьях, в 18 вкладах России в Международные ор-
ганизации ITU и CEPT. В ходе разработок высокоэффективных систем кодиро-
вания изображений было сделано более 10 изобретений, защищенных патентами.
Наряду с научной работой Дворковичи ведут активную научно-преподаватель-
скую деятельность (Виктор Павлович - профессор МГТУ им. Н.Э. Баумана,
Александр Викторович - профессор МЭИ), они авторы и соавторы ряда учеб-
ных пособий.
Авторы книги определяют в качестве важнейшей проблемы создания в России
современных эффективных систем цифровой обработки, кодирования, передачи,
приема изображений различного разрешения, звука и других видов информации
полное овладение теорией и математическими методами обработки этих видов
информации при использовании имеющихся отечественных и зарубежных мате-
риалов в качестве данных, задающих общее направление работ.
Внедрение видеоинформационных систем и их практическое использование
послужит началом реализации планов обучения высококлассных специалистов
данного профиля. В области организации науки и подготовки кадров важнейшим
является использование научно-исследовательских центров по видеоинформаци-
онным проблемам, обладающих необходимым научным и техническим потен-
циалом для решения как фундаментальных проблем обработки сигналов, так
и широкого круга прикладных задач.
Предлагаемый авторами материал книги дает возможность понять, с какими
проблемами сталкиваются специалисты - разработчики цифровых систем обра-
ботки и передачи аудиовизуальной информации.
Следует отметить главное, что подтверждает актуальность издания этого
материала, - важность мировой практики перехода к цифровым технологиям
в телекоммуникационных средствах передачи сигналов по каналам связи, назем-
ного и спутникового вещания.
В первых двух разделах последовательно и подробно рассмотрены вопросы
цифрового преобразования статических и динамических изображений, оценива-
ются объемы информации при преобразовании в цифровую форму изображений
различного разрешения, приводятся результаты исследований статистической
и визуальной избыточности изображений, излагаются методы и алгоритмы эф-
фективного энтропийного кодирования различных видов информации, оценива-
ются возможности использования визуальной избыточности изображений для
сокращения объемов передаваемой информации.
Следующие четыре раздела посвящены изложению методов кодирования изоб-
ражений, включая их кратномасштабную обработку. Особое внимание уделяется
оптимизации методов поиска векторов движения, дополнительным возможно-
стям компенсации движения деталей в динамических изображениях, подробно
изложены методы кодирования статических изображений JPEG и JPEG-2000,
систем кодирования динамических изображений MPEG-1, MPEG-2, MPEG-4,
а также наиболее эффективного стандарта кодирования - H.264/AVC, анализи-
руются основные характеристики и основные стандарты цифрового кодирования
речи, алгоритмы кодирования высококачественного звука, приведенные в стан-
дартах MPEG-1, MPEG-2, MPEG-4, Dolby AC-3. Рассмотрены также проблемы
подавления акустического эха в системах телеконференцсвязи.
Следующие три раздела посвящены анализу основных методов модуляции
и помехоустойчивого кодирования цифровой информации, приводится достаточ-
но подробное описание систем многочастотной OFDM-модуляции, основных со-
временных стандартов вещания видео- и аудиоинформации. Основное внима-
ние уделено изложению европейских стандартов цифрового телевидения DVB-
T/DVB-T2, DVB-S/DVB-S2, DVB-C/DVB-C2, а также отечественной мультиме-
дийной системе РАВИС и проблемам реализации систем видеоконференцсвязи.
Следует подчеркнуть, что отличительной особенностью данной книги являет-
ся то, что она написана не сторонними исследователями приведенного объемного
материала, а непосредственными разработчиками математических методов и ап-
паратных реализаций соответствующих систем.
Естественно, что участие в решении этих сложных задач и накопленный при
этом опыт не могли не вызвать интереса к их анализу и систематизации, посколь-
ку очевидно большое практическое значение таких работ. Это особенно важно
в настоящее время - время неотвратимости слияния телекоммуникационных
и компьютерных технологий.
Стремление авторов помочь читателям разобраться в весьма сложных пробле-
мах цифровой обработки информации, значимости и эффективности стандартов
кодирования и передачи аудиовизуальной информации является особенностью
данной книги.
В этом фундаментальном труде авторов удивительно сочетается множество
факторов, придающих ему исключительную значимость для дальнейших иссле-
дований и практического использования.
Книга, безусловно, будет способствовать активному внедрению цифровых те-
лекоммуникационных систем и, с учетом широкого использования при этом ком-
Вступительное слово академика РАН А.С. Бугаева 15
пьютерных технологий, заинтересует не только специалистов в областях кодиро-
вания и передачи аудиовизуальной информации, но и в других областях знаний.
Поскольку в книге весьма полно отражены проблемы, обсуждению которых
она посвящена, анализируется обширная литература по данным вопросам, пред-
лагаются оригинальные решения, способствующие развитию науки и достиже-
нию эффективных результатов развитии новых перспективных технологий, она
может быть отнесена к категории монографий.
Председатель экспертного совета
по электронике, измерительной технике,
радиотехнике и связи, академик РАН
А.С. Бугаев
Предисловие
Технической основой создаваемой в России информационной среды становятся
современные видеоинформационные системы. Они обеспечивают цифровую пе-
редачу динамических изображений, речи, звука, иных данных по каналам с раз-
личной пропускной способностью (видеотелефон, стационарная и мобильная ви-
деоконференцсвязь, интерактивные телевизионные системы и пр.).
Состояние и перспективы развития информационных технологий в начале
XXI века характеризуются становлением и широким практическим использо-
ванием техники цифровой обработки сигналов - одной из самых динамичных
и быстро развивающихся технологий в мире телекоммуникаций и информатиза-
ции общества. Цифровая обработка сигналов (ЦОС) - это информатика реаль-
ного времени, призванная решать задачи приема, обработки, сокращения избы-
точности сигнала и передачи информации в реальном времени.
Внедрение видеоинформационных систем различного назначения решает про-
блемы:
– создания высококачественных систем интерактивного цифрового телевизи-
онного вещания при удовлетворении постоянно возрастающих запросов на
частотные присвоения систем связи без пересмотра частотных планов;
– разработки и внедрения принципиально новых систем мобильного телера-
диовещания;
– создания принципиально новых интерактивных систем опроса обществен-
ного мнения;
– обеспечения деятельности органов государственной власти;
– создания мобильной видеоконференцсвязи между центральными учрежде-
ниями с удаленными центрами и районами, а также удаленных районов
между собой;
– обеспечения сбора и распространения информации различного экономиче-
ского и политического характера, распространяемой органами власти среди
населения, популяризации проводимых властями программ, акций, меро-
приятий;
– реализации оперативного контроля объектов и дистанционного управления
по устранению аварий и чрезвычайных ситуаций;
– оптимизации лечебной и профилактической деятельности, создания систем
мобильной телемедицины;
– создания систем дистанционного обучения на базе ведущих вузов, расши-
рения системы подготовки абитуриентов и пр.;
– поддержки малого бизнеса, проведения рекламных мероприятий и др.
Проводимые во всех технически развитых странах разработки алгоритмов
и аппаратуры сокращения объема, рационального пакетирования и передачи
по каналам связи с различной пропускной способностью видео-, аудио- и со-
путствующей информации являются основой эффективного использования теле-
коммуникационных систем и радиочастотного спектра, сохранения действующих
частотных планов, высвобождения значительной части частотного пространства
для передачи потребителям дополнительных видов услуг - видеотелефонии,
Предисловие 17
мобильной и стационарной видеоконференцсвязи, многопрограммного интерак-
тивного телевидения, телевидения повышенной и высокой четкости, технологий
трехмерного ТВ (3D-TV), телевидения ультравысокой четкости (ТУВЧ), много-
программного звукового вещания, а также систем ТВ со многими (в будущем
с произвольным числом) точками наблюдения.
Внедрение видеоинформационных систем в России связано с решением ряда
проблем:
– эффективного использования мирового опыта по созданию и применению
систем цифровой обработки и передачи информации и разработке соответ-
ствующих стандартов России;
– разработки и внедрения собственных мультимедийных систем и соответ-
ствующей аппаратуры;
– подготовки специалистов для обеспечения разработок, производства и эф-
фективной эксплуатации таких систем;
– создания средств метрологического обеспечения цифровых видеоинформа-
ционных систем;
– интегрирования в общемировую систему телекоммуникаций с учетом тен-
денций перехода к системам многопрограммного телевидения и телевиде-
ния высокой четкости в глобальном масштабе, передачи информации по
наземным, спутниковым, кабельным и Интернет-сетям.
Размер кадров изображений, их частота и формат существенно изменяются
в зависимости от вида приложений. Величина компрессии цифрового потока со-
ставляет от сотен (для систем с одной точкой наблюдения) до десятков тысяч
раз (для многомерных систем).
В настоящее время наряду с улучшением и созданием новых систем сжа-
тия традиционных видеосигналов, снимаемых с одной точки наблюдения, бурно
развивается как стереоскопическое телевидение (бинокулярное), так и автосте-
реоскопическое (или многоракурсное, с несколькими точками наблюдения до
9–16 видов). Также создано и развивается такое направление, как телевизионные
системы с произвольной точкой наблюдения (ТСПН или Free Viewpoint TV
FTV).
На рис. П.1 поясняются основные тенденции развития современных видеоин-
формационных систем. Наряду с ростом числа пикселов в системах ТВ с одной
точкой наблюдения, выражающемся в переходе от систем ТВ к ТВЧ и затем
к ТУВЧ, наблюдается рост числа точек наблюдения два вида для стерео-
скопических систем, до 16 видов для систем со многими видами и практически
бесконечное число видов для систем ТСПН (FTV).
Кодирование видеоинформации можно охарактеризовать тремя факторами:
– оптимизированные методы сжатия, обладающие высокой эффективностью,
но связанные с появлением артефактов на определенных типах изображе-
ний; при этом тратятся существенные усилия на улучшение кодирования
с целью уменьшения их визуальной зависимости;
– вычислительная сложность кодирования зачастую становится важной про-
блемой, в том числе и из-за роста мобильных маломощных приложений,
в то время как в прошлом это считалось не столь существенным факто-
ром и приводило лишь к необходимости учета ограничений на сложность
алгоритма обработки;
18 Предисловие
– активно рассматриваются новые типы контента (трехмерное телевидение,
мультивидовое видео и т. д.), при этом технологии сжатия развиваются так,
что особое внимание уделяется общей эффективности кодирования, но за-
частую оказывается неясным, как пользователи смогут получить доступ
к этим наборам данных и насколько хорошо сжатые форматы подходят
к типичным сценариям их использования.
Рис. П.1. Тенденции развития современных видеоинформационных систем
Помимо устранения пространственной избыточности, эффективное времен-
ное предсказание движения деталей изображения и его компенсация всегда было
ключевым фактором, определяющим общий коэффициент сжатия при кодиро-
вании видеоинформации.
Практически реализованные системы кодирования используют блочную оцен-
ку движения и его компенсацию, сопровождаемую блочным преобразованием
изображения, квантованием и энтропийным кодированием. Даже после замены
дискретного косинусного преобразования (ДКП) на его целочисленный вариант
блочные технологии кодирования видеоинформации остаются подобными пер-
воначально предложенным. Хотя очевидно, что ¾истинное¿ движение в кадре
не является ни поступательным, ни блочно-постоянным, блочная природа этих
алгоритмов весьма полезна в вычислительном отношении. Последние разработ-
Предисловие 19
ки существенно не изменили способов оценки движения. Расширение коснулось
изменения размеров блока, повышения пиксельной точности и новых режимов
предсказания при внутрикадровом кодировании.
Значительные успехи были достигнуты в создании метрик качества, которые
лучше оценивают субъективно воспринимаемое (перцепционное) качество. Одна-
ко в большинстве случаев эти новые метрики были разработаны при кодировании
статических изображений. Сопоставимые результаты для динамических изобра-
жений не так развиты. Развитие перцепционно ориентированных инструментов,
которые включали бы временные качественные критерии, является ключевой
задачей по улучшению рабочих характеристик систем кодирования видео. Заме-
тим, что эти виды инструментов достаточно хорошо развиты для кодирования
аудио.
Теоретически кодер будет более эффективным при применении соответству-
ющих методов оптимизации, реализация которых приводит к использованию
множества способов выбора режимов его работы в зависимости от структуры
кодируемых динамических изображений.
В связи с резким увеличением числа возможных комбинаций режимов и его
влиянием на вычислительную сложность таких кодеков анализируются различ-
ные возможности построения пространства решений, исследуются алгоритмы
и синтаксис кодирования, которые понизят общее количество допустимых ре-
жимов (мод), ограничат выбор режимов блоков предсказания и компенсации
движения деталей в нескольких кадрах динамических изображений.
В системах с произвольной точкой наблюдения пользователи практически
всегда имеют неполный доступ к набору данных, что приводит к созданию ко-
деров, позволяющих декодерам обладать некоторой гибкостью. Предположим,
сигналы от многих камер совместно кодировались, используя инструменты, раз-
витые в контексте многоракурсного кодирования (MVC Multiview Coding).
Тогда пользователи могут изменять угол наблюдения экрана, выбирая только
один из видов в потоке битов. Такие наборы данных должны позволять более
комплексный доступ к видеоинформации, разрешая пользователям выбор точ-
ки наблюдения и управления произвольным образом. При этом декодеру нужно
позволить использовать различные пути декодирования, каждый с различным
порядком просмотра данных, таким образом соответствуя различным опреде-
лениям того, что является будущим, а что - прошлым с точки зрения цели
декодирования.
Основными организациями по стандартизации кодирования видео являются:
– ITU-T Группа экспертов кодирования видео (Video Coding Experts Group
VCEG) в Международном союзе электросвязи Телекоммуникационный
сектор стандартизации (International Telecommunications Union - Telecommu-
nications Standardization Sector - ITU-T, организация ООН, ранее МККТТ -
CCITT), Исследовательская группа 16, Вопрос 6 (Study Group 16, Question 6);
– ISO/IEC Группа экспертов подвижных изображений (Moving Picture Ex-
perts Group MPEG) в Международной организации по стандартизации
и Международной электротехнической комиссии, Объединенный техниче-
ский комитет 1, Подкомиссия 29, Рабочая группа 11 (International Standar-
dization Organization and International Electrotechnical Commission, Joint
Technical Committee Number 1, Subcommittee 29, Working Group 11).
Движущей силой создания стандартов кодирования видеоинформации явля-
ются различные приложения и развитие их аппаратного обеспечения. Блочное
гибридное кодирование является, по сути, ядром всех стандартов сжатия видео.
Среди прошлых стандартов можно перечислить H.261, MPEG-1 часть 2, MPEG-2
часть 2/H.262, H.263 и MPEG-4 часть 2 (см. рис. П.2). Наиболее эффективным
является стандарт MPEG 4 часть 10 AVC/Н.264. К этому стандарту были при-
няты поправки по кодированию масштабируемого видео (SVC Scalable Video
Coding), кодированию многоракурсного видео (MVC Multiview Video Coding)
и реконфигурируемого кодирования видео.
Рис. П.2. История развития методов кодирования видео
Гибридное кодирование комбинирует два метода: движение от кадра к кадру
оценивается и компенсируется с помощью предсказания, основанного на ранее за-
кодированных кадрах; остаточная разность после предсказания кодируется, дан-
ные декоррелируются в пространственной области посредством преобразования
в 2-D-частотную (или вейвлет) область. Преобразованные данные квантуются,
после чего данные энтропийно кодируются с помощью метода Хаффмана, ариф-
метического кодера или иного метода.
Стандартный ряд гибридного кодирования H.26x (x = 1 . . . 4) рекомендован
группой VCEG (Video Coding Experts Group) ITU-T. MPEG-x (x = 1, 2, 4) разра-
батывается группой MPEG (Moving Picture Experts Group) и стандартизируется
ISO/IEC.
Группа VCEG ответственна также за работу ITU-T над стандартами кодиро-
вания неподвижных изображений, включая JPEG (ITU-T T.80, T.81, T.83, T.84,
и T.86), JBIG-1 (ITU-T T.80, T.82 и T.85), JBIG-2 (ITU-T T.88 и T.89), LS JPEG
(ITU-T T.87 и T.870), JPEG 2000 (ITU-T T.800 T.812), подобный JPEG ITU-T
T.851, и JPEG XR (ITU-T T.832, T.834 и T.835). VCEG работает над большин-
ством этих стандартов совместно с ISO/IEC JTC 1/SC 29/WG 1 (Совместная
экспертная группа по фотографии/Объединенная группа экспертов по бинарным
изображениям Joint Photographic Experts Group/Joint Bi-level Image experts
Предисловие 21
Group). Исследовательская группа ответственна за исследования, касающиеся
возможностей мультимедийной службы и возможностей приложений (включая
поддержку сетей будущего поколения NGN). Это охватывает мультимедийные
терминалы, системы (сетевое оборудование обработки сигналов, многоточечные
модули конференций, маршрутизаторы, гейткиперы, модемы, факсы), протоко-
лы и обработку сигналов (кодирование источника).
Несмотря на широкое внедрение цифровых видеоинформационных систем,
процесс разработки более эффективных алгоритмов сжатия визуальной и звуко-
вой информации и их передачи по каналам с различной пропускной способностью
продолжается. Поскольку имеющиеся стандарты определяют лишь цифровой
поток кодируемых данных и не регламентируют принципы его формирования,
имеется возможность более эффективной обработки сигналов в рамках этих стан-
дартов.
В 2004 г. организация ITU-T VCEG начала изучение технологических реше-
ний, которые могли бы позволить создать новый стандарт сжатия видео, суще-
ственно превосходящий H.264/AVC, который получил условное название H.265.
В 2007 г. ISO/IEC (MPEG) запустила проект с экспериментальным названи-
ем HVC.
К июлю 2009 г. результаты экспериментов показали среднее понижение пото-
ка битов приблизительно на 20% по сравнению с AVC (Высокий профиль); эти
результаты побудили MPEG инициировать сотрудничество с VCEG. Заявка на
создание технологии сжатия видео была подготовлена VCEG и MPEG в январе
2010 г. Представленные предложения были рассмотрены на первой встрече Объ-
единенной команды по кодированию видео (Joint Collaborative Team on Video
Coding JCT-VC) MPEG и VCEG, которая прошла в апреле 2010 г. JCT-VC
была создана как группа экспертов по видеокодированию от Исследовательской
группы ITU-T 16 (VCEG) и ISO/IEC JTC 1/SC 29/WG 11 (MPEG) с целью раз-
работки стандарта видеокодирования нового поколения. Оценки показали, что
некоторые из представленных 27 предложений могли обеспечить такое же визу-
альное качество, как у AVC, при уменьшении в два раза потока битов на многих
тестовых последовательностях за счет увеличения вычислительной сложности
в 2–10 раз. Некоторые предложения обеспечивали хорошее субъективное качество
и значения потока битов с более низкой вычислительной сложностью, чем у AVC.
Для совместного проекта было принято название HEVC (High Efficiency Video
Coding высокоэффективное видеокодирование). В настоящее время JCT-VC
работает над объединением основных технологий лучших предложений в одно
программное обеспечение. График работ нацелен на получение проекта конечно-
го стандарта для HEVC приблизительно к январю 2013 г.
На рис. П.3 приведены зависимости отношения сигнал/шумMPEG-кодеров от
реализуемых ими цифровых потоков. Из этих зависимостей следует, что стандарт
H.264/AVC по эффективности существенно превосходит ранее разработанные ко-
деры стандартов MPEG-1, MPEG-2 и MPEG-4.
Мультивидовое (или многоракурсное) видео (MVC Multiview Video Coding)
обеспечивает обширную информацию о сцене и расширяет зрительские впечат-
ления по сравнению с традиционным видео. Благодаря усовершенствованиям
технологий захвата и отображения мультивидовое видео станет востребованным
в потребительской сфере, включая 3DTV и телевидение с произвольной точкой
2 Предисловие
Рис. П.3. Сравнение характеристик MPEG-кодеров
наблюдения (ТСПН FTV). Среди реализаций 3D-приложений MVC являет-
ся одной из наиболее многообещающих технологий, поскольку огромный объем
данных, пропорциональный числу камер, должен быть сжат до такой степени,
чтобы его можно было передавать в пределах возможностей сетей связи.
Поправки MVC к структуре кодера H.264/AVC допускают широкий диапазон
совместно применяемых структур временного и межвидового предсказания, что
делает возможным достижение компромисса между эффективностью кодирова-
ния и сложностью декодирования, включая управление задержкой и буфером
декодированного изображения. Все возможные структуры совместно применяе-
мого временного и межвидового предсказания в основном относятся к особым
случаям, определяемым поправкой масштабируемого кодирования видео (SVC).
Тенденции развития алгоритмов кодирования и полученные степени сжатия
в их историческом развитии иллюстрируются рис. П.4, из которого следует, что
стандарт H.264/AVC при высоком качестве кодирования обеспечивает формиро-
вание информационного потока при величине 0,17 бита на пиксел изображения.
Это означает, что при кодировании стандартного ТВ-сигнала (8×3 бит/пиксел,
720 × 576 пикселов/кадр, 25 кадров/с) удается сформировать потоковое отобра-
жение менее 2 Мбит/с, а при кодировании сигнала ТВЧ порядка 5 Мбит/с.
Предполагается, что новый стандарт H.265 обеспечит до 20% улучшения объ-
ективных критериев и, кроме того, дополнительное уменьшение потока будет
связано с изменением субъективной оценки, т. е. в стандарте H.265 будут допус-
каться б´ольшие потери, чем в H.264, но эти потери будут не так очевидны для
восприятия.
После успешной разработки множества стандартов кодирования видео груп-
па MPEG приступила к деятельности по стандартизации реконфигурируемого
Предисловие 23
Рис. П.4. Достижения в кодировании видеосигналов
кодирования видео (RVC Reconfigurable Video Coding). Стандарт RVC пред-
лагает базовую структуру, подходящую для построения видеокодека с помощью
конфигурации средств кодирования, таким образом способствуя динамической
разработке, реализации и принятию решений по стандартизованному кодирова-
нию видео.
Совершенствование и развитие современных мультимедийных систем связано
не только с реализацией эффективных методов сжатия различных видов инфор-
мации, но и ее передачи в реальных сетях связи и вещания, предназначенных
для доставки контента телерадиовещания, видеоконференцсвязи и ряда допол-
нительных услуг передачи данных. Такие сети, как правило, предназначены для
достижения заданных качества обслуживания и режимов передачи/приема (на-
пример, с использованием наземных, спутниковых и кабельных сетей, Интернета).
В частности, цифровое телевизионное вещание в Европе основано на очень
успешной серии стандартов DVB. Частотные распределения согласованы в рам-
ках международного союза электросвязи ITU, в то время как сами сети вещания
реализуются в соответствии с национальными спецификациями.
Как показано на рис. П.5, внедрение цифрового формата осуществляется
в трех основных направлениях спутникового, наземного и кабельного вещания.
Первыми, последовательно внедряемыми, были спутниковые стандарты DVB-S,
а затем DVB-S2. В дополнение к этим стандартам следует добавить стандарт
DVB-RCS/RCS2 (RCS Return Channel via Satellite), обеспечивающий реализа-
цию обратного канала на основе режима многочастотного доступа с разделением
по времени (MF-TDMA) для интерактивных спутниковых услуг, а также стан-
дарт DVB-DSNG, используемый для сбора новостей через спутники.
24 Предисловие
Рис. П.5. Научно-технический прогресс в сфере вещательных технологий
Стандарты DVB-T, а затем DVB-T2 определяют принципы трансляции эфир-
ного цифрового телевизионного вещания. Стандарты DVB-H/DVB-SH исполь-
зуют эфирные и спутниковые каналы для передачи узкополосного телевизион-
ного вещания на малогабаритные приемники с малыми экранами. Традицион-
но MMDS (Microwave Multipoint Distribution Service) системы беспроводного
многоканального телевидения ориентированы на микроволновые частоты в диа-
пазоне 2,1 ГГц и от 2,5 ГГц до 2,7 ГГц. В последнее время все большее внимание
уделяется системам беспроводной передачи на частотах выше 20 ГГц. В этой об-
ласти стандартно используются диапазоны 25–32 ГГц и 40,5–42,5 ГГц. Нижний
диапазон был первоначально освоен в США и Канаде, где системы высокоча-
стотной передачи использовались вместо витой пары при построении телекомму-
никационных сетей. В соответствии с назначением системы получили название
LMDS (Local Multipoint Distribution Service). Сейчас технология LMDS при по-
лосе каждого канала от 950 до 2150 МГц начала использоваться и в Европе, для
построения телекоммуникационных, в том числе телевизионных сетей. Верхний
диапазон первоначально был выделен в Европе для аналогового ТВ-вещания.
В связи с этим системы, работающие на частотах 40,5–42,5 ГГц, получили назва-
ние MVDS (Multipoint Video Distribution Systems). Наиболее привлекательным
качеством систем MVDS является колоссальная ширина предоставляемого диа-
пазона 2 ГГц. Это в два с лишним раза превышает диапазон наземного вещания
и в 10 раз частотную полосу систем MMDS.
Системы DVB-C и DVB-C2 регулируют цифровые стандарты кабельного те-
левизионного вещания, использующие VHF и UHF-диапазоны частот на вторич-
ной основе. К кабельным системам примыкают также стандарт телевизионного
вещания по IP-сетям DVB-IPTV и стандарт DVB-SMATV (SMATV Satellite
Master Antenna Television), подразумевающий непосредственное распределение
спутниковых сигналов по сетям кабельного телевидения. Действие европейского
стандарта DVB-SMATV распространяется на кабельные сети до 3000 МГц, т. е.
полностью на весь диапазон промежуточных частот 950–2400 МГц.
С 2010 года внедряются стандарты цифрового вещания второго поколения для
систем спутникового, эфирного и кабельного вещания DVB-S2/DVB-T2/DVB-C2.
Предисловие 25
Эти стандарты применяются в службах вещания, распределения контента, элек-
тронного сбора новостей и подачи сигнала в студию, интерактивных службах.
По сравнению с первым поколением стандартов DVB-S/DVB-T/DVB-C были из-
менены параметры обработки сигналов: использовано новое поколение прямой
коррекции ошибок, что позволило вплотную приблизиться к пределу Шеннона;
применяются более высокие созвездия, что привело к существенному повышению
эффективности; увеличено возможное количество несущих OFDM; вводятся но-
вые защитные интервалы; осуществлена минимизация количества рассеянных
пилотов в зависимости от защитного интервала, в результате чего сокращены
накладные расходы; расширена полоса пропускания; повышена эффективность
обработки информации за счет расширенного временного и частотного переме-
жения битов и ячеек.
В табл. П.1 приведено сравнение достигаемых скоростей цифрового потока
различных систем цифрового вещания первого и второго поколений для стан-
дартных сетей связи.
Таблица П.1. Скорости цифрового потока, Мбит/c
Полоса канала 26 МГц 54 МГц 8 МГц
Стандарт DVB-S DVB-S2 DVB-S DVB-S2 DVB-T DVB-T2 DVB-C DVB-C2
Минимальная 18,7 12,9 38,9 26,2 4,9 7,4 6,4 25,0
Максимальная 32,8 116,7 68,8 242,4 31,6 50,5 38,1 78,6
Из сравнения возможных максимальных скоростей цифрового потока, пе-
редаваемого по каналам цифрового телевизионного вещания систем первого и
второго поколений стандартов, вытекает существенное увеличение эффективно-
сти использования стандартных каналов связи.
Так, например, если при использовании стандарта эфирного вещания DVB-T
через канал с полосой пропускания 8 МГц возможно максимально передать до
14 программ стандартного телевидения или не более 6 программ телевидения
высокой четкости, то при переходе на стандарт DVB-T2 эти данные могут быть
увеличены примерно в 1,5 раза до 25 и 10 соответственно.
Следует упомянуть несколько форматов мультимедийного вещания, ориен-
тированных на прием с помощью мобильных терминалов. К ним относятся упо-
мянутый при рассмотрении эфирных систем формат DVB-H, формат системы
MediaFLO и группу форматов, базирующихся на системе радиовещания DAB
(T-DAB, DAB+, T-DMB), японский стандарт эфирного вещания ISDB-T и ки-
тайский формат DTMB. Для сжатия информации стандартно в настоящее время
используется технология MPEG-4 (H.264/AVC и HE-AAC), цифровые аудио-
и видеосигналы мультиплексируются в один мультимедийный высокоскоростной
транспортный поток.
Разработанная в России аудиовизуальная информационная система реального
времени РАВИС (RAVIS) обеспечивает решение проблемы цифровизации сети
мобильного радиовещания взамен аналоговых систем ЧМ-вещания (с полярной
модуляцией и с пилот-тоном) в выделенных для этих целей в России диапазонах
частот (66–74 МГц и 87,5–108 МГц соответственно) и внедрение собственных
мультимедийных систем и соответствующей аппаратуры.
Система РАВИС позволяет в стандартном канале (200–250 кГц) передавать
либо много программ стереозвука, включая поддержку объемного звукового ве-
26 Предисловие
щания, либо качественное цифровое телевизионное изображение с разрешением
352 × 288 пикселов на кадр и соответствующий звуковой стереосигнал.
Полностью отечественная разработка РАВИС имеет ряд ключевых преиму-
ществ:
– возможность в стандартном канале ЧМ-вещания передачи нескольких сте-
реофонических и многоканальных звуковых программ;
– трансляцию видеопрограмм для мобильного потребителя;
– реализацию телевизионного вещания в малонаселенных пунктах при уде-
шевлении системы кодирования и трансляции;
– обеспечение устойчивого мобильного приема сигнала в условиях многолуче-
вого распространения в среде с городской застройкой, в горной и лесистой
местности, в водных акваториях;
– радиус покрытия в десятки раз больше, а затраты на создание инфраструк-
туры мобильного телевещания в десятки раз ниже (к примеру, покрытие
мобильным телевещанием всей территории Москвы может быть обеспечено
одним либо максимум тремя передатчиками, работающими в одночастот-
ном режиме);
– возможность создания одночастотных сетей мобильного вещания вдоль же-
лезнодорожных и автомобильных трасс;
– реализацию эфирных систем оповещения населения и организаций в усло-
виях ЧС;
– организацию систем для использования различными спецслужбами и др.
В конце XX века одной из бурно развивающихся технологий в области телеком-
муникаций стала видеоконференцсвязь (ВКС). Появление видеоконференцсвязи
явилось технологическим развитием цифровой телефонии и видеотелефонии. Но-
вые возможности, предоставляемые ВКС, привели к бурному росту количества
пользователей этой технологии. Естественно, что развитие ВКС не могло идти
без использования предшествующих стандартов ITU и создания новых реко-
мендаций, позволяющих унифицировать подходы к передаче мультимедийного
контента и внедрения дополнительных сервисов.
Серьезной проблемой при внедрении видеоинформационных систем в России
является подготовка специалистов данного профиля. Отечественная литерату-
ра, посвященная изложению современных способов цифровой обработки муль-
тимедийной информации, практически отсутствует, эта важнейшая область не
отражена в ныне существующих программах обучения специалистов. Функцией
обучения специалистов теории и практике мультимедийных систем, помимо со-
здания представления о весьма сложных преобразованиях сигналов в процессе
сокращения объема информации, должно стать привлечение молодых специали-
стов России к исследованиям еще не решенных проблем в этой перспективной
области.
Хотелось бы надеяться, что начавшееся широкое внедрение в практику видео-
информационных систем послужит началом реализации планов обучения специ-
алистов данного профиля. В области организации науки и подготовки кадров
важнейшим является формирование сети научно-исследовательских центров по
видеоинформационным проблемам, обладающих необходимым научным и тех-
Предисловие 27
ническим потенциалом для решения как фундаментальных проблем обработки
сигналов, так и широкого круга прикладных задач.
Хотя проблемы метрологического обеспечения разработки и внедрения видео-
информационных систем в данной работе почти не затрагиваются, следует ука-
зать, что в России сложилась крайне тяжелая ситуация, вызванная повсеместным
недостатком, а часто и отсутствием измерительной аппаратуры, необходимой
для разработки, настройки и поддержания технических характеристик систем
передачи информации в состоянии, обеспечивающем их качественное функцио-
нирование.
Особые проблемы возникают в связи с началом широкого внедрения систем
и аппаратуры цифровой обработки и передачи компрессированных сигналов по
каналам связи. Разрабатываемые системы требуют создания соответствующих
контрольных и измерительных средств. С внедрением видеоинформационных си-
стем потребность в использовании измерительной аппаратуры будет возрастать,
поскольку требуется создание принципиально новых способов и средств контро-
ля и измерений. При этом необходимо, чтобы эти средства были совместимы
и с традиционными аналоговыми системами.
Метрологическая безопасность России залог создания высококачественной
видеоинформационной аппаратуры и ее эффективного использования.
На современном этапе развития техники выполнение требований метрологии
связано с созданием виртуальных измерительных систем на базе использования
персональных компьютеров в качестве устройств анализа и организации струк-
туры систем формирования и обработки измерительной информации.
Для оценки соответствия качества передаваемой видеоинформации требова-
ниям, предъявляемым к ней в различных системах и условиях передачи, а так-
же для сравнения эффективности работы различных устройств видеокодиро-
вания и передачи видеоинформации, требуются методики и средства субъек-
тивной и объективной оценки качества видео, наблюдаемого потребителем. Эти
методики должны учитывать характерные особенности и искажения как при
аналоговой, так и при цифровой и смешанной системах обработки и передачи
видеоинформации.
В настоящее время широко дебатируются вопросы, связанные с проблемами
реализации и использования различных цифровых абонентских устройств. Са-
мым рациональным решением проблемы приема является применение компью-
терных систем, содержащих соответствующие тюнеры. Эффективность исполь-
зования компьютеров связана также с возможностью постепенного наращивания
мультимедийных функций путем замены плат компьютеров на более совершен-
ные и дополнения их новыми платами и программами. При этом весьма привле-
кательным является использование программных декодеров, что обеспечивает
возможность совершенствования стандартов кодирования, не изменяющих аппа-
ратные средства абонентов.
Главным преимуществом применения компьютерной технологии является ис-
пользование различных дисплеев: от настольных до настенных вариантов, от
стандартного разрешения до разрешения высокой четкости и др. При этом изме-
нение типа дисплея практически не требует замены аппаратной части.
В связи с этим важнейшей проблемой проведения фундаментальных работ
в России по данной тематике является задача полного овладения теорией и ма-
28 Предисловие
тематическими методами обработки информации, используя имеющиеся зару-
бежные материалы в качестве информации, задающей общее направление работ.
А далее с учетом полученного опыта по освоению стандартных алгоритмов сле-
дует разработка более эффективных систем.
Материал, изложенный в данной книге, состоит из девяти частей, изложенных
в 22 главах.
В части I (главы 1–3) ¾Видеоинформационные приложения и объем циф-
ровой информации¿ сжато изложены проблемы цифрового преобразования ста-
тических и динамических изображений, оцениваются объемы информации при
преобразовании в цифровую форму изображений различного разрешения от
видеотелефонии до ¾цифрового кино¿, изложены принципы эффективного кван-
тования различных видов информации.
Часть II (главы 4, 5) ¾Статистическая и визуальная избыточность изобра-
жений¿ посвящена исследованиям проблем статистической и визуальной избы-
точности монохромных и цветных изображений, излагаются методы и алгоритмы
эффективного энтропийного кодирования различных видов информации об изоб-
ражениях, оцениваются возможности использования визуальной избыточности
статических и динамических изображений для сокращения объемов передавае-
мой информации.
В части III (главы 6–9) ¾Основные методы сжатия изображений¿ рассматри-
ваются методы непосредственного кодирования и кодирования с предсказанием,
групповое кодирование изображений, методы блочного и фрактального кодиро-
вания, кратномасштабная обработка изображений. Основное внимание уделено
анализу дискретных линейных ортогональных преобразований и, в частности,
широко используемым дискретному преобразованию Фурье, косинусному пре-
образованию, преобразованию Кархунена–Лоэва и др. Подробно анализируются
методы обработки изображений с применением вейвлет-преобразований и реали-
зации на их основе кратномасштабных преобразований изображений.
В части IV (главы 10–12) ¾Внутрикадровая и межкадровая обработка изоб-
ражений¿ достаточно подробно излагаются методы повышения качества внутри-
кадрового кодирования статических изображений, принципы анализа движения
деталей и его компенсации в динамических изображениях, идеология обработки
изображений при кратномасштабном анализе. Особое внимание уделяется оп-
тимизации методов поиска векторов движения, дополнительным возможностям
компенсации движения деталей в динамических изображениях.
Часть V (главы 13, 14) ¾Основные стандарты цифрового кодирования ви-
деоинформации¿ посвящена анализу методов кодирования статических изобра-
жений JPEG и JPEG-2000, системам кодирования динамических изображений
MPEG-1, MPEG-2, обобщенному кодированию аудиовизуальных объектов MPEG-4,
а также наиболее эффективному стандарту кодирования таких изображений
H.264/AVC. Кроме того, в этой части рассмотрены некоторые проблемы реа-
лизации кодирующих устройств и визуализации их параметров.
В части VI (главы 15–18) ¾Основные методы кодирования речевой и звуковой
информации¿ анализируются основные характеристики и цифровое представле-
ние речевой и звуковой информации, приводится достаточно подробное описание
основных стандартов цифрового кодирования речи: G.711, G.722, G.723.1, G.728,
G.729 и др., алгоритмы кодирования высококачественного звука, приведенные
Предисловие 29
в стандартах MPEG-1, MPEG-2, MPEG-4, Dolby AC-3. Рассмотрены также про-
блемы подавления акустического эха в системах телеконференцсвязи. Глава 18,
посвященная подавлению акустического эха, написана совместно с Сараной Д.В.
Часть VII (главы 19, 20) ¾Основные методы и системы канального кодирова-
ния и модуляции цифровой информации¿ посвящена анализу основных методов
модуляции и помехоустойчивого кодирования цифровой информации, приводит-
ся достаточно подробное описание систем многочастотной OFDM-модуляции, ал-
горитмы синхронизации OFDM-сигналов в приемных устройствах. Глава 19, по-
священная канальному кодированию информации, составлена совместно с к. т. н.
Бакке А.В.
В части VIII (глава 21) ¾Основные стандарты систем цифрового телевизион-
ного вещания¿ приводится достаточно подробное описание основных современ-
ных стандартов передачи видео- и аудиоинформации: ATSC, DVB-S/S2, DVB-T/T2,
DVB-C/C2, ISDB-S, ISDB-T, DTMB (DMB-T/H). Проводится сравнение евро-
пейских стандартов первого и второго поколений. Показано, сколь важен быст-
рый переход в России на системы вещания второго поколения DVB-S2, DVB-T2,
DVB-C2.
Последняя часть IX (главы 22, 23) ¾Стандарты систем мобильного радиовеща-
ния и видеоконференцсвязи¿ посвящена изложению стандартов телерадиовеща-
ния DVB-H, MediaFLO, T-DMB/T-DAB, РАВИС и DRM+, а также проблемам
реализации систем видеоконференцсвязи на базе использования трех разделов
рекомендаций ITU-T:
– аудиовизуальные и мультимедийные системы (серия H);
– передающие системы и средства, цифровые системы и цепи (серия G);
– терминалы для телематических сервисов (серия T).
Основное внимание уделено изложению принципов построения российской
аудиовизуальной системы реального времени РАВИС, предназначенной для
создания цифровых систем взамен аналоговых сетей УВЧ/FM радиовещания,
а также реализации разработки российских программных решений видеоконфе-
ренцсвязи VPhone и ¾ДАВ телекон¿. Глава 23, в которой рассмотрены проблемы
построения систем видеоконференцсвязи, написана совместно с к. м. н. Федоро-
вым В.Ф.
Ï ÈÂËÈÎÄÆÅÅÎÍÈÈÈÍÍßÔÔ×ÈÎÎÀ ÎÑ ÌÒÌÁÜÀÚÀIÖÅÖÌÈÈÖÎÈÍ ÔÛÎÅÂÎÉ
Ââåäåíèå
Процесс цифровой обработки визуальной информации охватил различные виды
видеоинформационных приложений и существенно расширил их спектр: кроме
широко распространенного традиционного телевидения и различных экзотиче-
ских разновидностей ТВ специального назначения появились и повсеместно внед-
ряются самые различные видеоприложения от видеотелефонии до телевидения
высокой четкости (ТВЧ) и ¾цифрового кино¿ [1.1, 1.2].
Цифровые системы кодирования изображений, их передачи и приема позволя-
ют достичь невиданного доселе уровня качества и предоставляют пользователю
массу новых возможностей и новых видов услуг [1.1–1.4].
Неудивительно в связи с этим то, что цифровая обработка телевизионных
и компьютерных изображений в виду ее особой важности выделилась в самосто-
ятельную область техники, в которую входят [1.5–1.7]:
– коррекция изображений, их ¾препарирование¿, т. е. сознательное разделе-
ние на части цифровыми средствами, видоизменение этих частей и их об-
ратная ¾сборка¿;
– оценка параметров изображений с целью контроля качества их передачи
и приема;
– преобразование и кодирование изображений для хранения или передачи по
каналам связи;
Введение 31
– компьютерная графика, а также визуализация информации, т. е. представ-
ление массивов данных в виде различных изображений, что очень эффек-
тивно, так как облегчает решение многих задач, сложных именно своей
абстрактностью.
Эта область включает также моделирование систем обработки, хранения и пе-
редачи визуальной информации по каналам связи, т. е. набор компьютерно-мате-
матических задач, необходимых для разработки новой цифровой телевизионной
техники.
Разумеется, все перечисленные задачи связаны между собой и по методам
решения, и по используемым для этого техническим средствам.
Цифровая обработка изображений является, по сути, основной базой для со-
здания нового поколения видеоинформационной техники. Без нее немыслима
реализация систем видеотелефонии, видеоконференцсвязи, цифрового интерак-
тивного телевизионного вещания, цифрового кино. Работы по созданию таких
систем уже полным ходом ведутся сегодня в технически развитых странах, и при-
влеченные финансовые, технические и интеллектуальные ресурсы таковы, что
становится совершенно ясно: переход к цифровым видеоинформационным систе-
мам в общемировом масштабе неизбежен и является делом близкого будущего.
Именно по всем этим причинам исследования методов цифровой обработки
видеоинформации должны стать одной из важнейших частей курса обучения
специалистов широкого профиля, и в частности, телевидения.
Однако и сама цифровая обработка изображений в связи с особенностями про-
блем, стоящих на пути создания видеоинформационных систем будущего, имеет
свое ядро, т. е. свою главную задачу, без решения которой немыслимо решение
всех остальных.
Это задача так называемого сжатия изображений, т. е. уменьшения объ-
ема информации, необходимого для передачи информации по каналам связи
путем сокращения содержащейся в составе изображения информационной избы-
точности. Таким образом, ключевыми вопросами, решение которых определяет
эффективность развивающихся и вновь создаваемых систем, являются задачи
компрессии видеоинформации и оценки ее качества.
Решение именно этой задачи имеет, в частности, важное значение для внед-
рения телевидения высокой четкости. Упомянутая ¾высокая четкость¿ в этих
системах достигается увеличением как количества строк в кадре, так и количе-
ства элементов в каждой строке, а значит, резко возрастает и соответствующий
каждому изображению (кадру) объем информации.
Между тем передавать эти изображения предстоит с использованием суще-
ствующих каналов связи, пропускная способность которых, естественно, остается
прежней. Становится очевидным, что как только будет создан эффективный
и достаточно просто реализуемый алгоритм сжатия телевизионных изображений
(а такие работы ведутся давно, и варианты решения этой задачи практически
уже найдены), внедрение телевидения высокой четкости станет реальностью.
Однако не только для телевидения высокой четкости нужно сжатие изобра-
жений. Максимально эффективное использование существующих каналов связи
является сегодня для телевидения проблемой номер один.
Частотное пространство телевидения во многих случаях ограничено, а, кроме
того, крайне привлекательным представляется внедрять новые системы телеви-
32 Введение
дения, не меняя при этом существующую линейную каналообразующую аппа-
ратуру. Поэтому решение такой задачи, как обеспечение возможности передачи
хотя бы 4–6 программ телевидения в стандартном радиоканале, является сегодня
исключительно важным, прежде всего с точки зрения экономической.
Таким образом, разработка эффективного способа сжатия изображений поз-
волит решить сразу две задачи, равные по своей важности.
Главной функцией данного материала является создание ясного представ-
ления о сложных цифровых преобразованиях сигналов в процессе сокращения
объема передаваемой визуальной информации.
Прежде чем перейти к изложению методов цифровой обработки видеоин-
формации, необходимо оценить ее объем для различных систем формирования
и передачи изображений. Этому и посвящен первый раздел настоящего материа-
ла. В нем кратко изложены сведения об особенностях существующих стандартов
телевидения, а также систем кодирования цвета, а кроме того, рассмотрены неко-
торые вопросы, связанные с представлением в цифровом виде сигналов различ-
ных систем передачи изображений. Следует отметить, что везде в этом разделе,
где будет говориться о способах уменьшения объема информации при цифровой
передаче изображений, имеются в виду широко известные тривиальные мето-
ды предварительного снижения объема цифрового потока, которые сами по себе
не в состоянии обеспечить решения изложенных выше задач и не имеют ниче-
го общего с собственно алгоритмами сжатия изображений, содержание которых
изложено в последующих разделах.
ËÀÂÀ1.Àí1àëîÔÑÝãÒÒÎâÀÀû åÒËÌÈèÎÀö×ÍÒèÅ ÛÑðÛîÊÈâÅÈûÇåÎÈÅðÇÈÁàñÎ òÄÀðÁîÆÈ âûÀÍÅåÆÍÀèçÈÌÅîÍÉáÈðÈ.×àæßÅåÑíèÊÿÈÅ
Телевизионные и компьютерные изображения обычно воспроизводятся в виде
растра, представимого непрерывной или дискретной функцией вдоль строк по
горизонтали и конечным числом строк по вертикали. В аналоговом телевидении
каждый кадр динамического изображения формируется путем чересстрочной
развертки в виде двух последовательно передаваемых полей [1.8, 1.9].
На рис. 1.1 приведено схематичное представление чересстрочной развертки
изображения. Сплошные черные линии характеризуют движение луча электрон-
ной трубки в одном поле, а пунктирные в другом поле кадра. Тонкие серые
штриховые линии характеризуют обратный ход луча по строкам и между полями.
Рис. 1.1. Представление растра аналогового телевидения
Цифровые изображения разбиваются также и вдоль строк на дискретные от-
счеты, называемые пикселами (от сокращения английских слов PICture’S
ELement, элемент изображения). Количество пикселов, на которые разбито изоб-
ражение, определяет его детальность. Если изображение представимо в виде M
34 Глава 1. Форматы изображений. Статические и динамические изображения
строк, каждая из которых содержит N дискретных отсчетов, то массив кадра
состоит из N ×M пикселов.
В различных приложениях используются разные форматы кадров. Так, эта-
лонные компьютерные изображения часто имеют равное количество строк и пик-
селов в каждой строке, т. е. NM. В стандартном телевидении используется фор-
мат кадра с соотношением N : M = 4 : 3, а в телевидении высокой четкости
и в цифровом кино с соотношением N : M = 16 : 9 [1.2]. Однако номенклату-
ра используемых форматов кадра значительно более обширна, часть достаточно
широко используемых форматов приведена в табл. 1.1 [1.10–1.18].
Таблица 1.1. Форматы кадра изображения
Наименование
формата
Разрешение,
N ×M
Соотношение
сторон кадра Применение
1 2 3 4
Общий формат обмена CIF и его производные
QQCIF 88 × 72 11 : 9 Мобильные телефоны
SQCIF (Sub-QCIF) 128 × 96 4 : 3 -¾-
QCIF 176 × 144 11 : 9
Видеоконференция
(PAL/SECAM)
CIF 352×288 -¾- -¾-
iCIF 352×576 11:18
Цифровое видео
(PAL/SECAM)
2CIF 704×288 22:9 -¾-
4CIF 704×576 11:9 TВ PAL/SECAM
16CIF 1408×1152 -¾- Цифровое видео
Стандартный формат изображения SIF и его производные
SQSIF 80×60 4:3 Мобильные телефоны
QSIF 160×120 -¾- -¾-
SIF 320×240 -¾-
Видеоконференция
(NTSC)
iSIF 352×480 11:15
Цифровое
видео(NTSC)
2SIF 704×240 44:15 –
4SIF 704×480 22:15 TВ NTSC
Форматы графических подсистем
QQQVGA 80×60 4:3 Мобильные телефоны
QQVGA 160×120 -¾- -¾-
QVGA 320×240 -¾- Видеоконференция
VGA 640×480 -¾- ТВ NTSC
WVGA 800×480 5:3
Компьютерные
мониторы
SVGA 800×600 4:3 -¾-
XGA 1024×768 -¾- -¾-
WXGA 1280×768 5:3 -¾-
QuadVGA 1280×960 8:3 -¾-
SXGA 1280×1024 5:4 -¾-
SXGA+ 1400×1050 4:3 -¾-
1.1. Аналоговые и цифровые растровые изображения 35
Таблица 1.1 (окончание)
1 2 3 4
WSXGA 1440×900 8:5 -¾-
UGA, UVGA 1600×1200 4:3 -¾-
UXGA 1600×1280 5:4 -¾-
WSXGA+ 1680×1050 8:5 -¾-
WUXGA 1920×1200 -¾- -¾-
QXGA 2048×1536 4:3 -¾-
WQXGA 2560×1600 8:5 -¾-
QSXGA 2560×2048 5:4 -¾-
WQSXGA 3200×2048 25:16 -¾-
QUXGA 3200×2400 4:3 -¾-
WQUXGA 3840×2400 8:5 -¾-
HXGA 4096×3072 4:3 -¾-
WHXGA 5120×3200 8:5 -¾-
HSXGA 5120×4096 5:4 -¾-
WHSXGA 6400×4096 25:16 -¾-
HUXGA 6400×4800 4:3 -¾-
WHUXGA 7680×4800 8:5 -¾-
Видеоформаты и телевизионные форматы
w288p 512×288 16:9
Широкоформатное
видео
400p 528×400 4:3
Видео стандатной
четкости
448p 576×448 -¾- -¾-
w384p 672×384 16:9
Широкоформатное
видео
ТВ стандарт (D1) 720×480 3:2 DVD-Video NTSC
ТВ стандарт (D1) 720×576 5:4
DVD-Video
PAL/SECAM
w448p 768×448 16:9
Широкоформатное
видео
w480p, ED 854×480 -¾- LCD/PDP
ТВ-дисплеи
w576p 1024×576 -¾-
Широкоформатное
видео
w720p, HD 1280×720 -¾-
ТВ повышенной
четкости
w768p 1366×768 -¾-
LCD/PDP
ТВ дисплеи
w1080p, UHD 1920×1080 -¾- ТВЧ ATSC
w1152p, UHD 2048×1152 -¾- ТВЧ DVB-T
w4320p, UHDV 7680×4320 -¾-
ТВ сверхвысокой
четкости
Форматы кадров в этой таблице разбиты на 4 раздела.
Первый из них характеризует Общий Формат Обмена CIF (Common
Itermediate Format), обычно используемый в телеконференциях, и производ-
36 Глава 1. Форматы изображений. Статические и динамические изображения
ные от него форматы. Второй раздел определяет параметры стандартного фор-
мата изображения SIF (Standard Image/Interchange Format) и его произ-
водных. Третий, наибольший раздел характеризует форматы графических под-
систем, используемые в основном в компьютерных дисплеях. И, наконец, в чет-
вертом разделе приведен перечень основных форматов, используемых в телеви-
зионных системах стандартной и высокой четкости.
В зависимости от параметров каждого пиксела изображения можно разделить
на бинарные, полутоновые, полноцветные и палитровые [1.6, 1.19].
Пикселы бинарных изображений имеют лишь два значения, характеризу-
ющие черные или белые точки. Такая информация используется для передачи
простых изображений, например при передаче факсов.
Полутоновые изображения характеризуются значительным количеством
уровней на каждый пиксел его величина определяет яркость воспроизводимого
элемента. Существуют различные форматы полутоновых изображений, опреде-
ляющие динамический диапазон воспроизводимых яркостей элементов. Чаще
всего используется формат элементов, который кодируется 8 битами на пиксел,
т. е. может принимать значения от 0 до 28 − 1 = 255. В ряде случаев, например
в медицинских технологиях, используют полутоновые изображения, элементы
которых кодируются до 16 битов на пиксел, т. е. число возможных градаций их
яркости может составлять 216 = 65 536.
Каждый пиксел полноцветного изображения представим в виде тройки –
красной (Red), зеленой (Green) и синей (Blue) составляющих, каждая из кото-
рых обычно задается 8 битами значениями от 0 до 255. Следовательно, цвет
каждого пиксела определяется 24 битами, и изображение теоретически может
содержать (28)3 = 16 777 216 различных цветов.
Величины красного, зеленого и синего цветов являются координатами цве-
та и обозначаются соответственно X, Y и Z. Часто описание цвета выражают
координатами цветности относительными величинами, которые задаются со-
отношениями:
x =
X
X + Y + Z
; y =
Y
X + Y + Z
; z =
Z
X + Y + Z
. (1.1)
Из (1.1) следует, что x + y + z = 1.
На рис. 1.2 приведено схематическое изображение цветового куба xyz. Точ-
ки, соответствующие красному, зеленому и синему цветам, расположены на трех
вершинах куба с координатами (1, 0, 0), (0, 1, 0) и (0, 0, 1). Точки на главной диа-
гонали представляют собой оттенки серого цвета: от черного в начале координат
(0, 0, 0) до белого в точке (1, 1, 1).
На рис. 1.3 представлены изображения цветового куба, состоящего из (28)3
различных цветов. Иногда 24-битовое цветное изображение называют изобра-
жением в естественных цветах, поскольку при этом возможно воспроизведение
практически всех оттенков реально существующих предметов.
Палитровые изображения используются в целом ряде приложений, в кото-
рых имеет смысл использовать ограниченное число цветов. При этом используе-
мое количество воспроизводимых цветов ограничено величиной 256 или меньшим
числом. Применительно к Интернет-приложениям это подмножество цветов на-
зывается палитрой фиксированных Web цветов или набором цветов, одинаково
1.1. Аналоговые и цифровые растровые изображения 37
Рис. 1.2. Схематическое изображение цветового куба
воспроизводимых всеми программами просмотра Интернет-сайтов. Поскольку из
256 цветов только 216 воспроизводятся одинаково большинством операционных
систем, эти 216 = 63 цветов стали de facto стандартом фиксированных цветов
(см. рис. 1.4).
Рис. 1.3. 24-битовый полноцветный куб RGB: вид с двух сторон
В данном варианте каждая из трех RGB компонент может принимать лишь
6 возможных значений: 0, 51, 102, 153, 204 и 255. Эти значения обычно выражают
в щестнадцатеричной системе счисления, как приведено в табл. 1.2.
Поскольку для формирования цвета требуется три числа, каждый цвет из
палитры задается тремя двузначными числами (в шестнадцатеричной системе
38 Глава 1. Форматы изображений. Статические и динамические изображения
счисления). Так, шесть воспроизводимых оттенков серого цвета, входящих в па-
Рис. 1.4. Куб (а) и палитра (б) фиксированных RGB цветов
Таблица 1.2. Значения RGB компонент в палитре фиксированных частот
Система счисления Значения RGB компонент
Шестнадцатеричная 0 33 66 99 СС FF
Десятичная 0 51 102 153 204 255
литру, определяются числами (00 00 00), (33 33 33), (66 66 66), (99 99 99), (СС СС СС),
1.2. Цветовые системы 39
(FF FF FF). Наиболее яркие красный, зеленый и синий цвета задаются, соответ-
ственно, значениями (FF 00 00), (00 FF 00) и (00 00 FF).
Основной закон смешения цветов устанавливает трехмерность цвета и воз-
можность выражения практически всех цветов через смеси только трех линейно
независимых цветов. При этом яркость смеси цветов равна сумме яркостей со-
ставляющих смеси [1.21–1.23].
Трехмерное цветовое пространство является удобной и наглядной формой
геометрического представления множества цветов и действий над ними. В цве-
товом пространстве можно ввести сколько угодно координатных систем. Началом
координат во всех этих системах обычно устанавливается точка нулевого цвета
черного. 1.2Öâåòîâûåñèòåìû
Цветовая система полностью определяется заданием трех координатных осей,
исходящих из начала координат, и соответствующим их масштабированием. В об-
щем случае устанавливаемые по осям масштабы могут быть различными. Основ-
ные цвета, положенные в основу цветовой координатной системы, используются
для выражения остальных цветов в данной координатной системе. Важным усло-
вием выбора основных цветов является их линейная независимость, т. е. ни один
из трех основных цветов не должен получаться путем смешения двух других
цветов.
В системе координат c заданными основными цветами X, Y,Z любой цвет F
определяется соотношением
F = αxX + αyY + αzZ. (1.2)
Яркость FB также является одной из возможных цветовых координат:
FB = αBxX + αByY + αBzZ. (1.3)
Коэффициенты αBx, αBy, αBz характеризуют вклады каждой из цветовых
координат в яркость воспроизводимого цвета и являются яркостными коэффи-
циентами в данной цветовой системе координат. Термин ¾яркость¿ обозначает
количественную меру интенсивности ахроматического (неокрашенного) света, ко-
торая принимает значения в диапазоне от черного до белого с промежуточными
серыми оттенками.
Хроматический (окрашенный) свет характеризуется следующими параметра-
ми [1.21, 1.22]:
– электромагнитным спектром, охватывающим диапазон длин волн примерно
от 380 до 780 нм (рис. 1.5);
– потоком лучистой энергии, излучаемой в единицу времени и измеряемой
в ваттах;
– световым потоком, оцениваемым по зрительному ощущению и измеряемым
в люменах;
– светлотой, цветовым тоном и насыщенностью, которые отражают уровень
производимого световым потоком зрительного ощущения и определяют цве-
товое восприятие.
40 Глава 1. Форматы изображений. Статические и динамические изображения
Рис. 1.5. Длины волн видимой части электромагнитного спектра
Цветовая система RGB
Субъективные измерения цветовых координат смешения трех чистых спектраль-
ных цветов (при одинаковой мощности монохроматических излучений с равной
энергией) привели к разработке принятого Международной комиссией по осве-
щению (МКО) стандартного набора монохроматических первичных основных
цветов: красного (R) с длиной волны 700 нм, зеленого (G) 546,1 нм и сине-
го (B) 435,8 нм.
В соответствии с теорией цветового зрения предполагается наличие в сетчат-
ке глаза светочувствительных приемников (колбочек) трех видов: 65% из них
воспринимают красный свет, 33% зеленый свет и 2% синий свет.
Совокупность реакций каждого из трех приемников на падающее излучение
определяет восприятие цвета. Если обозначить спектральные чувствительности
трех приемников ¯ R(λ), ¯ G(λ) и ¯B (λ), то три составляющие светового потока R, G
и B определяются соотношениями:
R =
max Z min
ϕ(λ)¯R(λ) dλ, G =
max Z min
ϕ(λ)¯G(λ) dλ, B =
max Z min
ϕ(λ)¯B (λ) dλ, (1.4)
где ϕ(λ) спектральная интенсивность лучистого потока на длине волны λ.
На рис. 1.6 представлены относительные кривые спектральной чувствитель-
ности трех светочувствительных приемников глаза [1.20]. Эти зависимости вос-
приятия цвета показывают, что никакая монохроматическая составляющая не
может характеризовать красный, зеленый или синий цвет. Следовательно, опре-
деленный набор монохроматических первичных составляющих не обеспечива-
ет возможность получения всех цветов спектра. Разным цветовым ощущениям
в одинаковых условиях наблюдения соответствуют разные спектральные распре-
деления излучения. Однако обратное утверждение неверно, т. е. ощущение одного
и того же цвета может возникать при различных спектральных распределениях
излучения.
Трехцветное выражение цвета опирается на установленный опытным путем
факт, что для большинства встречающихся в природе цветов можно выполнить
зрительное уравнивание со смесями взятых в различных пропорциях только трех
основных цветов. Эта связь взаимно однозначна независимо от спектрального
распределения излучения данного цвета [1.23–1.29].
В основе RGB-модели лежит Декартова система координат, цветовое про-
странство в соответствии с соотношениями (1.1) и рис. 1.3 представляет собой
1.2. Цветовые системы 41
Рис. 1.6. Функции относительной спектральной чувствительности трех видов светочув-
ствительных приемников глаза
куб. Другой способ задания цвета основан на применении двумерной диаграммы
цветностей МКО с x (красной) и y (зеленой) координатами (рис. 1.7). Третья z
(синяя) координата вычисляется однозначно: z = 1 − x − y.
На диаграмме цветностей МКО показано положение цветностей чистых спек-
тральных цветов, образующих подковообразную кривую чистых спектральных
цветностей. Линия, соединяющая точки чистых спектральных цветностей с дли-
нами волн 380 и 780 нм, называется линией пурпурных цветов. На этой же
диаграмме приведены точки стандартизованных величин источников света, ко-
торые воспроизводят условия освещения: А искусственного электрическими
лампами накаливания; В прямого солнечного света; С рассеянного дневного;
D65 усредненного дневного. Точка Е точка равной энергии при x = y =
= z = 1/3, она соответствует цветности естественного дневного цвета.
Источники света характеризуют также цветовой температурой, соответству-
ющей абсолютной температуре идеального излучателя (абсолютно черного тела),
цвет которого имеет ту же цветность, что и данное излучение (табл. 1.3) [1.29].
Выбранные на диаграмме МКО точки основных цветов определяют цветовую
модель RGB. При этом сочетания двух из основных цветов: зеленый + синий,
синий + красный, красный + зеленый воспроизводятся в виде вторичных цве-
тов голубого, пурпурного и желтого цветов, как показано на рис. 1.8.
42 Глава 1. Форматы изображений. Статические и динамические изображения
Рис. 1.7. Диаграмма цветностей МКО
Таблица 1.3. Координаты цветности и цветовая температура стандартных источников
света
Источник излучения
Координаты цветности
Цветовая температура, К
x Y
A 0,4512 0,4059 2856
B 0,3498 0,3527 4874
C 0,3104 0,3191 6774
D65 0,3138 0,3310 6504
E 1/3 1/3 5400
Рис. 1.8. Первичные и вто-
ричные основные цвета све-
товых источников
Таким образом, использование трех основных цве-
тов световых источников RGB, в которых каждый
элемент (пиксел) имеет глубину представления 24 бита
(по 8 битов на красную, зеленую и синюю составля-
ющие), позволяет создавать на экране цветного мо-
нитора полноцветное (True Color) изображение, как
показано на рис. 1.9.
Цветовые системы CMY и CMYK
Система CMY используется в цветных принтерах и ко-
пировальных устройствах, в которых цветные красите-
ли наносятся на бумагу.
1.2. Цветовые системы 43
Рис. 1.9. Формирование полноцветного изображения
Если в системе RGB голубой (Cyan), пурпурный (Magenta) и желтый (Yellou)
являются вторичными цветами, то в системе CMY они образуют первичные цвета
красителей, реализуя субстрактивный цветовой синтез.
Очевидно, если поверхность, покрытая голубой краской, освещается белым
светом, то красный цвет от нее не отражается. От поверхностей, покрытых пур-
пурной или желтой краской, не отражаются, соответственно, зеленый и синий
цвета.
Преобразование данных из RGB в CMY осуществляется простой операцией:
C
M
Y =
1
1
1 −
R
G
B , (1.5)
где значения цветов нормированы и находятся в диапазоне [0, 1].
В связи с тем, что смешивание в равном количестве голубого, пурпурного
и желтого цветов приводит при печати к появлению не черного, а грязно-серого
цвета, система CMY расширяется до системы CMYK, содержащей дополнительно
ключевой (Key) черный цвет (рис. 1.10).
Цветовая система HSI
Цветовые системы RGB и CMYK не приспособлены для словесного описания цве-
тов. Цветной объект обычно описывается такими понятиями, как цветовой тон,
его насыщенность и светлота, соответствующая понятию интенсивности (полуто-
новой яркости).
В цветовой системе HSI (Hye цветовой тон, Saturation насыщенность,
Intensity интенсивность) используется естественное описание цвета. Специфи-
4 Глава 1. Форматы изображений. Статические и динамические изображения
кой системы HSI является тот факт, что яркостная информация (интенсивность)
отделена от цветовой информации, характеризуемой цветовым тоном и насыщен-
ностью.
Рис. 1.10. Первичные и
вторичные основные цвета
красителей
Существуют различные формы геометрической ин-
терпретации системы HSI. Одна из них представляет
все цветовое пространство в виде фигуры из двух оди-
наковых и соединенных своими основаниями конусов,
как показано на рис. 1.11.
Расстояние между вершинами этих конусов нор-
мировано и равно 1, так что высота каждого кону-
са равна 0,5. Вершина нижнего конуса соответствует
уровню черного (0, 0), а верхнего уровню белого
(1, 0). Таким образом, интенсивность (яркость) объекта
определяется расстоянием от точки уровня черного до
горизонтального сечения, характеризующего цветовую
информацию. На рис. 1.11 приведено два сечения, со-
ответствующие I = 0,5 (в соединении оснований двух
конусов) и I = 0,75.
Рис. 1.11. Геометрическая интерпретация цветовой системы HSI
Цветовые параметры объекта характеризуются параметрами вектора, соеди-
няющего точку с центром круга, образованного соединением оснований двух
конусов, т. е. сечением фигуры на уровне интенсивности I = 0,5. Радиус этого
круга равен 1. При этом цветовой тон определяется углом H◦ наклона вектора
относительно ординаты, проведенной в направлении красного цвета. В представ-
ленной на рис. 1.11 плоскости сечения фигуры первичные основные (красный,
зеленый и синий) цвета расположены относительно друг друга под углом 120◦.
1.2. Цветовые системы 45
Вторичные (голубой, пурпурный и желтый) цвета смещены относительно друг
друга также на углы 120◦, а относительно первичных цветов на углы 60◦.
Насыщенность цвета S имеет значения в диапазоне [0, 1] и определяется длиной
вектора, соединяющего центр круга с точкой, определяющей цветовые парамет-
ры воспроизводимой детали.
Преобразование цветов из системы RGB в систему HSI
Если координаты RGB нормированы таким образом, что их значения ограни-
чены диапазоном [0, 1], и угол H◦ отсчитывается от красной оси пространства
HSI, то интенсивность (яркость), насыщенность и цветовой тон определяются
соотношениями:
I =
1
3
(R + G + B), (1.6)
S =
min(R,G,B)
I
, (1.7)
H◦ = θ◦, при B 6 G,
360◦ − θ◦, при B > G,
(1.8)
где θ◦ = 180
· arccosn R−1
2 (G+B)
[(R−G)2+(R−B)(G−B)]1/2o.
Преобразование цветов из системы HSI в систему RGB
Формулы преобразования различны для трех секторов параметра H◦.
RG сектор (0◦ 6 H◦ <120◦ ):
R = I h1 + S cosH◦
cos(60◦−H◦) i,
B = I(1 − S),
G = 3I − (R + B).
(1.9)
GB сектор (120◦ 6 H◦ < 240◦):
G = I h1 + S cosH◦
cos(180◦−H◦) i,
R = I(1 − S),
B = 3I − (R + G).
(1.10)
BR сектор (240◦ 6 H◦ <360◦ ):
B = I h1 + S cosH◦
cos(300◦−H◦)i,
G = I(1 − S),
R = 3I − (B + G).
(1.11)
Цветовые системы Y UV , Y IQ, Y DRDB, Y CRCB
Эти цветовые системы чаще всего используются в аналоговом и цифровом те-
левидении. Составляющая Y характеризует яркость элементов телевизионного
изображения, ее величина определяется линейной комбинацией основных цветов:
46 Глава 1. Форматы изображений. Статические и динамические изображения
Y = αRR + αGG + αBB, (1.12)
где коэффициенты αR, αG, αB определяют параметры исходного белого цвета,
и при изменяющихся основных RGB цветах в диапазоне [0, 1] αR + αG + αB = 1.
Остальные параметры этих систем (U, V ), (I,Q), (DR,DB), (CR,CB) линей-
но зависят от двух так называемых цветоразностных составляющих R-Y и B-Y
или являются их линейной комбинацией. Более подробное описание этих систем
приводится в главе 2.
Цветовая система CIELAB
Унифицированное пространство восприятия цвета CIELAB является стандартом,
принятым МКО в 1976 году [1.30]. Евклидово расстояние между двумя любыми
одинаково визуально различимыми цветовыми точками этого пространства име-
ет практически равную величину.
В цветовом пространстве CIELAB (точнее, CIE 1976 L*a*b) значение светло-
ты отделено от значения хроматической составляющей цвета (тон, насыщен-
ность). Светлота задана координатой L (изменяется от 0 до 100, т. е. от самого
темного до самого светлого), хроматическая составляющая двумя полярными
координатами a и b. Первая обозначает положение цвета в диапазоне от зелено-
го до пурпурного, вторая от синего до желтого. Это позволяет эффективно
применять данную систему при цветовом анализе.
На рис. 1.12 приведены изображения системы L*a*b для двух значений свет-
лоты L.
Рис. 1.12. Изображения изменений полярных координат a и b системы CIELAB при двух
значениях светлоты L
В отличие от цветовых пространств RGB или CMYK, которые являются, по
сути, набором аппаратных данных для воспроизведения цвета на экране монито-
ра или на бумаге (цвет может зависеть от типа печатной машины, марки красок,
влажности воздуха в цехе или производителя монитора и его настроек), CIELAB
однозначно определяет цвет. Поэтому CIELAB нашел широкое применение в про-
граммном обеспечении для обработки изображений в качестве промежуточного
цветового пространства, через которое происходит конвертирование данных меж-
ду другими цветовыми пространствами. При этом особые свойства L*a*b сделали
редактирование в этом пространстве мощным инструментом цветокоррекции.
1.3. Статические и динамические эталонные изображения 47
Благодаря характеру определения цвета в L*a*b появляется возможность от-
дельно воздействовать на яркость, контраст изображения и на его цвет. L*a*b
предоставляет возможность избирательного воздействия на отдельные цвета в изоб-
ражении, усиления цветового контраста, незаменимыми являются и возможно-
сти, которые это цветовое пространство предоставляет для борьбы с шумом на
изображении.
Учитывая соотношения
X
Y
Z =
0,412453 0,357580 0,180423
0,212671 0,715150 0,072169
0,019334 0,119193 0,950227 ·
R
G
B , (1.13)
перевод RGB данных в компоненты L*a*b* осуществляется следующим образом:
L∗ = 116 · f Y
Yn − 16,
a∗ = 500 · hf X
Xn − f Y
Yn i,
b∗ = 200 · hf Y
Yn − f Z
Zn i,
(1.14)
где
f(q) = q1/3, при q < 0,008856;
7,787 · q + 16/116, иначе;
q ∈ X
Xn
,
Y
Yn
,
Z
Zn .
Величины Xn, Yn, Zn определяют источник белого цвета D65 стандарта МКО и
могут быть получены при R = G = B = 100. 1.3Ñòàè÷åñêèåèäèíàìè÷åñêèåýòàëîíûåèçîáðàæåíèÿ
Цифровая обработка изображений применяется для решения различных задач:
– пространственного и частотного улучшения изображений;
– восстановления изображений, пораженных различными видами помех;
– сокращения избыточности и эффективного кодирования изображений для
хранения и передачи по каналам связи;
– распознавания и обнаружения объектов в изображениях и др.
При создании систем цифровой обработки изображений используются раз-
личные статические и динамические эталонные изображения, обладающие опре-
деленными свойствами [1.31–1.35].
Статические эталонные изображения применяются, в частности, для анализа
эффективности методов сжатия изображений, а также для анализа внутрикад-
рового кодирования динамических изображений. Динамические эталонные изоб-
ражения используются, например, для анализа эффективности поиска векторов
и компенсации движения деталей в изображениях, и др.
Статические эталонные изображения
На рис. 1.13а приведено широко используемое классическое цветное изображение
¾Лена¿ (¾Lenna¿), содержащее множество плавных цветовых переходов и на-
клонных границ, а на рис. 1.13б черно-белое изображение ¾Элина¿ (¾Elaine¿).
48 Глава 1. Форматы изображений. Статические и динамические изображения
Рис. 1.13. Изображения ¾Лена¿ (а) и ¾Элина¿ (б)
Рис. 1.14. Цветные изображения ¾Девушка¿ (а) и ¾Перцы¿ (б)
Аналогичными свойствами обладают эталонные изображения ¾Девушка¿ (¾Girl¿)
и ¾Перцы¿ (¾Peppers¿), которые даны на рис. 1.14.
На рис. 1.15 представлены три черно-белых изображения. Первое из них
¾Барбара¿ (¾Barbara¿) содержит множество различно ориентированных по-
лосок на скатерти, платке и брюках; при неэффективной обработке этого изоб-
ражения часто возникает муар и другие артефакты. На втором изображении
¾Золотой Холм¿ (¾Goldhill¿) на переднем и заднем планах содержится мно-
жество мелких деталей, третье изображение ¾Кинооператор¿ (¾Cameraman¿)
– содержит ряд протяженных разнонаправленных деталей.
Рис. 1.16 иллюстрирует два классических тестовых цветных изображения, со-
держащие вертикально и горизонтально ориентированные элементы, ¾Гавань¿
(¾Harbour¿) и ¾Корабль¿ (¾Boat¿).
1.3. Статические и динамические эталонные изображения 49
Рис. 1.15. Черно-белые эталонные изображения ¾Барбара¿ (а), ¾Золотой Холм¿ (б), ¾Ки-
нооператор¿ (в)
Рис. 1.16. Цветные изображения ¾Гавань¿ (а), ¾Корабль¿ (б)
Динамические эталонные изображения
При анализе качества преобразований динамических изображений используются
различные эталоны в зависимости от вида приложений.
Так, при разработке систем видеотелефонии и видеонаблюдения применяют
малоподвижные изображения.
Такие последовательности можно увидеть при воспроизведении AVI файлов,
содержащих цветные динамические изображения ¾Клер¿ (¾Claire¿, 335 кадров),
черно-белые изображения ¾Сьюзи¿ (¾Susie¿, 149 кадров), цветные изображения
¾Монитор холла¿ (¾Hall_monitor¿, 599 кадров).
При создании систем видеоконференцсвязи используют изображения с бо-
лее подвижными деталями. В качестве примеров приведены AVI файлы трех
последовательностей изображений: ¾Теннис¿ (¾Tennis¿, 223 кадра), ¾Прораб¿
(¾Foreman¿, 599 кадров) и ¾В автомобиле¿ (¾Carphone¿, 191 кадр).
Для оценки качества кодирования телевизионных изображений чаще всего ис-
пользуются динамические изображения ¾Сад цветов¿ (¾FlowerGarden¿, 229 кад-
ров), ¾Береговая охрана¿ (¾Coastguard¿, 300 кадров) и ¾Футбол¿ (¾Football¿,
249 кадров).
50 Глава 1. Форматы изображений. Статические и динамические изображения
Рис. 1.17. Кадры из видеопоследовательности ¾Клер¿
Рис. 1.18. Кадры из видеопоследовательности ¾Сьюзи¿
Рис. 1.19. Кадры из видеопоследовательности ¾Монитор холла¿
Рис. 1.20. Кадры из видеопоследовательности ¾Теннис¿
Рис. 1.21. Кадры из видеопоследовательности ¾Прораб¿
1.3. Статические и динамические эталонные изображения 51
Рис. 1.22. Кадры из видеопоследовательности ¾В автомобиле¿
Рис. 1.23. Кадры из видеопоследовательности ¾Сад цветов¿
Рис. 1.24. Кадры из видеопоследовательности ¾Береговая охрана¿
Рис. 1.25. Кадры из видеопоследовательности ¾Футбол¿
ËÀÂÀ2.1Ìî2íÑÈÈõÏðÑîÅìÒ íÅÅîÌÄåòÀÛåë×ÔÈâèÎäÂå ÈíÌèÄåÈÅ ÎÎÈÂÍÀÔÍÈÎß ÌÀÖÈ
Полный сигнал монохромного телевидения состоит из сигнала яркости, несу-
щего информацию о яркости передаваемого изображения, и сигнала синхрони-
зации, который представляет собой совокупность синхронизирующих импульсов
строк и полей телевизионного кадра [1.8, 1.9, 1.35].
В составе ТВ-сигнала чередуются так называемые активные интервалы, в ко-
торых передаются собственно сигналы изображения, и пассивные интервалы,
предназначенные для передачи управляющих гасящих и синхронизирующих
импульсов.
На рис. 2.1 в качестве примера приведено стилизованное изображение так
называемого линейного градационного клина (10 градаций яркости) и соответ-
ствующая ему форма полного ТВ-сигнала в интервале одной строки.
При этом сигнал изображения имеет положительную полярность, изменя-
ясь от уровня черного (минимальный уровень) до уровня белого (максимальный
уровень), а синхронизирующие и гасящие импульсы характеризуются сигналами
отрицательной полярности.
За опорный уровень принят уровень гашения, соответствующий передаче
уровня гасящих импульсов. Номинальные уровень белого и уровень черного
характеризуют максимально допустимые изменения сигнала яркости.
При цифровой обработке сигнала яркости обычно предусматривается исполь-
зование 8-разрядного цифрового кода, обеспечивающего точное воспроизведение
256 градаций яркости [1.36–1.39]. Как известно, максимальный контраст теле-
визионных изображений не превышает величины 200. Длительность активных
интервалов, форма гасящих и синхронизирующих импульсов, частоты строк, по-
лей и кадров, верхняя граничная частота сигнала яркости и др. нормируются
ТВ-стандартами [1.8, 1.9, 1.35, 1.40].
В табл. 2.1 приведена классификация используемых в различных странах
ТВ-стандартов, объединенных по принципу равенства верхних граничных частот
спектра сигнала яркости (fгр).
В таблице также приведена необходимая скорость передачи информации (или
объем информации, передаваемой за 1 сек) при дискретизации полного ТВ-сиг-
нала с частотой Котельникова–Найквиста и при использовании 8-разрядного
кодирования (K = 8).
Очевидно, что объем передаваемой информации (I) прямо пропорционален
граничной частоте спектра сигнала яркости [1.41]:
I = K × 2 × fгр.
2.1. Статические и динамические эталонные изображения 53
Рис. 2.1. Изображение градационного клина и форма сигнала в строчном интервале
Таблица 2.1. Стандарты аналогового ТВ-вещания
Стандарты Число строк/полей
в секунду
Граничная частота спектра
сигнала яркости, МГц
Объем информа-
ции, Мбит/с
M
N
525/60
625/50
4,2 67,2
B/G/H 625/50 5,0 80,0
I 625/50 5,5 88,0
D/K/K1/L 625/50 6,0 96,0
Для телевизионного стандарта, используемого в России, fгр = 6 МГц и I = 8×2× 6 = 96 Мбит/сек. При цифровой обработке сигналов весьма важными являются
сведения об объеме передаваемой информации или требуемой скорости передачи
цифрового потока, получаемого первоначально при переводе сигнала в цифровой
вид (еще до цифровой обработки), т. к. эти сведения служат отправной точкой
для всех дальнейших рассуждений.
54 Глава 2. Системы формирования и передачи видеоинформации
Рис. 2.2. Форма гасящих и синхронизирующих импульсов строк и полей
Стандарты M и N, нормирующие граничную частоту спектра сигнала ярко-
сти, равной fгр = 4,2 МГц, используются в странах Северной иЮжной Америки,
Японии, Южной Корее и ряде стран Юго-Восточной Азии.
Граничная частота 5 МГц (стандарты B/G/H) используется в системах те-
левидения, применяемых в большинстве стран Западной и Северной Европы,
Северной и Восточной Африки, Юго-Западной и Южной Азии, в Австралии.
Стандарт I, используемый в Великобритании и странахЮжной Африки, нор-
мирует граничную частоту сигнала яркости в 5,5 МГц.
И, наконец, Франция, страны Восточной Европы, Россия, страны СНГ, Китай
и ряд стран Центральной Африки используют стандарты D/K/K1/L, нормиру-
ющие частоту сигнала яркости в 6 МГц.
Учитывая, что сигнал яркости передается лишь в активных интервалах пол-
ного ТВ-сигнала, на самом деле объем информации может быть несколько умень-
шен. Его величина может быть рассчитана следующим образом:
I0 = I ×
Vакт
V ×
Hакт
H
= I ×
(V − Vпас)
V ×
(H − Hпас)
H
,
где V , H длительности кадра и строки, Vакт и Hакт длительности актив-
ных частей кадра и строки, Vпас и Hпас длительности пассивных частей кадра
и строки. В таком случае, учитывая, что V = 625H, Vпас = 50H, можно рассчи-
тать:
I = 96 × (575/625)× (64 − 12)/64 = 72 Мбит/с.
2.2. Цветное телевидение 5
На рис. 2.2 приведена форма гасящего импульса и последовательности синхро-
низирующих импульсов полей, а также форма пассивного строчного интервала
для используемых в России стандартов D, K. 2.Öâåòíîåòåëâèäåíèå
Стандартные системы цветного телевидения NTSC, PAL и SECAM [1.8, 1.42–
1.44] различаются в основном принципами формирования сигналов цветности,
передаваемых на поднесущих путем уплотнения спектра полного телевизионно-
го сигнала монохромного телевидения, так что на участке спектра, занимаемом
сигналами цветности, располагаются также и спектральные составляющие сиг-
нала яркости.
В табл. 2.2 приведен перечень государств, использующих различные системы
цветного телевидения.
Таблица 2.2. Использование различных систем цветного ТВ
B,G/PAL
Австралия
Австрия
Албания
Алжир
Бангладеш
Бахрейн
Бельгия
Бруней
Гана
Германия
Гибралтар
Дания
Босния
и Герцеговина
Замбия
Зимбабве
Израиль
Индия
Индонезия
Иордания
Италия
Исландия
Испания
Йемен
Камерун
Катар
Кения
Кувейт
Либерия
Люксембург
Македония
Малави
Малайзия
Мальдивы
Мальта
Мозамбик
Монако
Нигерия
Нидерланды
Новая
Зеландия
Норвегия
ОАЭ
Оман
Пакистан
Папуа Новая
Гвинея
Португалия
Сербия
Сингапур
Сирия
Словения
Судан
Сьерра-Леоне
Таиланд
Танзания
Тунис
Турция
Уганда
Финляндия
Хорватия
Черногория
Швейцария
Швеция
Шри-Ланка
Экваториаль-
ная Гвинея
Эфиопия
I/PAL
Ангола
Ботсвана
Великобритания Гонконг
Ирландия
Лесото Южная
Африка
N/PAL Аргентина Парагвай Уругвай
D/PAL Китай
M/PAL Бразилия
D,K/PAL КНДР Румыния
B,G/SECAМ
Греция
Египет
Ирак
Иран
Кипр
Ливан
Ливия
Маврикий
Мавритания
Мали
Марокко
Саудовская
Аравия
Тунис
D,K/SECAM
Афганистан
Болгария
Венгрия
Вьетнам
Монголия
Польша
СНГ и страны
Балтии
Словакия
Чехия
K1/SECAM
Бенин
Буркина-Фасо
Бурунди
Габон
Гвинея
Джибути
Заир
Конго
Кот-
д’Ивуар
Мадагаскар
Нигерия
Сенегал
Того
ЦАР
Чад
L/SECAM Люксембург Монако Франция
M/NTSC
Антильские
острова
Бермуды
Бирма
Боливия
Доминиканская
респ.
Венесуэла
Виргинские ост-
рова
Гаити
Гватемала
Гондурас
Канада
Колумбия
Коста-Рика
Куба
Мексика
Никарагуа
Панама
Перу
США
Суринам
Филиппины
Чили
Эквадор
Ю. Корея
Ямайка
Япония
56 Глава 2. Системы формирования и передачи видеоинформации
Система NTSC используется в Северной и Центральной Америке, в ряде стран
восточной части Южной Америки, а также в Японии, Южной Корее и в ряде
стран Юго-Восточной Азии.
Система SECAM применяется в России, в странах Восточной Европы и СНГ,
во Франции, в большинстве стран Северной Африки и Юго-Западной Азии.
Система PAL применяется в большинстве стран Западной и Северной Евро-
пы, в Индии, Китае, Австралии, Бразилии, Аргентине и ряде других стран.
Телевизионные системы, как следует из правил колориметрии, должны вос-
производить все цветности, лежащие в пределах треугольника основных цветов
на диаграмме международной комиссии по освещению МКО [1.24–1.27, 1.45].
На графике цветностей МКО (в обычной системе координат xy) основные
цвета R1,G1 и B1, а также белый цвет C, или исходная цветность системы при-
емника стандарта NTSC, имеют следующие координаты [1.40]:
XR1 = 0,67; YR1 = 0,33;
XG1 = 0,21; YG1 = 0,71;
XB1 = 0,14; YB1 = 0,08;
XC = 0,310; YC = 0,316.
Различным сочетанием (линейной комбинацией) этих трех основных цветов
можно получить любую цветность в пределах треугольника основных цветов на
диаграмме МКО.
При стандартизации систем PAL и SECAM были приняты измененные ос-
новные цвета (R2,G2,B2) и исходная цветность D65, которые соответствовали
созданным ко времени стандартизации люминофорам с повышенной яркостью,
но с уменьшенной насыщенностью зеленого и красного цветов. Основные цвета
и исходная цветность системы приемника имеют следующие координаты [1.40]:
XR2 = 0,64; YR2 = 0,33;
XG2 = 0,29; YG2 = 0,6;
XB2 = 0,15; YB2 = 0,06;
XD = 0,313; YD = 0,329.
Цветовые треугольники изображения на фоне цветового локуса диаграммы цвет-
ностей МКО даны на рис. 1.7.
При формировании полного цветового телевизионного сигнала во всех систе-
мах цветного телевидения используются сигнал яркости (E′Y ) и два цветораз-
ностных сигнала (E′R −Y и E′B −Y ), формируемые из гамма-скорректированных
сигналов основных цветов (E′R,E′G и E′B ) [1.8, 1.9]:
E′Y = 0,299E′R + 0,587E′G + 0,114E′B;
E′R −Y = E′R − E′Y ;
E′B −Y = E′B − E′Y .
Для оценки качества передачи и воспроизведения полного цветового ТВ-сиг-
нала обычно в качестве тестовых используют сигналы цветных полос, содер-
жащих три полосы основных цветов (красную, зеленую и синюю), три полосы
главных дополнительных цветов (желтую, голубую, пурпурную), а также белую
и черную полосы [1.46].
2.2. Цветное телевидение 57
Рис. 2.3. Цветные полосы и диаграммы их видеосигналов
Наиболее часто применяют сигналы вертикальных цветных полос, соответ-
ствующих 100% яркости белой полосы, 75% яркости и 100% насыщенности цвет-
ных полос. Иногда первая полоса разбивается на два участка: 100% яркости
(белая полоса) и 75% яркости (серая полоса).
На рис. 2.3 приведено стилизованное изображение и диаграммы сигналов при
передаче указанных вертикальных цветных полос. Верхняя часть диаграммы ха-
рактеризует формы сигналов основных цветов E′R , E′G и E′B , а нижняя формы
сигнала яркости E′Y (черная линия) и цветоразностных сигналов E′R −Y и E′B −Y .
2.2.1. Система NTSC
В системе NTSC используются не непосредственно цветоразностные сигналы,
а их линейная комбинация [1.8, 1.43]:
E′I = −0,27E′B −Y + 0,74E′R −Y ;
E′Q = 0,41E′B −Y + 0,48E′R −Y .
Коэффициенты здесь выбраны экспериментально с таким расчетом, чтобы мини-
мизировать ширину спектра одного из сигналов, а именно E′Q . Полосу, занимае-
58 Глава 2. Системы формирования и передачи видеоинформации
мую этим сигналом, удалось таким образом уменьшить примерно до 0,6МГц. Оба
сигнала E′I и E′Q передаются путем квадратурной модуляции одной поднесу-
щей, частота которой жестко связана с частотой строчной развертки fH и равна:
fS =
455
2 × fH = 3,579545 МГц,
fH = 15734,264 Гц.
Система NTSC применяется только в странах (см. табл. 2.2), в которых ис-
пользуется телевизионный стандарт M (граничная частота спектра сигнала яр-
кости 4,2 МГц).
В соответствии с требованиями на систему NTSC ограничение спектра сигна-
ла E′I должно осуществляться ФНЧ, имеющим затухание менее 3 дБ на частоте
1,3 МГц и более 20 дБ на частоте 3,6 МГц. Фильтр, обеспечивающий ограниче-
ние спектра сигнала E′Q, должен иметь затухание менее 2 дБ на частоте 0,4 МГц,
менее 6 дБ на частоте 0,5 МГц и более 6 дБ на частоте 0,6 МГц.
Сигнал цветности NTSC на поднесущей можно представить в виде:
E′S = E′I cos(ωSt + 33◦) + E′Q sin(ωSt + 33◦) = E′S0 cos(ωSt + 33◦ − ϕ),
где E′S 0 = q(E′I )2 + (E′Q )2, ϕ = Arctg(E′Q /E′I ), ωS = 2π·fS, fS частота цветовой
поднесущей.
Стилизованное изображение и форма сигналов E′I ,E′Q,E′S и полного цветово-
го ТВ-сигнала при передаче цветных полос 75% яркости и 100% насыщенности
приведены на рис. 2.4.
Для восстановления фазы цветовой поднесущей в приемном устройстве в со-
ставе полного цветового ТВ-сигнала NTSC передается вспышка цветовой подне-
сущей с длительностью, равной не менее 8 периодов частоты fS. Фаза поднесущей
во вспышке повернута на 180◦ относительно оси B–Y.
Стилизованная векторная диаграмма сигналов цветных полос изображена на
рис. 2.5, а параметры этих сигналов даны в табл. 2.3.
На рис. 2.5 вектор серого цвета характеризует вспышку цветовой поднесущей.
Ввиду того, что частота цветовой поднесущей в системе NTSC кратна нечетной
гармонике половины строчной частоты, полный цикл изменения фазы равен двум
кадрам (табл. 2.4).
Теоретически перевод полного цветового ТВ-сигнала NTSC в цифровой вид
может быть осуществлен, как было указано выше, при частоте дискретизации,
равной частоте Котельникова–Найквиста, т. е. 8,4 МГц.
Однако на практике при такой частоте требуется чрезвычайно точное кван-
тование сигнала по уровню (более 10 разрядов), а также очень точные и трудно-
реализуемые фильтры на передаче и приеме.
Только таким образом при этом можно избежать искажений цветовой под-
несущей, приводящих к возникновению ложных движущихся деталей в составе
воспроизводимого на приеме изображения.
Указанные дефекты можно также устранить путем повышения частоты дис-
кретизации и привязки ее к частоте цветовой поднесущей [1.37, 1.47].
При использовании 9-разрядного кодирования, необходимого для обеспече-
ния малых погрешностей восстановления фазы поднесущей, объем информации
2.2. Цветное телевидение 59
Рис. 2.4. Изображение цветных полос и форма соответствующих сигналов системы NTSC
преобразованного сигнала составит:
I0 = 9 × fД = 128,7 Мбит/с.
2.2.2. Система PAL
В системе PAL [1.9, 1.37, 1.43, 1.44], широкое применение которой иллюстриру-
ется табл. 2.2, используются два компрессированных цветоразностных сигнала:
E′U = 0, 493E′B −Y ;
E′V = 0, 877E′R −Y .
Сигнал цветности формируется путем квадратурной модуляции этими сиг-
налами одной цветовой поднесущей, причем модуляция осуществляется таким
образом, что полярность одного из цветоразностных сигналов на поднесущих
коммутируется от строки к строке:
E′S = E′U cos ωSt + E′V sinωSt = E′S 0 cos(ωSt − ϕ),
E′∗S = E′U cos ωSt − E′V sinωSt = E′S0 cos(ωSt − ϕ),
где E′S0 = p(E′U )2 + (E′V )2, ϕ = arctg(E′V /E′U ), ωS = 2π · fS, fS частота цвето-
вой поднесущей.
fS = 1135
4
+
1
625 fH = 4,43361875 МГц для стандартов B, G, H, I;
60 Глава 2. Системы формирования и передачи видеоинформации
Рис. 2.5. Векторные диаграммы сигналов цветных полос различных систем цветного те-
левидения
Таблица 2.3. Параметры сигналов цветных полос NTSC
Цвет
полосы
Сигналы основных
цветов
Сигнал
яркости
Сигналы цветности NTSC
по видеочастоте на поднесущей
E′R, % E′G, % E′B , % E′Y , % E′Q, % E′I , % размах, % фаза, ˚
Белый 100 100 100 100 0 0 0 –
Серый 75 75 75 75 0 0 0 –
Желтый 75 75 0 66,6 −23,4 +24,2 66,6 167
Голубой 0 75 75 52,4 −16,0 −45,0 95,2 283,5
Зеленый 0 75 0 44,2 −39,2 −20,7 88,4 240,5
Пурпурный 75 0 75 30,7 +39,2 +20,7 88,4 60,5
Красный 75 0 0 22,5 +16,0 +45,0 95,2 103,5
Синий 0 0 75 8,2 +23,4 −24,2 66,6 347
Черный 0 0 0 0 0 0 0 –
Вспышка – – – – −16,8 +10,9 40 180
fS =
909
4
fH = 3,57561149 МГц для стандарта N.
В соответствии со стандартом на систему PAL фильтры, осуществляющие
ограничение спектра сигналов EU и EV , должны иметь затухание не более 3 дБ
на частоте 1,3 МГц и не менее 20 дБ на частоте 4 МГц.
2.2. Цветное телевидение 61
Таблица 2.4. Изменение фазы поднесущей по строкам сигнала NTSC
№ строки
№ кадра
1 кадр 2 кадр 3 кадр
1 поле 2 поле 1 поле 2 поле 1 поле 2 поле
n-2 0 π π 0 0 π
n-1 π 0 0 π π 0
n 0 π π 0 0 π
n+1 π 0 0 π π 0
n+2 0 π π 0 0 π
Форма осциллограмм цветоразностных сигналов и полного цветового ТВ-сиг-
нала PAL при передаче цветных полос 75%-й яркости и 100%-й насыщенности
приведена на рис. 2.6.
Рис. 2.6. Изображение цветных полос и форма соответствующих сигналов системы PAL
Вспышка цветовой поднесущей передается на задней площадке строчного га-
сящего импульса (10 ± 1 периодов колебаний), ее фаза коммутируется от строки
к строке и составляет 135◦ в строках, где передается сигнал +EV , и −135◦ в стро-
ках, где передается сигнал −EV . Наглядное представление о сигнале цветности
дает векторная диаграмма рис. 2.5. В табл. 2.5 приведены основные параметры
составляющих полного цветового ТВ-сигнала цветных полос.
62 Глава 2. Системы формирования и передачи видеоинформации
Ввиду того, что в системе PAL в двух смежных строках передаются различ-
ные сигналы цветности, а частота цветовой поднесущей равна сумме нечетной
гармоники четверти строчной частоты и частоты кадров (кроме стандарта N),
полный цикл изменения сигнала цветности равен четырем кадрам (см. табл. 2.6) [1.48].
При использовании в качестве частоты дискретизации четвертой гармоники
цветовой поднесущей и 9-разрядного кодирования объем информации преобра-
зованного в цифровой код полного цветового ТВ-сигнала системы PAL составит:
– для стандарта N I0 ≈ 128,7 Мбит/с;
– для стандартов B, G, H, I I0 ≈ 159,6 Мбит/с.
Таблица 2.5. Параметры сигналов цветных полос PAL
Цвет
полосы
Сигналы основных
цветов
Сигнал
яркости
Сигналы цветности PAL
на видеочастоте на поднесущей
ER, % EG, % EB, % EY , % EU, % EV , % размах, %
фаза, ◦
E′S E′∗S
Белый 100 100 100 100 0 0 0 – –
Серый 75 75 75 75 0 0 0 – -
Желтый 75 75 0 66,6 −32,9 +7,3 66,6 167 193
Голубой 0 75 75 52,4 +11,1 −46,5 95,2 283,5 76,5
Зеленый 0 75 0 44,2 −21,8 −39,2 88,4 240,5 119,5
Пурпурный 75 0 75 30,7 +21,8 +39,2 88,4 60,5 299,5
Красный 75 0 0 22,5 −11,1 +46,5 95,2 103,5 256,5
Синий 0 0 75 8,2 +32,9 −7,3 66,6 347 13
Черный 0 0 0 0 0 0 0 – –
Вспышка – – – – −15,1 +15,1 42,8 135 225
Таблица 2.6. Изменение фазы поднесущей по строкам сигнала PAL
№ строки
№ кадра
1 кадр 2 кадр 3 кадр 4 кадр 5 кадр
1 поле 2 поле 1 поле 2 поле 1 поле 2 поле 1 поле 2 поле 1 поле 2 поле
n − 4 F0 F∗ /2 F∗ 3 /2 F0 F F∗ 3 /2 F∗ /2 F F0 F∗ /2
n − 3 F∗ 3 /2 F0 F F∗ 3 /2 F∗ /2 F F0 F∗ /2 F∗ 3 /2 F0
n − 2 F F∗ 3 /2 F∗ /2 F F0 F∗ /2 F∗ 3 /2 F0 F F∗ 3 /2
n − 1 F∗ /2 F F0 F∗ /2 F∗ 3 /2 F0 F F∗ 3 /2 F∗ /2 F
n F0 F∗ /2 F∗ 3 /2 F0 F F∗ 3 /2 F∗ /2 F F0 F∗ /2
n + 1 F∗ 3 /2 F0 F F∗ 3 /2 F∗ /2 F F0 F∗ /2 F∗ 3 /2 F0
n + 2 F F∗ 3 /2 F∗ /2 F F0 F∗ /2 F∗ 3 /2 F0 F F∗ 3 /2
n + 3 F∗ /2 F F0 F∗ /2 F∗ 3 /2 F0 F F∗ 3 /2 F∗ /2 F
n + 4 F0 F∗ /2 F∗ 3 /2 F0 F F∗ 3 /2 F∗ /2 F F0 F∗ /2
Примечание: F и F∗ вид передаваемого сигнала; 0, π/2, π, 3π/2 фаза поднесущей.
2.2.3. Система SECAM
В системе SECAM [1.9, 1.37, 1.43, 1.44, 1.49] (см. табл. 2.2) сигнал цветности
представляет собой две цветовых поднесущих, промодулированных по частоте
2.2. Цветное телевидение 63
цветоразностными сигналами в двух смежных строках:
D′B = 1,5EB−Y ;
D′R = −1,9ER−Y .
Особенностью этой системы является то, что сигналы двух частотно-модулиро-
ванных цветовых поднесущих передаются в строчных интервалах поочередно,
т. е. в каждой из строк передается только один из сигналов D′B или D′R , а на
приеме в качестве второго сигнала используется сигнал из предыдущей строки,
что достигается применением линии задержки на длительность строчного ин-
тервала. Такая замена реального сигнала на сигнал предыдущей строки не ведет
к заметным искажениям, т. к. сигнал цветности от строки к строке изменяется
очень мало.
Учитывая, что при декодировании частотно-модулированных поднесущих спектр
флуктуационных помех приобретает треугольный характер, для повышения по-
мехоустойчивости в кодирующем устройстве цветоразностные сигналы подвер-
гаются предварительной коррекции по видеочастоте с помощью фильтра, ком-
плексная частотная характеристика которого равна:
KB(if) =
1 + if/f0
1 + if/3f0
,
гдеf0 = 85 кГц, f < 3 МГц.
На рис. 2.7 приведены формы цветоразностных сигналов цветных полос после
их предварительной коррекции фильтром с указанной характеристикой.
Рис. 2.7. Изображение цветных полос и форма соответствующих сигналов системы
SECAM
64 Глава 2. Системы формирования и передачи видеоинформации
Рис. 2.8. Параметры цепей формирования сигналов цветности системы
SECAM
На рис. 2.8 приведена номинальная результирующая АЧХ цепи предыскаже-
ний цветоразностных сигналов и ФНЧ, ограничивающих их спектр. Подавление
спектра этих сигналов на частоте 1,3 МГц должно быть менее 3 дБ, а на частоте
3,5 МГц более 30 дБ.
В результате предкоррекции сигналов D′R и D′B на их перепадах появляются
выбросы (см. рис. 2.7), размах которых с учетом ограничения спектра сигна-
лов примерно равен размаху перепадов. Для ограничения диапазона изменения
поднесущих частот в частотном модуляторе производят ограничение выбросов,
превышающих границы интервалов:
+ 1,25 и − 1,81 для сигнала D′R;
+ 2,20 и − 1,52 для сигнала D′B .
Номинальная девиация частот цветовых поднесущих, соответствующая уров-
ням цветоразностных сигналов, равным 1,0, должна быть 280 кГц в строке с сиг-
налом D′R и 230 кГц в строке с сигналом D′B (рис. 2.9).
Предкорректированные сигналы D′R модулируют по частоте цветовую подне-
сущую f0R = 282 · fH = 4,40625 МГц, а предкорректированные сигналы D′B
цветовую поднесущую f0B = 272 · fH = 4,25 МГц.
Предельная величина девиации, соответствующая передаче пиковых значе-
ний цветоразностных сигналов, равна:
– для сигнала D′R : +350 кГц и −506 кГц;
– для сигнала D′B : +506 кГц и −350 кГц.
2.2. Цветное телевидение 65
Рис. 2.9. Диаграммы, поясняющие взаимосвязь между частотами поднесущих системы
SECAM и их девиацией
Характеристики модуляторов также изображены на рис. 2.8. Иллюстрацией здесь
могут служить данные, приведенные на рис. 2.9 и в табл. 2.7.
Ввиду того, что частоты f0R и f0B кратны частоте строк, без использования
специальных мер цветовые поднесущие на экране кинескопа могут создавать за-
метный узор из темных и светлых полос.
Для снижения заметности этого рисунка производят коммутацию фазы цвето-
вых поднесущих по следующему закону: фаза цветовых поднесущих независимо
от вида модулирующих сигналов (D′R или D′B ) изменяется на 180◦ в начале и
в конце каждой третьей строки и, кроме того, в начале и конце каждого поля.
В табл. 2.8 приведено изменение вида сигнала цветности и фазы цветовых
поднесущих по строкам в системе SECAM (передаваемый сигнал D′R обозначен
буквой R, а D′B буквой B) [1.48].
6 Глава 2. Системы формирования и передачи видеоинформации
Таблица 2.7. Параметры сигналов цветных полос SECAM
Цвет
полосы
Сигналы основных
цветов
Сигнал
яркости
Сигналы цветности SECAM
по видеочастоте на поднесущей
ER, % EG, % EB, % EY , % D′R, % D′B , %
строка D′R строка D′B
размах,
%
деви-
ация,
кГц
размах,
%
деви-
ация,
кГц
Белый 100 100 100 100 0 0 30,7 0 23,8 0
Серый 75 75 75 75 0 0 30,7 0 23,8 0
Желтый 75 75 0 66,6 −16,2 −100 26,2 −45 51,8 −230
Голубой 0 75 75 52,4 +100 +33,6 68,0 +280 24,1 +78
Зеленый 0 75 0 44,2 +83,6 −66,0 61,8 +235 40,0 −152
Пурпурный 75 0 75 30,7 −83,6 +66,0 30,4 −235 30,2 +152
Красный 75 0 0 22,5 −100 −33,6 36,0 −280 30,3 −78
Синий 0 0 75 8,2 +16,2 +100 36,0 +45 39,6 +230
Черный 0 0 0 0 0 0 30,7 0 23,8 0
СЦС − − − − +125 −152 77,6 +350 71,2 −350
Примечание: СЦС сигналы цветовой синхронизации, передаваемые в интер-
вале кадрового гасящего импульса.
Для повышения помехоустойчивости декодирования цветоразностных сигна-
лов дополнительно производится предварительная коррекция частотно-модули-
рованных поднесущих с помощью цепи, комплексный коэффициент передачи
которой:
KП(if) =
1 + i · 16F
1 + i · 1, 26 F
, где F =
f
f0 −
f0
f
, f0 = 4,286 МГц, |F| < 1.
Номинальная АЧХ этой цепи также приведена на рис. 2.8.
Включение в приемнике корректирующих цепей на поднесущей и по видеоча-
стоте с характеристиками, обратными KП(if) и KB(if), обеспечивает уменьше-
ние суммарной мощности флуктуационных помех в цветоразностных сигналах
примерно в 4 раза. Форма цветовых поднесущих после предкоррекции при пере-
даче цветных полос и форма полного цветового ТВ-сигнала в активных строках
растра приведены на рис. 2.8. Наглядное представление о взаимосвязи между
частотами поднесущих, их девиациями дает рис. 2.9.
Полный цветовой ТВ-сигнал формируется путем сложения сигналов яркости,
цветности и синхронизации.
Сигналы цветовой синхронизации (СЦС) передаются в строках с 7-й по 15-ю
и с 320-й по 328-ю и формируются из разнополярных импульсов с пилообразным
фронтом. Номинальные размахи СЦС в строках D′R и D′B соответственно равны
0,54 В и 0,5 В. Форма СЦС приведена на рис. 2.10. В табл. 2.7 даны основные
параметры сигналов цветных полос, кодируемых по системе SECAM.
При использовании в качестве частоты дискретизации четвертой гармони-
ки цветовой поднесущей покоя в строках D′R и 9-разрядном кодировании объем
информации преобразованного в цифровой код полного цветового ТВ-сигнала
системы SECAM составит I0 ≈ 158,6 Мбит/с.
2.2. Цветное телевидение 67
Таблица 2.8. Изменение сигналов цветности и фаз цветовых
поднесущих по строкам сигнала SECAM
Номер
строки
Номер кадра
1 кадр 2 кадр 3 кадр 4 кадр 5 кадр 6 кадр 7 кадр
1 поле
2 поле
1 поле
2 поле
1 поле
2 поле
1 поле
2 поле
1 поле
2 поле
1 поле
2 поле
1 поле
2 поле
n − 6 R0 B0 B R R0 B B0 R0 R B B0 R R0 B0
n − 5 B R R0 B B0 R0 R B B0 R R0 B0 B R
n − 4 R0 B B0 R0 R B B0 R R0 B0 B R R0 B
n − 3 B0 R0 R B B0 R R0 B0 B R R0 B B0 R0
n − 2 R B B0 R R0 B0 B R R0 B B0 R0 R B
n − 1 B0 R R0 B0 B R R0 B B0 R0 R B B0 R
n R0 B0 B R R0 B B0 R0 R B B0 R R0 B0
n + 1 B R R0 B B0 R0 R B B0 R R0 B0 B R
n + 2 R0 B B0 R0 R B B0 R R0 B0 B R R0 B
n + 3 B0 R0 R B B0 R R0 B0 B R R0 B B0 R0
n + 4 R B B0 R R0 B0 B R R0 B B0 R0 R B
n + 5 B0 R R0 B0 B R R0 B B0 R0 R B B0 R
n + 6 R0 B0 B R R0 B B0 R0 R B B0 R R0 B0
Рис. 2.10. Сигналы синхронизации полного цветового ТВ-сигнала системы SECAM
В табл. 2.9 сведены данные о требуемой скорости цифровой передачи моно-
хромного ТВ-сигнала и cигналов различных систем цветного телевидения.
2.2.4. Цифровые компонентные телевизионные
сигналы
Уменьшение объема информации при цифровой передаче сигналов цветного те-
левидения возможно при кодировании компонент полного цветового ТВ-сигнала.
К примеру, в системе NTSC сигналы EY , EI и EQ могут быть продискре-
тизированы с соответствующими частотами Котельникова–Найквиста 8,4 МГц,
3 МГц и 1,2 МГц. При 8-битовом квантовании сигнала яркости и 7-битовом
68 Глава 2. Системы формирования и передачи видеоинформации
Таблица 2.9. Сравнение объемов информации для различных
систем цветного телевидения
Тип
изображения
Сигналы
Граничные частоты
сигналов яркости
и цветности, МГц
Сигналы цветовой
поднесущей, МГц
Скорость передачи
цифровой инфор-
мации, Мбит/с
Монохромное EY 6,0 – 72
NTSC EY /EI/EQ 4,2/1,5/0,6 ≈ 3, 58 128,7
PAL EY /EU/EV 5,0/1,5/1,5 ≈ 4, 43 159,6
SECAM EY /D′R/D′B
построчно
6,0/1,5/1,5
4,406 D′R,
4,25 D′B
158,6
сигналов цветности, получим поток 96,6 Мбит/с, что соответствует дискретиза-
ции полного ТВ-сигнала 9-битовым ИКМ.
Если снизить цветовую четкость изображения по вертикали до цветовой чет-
кости по горизонтали, т. е. уменьшить количество строк для сигнала EI в два
раза, а для сигнала EQ в четыре раза, то цифровой поток станет равным
79,8 Мбит/с.
Дополнительное сокращение цифрового потока связано с устранением пас-
сивных участков строк и полей. В этом случае цифровой поток станет равным
60 Мбит/с.
Кодирование составляющих сигналов PAL и SECAM может осуществляться
аналогичным образом, хотя потребуется несколько большая скорость передачи
ввиду расширения полосы частот используемых сигналов яркости и цветности.
Так, для телевизионного стандарта, используемого в России (граничная часто-
та спектра сигнала яркости 6 МГц и граничные частоты спектров цветоразност-
ных сигналов 1,5 МГц), требуется использование цифрового потока порядка
80Мбит/с (с учетом сокращения цветовой четкости по вертикали в 4 раза и устра-
нения гасящих интервалов).
Попытка создать цифровой сигнал, совместимый с компонентами сигналов
NTSC, PAL и SECAM привела к созданию международного стандарта покомпо-
нентного кодирования полного цветового ТВ-сигнала [1.36, 1.37, 1.50].
Этот стандарт предусматривает передачу сигналов яркости EY и цветораз-
ностных сигналов ER−Y и EB−Y , преобразованных в 8-разрядный цифровой код
с частотой дискретизации:
fDY = 858 · fH NTSC = 864 · fH PAL / SECAM = 13,5 МГц для яркостного сигнала,
fDR−Y/B−Y = 6,75 МГц для цветоразностных сигналов.
Здесь fH NTSC частота строк для стандартов на 525/60 строк/полей в секунду,
fH PAL / SECAM частота строк для стандартов на 625/50 строк/полей в секунду.
Для передачи диапазона размахов сигналов в пределах от 0 до 1,0 (1,0 мак-
симальный размах сигнала яркости) из общего числа 256 уровней квантования
отведено 220 уровней для сигнала яркости и 225 уровней для цветоразностных
сигналов.
Максимальный и минимальный (255 и 0) уровни зарезервированы для сигна-
лов синхронизации, диапазон изменений информационных сигналов 1. . . 254.
2.2. Цветное телевидение 69
Цифровой сигнал яркости определяется как:
YD = round(219EY + 16),
а цветоразностных сигналов:
CR = round(112ER−Y /0, 701 + 128),
CB = round(112EB−Y /0, 886 + 128),
где round(x) округление x до ближайшего целого.
Амплитудный диапазон сигнала ER−Y лежит в пределах −0,701. . .+0,701,
а сигнала EB−Y в пределах −0,886. . .+0,886.
Крайние числа этих пределов соответствуют максимальным и минимальным
уровням цветоразностных сигналов при передаче цветных полос 100%-й яркости
и насыщенности.
Дискретизирующая структура должна быть ортогональной и статической в про-
странстве и во времени. Отсчеты сигналов цветности в строке должны позици-
онно совпадать с нечетными отсчетами сигнала яркости.
В студийном варианте обычно производится непрерывная дискретизация сиг-
нала яркости и цветоразностных сигналов без устранения пассивных участков
этих сигналов. В этом случае при 8-битовом квантовании возникает цифровой
поток объемом 216 Мбит/с.
При устранении пассивных интервалов и обеспечении равной четкости изоб-
ражения по горизонтали и вертикали объем информации может быть существен-
но сокращен.
При частоте дискретизации 13,5 МГц количество отсчетов в строчном ин-
тервале ТВ-стандарта 625/25 равно 864. В активной части строки укладывается
720 отсчетов сигнала яркости.
Если формат изображения определяется соотношением 4 : 3, то в кадре долж-
но быть использовано: 720 · 3/4 = 540 строк (при равной четкости по горизон-
тали и вертикали). Однако в стандартном телевизионном вещании используется
576 активных строк.
При 360 отсчетах каждого из цветоразностных сигналов в активной части
строчного интервала количество используемых строк составляет 288. Таким об-
разом, в случае 8-разрядного кодирования (см. рис. 2.11) сигнала яркости и двух
цветоразностных сигналов общая скорость цифрового потока составит:
I0 = 8 · 25 · [720 · 576 + 2 · 360 · 288] = 124,416 Мбит/с.
Здесь число 25 количество кадрам в секунду.
Для обеспечения качества вещания, соответствующего стандартным систе-
мам цветного телевидения, учитывая, что спектры цветоразностных сигналов
примерно в четыре раза уже спектра сигнала яркости, частота дискретизации
сигналов цветности может быть уменьшена еще в два раза, а количество исполь-
зуемых строк сокращено до 144. В этом случае объем информации о цветораз-
ностных сигналах может быть дополнительно сокращен в четыре раза, и общая
скорость цифрового потока составит:
I0 = 103,68 Мбит/с.
В американском стандарте используется 640 отсчетов в активной части строк
и 480 активных строк при частоте кадров, равной 30 кадров в секунду. Следо-
70 Глава 2. Системы формирования и передачи видеоинформации
Рис. 2.11. Шкалы сигнала яркости и цветоразностных сигналов при компонентном коди-
ровании
вательно, в случае 8-разрядного кодирования сигнала яркости и двух цветораз-
ностных сигналов общая скорость цифрового потока составит:
I0 = 8 · 30 · [640 · 480 + 2 · 320 · 240] = 110,592 Мбит/с. 2.3Òåëâèäåíè åïîâûøåíîé,÷òêîñò,¾öðîêèí¿âûñîêéèñâåðõâûñîêé
Телевидение высокой четкости, рассматривавшееся в первых вариантах реали-
зации как новая аналоговая система, в настоящее время развивается только
в цифровом виде.
Телевидение повышенной четкости имеет иной формат кадра, определяемый
соотношением 16 : 9 его ширины к высоте, примерно в два раза большее про-
странственное разрешение (1280×720) по сравнению со стандартным ТВ и может
иметь в два раза большее временное разрешение (50, 60 кадров/с) при исполь-
зовании прогрессивной развертки. Цветоразностные сигналы имеют в два раза
меньшее разрешение по горизонтали по отношению к сигналу яркости и такое
же или в два раза меньшее разрешение по вертикали (так называемые модели
цветности 4 : 2 : 2 и 4 : 2 : 0) [1.2, 1.51–1.55]. При этом скорости формируемо-
го цифрового потока для систем ТВ повышенной четкости лежат в диапазоне
264–844 Мбит/с.
Телевидение высокой четкости имеет еще более высокое пространственное
разрешение (1920×1080) [1.2, 1.51–1.55]. При воспроизведении на большом экране
повышается заметность мельканий и погрешностей цветности, поэтому в систе-
мах ТВЧ, как правило, рекомендуется использовать прогрессивную развертку
2.4. Видеотелефония и видеоконференцсвязь, домашнее видео 71
с частотой кадров 50 или 60 Гц и модель яркость/цветность 4 : 2 : 2, при ко-
торой на каждый пиксел приходится 16 битов информации (точнее, 32 бита на
2 пиксела 2 восьмибитных значения яркости и по одному восьмибитному зна-
чению каждого из цветоразностных сигналов). Результирующий цифровой поток
видеоданных, таким образом может составить до 2 Гбит/с.
Еще большие значения скорости цифрового потока получаются для перспек-
тивных систем ТВ сверхвысокой четкости и ¾цифрового кино¿ [1.52]. Здесь пред-
полагается использовать пространственные разрешения от 1920 × 1080 (уровень
Н0) до 7680 × 4320 (уровень Н3). Для представления отсчетов яркости и цвет-
ности предполагается использовать 10 (Н0, Н1) или 12 (Н2, Н3) битов. Скорость
цифрового потока, таким образом, составит от 2,3 (Н0) до 66,7 (Н3) Гбит/с.
Наряду с улучшением и созданием новых систем сжатия традиционных видео-
сигналов, снимаемых с одной точки наблюдения, бурно развивается как стерео-
скопическое телевидение (бинокулярное), так и автостереоскопическое (с несколь-
кими точками наблюдения, обычно до 9–16 видов). Кроме того, создано и раз-
вивается такое направление, как телевизионные системы с произвольной точкой
наблюдения (ТСПТН) [1.54].
Мультивидовое видео, записанное синхронизированными фото- или видеока-
мерами с различных точек наблюдения, дает обширную 3D-информацию о сцене
и расширяет зрительские впечатления по сравнениюс традиционнымвидео. 3D-телеви-
дение обеспечивает трехмерное ощущение глубины наблюдаемого вида, а ТСПТН
дает возможность интерактивного выбора точки наблюдения и направления в пре-
делах определенного рабочего диапазона углов обзора. Реализация 3D-прило-
жений зависит от полного цикла обработки, включая захват, сжатие, передачу,
отображение и интерактивное представление. Кодирование нескольких видов ди-
намических изображений является одной из наиболее многообещающих техноло-
гий, поскольку огромный объем данных, пропорциональный числу камер, должен
быть сжат до такой степени, чтобы его можно было передавать в пределах воз-
можностей сетей связи. 2.4Âèîäìåàîøòíå ëâèîäíåèîÿèâèäåîêí åðíöñâÿçü,
В системах видеотелефонии и видеоконференцсвязи предъявляются понижен-
ные (по сравнению с обычным ТВ) требования как к четкости изображения
(пространственному разрешению), так и к его динамичности (временному разре-
шению).
В видеотелефонии обычно используются разрешения до 176×144 пиксела при
скорости смены кадров до 5 кадров/с. Соответственно, скорость результирующе-
го цифрового потока сравнительно невелика до 1,5 Мбит/с.
В видеоконференцсвязи может использоваться большая четкость изображе-
ния до четверти телевизионного при кадровой скорости до 25–30 кадров/с,
скорость цифрового потока доходит до 35 Мбит/с.
В системах домашнего видео и видео по запросу используется телевизионное
временное разрешение (25–30 кадров/с), но снижены требования к простран-
72 Глава 2. Системы формирования и передачи видеоинформации
ственному разрешению, поэтому скорость цифрового потока в этих системах
примерно в 4 раза ниже, чем в ТВ-системах.
Цифровое представление видеосигнала требует больших объемов памяти для
хранения и высоких пропускных способностей каналов связи (см. табл. 2.10).
Использование каналов связи для передачи цифровых видеосигналов без специ-
альной обработки было бы малоэффективным, так как цифровое представление
видеоинформации обладает, как правило, существенной избыточностью.
Для снижения потока видеоданных в различных системах передачи информа-
ции чаще всего используются стандартизованные методы, позволяющие произво-
дить совместимое оборудование множеству компаний, работающих в этой обла-
сти. Наибольшее распространение получили стандарты семейства MPEG [1.56–
1.60], использующие общую схему видеокомпрессии.
В табл. 2.10 приведены параметры исходных видеосигналов для различных
приложений, обеспечивающих передачу движущихся изображений, а в табл. 2.11
параметры исходных сигналов для некоторых видеоинформационных систем со
многими точками наблюдения. 2. 5ðà è÷åñêèåèíòðàòâíèûçåîáñèðàòæåìíûèÿï,å ðàêäñàè÷ìèëçüîíáûðåàñæèåíòèåéìû
В ряде случаев такие изображения статические и двухуровневые. Так как изоб-
ражение обычно состоит из текста и рисунков, требуется более высокое простран-
ственное разрешение по сравнению со стандартным телевидением.
В большинстве случаев такие изображения можно представить в виде соче-
тания мозаичных или геометрических элементов, которые хранятся в памяти
приемного устройства.
Имеются стандарты МККТТ по передаче графических изображений. Факси-
мильные системы обеспечивают передачу сигналов по телефонным аналоговым
или цифровым каналам (общего пользования или выделенным). Цифровая пере-
дача обычно ведется со скоростями 1200, 2400, 4800 или 9600 бит/с. В новейших
системах скорости достигают 56 Кбит/с при помехоустойчивом кодировании.
Интерактивные системы передачи изображений это так называемые си-
стемы Телетекст и Видеотекс [1.61, 1.62]. Первая из них предполагает передачу
информации в интервалах строк гасящих импульсов полей ТВ-сигнала, вторая
использует телефонные линии общего пользования. Обе имеют один стандарт,
определяющий набор используемых символов:
– литеры и мозаичные элементы;
– прямые;
– точки;
– дуги;
– многоугольники и т. д.
Они объединены в кодовые таблицы, составляющие иерархическую структуру.
2.5. Графические изображения, факсимильные системы 73
Таблица 2.10. Параметры видео для различных приложений
Приложения
Размер
кадра
Модель
цветности,
количество
битов на пиксел
Формат
экрана
Частота
кадров,
кадров/с,
развертка
Скорость
цифрового
потока,
Мбит/с
Видеотелефония
subQCIF,
QSIF, QCIF 4 : 2 : 0, 12 4 : 3
1–5
прогрессивная 0,141–1,45
Видеоконференц-
связь
QSIF,
QCIF,
SIF, CIF
4 : 2 : 0, 12 4 : 3
5–30
прогрессивная 1,10–34,8
Домашнее видео,
видео по
требованию
SIF
4 : 2 : 0, 12 4 : 3
30
прогрессивная 26,4
CIF
25
прогрессивная 29,0
Стандартное ТВ
640 × 480
(NTSC) 4:2:0, 12 4:2:2, 16 4:3
30
чересстрочная 105–141
720 × 576
(PAL, SECAM)
25
чересстрочная 119–158
ТВ-повышенной
четкости
1280 × 720
4 : 2 : 0, 12
4 : 2 : 2, 16 16 : 9
25, 30, 50, 60
прогрессивная 264–844
ТВЧ 1920 × 1080 4:2:2, 16 16:9
25, 30
чересстрочная 791–949
25, 30, 50, 60
прогрессивная 791–1900
Цифровое
кино
H0 1920 × 1080
4:2:2, 20
16 : 9
60
прогрессивная
2370
H1 3840 × 2160 9490
H2 5760 × 3240
4 : 4 : 4, 36
38400
H3 7680 × 4320 68300
74 Глава 2. Системы формирования и передачи видеоинформации
Таблица 2.11. Параметры видео для некоторых информационных систем
со многими точками наблюдения
Многомерные
телевизионные
системы
Формат и размер
кадра
Модель цветности
и количество би-
тов на
пиксел
Число кадров
в секунду, тип
развертки
Скорость
цифрового
потока,
Гбит/с
Трехмерное ТВ
2 × 1080i
1920 : 1080;
(2 × 960) : 1800;
16 : 9
4 : 2 : 0;
12
50, 60;
чересстрочная
0,8–0,95
Трехмерное ТВ
Blu–Ray;
3D(кино);
2 × 1080p
1920 : 1080;
16 : 9
4 : 2 : 2;
32
24;
прогрессивная
1,58
Трехмерное ТВ
HD-3D; 2 × 1080p
1920 : 1080;
16 : 9
4 : 2 : 0;
24
50, 60;
прогрессивная
3,2–3,6
Трехмерное ТВ
MultiView 3D-TV,
несколько видов;
n × 1080p
1920 : 1080;
16 : 9
4 : 2 : 0;
12
50, 60;
прогрессивная
n × 1,5 ∼ 100–1000
Трехмерное ТВ
Free Viewpoint
TV (FTV)
произвольное к-во
видов;
n × 1080p
1920 : 1080;
16 : 9
4 : 4 : 4;
24
50, 60;
прогрессивная
n × 1,5 ∼ 100–1000
Трехмерное ТВ
3D-Integral
Imaging, на
основе
интегральной
фотографии;
n2 × 4320p
7680 : 4320 4 : 4 : 4
60;
прогрессивная
n2 × 1,5 ∼ 15 000
Голографические
системы ТВ 4320 : 8192
60;
прогрессивная
40 × 1,5 ∼ 10 000–
1 000 000
ËÀ3.Â1ÀÏîáð3úåäìñòîàìâëäåàíèåûèõçîáðàÖÏÂæÈ ÈåíÅÄÔèÄÿÅ ÑÎêÎîÒÈíÂåÀÎÍ÷ÂíÔÅûËìÎÅÍ ÈÌÅÀÖÈ
Телевизионное и компьютерное изображение в его цифровом представлении яв-
ляется набором значений интенсивностей светового потока, распределенных на
конечной площади, имеющей обычно прямоугольную форму.
Для простоты рассмотрим монохромные изображения. Тогда интенсивность
излучаемой световой энергии с единицы поверхности в точке с координатами
(x, y) изображения можно представить неким числом B(x, y), характеризующим
яркость пиксела с координатами (x, y).
Задача состоит в удобном для цифровой обработки представлении B(x, y)
конечным количеством двоичных цифр (битов).
Если даже B(x, y) изменяется во времени, предполагается, что объем инфор-
мации в единицу времени, требуемый для представления B(x, y), конечен, т. е.
конечна скорость ее передачи.
Таким образом, поскольку движение непрерывно, а скорость передачи конеч-
на, то имеет место дискретное представление непрерывного процесса, и часть
визуальной информации безвозвратно теряется.
Однако если даже значения B(x, y) могут быть получены с большой точно-
стью (например, для не меняющегося во времени B(x, y) или для меняющегося
во времени B(x, y) при очень высокой скорости передачи информации), то, как
будет показано ниже, далеко не всегда необходимо сохранять всю информацию.
Плотность размещения пикселов связана с пространственным разрешением,
которое в телевидении обычно определяется количеством различимых линий на
единицу длины. На рис. 3.1 в качестве примера приведено изображение верти-
кальных и горизонтальных черно-белых линий, изменяющихся по ширине скач-
ками от минимальной величины. Очевидно: если плотность черно-белых линий
достигает некоторой критической величины, то зрительное их восприятие нару-
шается визуально они воспринимаются в виде непрерывного серого поля.
Обычно значение уровня сигнала в каждом из пикселов определяют путем
взвешенного усреднения B(x, y) в малой окрестности δ [1.37, 1.63]:
ˆB
(x, y) =
y+ Z y−
x+ Z x−
B(w, z) · HC(x − w, y − z) dwdz, (3.1)
где HC(u, v) взвешивающая функция или импульсный отклик фильтра.
76 Глава 3. Цифровое представление видеоинформации
Рис. 3.1. Изображение вертикальных и горизонтальных черно-белых полоc
Этот процесс называется префильтрацией, т. к. изображение фильтруется до
дискретизации. Часто в качестве взвешивающей функции используют функцию
Гаусса:
HC(u, v) = K · exp(−au2 − bv2), (3.2)
где |u|, |v| < δ; K, a, b константы.
Два варианта откликов для разных значений констант a и b приведены на
псевдотрехмерной диаграмме рис. 3.2.
Рис. 3.2. Варианты импульсных откликов префильтра Гаусса
При восстановлении изображения (т. е. воспроизведении точек между дис-
кретными пикселами) используют различные методы интерполяции:
3.1. Графические изображения, факсимильные системы 7
ˆB
(x, y) =Xk
ˆB
(xk, yk) · Hd(x − xk, y − yk), (3.3)
где Hd(u, v) интерполяционная функция [1.37, 1.63]. Обычно используют би-
линейную функцию:
Hd(u, v) = S(u, x) · S(v, y), (3.4)
где x и y горизонтальные и вертикальные расстояния между пикселами.
Для прямоугольных массивов пикселов используют линейную интерполяцию:
S(z, ) = 1 −
z
,
z
6 1. (3.5)
Часто применяются более гладкие интерполяции.
Квадратичная интерполяция:
S(z, ) = ( 3
4 − z
2
, z
6 1
2 ;
9
8 − 3
2 z
+ 1
2 z
2
, 1
2 < z
6 3
2 .
(3.6)
Кубическая интерполяция (непрерывная первая производная):
S(z, ) = ( 1 − 5
2 z
2
+ 3
2 z
3
, z
6 1;
2 − 4 z
+ 5
2 z
2
− 1
2 z
3
, 1 < z
6 2.
(3.7)
Интерполяция кубическим B-сплайном (непрерывные первая и вторая произ-
водные):
S(z, ) = ( 2
3 − z
2
+ 1
2 z
3
, z
6 1;
4
3 − 2 z
+ z
2
− 1
6 z
3
, 1 < z
6 2.
(3.8)
Псевдотрехмерное представление интерполяционных многочленов приведено на
рис. 3.3. Этот процесс интерполяции называется постфильтрацией. Целиком це-
почка цифровой обработки изображений выглядит так, как показано на рис. 3.4.
При этом перед цифровой обработкой изображения осуществляется его пре-
фильтрация, затем следуют дискретизация, квантование и кодирование пиксе-
лов. При восстановлении изображения после декодирования пикселов произво-
дится постфильтрация.
Наиболее часто встречающаяся форма пространственной дискретизации
сканирование растра, преобразующее двумерное изображение в одномерную вре-
менную функцию. В частности, в телевидении используется чересстрочная раз-
вертка. Из функции B(x, y) при этом создается одномерная функция [1.37, 1.47]
B(t) = B[t(x, y)], которая подвергается префильтрации:
ˆB
(t) = Z B(τ) · hC(t − τ)dτ , (3.9)
где hC(τ) импульсная характеристика префильтра. Затем ˆB (t) дискретизи-
руется так, чтобы в строке умещалось целое количество точек nˆB(tk)o (k =
= 1 . . .NS), а в кадре целое количество строк. Полученный продискретизиро-
ванный сигнал
BS(t) =
NS Xk=1
ˆB
(t) · δ(t − tk) (3.10)
78 Глава 3. Цифровое представление видеоинформации
Рис. 3.3. Псевдотрехмерное представление интерполяционных многочленов, используе-
мых при восстановлении изображений
Рис. 3.4. Последовательность операций цифровой обработки изображений
квантуется и превращается в цифровой код. Здесь δ(τ) дельта-функция.
После декодирования и временной постфильтрации производится восстанов-
ление непрерывного сигнала и растра:
˜B
(t) = Z BS(τ) · hd(t − τ)dτ = ˜B (xt, yt) или
˜B
(x, y) = Z ˜B(t) · hd(x − xt, y − yt)dt.
(3.11)
3.2. Фурье-преобразование, теорема о дискретизации 3.2Ôóðüå-ïðåîáðàçîâàíèå,òåîðåìàîäèñêðåòèçàöè79
Пространственная дискретизация и квантование уровней пикселов изображе-
ния не единственный метод представления визуальной информации конечным
количеством данных.
Если исходное изображение B(x, y) преобразуется в некоторую другую фор-
му до дискретизации и квантования, то иногда можно получить более удобное
представление и кодирование информации.
Одним из таких представлений является Фурье-преобразование [1.64–1.69],
при котором прямоугольное изображение B(x, y) в координатах 0 6 x 6 X;
0 6 y 6 Y , с помощью комплексных функций
mn(x, y) =
1
√XY · exp 2πi (
nx
X
+
my
Y
) (3.12)
может однозначно быть записано в виде ряда:
B(x, y) =
∞X m=−∞
∞X n=−∞
cmn · mn(x, y), (3.13)
где
cmn =
Y Z0
X Z0
B(x, y) · ′mn(x, y) dx dy,
′mn(x, y) комплексно сопряжена с mn(x, y), а базисные функции mn(x, y)
ортогональны, поскольку
Y Z0
X Z0
mn(x, y) · ′kl(x, y) dx dy = δmk · δnl. (3.14)
Как известно, преобразованиеФурье, примененное к одномернойфункции y = F(x),
позволяет получить разложение этой функции на частотные компоненты так, что
каждая точка кривой F(x) может быть представлена суммой синусоид и косину-
соид различных частот, взятых каждая со своим коэффициентом [1.69, 1.70]. Ана-
логично, представление B(x, y) в сочетаниях экспоненциальных базисных Фурье-
изображений есть разложение изображений на компоненты пространственных
частот:
f x =
n
X
периодов на единицу длины по оси x и
f y =
m
Y
периодов на единицу длины по оси y.
Комплексные коэффициенты cmn характеризуют интенсивность и фазу этих про-
странственных частот относительно выбранной системы координат.
Общая пространственная частота двумерного периодического изображения
определяется соотношением:
fs = qf2x + f2
y.
Компоненты высших пространственных частот определяют быстрые изменения
интенсивности в изображении, характеризующие мелкие детали, резкие переходы
80 Глава 3. Цифровое представление видеоинформации
яркости и пр. Компоненты низких пространственных частот связаны с медлен-
ными и плавными изменениями яркости.
Очевидно, можно выбрать некоторые граничные пространственные частоты
Fx и Fy, исходя из того критерия, что пространственные частоты выше гранич-
ных уже ничего не добавляют к качеству изображения, поскольку игнорируются
зрительным анализатором человека. Наличие в сигнале пространственных ча-
стот выше граничной уже не приводит к повышению визуальной четкости вос-
производимого изображения, а следовательно, эти составляющие сигнала можно
отбросить.
Тогда изображение ˆB(x, y), в общем случае отличающееся от B(x, y), пред-
ставимо конечным числом пространственных частот:
ˆB
(x, y) =
M X
m
=
−
M
N X
n
=
−
N
cmn · mn(x, y), (3.15)
и спектральные компоненты ограничены частотами:
|fx| <
2N + 1
2X
= Fx,
|fy| <
2M + 1
2Y
= Fy,
а количество ненулевых коэффициентов cmn равно NS = (2M + 1)(2N + 1).
При этом ограниченное число коэффициентов Фурье cmn можно рассчитать,
используя NS дискретных значений ограниченного по спектру изображения B(x, y),
поскольку для каждого пиксела с координатами (xk, yk) можно записать:
ˆB
(xk, yk) =
M X
m
=
−
M
N X
n
=
−
N
cmn · mn(xk, yk). (3.16)
Это и есть разложение элемента изображения на пространственные частоты с
помощью двумерного преобразования Фурье.
Если пикселы выбраны таким образом, что NS этих уравнений линейно неза-
висимы, то их можно решить относительно NS неизвестных коэффициентов, не
прибегая к вычислению интегралов.
Такое множество дискретных точек состоит из прямоугольного массива с
Nx = 2N + 1 столбцов и Ny = 2M + 1 строк.
В этом случае NS = Nx × Ny и для |m|, |k| 6 M; |n|, |l| 6 N можно пока-
зать, что
NX−1 Xi=0
NY −1 Xj=0
mn(xi, yj) · ′kl(xi, yj) =
Ns
XY · δmk · δnl, (3.17)
где xi = X
Nx · i, yj = Y
Ny · j. Отсюда вытекает, что
cmn =
XY
Ns ·
NX−1 Xi=0
NY −1 Xj=0
ˆB
(xi, yj) · ′mn(xi, yj). (3.18)
В этом и состоит суть теоремы отсчетов, необходимая плотность которых должна
немного превышать удвоенные граничные пространственные частоты [1.37]:
Dx =
2N + 1
X
= 2Fx, Dy =
2M + 1
Y
= 2Fy.
3.2. Фурье-преобразование, теорема о дискретизации 81
Рис. 3.5. Двумерная функция отсчетов
При этом такие дискретные отсчеты полностью определяют ограниченное по
спектру изображение ˆB (x, y) в любых его точках.
Можно показать, что значение интенсивности ограниченного по спектру изоб-
ражения в любой его точке с координатами (x, y) определяется взвешенной сум-
мой отсчетов:
ˆB
(x, y) =
2NXi=0
2MXj=0
ˆB
(xi, yj) · χ(x − xi, y − yj), (3.19)
где
χ(u, v) =
sin π (2N+1)u
X · sin π (2M+1)v
Y
Ns · sin π u
X · sin π v
Y
так называемая функция отсчетов, имеющая максимум в точке u = 0, v = 0
и быстро спадающая по мере удаления от нее.
Эта функция приведена на рис. 3.5. С ее помощью обеспечивается точная
интерполяция изображений, строго ограниченных по спектру.
Приведенные выше выражения представляют собой аналог теоремы Котель-
никова [1.70] для двумерного сигнала. Заметим, что функция χ(u, v) очень похо-
жа на двумерную sinc-функцию (sinc (z) = sin z
z ), за исключением того, что она
периодична по u и v с периодами X и Y соответственно.
Префильтрация изображения фильтром с импульсной характеристикой χ(u, v)
обеспечивает удаление частот выше определенного заданного предела.
Фильтрация изображения имеет одно важное отличие от фильтрации беско-
нечной одномерной функции времени. Для ограниченного в пространстве изоб-
ражения непрерывность резко нарушается на краях.
Это нарушение часто приводит к росту высокочастотных компонент, которые
не имеют отношения к информации, содержащейся в изображении.
При попытке отфильтровать эти частоты появляются сильные искажения на
границах (так называемый эффект Гиббса).
В качестве примера на рис. 3.6 приведено изображение без программного огра-
ничения спектра (а) и с резким его ограничением (б). Там же приведена разность
яркостей этих двух изображений (в). Как видно, при ограничении спектра наи-
более заметны искажения колебательного характера на границах изображения.
82 Глава 3. Цифровое представление видеоинформации
Рис. 3.6. Эффект Гиббса при
резком ограничении спектра изоб-
ражения
3.Èçîáðàæåíèå,èçìåíÿþùåñÿâîâðåìíè
Изменяющееся во времени изображение можно представить в виде трехмерной
функции B(x, y, t), которая для временного интервала 0 6 t 6 T может быть
записана следующим образом [1.37]:
B(x, y) =
∞X m,n,p=−∞
cmnp · mnp(x, y, t), (3.20)
где
mnp(x, y, t) =
1
√XY T · exp 2πi (
nx
X
+
my
Y
+
pt
T
),
cmp =
TZ0
YZ0
XZ0
B(x, y, t) · ′mnp(x, y, t) dxdy dt,
p/T временная частота.
Если после префильтрации p/T меньше некоторой величины W (Гц), то по
аналогии с вышеизложенным изображение можно продискретизировать во вре-
мени с частотой 2W Гц. Для человеческого глаза граница этой частоты 10–15 Гц
обычно вполне достаточна [1.8, 1.9].
При этом движущееся изображение в последовательности кадров представля-
ет собой дискретные мгновенно зафиксированные статические изображения, как
показано на рис. 3.7.
Практически временная префильтрация осуществляется в самом датчике, по-
скольку большинство датчиков до дискретизации просто накапливает световую
энергию за время экспозиции TI .
3.3. Изображение, изменяющееся во времени 83
Рис. 3.7. Дискретная последовательность кадров
Это обеспечивает ослабление каждой временной частотной компоненты на
sinc(ft · TI), где ft (в герцах) временная частота.
Следует заметить, что если время интегрирования TI очень мало, то времен-
ная префильтрация неэффективна и возможно возникновение строб-эффекта,
вызывающего, например, иллюзорное вращение колес назад и движение рывками.
Однако даже если TI равно периоду между кадрами TF , ослабление на по-
ловинной частоте дискретизации ft = 1/2 · TF составляет только 4 дБ, что
недостаточно для устранения указанного выше эффекта согласно теореме о дис-
кретизации.
В телевизионной камере префильтрованное указанным образом изображение
(TI = TF ) сканируется по растру, и дискретизация производится над одномер-
ным сигналом ˆB (t) = ˆB(xt, yt, t). Таким образом, между дискретизацией точек
вверху и внизу растра проходит некоторое время, равное длительности кадра
(поля). Это приводит к определенному искажению формы больших движущихся
объектов, если рассматривать один кадр. Однако форма быстродвижущихся объ-
ектов также нарушается (точнее, ¾расплывается¿) при временной фильтрации.
Восстановление изображения требует интерполяции или постфильтрации. Одна-
ко временная постфильтрация из-за аппаратных сложностей осуществляется не
аппаратурой, а человеческим глазом.
Следует отметить, что эффективность такой интерполяции изображений между
кадрами зависит от окружающего освещения: чем ярче дисплей, тем выше за-
метность мерцания из-за недостаточной временной постфильтрации глазом.
84 Глава 3. Цифровое представление видеоинформации
Как было отмечено, для большинства движущихся изображений временные
частоты редко превышают 10–15 Гц. Именно по этой причине в кинокамерах
смена кадров осуществляется с частотой 24 Гц. Однако для того, чтобы не бы-
ло мерцаний, проектор производит смену кадров с частотой 48 или 72 Гц, что
достигается путем показа каждого кадра 2 или 3 раза.
В телевидении эта технология до сих пор не использовалась, поскольку в при-
емнике требовалось хранить достаточно большой объем информации.
Вместо этого используется следующее свойство глаза: временная постфиль-
трация осуществляется глазом значительно более эффективно для мелких дета-
лей изображения, т. е. высоких пространственных частот, чем для более крупных
деталей изображения, т. е. более низких пространственных частот.
Таким образом, эффективность фильтрации может быть достигнута, если
низкие пространственные частоты записываются в видеокамере и воспроизводят-
ся ТВ-приемником с частотой 50–60 Гц, а высокие пространственные частоты
лишь с частотой 25–30 Гц.
Это как раз и достигается использованием чересстрочной развертки (2:1). Од-
нако ее использование приводит к следующим дефектам:
– мерцанию строк при воспроизведении высоких вертикальных пространствен-
ных частот;
– искажению формы объектов при их движении в горизонтальном направлении. 3.4Êâàíòîâàíèå.Èìïóëüñíî-êîäîâàÿìîäóëÿöèÿ
Одним из основных шагов при получении представления визуальной информации
потоком с конечной битовой скоростью является превращение каждого значения
элемента изображения в двоичное слово конечной длины, т. е. создание кода.
В процессе квантования отсчет аналогового сигнала сравнивается с набо-
ром пороговых уровней. Если отсчет попадает в определенный амплитудный
интервал, то ему приписывается значение фиксированного уровня квантования,
соответствующего данному интервалу. В цифровой системе каждому квантован-
ному отсчету ставится в соответствие двоичная кодовая комбинация.
Уровни и коды квантования могут изменяться в зависимости от обстоятельств.
Например, неэффективно квантовать и кодировать все коэффициенты Фурье-
изображения по одному правилу.
Квантование аналоговых величин приводит к потере части информации. Важ-
ным вопросом является рациональный выбор пороговых уровней и уровней кван-
тования, обеспечивающий минимальную погрешность процедуры восстановле-
ния, определенную выбранным критерием.
При решении задачи о квантовании аналоговой величины u, изменяющейся
в пределах от UH до UK, необходимо выбрать такой набор пороговых уровней dj
и уровней rj , что если
dj 6 u < dj+1,
то исходное значение u заменяется на число rj [1.37, 1.39, 1.47].
3.4. Квантование. Импульсно-кодовая модуляция 85
Рис. 3.8. Изображение при различном числе уровней квантования и пример размещения
пороговых уровней и уровней квантования
На рис. 3.8 приведен пример размещения пороговых уровней и уровней кван-
тования на отрезке числовой оси, содержащей J пороговых уровней.
Уровни квантования и пороговые уровни выбираются так, чтобы уменьшить
до минимума некоторую заданную величину, характеризующую ошибку кванто-
вания, т. е. степень различия между u и ее квантованной величиной ˆu, равной
соответствующему уровню квантования. В качестве меры ошибки зачастую вы-
бирают среднеквадратичную ошибку:
e =
UK Z UH
(u − ˆu)2p(u) du =
J−1 Xj=0
dj+1 Zdj
(u − rj)2p(u) du, (3.21)
где p(u) плотность распределения случайной величины u.
Если число уровней квантования велико, то положения пороговых уровней
и уровней квантования достаточно точно определяются по формуле [1.37, 1.39,
1.64]:
86 Глава 3. Цифровое представление видеоинформации
dj =
(UK − UH)
UK R UH
du
3√p(u)
UK R UH
du
3√p(u)
+ U′H , (3.22)
где uj = j(UK−UH)
J +UH, j = 0, 1 , . . . , J; rj = dj+1−dj
2 , j = 0, 1 , . . . , J − 1. Если же
число уровней квантования невелико, то применяется более сложный алгоритм
вычисления величины dj и rj , называемый алгоритмомМакса или Ллойда–Макса
[1.64, 1.71]. При этом для заданной плотности вероятностей p(u) оптимальные
значения пороговых уровней и уровней квантования можно найти путем решения
рекуррентным способом системы уравнений:
rj = 2dj − rj−1;
rj =
dj+1
R
dj
u·p(u) du
dj+1
R
dj
p(u) du
.
(3.23)
При этом среднеквадратическая ошибка квантования становится минимальной:
emin =
J−1 Xj=0
dj+1 Zdj
u2p(u) du − rj
dj+1 Zdj
p(u) du. (3.24)
В табл. 3.1 приведены расположения только положительных пороговых уровней
и уровней квантования (dj и rj , j = 0, 1, . . . ) в квантователях Ллойда–Макса для
плотностей равномерного распределения вероятностей в пределах [−1, 1], а также
распределений Гаусса и Лапласа:
p(u) =
1
σ√2π
exp −
u2
2σ2 , (3.25)
p(u) =
1
σ√2
exp −|u|√2
σ !. (3.26)
Таблица 3.1. Пороговые уровни и уровни квантования Ллойда–Макса
Число пороговых
уровней
Равномерное
распределение
Распределение
Гаусса
Распределение
Лапласа
dj rj dj rj dj rj
3
0,0000 0,0000 0,0000
0,5000 0,7979 0,7071
1,0000 ∞ ∞
5
0,0000 0,0000 0,0000
0,2500 0,4528 0,4198
0,5000 0,9816 1,1269
0,7500 1,5104 1,8340
1,0000 ∞ ∞
3.4. Квантование. Импульсно-кодовая модуляция 87
Таблица 3.1 (окончание)
7
0,0000 0,0000 0,0000
0,1250 0,2451 0,2334
0,2500 0,5005 0,5332
0,3750 0,7560 0,8330
0,5000 1,050 1,2527
0,6250 1,3439 1,6725
0,7500 1,7479 2,3796
0,8750 2,1519 3,0867
1,0000 ∞ ∞
9
0,0000 0,0000 0,0000
0,0625 0,1284 0,1240
0,1250 0,2582 0,2644
0,1875 0,3880 0,4048
0,2500 0,5224 0,5667
0,3125 0,6568 0,7287
0,3750 0,7995 0,9198
0,4375 0,9423 1,1110
0,5000 1,0993 1,3444
0,5625 1,2562 1,5778
0,6250 1,4371 1,8776
0,6875 1,6180 2,1773
0,7500 1,8435 2,5971
0,8125 2,0690 3,0169
0,8750 2,4008 3,7240
0,9375 2,7326 4,4311
1,0000 ∞ ∞
Отрицательные пороговые уровни и уровни квантования соответственно равны:
d−j = −dj и r−j = −rj , j = 0, 1, . . . .
В системе обработки сигналов яркости телевизионных изображений с примене-
нием импульсно-кодовой модуляции (ИКМ) каждый отсчет обычно квантуется
на основе линейной шкалы, и ему ставится в соответствие двоичная кодовая ком-
бинация.
При кодировании непосредственно яркостного сигнала применяют равномер-
ный код, и поэтому число уровней квантования пикселов определяется соотно-
шением [1.36, 1.37, 1.39]: J = 2B, где B число двоичных разрядов (битов),
отведенных для кодирования отсчетов.
Замена исходных пикселов квантованными приближениями приводит к ошиб-
кам восстановленного изображения, которые проявляются в виде случайного
шума или ¾снега¿. В большинстве приложений этот шум практически не виден
при 8-битовом квантовании, при снижении числа битов заметность шума увели-
чивается (см. рис. 3.8).
Следует отметить, что заметность шума ИКМ-квантования сильно зависит
от того, как много шума в исходном изображении до квантования. Большинство
приложений требуют, чтобы шум квантования был малым по сравнению с шумом
исходного изображения.
8 Глава 3. Цифровое представление видеоинформации
В системах с ИКМ сокращение цифрового потока может быть осуществлено
простым уменьшением числа разрядов в кодовых комбинациях.
При субъективной оценке качества воспроизводимых изображений число раз-
рядов B понижают до тех пор, пока эффекты, вызванные квантованием, не
выйдут за границы допустимого. Глаз способен определить от 10 до 15 градаций
абсолютного значения светлоты, но имеет гораздо большую чувствительность к
различию светлоты соседних элементов изображения [1.64, 1.45].
При уменьшении числа уровней квантования прежде всего бросается в глаза
эффект появления контуров в тех областях, где светлота исходного изображения
изменяется плавно (см. рис. 3.8). Появление контуров вызывается скачкообраз-
ным изменением светлоты квантованного изображения при переходе от одного
уровня квантования к другому.
Наименьшее число разрядов ИКМ, позволяющее предотвратить появление
контуров в областях с плавным изменением светлоты, как было указано, зависит
от ряда факторов, в том числе от линейности характеристики дисплея и свойств
шума до и после преобразования изображения в видеосигнал.
Ëèòåðàòóðàê÷àñòèI
1.1. Цифровая обработка телевизионных и компьютерных изображений / Под
ред. Ю.Б. Зубарева и В.П. Дворковича. 2-е изд., перераб. и доп. М.: НАТ,
1997.
1.2. Кривошеев М.И. Международная стандартизация цифрового телевизион-
ного вещания. М.: НИИР, 2006
1.3. Зубарев Ю.Б., Кривошеев М.И., Красносельский И.Н. Цифровое телевизи-
онное вещание. Основы. Методы. Системы. М.: Мир, 2001
1.4. Синепол В.С., Цикин И.А. Системы компьютерной видеоконференцсвязи.
М.: Связь и бизнес, 1999
1.5. Методы компьютерной обработки изображений / Под ред. В.А. Сойфера.
М.: Физматлит, 2001
1.6. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера,
2005
1.7. Яне Б. Цифровая обработка изображений. М.: Техносфера, 2007
1.8. Справочник по телевизионной технике / Пер. с англ. под ред. С.И. Катаева.
Т.1–2. М.-Л.: Госэнергоиздат, 1962
1.9. Телевизионная техника. Справочник / Под общ. ред. Ю.Б. Зубарева и Г.Л.
Глориозова. М.: Радио и связь, 1994
1.10. Видеоконференции и видеоконференцсвязь: словарь терминов
http://slovotolk.com/society/tvcinema /frameglossary_rus.html
1.11. Видеоконференции и видеоконференцсвязь: словарь терминов
http://www.stel.ru/videoconference/tech_vc/glossary/
1.12. NNM-Club:: Глоссарий перечень видео и кодек терминов
http://nnm-club.ru/forum/viewtopic.php?t=28
1.13. Standards Videokonferenz|Audiokonferenz|Vebkonferenz
http://www.mvc.de/contenttwocolumns.php?c=16&pn=4&pk=23#v
1.14. SkyVisionDVR.Com List of Image Resolution
http://skyvisiondvr.com/sky/index.php?option=com_content&task=
view&id=11&Itemid=25
1.15. Ох уж эти разрешения
http://www.mobil.ru/article.php?advice=108
1.16. John McGowan’s AVI Overview: Glossary
http://www.jmcgowan.com/avigloss.html
1.17. USB PC Camera
http://www.pc-cameras.philips.com/manuals/Pdf/usermanual646en.pdf.
1.18. TRLabs / Video Conferencing: Promising but why did we end up traveling to
this Symposium?
http://www.win.trlabs.ca/icts/images/andrewkostiuk.pdf
90 Литература к части I
1.19. Приоров А.Л., Хрящев В.В., Апальков И.В. Цифровая обработка изобра-
жений: Учебное пособие. Ярославль: ЯрГУ им. П.Г. Демидова, 2007
1.20. Hoffman G. CIE Color Space
http:www.fho-emde/∼hoffmann/ciexyz29082000.pdf
1.21. Гуревич М.М. Цвет и его измерение. М.: АН СССР, 1950
1.22. Кустарев А.К. Колориметрия цветного телевидения. М.: Связь, 1967
1.23. Кривошеев М.И., Кустарев А.К. Световые измерения в телевидении. М.:
Связь, 1973
1.24. CIE 1931 Color Space
http://en. wikipedia.org/wiki/CIE 1931 color space
1.25. MacAdam D.L. Sources of Color Science. Cambridge, MA, MIT Press, 1970
1.26. Джадд Д., Вышецки Г. Цвет в науке и технике. М.: Мир, 1978
1.27. Юстова Е.Н. Таблицы основных колориметрических величин. М.: Изд-во
Комитета стандартов, 1967
1.28. Photometry/Colorimetry-light perception
http://www/paladix/cz///www.wikipedia.org
1.29. Chromaticity Diagrams Lab Report
http:www.efg2.com/Lab/Graphics/Colors/Cromaticity.html
1.30. Lab Color Spase
http://en. wicipedia.org/wiki/Lab_color_cpace
1.31. CIPR Still Images
http://www.cipr.rpi.edu/resource/stills/index.html
1.32. CIPR Sequences
http://www.cipr.rpi.edu/resource/sequences/index.html
1.33. The University of South California free database
http://sipi.usc.edu/database/index/html
1.34. Wikipedia materials plas
http://en/ wikipedia.org/wiki/Standard test image#cite note-1
1.35. МККР. Характеристики монохромных систем телевидения. Отчет 308
1.36. МККР. Параметры кодированных сигналов цифрового телевидения для
студий. Рекомендация 601
1.37. Netravali A.N., Haskell B.G. Digital pictures: Representation and Compression.:
Plenum Press, N.Y., 1991
1.38. Цифровое телевидение / Под ред. М.И.Кривошеева. М.: Связь, 1980
1.39. Цифровое кодирование телевизионных изображений / Под ред. И.И. Цу-
кермана. М.: Связь, 1981
1.40. МККР. Характеристики телевизионных систем. Отчет 624
1.41. Темников Ф.Е., Афонин В.А., Дмитриев В.И. Теоретические основы ин-
формационной техники. М.: Энергия, 1971
1.42. Певзнер Б.М. Системы цветного телевидения. Л.: Энергия, 1969
1.43. МККР. Характеристики систем цветного телевидения. Отчет 407
Литература к части I 91
1.44. Новаковский С.В. Стандартные системы цветного телевидения. М.: Связь,
1976
1.45. Певзнер Б.М. Качество цветных телевизионных изображений. М.: Радио и
связь, 1988
1.46. МККР. Номенклатура сигналов цветных полос. Рекомендация 471
1.47. Птачек М. Цифровое телевидение. Теория и техника. М.: Радио и связь,
1990
1.48. Дворкович В.П., Кривошеев М.И. Особенности измерения и контроля в
цветном телевидении. М.: Издательство ГКТР, 1981
1.49. ГОСТ 7845. Система вещательного телевидения. Основные параметры. Ме-
тоды измерений
1.50. Новаковский С.В., Котельников А.В. Новые системы телевидения. М.: Ра-
дио и связь, 1992
1.51. ITU-R Recommendation BT.1200-1 Target standard for digital video systems
for the studio and for international programme exchange, 1998
1.52. ITU-R Recommendation BT.1201-1 Extremely high resolution imagery, 2004
1.53. МККР. Подходы к разработке общемирового стандарта студийного ТВЧ.
Отчет AW/11
1.54. Дворкович В., Чобану М. Проблемы и перспективы развития систем ко-
дирования динамических изображений // MediaVision. 2011. № 2, 3, 4, 5,
7, 8
1.55. Хлебородов В.А. На пути к единому мировому стандарту ТВЧ // Техника
кино и телевидения, 1988, № 2
1.56. ISO/IEC 11172-2 Information Technology Coding of Moving Pictures and
Associated Audio for Digital Storage Media at up to about 1,5 Mbit/s Part
2: Video, 1993 (MPEG-1 Video)
1.57. ISO/IEC 14496-2 Information Technology Coding of Audio-VisualObjects
Part 2: Visual, 2004 (MPEG-4 Video)
1.58. ITU-T Recommendation H.261 Video Codec for Audiovisual services at p x
64 kbit/s, 1993; ITU-T Recommendation H.263 Video Coding for Low Bit
Rate Communication, 2005
1.59. ITU-T Recommendation H.262 / ISO/IEC 13818-2 Information Technology
Generic Coding of Moving Pictures and Associated Audio Information: Video,
2000 (MPEG-2 Video)
1.60. ITU-T Recommendation H.264 Advanced Video Coding for Generic Audio-
visual Services / ISO/IEC 14496-10 Information Technology Coding of
Audio-Visual Objects Part 10: Advanced Video Coding, 2005
1.61. Дорошенко И.В. Системы телетекста. Техника средств связи. Сер. Техника
телевидения. 1981, вып. 3
1.62. Мартин Дж. Видеотекс и информационное обслуживание общества. Пере-
вод с английского. М.: Радио и связь, 1987
92 Литература к части I
1.63. Jayant N.S., Noll P. Digital Coding of Waveforms, Chapter 4.: Prentice Hall,
N.J., 1984
1.64. Прэтт У. Цифровая обработка изображений. Т. 1–2. М.: Мир, 1982
1.65. Залманзон Л.А. Преобразования Фурье, Уолша, Хаара и их применение в
управлении, связи и других областях. М.: Наука, 1989
1.66. Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке цифро-
вых сигналов. М.: Связь, 1980
1.67. Гольдберг Л.М., Матюшкин Б.Д., Поляк М.Н. Цифровая обработка сигна-
лов. Справочник. М.: Радио и связь, 1985
1.68. Ярославский Л.П. Введение в цифровую обработку изображений. М.: Сов.
радио, 1979
1.69. Рабинер Л.Р. Гоулд Б. Теория и применение цифровой обработки сигналов.
М., Мир, 1978
1.70. Левин Б.Р. Теоретические основы статистической радиотехники. т.1, т.2,
т.3. М.: Сов. радио, 1974, 1975, 1976
1.71. Max J. Quantizing for minimum distortion. IEEE Trans., 1960, v. JT-6, № 3