Если что-то удается читать без усилий,
значит больших усилий стоило это написать.
Энрике Хардиел Понсела
Настоящее издание является результатом значительной переработки книги
«Цифровая обработка изображений». При подготовке этого издания, как и при
подготовке предыдущих четырех редакций (Гонсалес и Уинтц, 1977 г. и 1978 г.;
Гонсалес и Вудс, 1992 г. и 2002 г.), мы ориентировались прежде всего на студентов
и преподавателей. Как и прежде, основные цели этой книги — служить введе-
нием в основные понятия и методы цифровой обработки изображений, а также
создать основу для последующего изучения и проведения самостоятельных ис-
следований в этой области. С учетом этих целей мы вновь сконцентрировались
на материале, который считаем фундаментальным и применимым не только
для решения узкоспециальных задач. Уровень математической сложности кни-
ги остался в рамках программы колледжа высшей ступени или первого курса
университета и предполагает начальную подготовку в области математического
анализа, линейной алгебры и линейных систем, теории вероятности и матема-
тической статистики, а также компьютерного программирования. Дополняю-
щий книгу Интернет-сайт содержит учебные материалы, помогающие читате-
лям при необходимости освежить в памяти эти темы.
Одна из важнейших причин, почему настоящая книга уже более 30 лет явля-
ется мировым лидером в своей области, — это высокая степень внимания к из-
менению образовательных потребностей наших читателей. Нынешнее издание
базируется на самом обширном из когда-либо нами проводившихся исследова-
ний читательского мнения. К исследованию были привлечены профессорско-
преподавательский состав, студенты и независимые читатели из 134 организа-
ций в 32 странах. Исследование показало, что необходимо:
расширить введение в начале книги касательно математических инстру• -
ментов, используемых в обработке изображений;
• развернуто объяснить технику обработки гистограмм;
• излагать сложные алгоритмы в форме пошагового краткого описания;
• подробнее объяснить пространственную корреляцию и свертку;
• добавить введение в теорию нечетких множеств и применение ее в циф-
ровой обработке изображений;
• пересмотреть материал, относящийся к частотной области, начиная
с базовых принципов и демонстрации того, как дискретное преобразо-
вание Фурье следует из дискретизации данных;
• охватить тематику, связанную с компьютерной томографией;
• разъяснить основные понятия в главе о вейвлет-анализе ;
• переработать главу о сжатии данных, чтобы шире охватить методы сжа-
тия видеоинформации, обновленные стандарты и технологию цифро-
вых водяных знаков;
• расширить главу о морфологии с целью охвата морфологического вос-
становления изображений и переработать раздел о полутоновой морфо-
логии;
расширить тематику сегментации изображений за счет более совершен• -
ных методов обнаружения контуров, таких как алгоритм Кэнни, и более
широкой трактовки пороговой обработки изображений;
• обновить содержание главы о представлении и описании изображений;
• упростить материал, относящийся к структурным методам распознава-
ния образов.
Переработка и дополнение книги, предпринятые в этом издании, отража-
ют наше стремление соблюсти разумный баланс между строгостью и ясностью
изложения и конъюнктурными соображениями, оставаясь при этом в рамках
приемлемого объема книги. Наиболее важные изменения, сделанные в этом из-
дании книги, перечислены ниже.
Глава 1: Внесены изменения в несколько иллюстраций, а текст частично
переработан в соответствии с изменениями в последующих главах.
Глава 2: Приблизительно половина главы переработана, чтобы включить
новые изображения и более понятные объяснения. В число крупных изменений
входят новый раздел, посвященный интерполяции изображений, и обширный
новый раздел, обобщающий главные математические инструменты, которые
используются в книге. Однако вместо сухого перечисления математических
концепций мы использовали эту возможность, чтобы во второй главе ввести
в оборот ряд прикладных задач обработки изображений, которые прежде были
разбросаны по всей книге. Например, в эту главу мы перенесли усреднение
и вычитание изображений в качестве иллюстрации арифметических опера-
ций. Здесь мы следуем тенденции, начатой во втором издании книги: как мож-
но раньше вводить в обсуждение приложения, не только для иллюстрации, но
и для мотивации студентов. Закончив изучение главы 2 в ее обновленном виде,
читатель получит базовое понимание того, как осуществляется манипулиро-
вание цифровыми изображениями и их обработка. Это та твердая основа, на
которой строится остальная часть книги.
Глава 3: Основная переработка этой главы связана с подробным обсужде-
нием пространственной корреляции и свертки и их применением для фильтра-
ции изображений с помощью пространственных масок. Исследование рынка
также выявило потребность в численных примерах, иллюстрирующих технику
эквализации и задания гистограммы, поэтому мы добавили несколько приме-
ров для демонстрации действия этих инструментов обработки. При исследо-
вании часто высказывалось пожелание рассмотреть нечеткие множества и их
приложения к обработке изображений. Мы включили в эту главу новый раз-
дел, посвященный основам теории нечетких множеств и ее применениям для
яркостных преобразований и пространственной фильтрации — двум главным
областям использования этой теории в обработке изображений.
Глава 4: За последние четыре года больше всего замечаний и предложений
мы слышали в связи с изменениями, сделанными в главе 4 при переходе от пер-
вого ко второму изданию. Целью этих изменений было упростить изложение
преобразования Фурье и частотной области. Очевидно, мы зашли слишком
далеко, и многие пользователи книги жаловались на излишнюю поверхност-
ность материала. В настоящем издании мы исправили этот дефект. Теперь из-
ложение материала начинается с преобразования Фурье одной непрерывной
переменной и далее переходит к выводу дискретного фурье-преобразования,
Предисловие к английскому изданию 13
исходя из базовых понятий дискретизации и свертки. Побочным результатом
такой формы подачи материала стал наглядный вывод теоремы отсчетов и ее
следствий. После этого изложение для одномерной постановки распространя-
ется на двумерный случай, где мы приводим ряд примеров, иллюстрирующих
влияние дискретизации на цифровые изображения, в том числе эффекты, вы-
званные наложением спектров и муаром. Затем мы иллюстрируем двумерное
дискретное преобразование Фурье, выводя и суммируя ряд его важных свойств.
Эти понятия далее используются в качестве основы для фильтрации в частот-
ной области. В заключение обсуждаются вопросы реализации, такие как раз-
ложение преобразований и вывод алгоритма быстрого преобразования Фурье.
К концу этой главы читатель перейдет от дискретизации одномерных функций
через понятный вывод основ дискретного фурье-преобразования к некоторым
важнейшим его применениям для цифровой обработки изображений.
Глава 5: Основным изменением в этой главе стало добавление раздела, ка-
сающегося реконструкции изображения по проекциям, с упором на компью-
терную томографию (КТ). Изложение КТ начинается с наглядного примера, де-
монстрирующего основополагающие принципы реконструкции изображения
по проекциям, и описания различных применяемых на практике методов фор-
мирования изображения. Затем мы выводим преобразование Радона и теорему
о центральном сечении, используя их как основу для формулировки концепции
фильтрации и обратного проецирования. Обсуждается реконструкция изобра-
жений с помощью как параллельных, так и веерных пучков; обсуждение иллю-
стрируется примерами. Включение этого уже давно ожидавшегося материала
представляет собой важное добавление к книге.
Глава 6: Изменения в этой главе ограничивались только уточнениями и не-
значительной коррекцией обозначений без добавления каких-либо новых по-
нятий.
Глава 7: Многочисленные полученные замечания относились к тому, что
переход от предшествующих глав к вейвлетам оказался трудным для начинаю-
щих. Чтобы сделать материал более понятным, мы заново переписали несколь-
ко подготовительных разделов.
Глава 8: Эта глава полностью переработана с учётом достигнутого современ-
ного уровня. Основные изменения касаются новых методов кодирования, бо-
лее широкого обсуждения видеоданных, полностью переработанного раздела
о стандартах сжатия и введения в технологию цифровых водяных знаков. Новая
организация материала упрощает его освоение начинающими студентами.
Глава 9: Основные изменения в этой главе состоят в добавлении нового раз-
дела о морфологической реконструкции и полной переработке раздела, посвя-
щенного полутоновой морфологии. Благодаря рассмотрению морфологической
реконструкции как для двоичных, так и для полутоновых изображений, появи-
лась возможность изложить более сложные и полезные морфологические алго-
ритмы, чем прежде.
Глава 10: Эта глава также подверглась значительной переработке. Сохранив
прежнюю организацию, мы добавили новый материал, лучше подчеркиваю-
щий основные принципы, а также обсуждение более совершенных методов сег-
ментации. Модели перепадов теперь рассматриваются и иллюстрируются бо-
лее подробно, как и свойства градиента. Детекторы контуров Марра-Хилдрета
и Кэнни добавлены в качестве иллюстрации более совершенных методов обна-
ружения контуров. Также переработан раздел о пороговой обработке, в который
добавлен метод Оцу нахождения оптимального порога, популярность которого
значительно возросла за последние несколько лет. Мы включили этот подход
вместо выбора оптимального порога на основе байесовского правила класси-
фикации не только потому, что его легче понять и реализовать, но и поскольку
он значительно чаще используется на практике. Байесовский подход перене-
сен в главу 12, где решающее правило Байеса обсуждается более подробно. Мы
также добавили обсуждение того, как использовать информацию о контурах
для улучшения пороговой обработки, и несколько новых примеров обработки
с адаптивным порогом. В разделы, посвященные морфологическим водоразде-
лам и использованию движения для сегментации, внесены только незначитель-
ные уточнения.
Глава 11: Главные изменения в этой главе связаны с добавлением алгорит-
ма прослеживания границы, более подробным изложением алгоритма аппрок-
симации дискретной границы с помощью ломаной минимальной длины и но-
вым разделом об использовании матриц сочетаемости яркостей для описания
текстуры. Новыми являются многие примеры в разделах 11.2 и 11.3, а также все
примеры в разделе 11.4.
Глава 12: Изменения в этой главе включают новый раздел о корреляцион-
ном сопоставлении и новый пример, демонстрирующий использование байе-
совского классификатора для распознавания интересуюших областей в муль-
тиспектральных изображениях. Раздел о структурной классификации теперь
ограничен обсуждением только сопоставления строк символов.
Все вышеуказанные изменения выразились в появлении в книге более 400
новых изображений, свыше 200 новых рисунков и таблиц, и более 80 новых за-
дач и упражнений для самостоятельной работы. Сложные процедуры обработки
по мере необходимости сведены в сжатую форму пошаговых алгоритмов. Также
обновились ссылки на литературу в конце каждой главы.
Интернет-сайт книги, основанный при выпуске второго издания, успешно
действует, привлекая более 20 тысяч посетителей ежемесячно. Этот сайт был пе-
ределан и пополнен новой информацией в соответствии с выпуском настоящего
издания книги. Более подробно возможности сайта и его наполнение представ-
лены в разделе «Сайт книги в сети Интернет», сразу после раздела «Благодар-
ности».
Это издание книги «Цифровая обработка изображений» отражает то, как
изменились с 2002 г. образовательные потребности наших читателей. Как обыч-
но для подобных проектов, прогресс продолжается и после окончания работы
над рукописью. Одна из причин, по которым эта книга была так хорошо при-
нята, начиная с ее появления в 1977 г., — это ее постоянный акцент на фун-
даментальных концепциях. Такой подход является одной из попыток указать
устойчивые ориентиры в стремительно развивающейся совокупности знаний.
Мы старались соблюсти тот же принцип при подготовке этого издания книги.
Р. С. Г.
Р. Е. В.
Благодарности
Мы в неоплатном долгу перед множеством лиц, как из академических кругов,
так и из промышленности и правительства, которые внесли большой вклад
в это издание книги. Их помощь была столь важной и разносторонней, что нам
трудно выделить их как-то иначе, чем просто перечислить в алфавитном по-
рядке. В частности, мы глубоко признательны за те многочисленные советы по
улучшению формы изложения и содержания книги, которые предложили наши
коллеги Монги А. Абиди, Стивен Л. Эддинс, Йонг Мин Ким, Брайан Морс, Эн-
дрю Олдройд, Али М. Реза, Эдгардо Фелипе Риверон, Хосе Руиз Шульклопер
и Кэмерон Х. Г. Райт.
Многие лица и организации оказали нам ценную помощь во время напи-
сания настоящего издания. Мы перечисляем их опять-таки по алфавиту. Мы
особо признательны Кертни Эспозито и Наоми Фернандес из компании The
MathWorks, предоставившим нам пакет программ MATLAB и оказавшим по-
мощь в его использовании, что позволило построить и уточнить многие при-
меры и экспериментальные результаты, включенные в настоящее издание.
Значительная доля использованных в нем новых изображений (а в некоторых
случаях – их история и объяснение) поступили к нам благодаря усилиям лиц,
чей вклад воистину неоценим, среди которых, в частности: Серж Бехер, Ме-
лисса Д. Байнд, Джеймс Бланкеншип, Уве Боос, Эрнесто Брибиеска, Майкл Е.
Кейси, Майкл У. Дэвидсон, Сьюзен Л. Форсбург, Томас Р. Гест, Лалит Гупта,
Дэниел А. Хаммер, Жонг Хе, Роджер Хиди, Хуан А. Херрера, Джон М. Хьюдек,
Майкл Гурвиц, Крис Й. Йохансен, Ронда Найтон, Эшли Мохамед, А. Моррис,
Кертис С. Обер, Джозеф Е. Пассенте, Дэвид Р. Пикенс, Майкл Робинсон, Бар-
ретт А. Шефер, Майкл Шаффер, Пит Сайтс, Салли Стоу, Крейг Уотсон, Дэвид
К. Уи и Роберт А. Вест. Мы также признательны другим лицам и организациям,
упоминающимся в подписях ко многим фотографиям, за любезное разрешение
использовать в книге предоставленные ими материалы.
Сотрудники издательства Прентис-Холл Винс О’Брайен, Роуз Кернан,
Скотт Дисанно, Майкл Мак-Дональд, Джо Руддик, Хитер Скотт и Элис Двор-
кин заслуживают особой благодарности. Их творческие способности, помощь
и терпение при выпуске книги были действительно неоценимыми.
Р. С. Г.
Р. Е. В.
Сайт книги в сети Интернет
www.prenhall.com/gonzalezwoods
или зеркальный сайт
www.imageprocessingplace.com
Хотя книга «Цифровая обработка изображений» содержит в себе весь необхо-
димый материал, дополняющий ее сайт в Интернет предлагает помощь в ряде
важных вопросов.
Для студентов и самостоятельных читателей на сайте имеются :
краткие обзоры по таким областям, как теория вероятностей, математи• -
ческая статистика, линейная алгебра;
• подробные решения к некоторым из предлагаемых в книге упражнений;
• учебные проекты для самостоятельной компьютерной реализации;
• раздел «Учебные пособия» с десятками обучающих материалов по боль-
шинству тем, рассматриваемых в книге;
• база данных, содержащая все изображения из книги.
Для преподавателей сайт предлагает:
• «Пособие для преподавателя» с полными решениями всех упражнений
из книги, а также примерами учебных планов и методическими указа-
ниями к проведению лабораторных работ. Это руководство бесплатно
предоставляется преподавателям, которые принимают данную книгу
в качестве основы для учебного курса;
• материалы для учебных презентаций в формате PowerPoint;
• изъятые из книги части прежних ее изданий в формате PDF, которые
преподаватель может при желании получить по сети и использовать
в учебном процессе;
• многочисленные ссылки на другие образовательные ресурсы.
Для практиков на сайте имеются дополнительные специализированные
разделы, например:
• ссылки на коммерческие сайты Интернет по тематике;
• отдельные новые литературные ссылки;
• ссылки на коммерческие базы данных изображений.
Данный Интернет-сайт является идеальным инструментом для актуализа-
ции книги в промежутках между изданиями, позволяя добавлять новые темы,
цифровые изображения и прочий материал, появившийся после выхода книги
из печати. Хотя выпуск книги осуществлялся с большим вниманием и заботой,
сайт также позволяет удобно размещать информацию об обнаруженных ошиб-
ках. Ссылки на материалы сайта отмечаются на полях следующим значком:
Об авторах
Рафаэл С. Гонсалес
Р. С. Гонсалес получил степень бакалавра в университете шт. Майами в 1965 г.,
а затем степени магистра и доктора философии по электротехнике в универ-
ситете шт. Флорида (г. Гейнсвилл) в 1967 и 1970 гг. соответственно. В 1970 г. он
поступил на работу на факультет электронной и компьютерной техники уни-
верситета шт. Теннеси (UTK) в г. Ноксвилл, где последовательно получил зва-
ния адъюнкт-профессора (1973 г.), профессора (1978 г.) и профессора с особыми
заслугами (1984 г.). С 1994 по 1997 гг. он был президентом факультета, а в настоя-
щее время является почетным профессором UTK в отставке.
Гонсалес был основателем двух лабораторий UTK: Лаборатории анализа
изображений и образов и Лаборатории робототехники и машинного зрения.
Он также основал в 1982 г. компанию Perceptics Corporation и вплоть до 1992 г.
был ее президентом. В течение трех последних лет этого периода он являлся со-
трудником Westinghouse Corporation, которая приобрела компанию Perceptics
в 1989 г.
Под руководством Гонсалеса компания Perceptics достигла больших успе-
хов в обработке изображений, машинном зрении и технологии запоминаю-
щих устройств на основе лазерных дисков. За первое десятилетие своей работы
компания Perceptics внедрила ряд новаторских изделий, в том числе: первую
в мире коммерческую систему машинного зрения для автоматического чтения
номерных знаков транспортных средств; ряд крупномасштабных систем обра-
ботки и хранения изображений, которые применяются на шести различных
заводах ВМФ США при контроле реактивных двигателей ракет «Трайдент 2»
для подводных лодок; семейство плат обработки изображений для модерниза-
ции компьютеров «Макинтош», занимающее передовые позиции на рынке; а
также линейку запоминающих устройств на базе лазерных дисков терабайтной
емкости.
Он часто привлекается промышленными предприятиями и правительством
в качестве консультанта в области распознавания образов, обработки изображе-
ний и обучающихся машин. Его академические заслуги в этих областях отме-
чены в 1977 г. премией технического факультета UTK за высокие достижения;
в 1978 г. премией ректора UTK для ученых-исследователей; в 1980 г. – премией
им. М. Е. Брукса как выдающийся профессор и почетным званием профессора
Magnavox Engineering. В 1981 г. он становится профессором IBM в университе-
те шт. Теннеси, а в 1984 г. получил там звание профессора с особыми заслуга-
ми. Он отмечен званием выдающегося выпускника университета шт. Майами
(1985 г.), премией научного общества «фи-каппа-фи» (1986 г.) и премией им. На-
тана В. Догерти университета шт. Теннеси за высокие достижения в области
техники (1992 г.).
Среди наград за промышленные достижения – премия выдающемуся инже-
неру IEEE 1987 г. за коммерческие разработки в Теннеси; Национальная премия
им. Альберта Роуза 1988 г. за успехи в создании коммерческих систем обработки
изображений; премия Б. Отто Уили за достижения в переносе технологий; зва-
ние «предприниматель года» агентства Куперс и Либранд в 1989 г.; премия вы-
дающемуся инженеру IEEE 1992 г.; и Национальная премия 1993 г. за развитие
технологии Ассоциации по автоматизированной обработке изображений.
Гонсалес является автором и соавтором свыше 100 технических статей, двух
монографий и четырех учебников в области распознавания образов, обработ-
ки изображений и робототехники. Его книгами пользуются в более чем 1000
университетах и исследовательских институтах по всему миру. Он включен
в престижные справочники «Кто есть кто в Америке», «Кто есть кто в технике»,
«Кто есть кто в мире», а также еще в 10 национальных и международных био-
графических перечней. Он совладелец двух патентов США и член редколлегий
научных журналов «Труды по теории систем» (IEEE Transactions on Systems),
«Человек и кибернетика» (Man and Cybernetics), Международного журнала по
вычислительной технике и информатике (International Journal of Computer and
Information Sciences). Он является членом IEEE и состоит в многочисленных
профессиональных и почетных обществах (в том числе «тау-бета-пи», «фи-
каппа-фи», «эта-каппа-ню» и «сигма-кси»).
Ричард Е. Вудс
Ричард Е. Вудс получил степени бакалавра, магистра и доктора философии по
электротехнике в университете шт. Теннеси (г. Ноксвилл). Его профессиональ-
ный опыт охватывает широкий диапазон от предпринимательской деятельности
до исполнения более традиционных обязанностей в академической, консуль-
тативной, правительственной и промышленной сферах. Недавно он основал
работающую в области высоких технологий компанию MedData Interactive, ко-
торая специализируется на разработке портативных компьютерных систем ме-
дицинского назначения. Он также является соучредителем и вице-президентом
компании Perceptics Corporation, отвечая в ней за разработку многих видов про-
дукции для количественного анализа изображений и автономного принятия
решений.
До работы в компаниях Perceptics и MedData д р Вудс был доцентом по элек-
тротехнике и вычислительной технике в университете Теннеси, а еще раньше —
инженером по компьютеризации в компании Union Carbide Corporation. В каче-
стве консультанта он привлекался к разработке ряда процессоров специального
назначения для многочисленных космических и военных ведомств, включая
агентство NASA, Центр управления баллистическими ракетами и Националь-
ную лабораторию Оук Ридж (Oak Ridge).
Д-р Вудс опубликовал множество статей по цифровой обработке сигналов и
состоит в ряде профессиональных обществ, включая «тау-бета-пи», «фи-каппа-
фи» и IEEE. В 1986 г. он был признан выдающимся выпускником университета
шт. Теннеси.
Предисловие научного редактора перевода
Тот факт, что не менее 90 % информации человек получает при помощи зрения,
давно превратился в банальное утверждение, однако не потерял своей значи-
мости. Более того, объемы зрительной информации, которую приходится по-
лучать, воспринимать и анализировать, постоянно возрастают. Все бóльшая
роль при этом отводится техническим системам обработки и анализа видео-
информации — как с целью преобразования и видоизменения поступающих
данных для последующего предоставления человеку, так и с целью автомати-
ческого их анализа и извлечения информации, в том числе для выбора после-
дующей реакции.
Число областей, в которых исходные данные поступают в виде изображе-
ний, огромно. Здесь и различные системы наблюдения, технического зрения,
мониторинга, видеотелефонии, которые регистрируют и передают огромные
объемы видеоданных, и различные автономные системы (роботы), принима-
ющие решение на основе анализа видеоинформации, и персонализированное
телевизионное вещание, и полиграфия со значительно возросшим объемом ил-
люстраций в печатной продукции, и медицина, и Интернет, и многие другие
направления. При этом наряду со значительным повышением уровня развития
техники, самую существенную роль играют методы обработки видеоинформа-
ции. Они обеспечивают улучшение изображений для их наилучшего восприя-
тия, сжатие видеоданных для хранения и передачи по каналам связи, а также
анализ, распознавание и интерпретацию зрительных образов для принятия ре-
шений и управления поведением автономных технических систем.
Широкое распространение как профессиональных, так и бытовых средств
фото- и видеорегистрации, а также достаточно мощных вычислительных ма-
шин, привело к появлению разнообразных программных средств обработ-
ки изображений. Они предоставляют богатые возможности преобразования
и улучшения данных, но, как правило (кроме простейших случаев), не дают
понимания того, какие именно операции над изображениями производятся.
В такой ситуации у пользователя нет возможности ни объяснить выполняемые
действия, ни быть уверенным, что при повторном их выполнении над другими
данными будет получен соответствующий результат, ни составить правиль-
ный план последовательности необходимых действий для достижения какой-
то поставленной цели. Решение этих задач возможно только на основе научно-
го подхода.
Монография известных американских специалистов в области цифровой
обработки изображений Р. Гонсалеса и Р. Вудса является введением в данную
область знаний и создает основы для дальнейшего изучения этой многогранной
и быстро развивающейся науки. В книге излагаются основы теории и методов
преобразования и анализа видеоинформации, и она является одним из наибо-
лее известных и распространенных за рубежом учебников в данной области нау-
ки. Многие из алгоритмов, которые в ней приведены, реализованы в различных
широко используемых пакетах компьютерного редактирования изображений.
В США данная книга вышла уже третьим изданием (первое появилось в 1992 г.).
Перед этим было два издания книги с тем же названием, написанной Гонсале-
сом и Винцем (в 1977 и в 1987 гг.).
Круг рассматриваемых в книге вопросов достаточно широк. Изучаются все
основные направления обработки и анализа изображений, включая основы те-
ории восприятия и регистрации видеоинформации, основные методы фильтра-
ции и вейвлет-преобразования, методы улучшения, восстановления и сжатия
черно-белых и цветных изображений, восстановления изображения по про-
екциям; также обсуждаются вопросы сегментации, распознавания образов,
описания и представления деталей, морфологического анализа изображения.
При этом необходимо отметить, что некоторые из вопросов, например, вопросы
вейвлет-преобразования изображений или сопоставление разнообразных под-
ходов к кодированию изображений и видеопоследовательностей до настоящего
момента были опубликованы на русском языке лишь в виде отдельных разроз-
ненных статей. Без сомнения, проведенные в книге рассмотрения не являются
исчерпывающими в каждом из отдельных вопросов, однако они дают достаточ-
но хорошее представление о сущности проблем и о наиболее распространенных
способах их решения.
Все разделы книги содержат достаточно подробные обсуждения, при-
водится большое количество примеров и обработанных изображений, ил-
люстрирующих рассматриваемые методы. Оригинал книги сопровождает-
ся Интернет-сайтом (англоязычным), расположенным по адресу http://www.
imageprocessingplace.com или http://www.prenhall.com/gonzalezwoods (адрес зеркаль-
ного сайта). На нем представлены вспомогательные и дополнительные мате-
риалы, решения предложенных авторами задач, методические материалы
по составлению учебных планов, а также база данных, содержащая многие
из приведенных в книге иллюстраций.
Материал книги излагается на вполне доступном уровне. Предполагается,
что читатель имеет математическую подготовку в объеме первых курсов техни-
ческого вуза и знаком с основами математического анализа, линейной алгебры,
теории вероятностей и математической статистики, а также владеет минималь-
ными навыками программирования.
Данная монография создавалась авторами как введение в основные по-
нятия и методы цифровой обработки изображений, дающее основы для по-
следующего углубленного изучения проблематики обработки изображений,
а также проведения самостоятельных исследований в этой области. В качестве
стиля изложения авторы выбрали постепенный переход от простого к слож-
ному и снабдили материал большим количеством задач, приведенных в конце
каждой главы. Эти качества, вместе с полнотой охвата и достаточной подробно-
стью рассмотрения изучаемых вопросов, позволяют рекомендовать эту книгу
в качестве основы для построения учебного курса по теории и методам циф-
ровой обработки изображений для студентов соответствующих специально-
стей. Данная книга будет полезна широкому кругу читателей: профессионалам
в области анализа и переработки видеоинформации, студентам и аспирантам,
специализирующимся в области информатики, а также всем интересующим-
ся вопросами компьютерной обработки и анализа неподвижных изображений
и видеопоследовательностей.
Следуя стилю авторов, мы сочли уместным привести список наиболее важ-
ных книг, изданных на русском языке, связанных с проблематикой обработки
изображений. Данный список помещен в конце главы 1 вслед за аналогичным
списком монографий, рекомендованных авторами. К сожалению, в нашей
стране в последние годы заметно ощущается недостаток учебной литературы,
отражающей как фундаментальные основы, так и изменения, происходящие
в области цифровой обработки видеоинформации. Мы надеемся, что книга
Р. Гонсалеса и Р. Вудса сможет восполнить возникший в отечественной учеб-
ной литературе дефицит книг из области теории и методов обработки изобра-
жений.
При переводе книги пришлось столкнуться с рядом трудностей, прежде
всего терминологического характера; встречались также и не отмеченные ав-
торами опечатки и неточности в формулировках. В русскоязычном издании
устранены многие из них: как те, которые были отмечены авторами, так и те, ко-
торые встретились уже при переводе. Переводчиками была проделана большая
работа по проверке значительной части формулировок, алгоритмов и выкла-
док. Насколько было возможно, переводчики старались сохранить стиль авто-
ров; однако книга написана не строго формально, в результате чего в некоторых
местах для достижения большей точности и ясности изложения приходилось
несколько отклоняться от текста оригинала. В тех случаях, когда по мнению
переводчиков полезным являлось дать некоторые разъяснения, были написаны
дополнительные примечания. Нумерация всех примечаний сделана сплошная
по каждой из глав: т. е. по умолчанию ссылка указывает на примечание внутри
той же самой главы.
Предыдущее издание настоящей книги (в том числе и его перевод на рус-
ский язык) вызвало большой интерес читателей. Хочется надеяться, что перевод
третьего издания также будет востребован.
Перевод книги выполнен канд. техн. наук Л. И. Рубановым (вводная часть,
гл. 1, 2, 9—12) и канд. техн. наук П. А. Чочиа (гл. 3—8). Данный перевод в зна-
чительной степени основан на переводе второго издания той же книги. В нем,
кроме двух указанных переводчиков, принимал участие канд. физ.-мат. наук
Д. В. Сушко (гл. 4—7), который кроме того оказал существенную помощь при
переводе гл. 5 настоящего издания.
П. А. Чочиа
ГЛАВА 1
Введение
Лучше один раз увидеть, чем сто раз услышать.
Пословица
Интерес к методам цифровой обработки изображений происходит из двух
основных областей ее применения, которыми являются повышение качества
изображений для улучшения его визуального восприятия человеком и обра-
ботка изображений для их хранения, передачи и представления в автономных
системах машинного зрения. Эта глава преследует несколько целей: (1) опреде-
лить границы области, называемой «обработка изображений»; (2) нарисовать
историческую перспективу развития этой области; (3) дать представление о со-
временном состоянии предмета, рассмотрев несколько важнейших областей,
где применяется обработка изображений; (4) кратко обсудить основные подхо-
ды, используемые в цифровой обработке изображений; (5) дать общее представ-
ление о компонентах типичной многоцелевой системы обработки изображений
и (6) указать книги и периодические издания, в которых публикуются работы
по тематике обработки изображений.
1.1. Что такое цифровая обработка изображений?
Изображение можно определить как двумерную функцию f(x, y), где x и y — ко-
ординаты в пространстве (конкретно на плоскости) и значение f которой в лю-
бой точке, задаваемой парой координат (x, y), называется интенсивностью или
уровнем серого1 изображения в этой точке. Если величины x, y и f принимают ко-
нечное число дискретных значений, то говорят о цифровом изображении. Циф-
ровой обработкой изображений называется обработка цифровых изображений
с помощью цифровых вычислительных машин (компьютеров). Заметим, что
цифровое изображение состоит из конечного числа элементов, каждый из ко-
торых расположен в конкретном месте и принимает определенное значение.
Эти элементы называются элементами изображения или пикселями2. Чаще всего
для элементов цифрового изображения используется термин «пиксель». Более
строгие формальные определения будут даны в главе 2.
1 В отечественной литературе для этого понятия широко распространен термин
яркость, который мы и будем использовать во всех случаях, когда это не приводит к не-
доразумениям. — Прим. перев.
2 Слово pixel образовано от английского словосочетания picture element — «элемент
изображения». В англоязычной литературе также широко употребляется сокращенное
написание pel. — Прим. перев.
Зрение является наиболее совершенным из наших органов чувств, поэтому
неудивительно, что зрительные образы играют важнейшую роль в человеческом
восприятии. Однако, в отличие от людей, способных воспринимать электро-
магнитное излучение лишь в видимом диапазоне, машинная обработка изо-
бражений охватывает практически весь электромагнитный спектр от гамма-
излучения до радиоволн. Обрабатываемые изображения могут порождаться
такими источниками, которые для человека непривычно связывать с наблю-
даемыми изображениями. Таковы, например, ультразвуковые изображения,
изображения, получаемые в электронной микроскопии или генерируемые ком-
пьютером. Таким образом, цифровая обработка изображений охватывает ши-
рокие и разнообразные области применения.
Не существует общепринятой точки зрения, где заканчивается обработка
изображений и начинаются другие смежные области, например анализ изо-
бражений и машинное зрение. Иногда разграничение делается здесь по тому
принципу, что обработка изображений определяется как дисциплина, в кото-
рой на входе и на выходе процесса присутствуют изображения. Мы убеждены,
что такое вычленение является ограниченным и отчасти искусственным. На-
пример, в рамках этого определения даже такая тривиальная задача, как опре-
деление средней интенсивности по полю изображения (при решении которой
ищется единственное число), не может рассматриваться как операция обработ-
ки изображения. С другой стороны, существуют такие области, как машинное
зрение, где конечной целью является компьютерная имитация человеческо-
го зрения, включая обучение, способность к умозаключениям и действиям
на основе наблюдаемой информации. Эта область сама по себе образует лишь
одно из направлений искусственного интеллекта, целью которого является
имитация интеллектуальной деятельности человека. Искусственный интел-
лект находится еще на начальной стадии своего развития, причем следует отме-
тить, что прогресс идет значительно медленнее, чем первоначально ожидалось.
Область, связанная с анализом изображений (иначе называемая «понимание»
или «интерпретация» изображений), занимает промежуточное положение меж-
ду обработкой изображений и машинным зрением.
Во всем диапазоне от обработки изображений до машинного зрения нет
четких границ, тем не менее можно различать в нем компьютеризованные про-
цессы низкого, среднего и высокого уровня. Процессы низкого уровня касаются
только примитивных операций типа предобработки с целью уменьшения шума,
повышения контраста или улучшения резкости изображений. Для низкоуров-
невых процессов характерен тот факт, что на входе и на выходе присутствуют
изображения. Обработка изображений на среднем уровне охватывает такие
задачи, как сегментация (разделение изображения на области или выделение
на нем объектов), описание объектов и сжатие их в удобную для компьютерной
обработки форму, а также классификация (распознавание) отдельных объек-
тов. Для процессов среднего уровня характерно наличие изображений только
на входе, на выход же поступают признаки и атрибуты, извлекаемые из этих изо-
бражений (например границы областей, линии контуров, отличительные при-
знаки конкретных объектов). Наконец, высокоуровневая обработка включает
в себя «осмысление» набора распознанных объектов, как это делается в анализе
изображений, и в пределе осуществление познавательных функций, которые
принято связывать со зрением.
Исходя из вышеприведенного замечания мы видим, что естественным
этапом перехода от обработки изображений к их анализу выступает распозна-
вание отдельных областей или объектов на изображении. Таким образом, то,
что в этой книге называется «цифровой обработкой изображений», включает
процессы с изображениями на входе и на выходе, а также процессы извлечения
признаков из изображений, вплоть до (или включая) распознавания индивиду-
альных объектов. В качестве иллюстрации, разъясняющей указанные понятия,
рассмотрим область автоматизированного анализа печатного или рукописного
текста. В сферу цифровой обработки изображений, которая рассматривается
в данной книге, входят процессы получения изображения области, содержа-
щей этот текст, предварительной обработки полученного изображения, вы-
деления (сегментации) отдельных символов текста, описания символов в под-
ходящей для компьютерной обработки форме и, наконец, распознавания этих
символов. Что касается осмысления содержимого страницы, то оно может быть
отнесено уже к сфере анализа изображений или даже машинного зрения, в за-
висимости от уровня сложности, который подразумевается за словом «осмыс-
ление». Как мы вскоре увидим, определенная таким образом цифровая обра-
ботка изображений успешно применяется в широком круге областей, важных
с социально-экономической точки зрения. Концепции, развиваемые в после-
дующих главах, служат основой для методов, которые используются в этих при-
кладных областях.
1.2. Истоки цифровой обработки изображений
Одно из первых применений цифровых изображений было опробовано в газет-
ном деле для передачи иллюстраций по трансокеанскому подводному кабелю
между Лондоном и Нью-Йорком. В начале 1920-х годов была внедрена система
«Бартлейн» для передачи изображений по кабелю, что позволило уменьшить
время доставки иллюстраций через Атлантику с обычной недельной задержки
до менее чем трех часов. С помощью специального печатающего оборудования
осуществлялось кодирование исходного изображения для передачи по кабе-
лю и последующее восстановление этого изображения на приемной стороне.
На рис. 1.1 показано изображение, переданное таким образом и распечатанное
затем на телеграфном буквопечатающем аппарате со специальным шрифтом,
имитирующим различные уровни почернения.
Ряд начальных проблем, связанных с улучшением визуального качества
этих первых цифровых изображений, относился к выбору процедуры печати
и распределению уровней интенсивности. Способ печати, использованный
для получения рис. 1.1, в конце 1921 г. был отвергнут в пользу технологии фото-
графической репродукции с использованием перфоленты, формируемой теле-
графным аппаратом на приемной стороне линии. На рис. 1.2 показано изо-
бражение, полученное таким способом. Улучшения по сравнению с рис. 1.1
очевидны как в отношении качества передачи полутонов, так и в простран-
ственном разрешении.
Ранние системы «Бартлейн» были способны кодировать изображения с по-
мощью пяти градаций яркости. В 1929 г. эти возможности были увеличены до 15
градаций. На рис. 1.3 приведено типичное изображение, которое могло быть по-
лучено с помощью оборудования, использующего 15 градаций яркости. За этот
период были внедрены системы, в которых фотопластинка экспонировалась
с помощью световых лучей, модулируемых закодированной на перфоленте ин-
формацией, что позволило значительно улучшить процесс репродукции.
Хотя в вышеприведенных примерах фигурируют цифровые изображения,
их нельзя рассматривать как результат цифровой обработки изображений
в контексте нашего определения, коль скоро при их получении не использова-
лись компьютеры. Таким образом, история цифровой обработки изображений
тесно связана с развитием цифровой вычислительной техники. В самом деле,
для цифровых изображений требуется такая большая память и вычислительная
мощность, что прогресс в области цифровой обработки изображений в значи-
тельной степени определяется развитием компьютеров и вспомогательных тех-
нологий для хранения, отображения и передачи данных.
Идея компьютера восходит к абаку, изобретенному на полуострове Малая
Азия более 5000 лет назад. Ближе к нашим дням, в последние два столетия де-
лались продвижения, заложившие основу для появления компьютеров. Однако
принципы того, что мы называем современным цифровым компьютером, были
3 Список литературы в конце книги расположен в алфавитном порядке по фами-
лии первого автора.
Рис. 1.1. Цифровое изображение, полученное в 1921 г. с кодовой ленты на теле-
графном аппарате с особым шрифтом [McFarlane3]
Рис. 1.2. Цифровое изображение, полученное в 1922 г. с использованием перфо-
ленты после прохождения сигнала через Атлантику дважды [McFarlane]
заложены всего лишь в 1940-х годах, когда Джон фон Нейман ввел в рассмотре-
ние два ключевых понятия: (1) равноправное хранение в памяти и данных, и про-
грамм и (2) условный переход в программе. Эти две идеи заложены в фундамент
центрального процессора, который является сердцем современных компьюте-
ров. Вслед за фон Нейманом был целый ряд ключевых продвижений, которые
привели к появлению компьютеров, достаточно мощных для использования
при цифровой обработке изображений. Кратко перечислим эти достижения:
(1) изобретение транзистора в компании Bell Laboratories в 1948 г.; (2) изобре-
тение в 1950-х и 1960-х гг. языков программирования высокого уровня КОБОЛ
(COBOL, Common Business-Oriented Language — общий язык программирова-
ния, ориентированный на бизнес) и ФОРТРАН (FORTRAN, Formula Translator
— «транслятор формул»); (3) изобретение интегральной микросхемы ком-
панией Texas Instruments в 1958 г.; (4) разработка операционных систем в начале
1960-х гг.; (5) выход на рынок персонального компьютера IBM в 1981 г. и (7) по-
следовательная миниатюризация электронных компонентов, начиная с появле-
ния больших интегральных схем (БИС) в конце 1970-х гг., затем сверхбольших
интегральных схем (СБИС) в 1980-х гг., вплоть до сегодняшних ультрабольших
интегральных схем (УБИС). Одновременно с перечисленными продвижениями
шло развитие в области запоминающих устройств и систем отображения, на-
личие которых необходимо для цифровой обработки изображений.
Первые компьютеры с мощностью, достаточной для выполнения осмыс-
ленных задач цифровой обработки изображений, появились в начале 1960-х гг.
Рождение того, что мы сегодня называем цифровой обработкой изображений,
прослеживается с момента возникновения таких машин и появления про-
грамм изучения космоса. Параллельный прогресс в этих двух областях привел
в действие мощный потенциал идей цифровой обработки изображений. Ра-
боты по использованию вычислительной техники для улучшения визуально-
го качества изображений, получаемых с помощью беспилотных космических
аппаратов, были развернуты в Лаборатории реактивного движения в Пасадене,
шт. Калифорния, в 1964 г., когда переданные космическим аппаратом «Рейн-
Рис. 1.3. Неретушированная фотография генералов Першинга и Фоша, пере-
данная в 1929 г. по кабелю из Лондона в Нью-Йорк с помощью 15-гра-
дационного оборудования [McFarlane]
жер-7» изображения лунной поверхности были подвергнуты компьютерной об-
работке для исправления различных искажений, обусловленных конструкцией
бортовой телевизионной камеры. На рис. 1.4 приведено изображение Луны, по-
лученное «Рейнджером-7» 31 июля 1964 г. в 9 час. 9 мин. восточно-американского
времени (EDT), приблизительно за 17 мин. до его удара о лунную поверхность
(на фотографии видны метки так называемой ризо-маркировки, применяемой
для коррекции геометрических искажений; эта техника обсуждается подроб-
нее в главе 2). Это было первое изображение Луны, полученное американским
космическим аппаратом4. Опыт, накопленный при обработке первых косми-
ческих изображений, послужил основой для разработки усовершенствован-
ных методов восстановления и улучшения изображений. Эти методы позже
применялись при обработке изображений, полученных в ходе полетов к Луне
космических аппаратов «Сервейер», полетов аппаратов «Маринер» по пролет-
ной траектории вблизи Марса, пилотируемых полетов космических кораблей
«Аполлон» на Луну и т. д.
Параллельно с космическими исследованиями в конце 1960-х — начале
1970-х гг. методы цифровой обработки изображений начали применяться в ме-
дицине, дистанционном исследовании земных ресурсов, астрономии. В начале
1970-х гг. была изобретена рентгеновская вычислительная томография, крат-
ко называемая также компьютерной томографией (КТ), что стало важнейшим
событием в области применения обработки изображений для медицинской
диагностики. При компьютерной томографии набор детекторов излучения
и рентгеновский источник располагаются на кольце, внутрь которого помеща-
ется исследуемый объект (т. е. пациент), и кольцо вращается вокруг объекта.
Проходящее через объект рентгеновское излучение улавливается детекторами,
4 Напомним, что первые космические снимки лунной поверхности (в том числе
обратной стороны Луны) были сделаны советской автоматической межпланетной стан-
цией «Луна 3» в 1959 г. — Прим. перев.
Рис. 1.4. Изображение лунной поверхности, переданное космическим аппара-
том «Рейнджер-7» 31 июля 1964 г. (Снимок предоставлен агентством
NASA)
находящимися на противоположной стороне кольца; этот процесс повторя-
ется по мере вращения источника. Томография состоит из алгоритмов, кото-
рые на основе использования данных от детекторов строят изображения «се-
чения» объекта в плоскости кольца. При движении объекта вдоль оси кольца
создается набор таких сечений, которые в совокупности образуют трехмерное
представление внутреннего строения объекта. Томографию независимо друг
от друга предложили сэр Годфри Н. Хаунсфилд и проф. Ален М. Кормак, ко-
торые в 1979 г. были удостоены за это изобретение Нобелевской премии по ме-
дицине. Интересно отметить, что рентгеновские лучи были открыты в 1895 г.
Вильгельмом Конрадом Рентгеном, получившим за это Нобелевскую премию
по физике в 1901 г. Эти два открытия, которые разделяет почти 100 лет, привели
к одному из наиболее важных сегодняшних применений цифровой обработки
изображений.
С 1960-х гг. до настоящего времени область применения обработки изобра-
жений значительно расширилась. Помимо медицинских и космических при-
ложений, методы цифровой обработки изображений сегодня используются
в широком круге областей. Компьютеризированные процедуры применяются
для облегчения восприятия рентгеновских и иных изображений в промыш-
ленности, медицине и биологии путем повышения контраста или цветового
кодирования различных уровней интенсивности (представления изображе-
ний в псевдоцветах). Аналогичные методы применяются в географии для из-
учения картины загрязнений окружающей среды по данным аэрофотосъемки
и космическим снимкам. Методы улучшения и восстановления изображений
применяются при обработке некачественных изображений утраченных объек-
тов или трудновоспроизводимых экспериментальных результатов. Например,
в археологии с помощью методов цифровой обработки изображений удалось
по имеющимся нечетким фотографиям успешно восстановить первоначаль-
ный вид раритетов, которые со времени съемки были утрачены или поврежде-
ны. В физике и смежных областях компьютерная обработка является обычным
способом улучшения качества изображений, получаемых в ходе экспериментов,
как, например, в электронной микроскопии или физике высокотемпературной
плазмы. Аналогичные примеры успешного применения технологий обработки
изображений можно найти в астрономии, биологии, медицинской радиологии,
промышленности, в оборонной и правоохранительной сфере.
Приведенные примеры относились к случаям, когда результаты обработки
предназначены для восприятия человеком. Другая крупная область примене-
ния методов обработки изображений, упоминавшаяся в начале этой главы, —
это решение задач, связанных с машинным восприятием изображений. В этом
случае интерес вызывают процедуры, извлекающие из изображения некоторую
информацию и представляющие ее в форме, подходящей для компьютерной об-
работки. Часто эта информация весьма мало похожа на визуальные признаки,
используемые людьми при интерпретации содержимого изображения. Приме-
рами информации такого рода, часто применяемой при машинном восприятии
изображений, могут быть статистические моменты, коэффициенты преобразо-
вания Фурье, значения многомерного расстояния и т. д. Типичными задачами
машинного восприятия, в которых интенсивно используются методы обработ-
ки изображений, являются автоматическое распознавание символов, системы
машинного зрения для автоматизации сборки и контроля продукции, задачи
опознавания «свой—чужой» для военных объектов, автоматическая обработка
отпечатков пальцев, проверка анализов крови и результатов рентгеновских ис-
следований, компьютерная обработка аэрофотоснимков и спутниковых изо-
бражений с целью прогнозирования погоды и экологического мониторинга.
Продолжающееся уменьшение соотношения цена/производительность совре-
менных компьютеров, рост пропускной способности сетей телекоммуникаций
и развитие Интернета создали беспрецедентные возможности для дальнейшего
расширения сферы цифровой обработки изображений. Некоторые из приклад-
ных областей рассматриваются в следующем разделе.
1.3.Примеры областей применения цифровой обработки изображений
Сегодня в технике нет почти ни одной области, которую в той или иной мере
не затрагивала бы цифровая обработка изображений. Наше обсуждение коснет-
ся лишь сравнительно небольшого числа таких прикладных областей, однако,
несмотря на вынужденную ограниченность материала, у читателя не должно
остаться сомнений в широте и важности применения обработки изображений.
В этом разделе демонстрируются многочисленные прикладные области, в каж-
дой из которых повседневно используются методы цифровой обработки изо-
бражений, описываемые в последующих главах. Многие из приведенных здесь
изображений впоследствии упоминаются во встречающихся в книге примерах.
Все эти изображения являются цифровыми.
Области применения цифровой обработки изображений столь разнообраз-
ны, что попытка охватить их во всей широте требует какой-то системы изло-
жения. Один из простейших способов — классификация прикладных областей
в соответствии с видами источников, формирующих соответствующие изо-
бражения (например оптические, рентгеновские и т. д.). Главным источником
энергии для формирования применяемых сегодня изображений является элек-
тромагнитное излучение. Среди других важных энергетических источников,
которые могут создавать изображения, упомянем акустические и ультразву-
ковые (механические) колебания, а также электронные пучки, применяемые
в электронной микроскопии. Кроме того, имеется целый класс синтетических
(искусственных) изображений, которые синтезируются компьютерными про-
граммами и используются для моделирования и визуализации. В этом разделе
мы кратко обсудим, как регистрируются изображения этих многочисленных
категорий и каковы области их применения. Методы преобразования изобра-
жений в цифровую форму будут рассмотрены в следующей главе.
Наиболее привычны изображения, создаваемые электромагнитным излу-
чением, особенно в видимом спектре или в рентгеновском диапазоне. Электро-
магнитные волны можно трактовать как распространяющиеся синусоидальные
колебания определенной частоты, а можно — как поток частиц, движущихся
со скоростью света. Каждая такая частица обладает определенной энергией,
но нулевой массой и называется квантом излучения (фотоном). Если располо-
жить диапазоны излучения в порядке убывания энергии фотона, то получим
изображенный на рис. 1.5 спектр, простирающийся от гамма-лучей (обладаю-
щих максимальной энергией) до радиоволн. Плавное изменение окраски ин-
тервалов диапазона на этом рисунке призвано подчеркнуть тот факт, что спектр
электромагнитного излучения не разграничен строго, а имеет смысл говорить
скорее о плавном переходе одного участка диапазона в другой.
1.3.1. Формирование изображений с помощью гамма-лучей
Изображения, полученные с помощью гамма-излучения, используются глав-
ным образом в медицинской радиологии и астрономических наблюдениях.
В медицинской радиологии применяется подход, при котором пациенту вводит-
ся радиоактивный изотоп, распад которого сопровождается гамма-излучением.
Это излучение регистрируется детекторами гамма-излучения, сигналы которых
и используются для формирования изображения. На рис. 1.6(а) приведен пол-
ный снимок скелета, полученный с помощью гамма-лучей описанным образом.
Изображения такого вида используются для обнаружения участков различных
патологий костей, в частности при инфекционных или онкологических заболе-
ваниях. Рис. 1.6(б) демонстрирует другой важный вид медицинских радиологи-
ческих изображений, получаемых методом позитронной эмиссионной томогра-
фии (ПЭТ). Используется тот же принцип, что и при рентгеновской томографии,
кратко описанный в разделе 1.2, однако вместо использования внешнего ис-
точника рентгеновского излучения пациент принимает радиоактивный изо-
топ, распад которого сопровождается позитронным излучением. При встрече
позитрона с электроном они аннигилируют с выделением двух гамма-квантов.
Это гамма-излучение регистрируется, и формируется томографическое изо-
бражение в соответствии с основными принципами томографии. Приведенное
на рис. 1.6(б) изображение представляет собой один кадр из последовательно-
сти изображений, которые в совокупности дают трехмерное представление тела
пациента. На этом кадре хорошо видны небольшие белые скопления — опухоли
в мозге и в легком пациента.
Около 15 тыс. лет назад в созвездии Лебедя произошел взрыв сверхно-
вой, что привело к образованию расширяющегося облака газа сверхвысо-
кой температуры, которое получило название Петли Лебедя. Столкновение
этого облака с окружающими газовыми облаками порождает излучение ши-
рокого спектра, которое в видимом диапазоне дает эффектную цветовую
картину. На рис. 1.6(в) приведено изображение Петли Лебедя в диапазоне
гамма-излучения. В отличие от примеров, показанных на рис. 1.6(а, б), это
10–106 105 104 103 102 101 100 10–1 10–2 10–3 10–4 10–5 10–6 10–7 10–8 9
Энергия фотона (электрон-вольт)
Гамма-
излучение
Рентгеновское
излучение
Ультра-
фиолетовое
излучение
Види-
мый
свет
Инфра-
красное
излучение
Микроволновое
(или СВЧ)
излучение
Радиоволны
Рис. 1.5. Спектр электромагнитного излучения в порядке убывания энергии
фотона
изображение было получено с использованием естественного излучения изо-
бражаемого объекта. Наконец, на рис. 1.6(г) демонстрируется изображение
гамма-излучения из клапана ядерного реактора. В левой нижней части изо-
бражения видна область сильной радиации.
Рис. 1.6. Примеры изображений, полученных с помощью гамма-лучей. (а) Сни-
мок скелета. (б) ПЭТ-изображение. (в) Петля Лебедя. (г) Гамма-
излучение из клапана реактора (яркое пятно). (Изображения предо-
ставили: (а) компания G. E. Medical Systems; (б) д-р Майкл Е. Кейси,
компания CTI PET Systems; (в) профессора Жонг Хи и Дэвид К. Уи,
университет шт. Мичиган)
в а
г б
1.3.2. Рентгеновские изображения
Рентгеновские лучи — один из самых старых источников электромагнитно-
го излучения, используемых для получения изображений. Хорошо известно
применение рентгеновских лучей для медицинской диагностики, однако они
также широко используются в промышленности и других областях, в частно-
сти астрономии. Рентгеновское излучение для формирования изображений
в медицине и промышленности генерируется с помощью рентгеновской труб-
ки — вакуумного прибора с катодом и анодом. Катод находится в нагретом со-
стоянии, вследствие чего испускает свободные электроны, которые с высокой
скоростью летят к положительно заряженному аноду. При соударении электро-
нов с ядрами атомов материала анода энергия выделяется в форме рентгеновско-
го излучения. Энергия рентгеновских лучей (часто называемая «жесткостью»),
определяющая их проникающую способность, регулируется изменением при-
ложенного к аноду напряжения, а интенсивность излучения (количество рент-
геновских лучей) регулируется изменением тока, проходящего через нить на-
кала катода. На рис. 1.7(а) показан хорошо знакомый рентгеновский снимок
грудной клетки, получаемый при помещении пациента между рентгеновской
трубкой и чувствительной к рентгеновскому излучению пленкой. При прохож-
дении рентгеновских лучей через тело пациента их интенсивность изменяется
в зависимости от степени поглощения (рассеяния), и окончательный уровень
энергии фиксируется на рентгеновской пленке, экспонируя ее почти так же,
как лучи света формируют изображение на фотопленке. В цифровой рентгено-
графии применяются два способа получения цифровых изображений: (1) дис-
кретизация (оцифровка) обычных рентгеновских пленок или (2) непосред-
ственная регистрация прошедших через тело пациента рентгеновских лучей
устройством, преобразующим рентгеновское излучение в световое (например
с помощью фосфоресцирующего экрана). Полученный световой сигнал затем
считывается с помощью цифровой системы, работающей в оптическом диапа-
зоне. Вопросы дискретизации изображений подробнее рассматриваются в гла-
вах 2 и 4.
Другое важное применение рентгеновских изображений — ангиография,
которая является одним из видов контрастной рентгенографии. Эта процеду-
ра используется для получения изображений кровеносных сосудов; такие изо-
бражения называются ангиограммами. В артерию или вену в паховой области
вводится катетер (тонкая гибкая трубка), который продвигается вдоль сосуда,
пока не достигнет обследуемой зоны. Затем через катетер впрыскивается кон-
трастное вещество, хорошо поглощающее рентгеновские лучи. Благодаря этому
усиливается контраст рентгеновского изображения кровеносных сосудов, что
позволяет врачу-радиологу видеть аномалии кровоснабжения или места заку-
порки сосудов. На рис. 1.7(б) демонстрируется ангиограмма аорты, на которой
виден катетер, введенный через крупный кровеносный сосуд внизу слева. Об-
ратим внимание на высокий контраст изображения крупного сосуда в направ-
лении потока контрастного вещества к почкам, которые тоже видны на изобра-
жении. Как описано в главе 2, в ангиографии широко используется цифровая
обработка изображений, в частности вычитание изображений с целью дальней-
шего повышения контраста исследуемых кровеносных сосудов.
1.3. Примеры областей применения цифровой обработки изображений 33
Рис. 1.7. Примеры рентгеновских изображений. (а) Рентгенограмма грудной
клетки. (б) Ангиограмма аорты. (в) Компьютерная томограмма голо-
вы. (г) Печатные платы. (д) Петля Лебедя. (Изображения предостави-
ли: (а, в) д-р Дэвид Р. Пикенс, департамент радиологии медицинско-
го центра университета Вандербилта; (б) д-р Томас Р. Гест, отделение
анатомии медицинской школы университета шт. Мичиган; (г) Джозеф
Е. Пассенте, компания Lixi, Inc.; (д) агентство NASA)
в б а
д
г
Еще одно важное применение рентгеновских лучей для формирования изо-
бражений в медицине — это компьютерная томография. Благодаря высокому
разрешению и возможности трехмерного представления, компьютерная томо-
графия с момента своего первого появления в начале 1970-х гг. произвела ре-
волюцию в медицине. Как отмечалось в разделе 1.2, каждое КТ-изображение
передает поперечный срез тела пациента. При продольном перемещении паци-
ента формируется множество таких срезов, которые в совокупности образуют
трехмерное представление внутреннего строения тела с продольным разреше-
нием, пропорциональным количеству срезов. На рис. 1.7(в) показано изображе-
ние типичного среза, получаемого при компьютерной томографии головы.
Аналогичная технология используется и в промышленном производстве,
хотя там обычно применяется рентгеновское излучение с большей энергией.
На рис. 1.7(г) приведено рентгеновское изображение печатной платы радиоэ-
лектронного прибора. Подобные изображения, будучи лишь одним из сотен
возможных промышленных применений рентгеновских изображений, исполь-
зуются для контроля печатных плат на наличие дефектов, таких как отсутствие
деталей или разрывы контактных дорожек. Промышленная компьютерная
томография применима, когда детали проницаемы для рентгеновских лучей,
что очевидно в случае пластмассовых узлов, но возможна даже и при контроле
крупных изделий вроде твердотопливных реактивных двигателей. На рис.1.7(д)
показан пример применения рентгеновских изображений в астрономии. Здесь
изображена та же Петля Лебедя, что и на рис. 1.6(в), но на этот раз в диапазоне
рентгеновского излучения.
1.3.3. Изображения в ультрафиолетовом диапазоне
Ультрафиолетовый «свет» находит разнообразные применения, в частности
в литографии, производственном контроле, микроскопии, лазерной технике,
биологических и астрономических наблюдениях. Мы проиллюстрируем ис-
пользование изображений ультрафиолетового диапазона на примерах из обла-
сти микроскопии и астрономии.
Ультрафиолетовое освещение используется во флуоресцентной микроско-
пии — одном из наиболее быстро развивающихся направлений микроскопии.
Явление флуоресценции было открыто в середине XIX в., когда впервые было
замечено, что минерал флюорит (плавиковый шпат) излучает свет при направ-
лении на него ультрафиолетового излучения. Сами по себе ультрафиолетовые
лучи невидимы, но при столкновении фотона ультрафиолетового излучения
с электроном атома флуоресцентного материала электрон переходит на более
высокий энергетический уровень. Последующее возвращение возбужденного
электрона на нижний уровень сопровождается излучением фотона с меньшей
энергией, что соответствует видимому (ближе к красному) диапазону спектра.
Принцип работы флуоресцентного микроскопа заключается в облучении под-
готовленного препарата ярким активизирующим освещением и последующем
выделении значительно более слабого флуоресцентного свечения. Таким об-
разом, глаз наблюдателя или другой детектор будет воспринимать только вто-
ричное излучение. Свечение флуоресцирующих участков должно наблюдаться
на темном фоне, чтобы обеспечивался достаточный для их обнаружения кон-
траст. Чем темнее фон, изготовленный из нефлуоресцирующего материала, тем
выше эффективность прибора.
Флуоресцентная микроскопия — прекрасный метод исследования мате-
риалов, обладающих флуоресцирующими свойствами, либо в естественной
форме (первичная флуоресценция), либо в результате обработки флуоресци-
рующими химикатами (вторичная флуоресценция). Рис. 1.8(а, б) демонстри-
руют типичные возможности флуоресцентной микроскопии. На рис. 1.8(а) по-
Рис. 1.8. Примеры изображений в ультрафиолетовом диапазоне. (а) Нормальное
зерно. (б) Зерно, зараженное головней. (в) Петля Лебедя. (Изображения
предоставили: (а, б) д-р Майкл У. Дэвидсон, университет шт. Флорида;
(в) агентство NASA)
в
а б
казан полученный с помощью флуоресцентного микроскопа снимок здорового
зерна, а на рис. 1.8(б) — снимок зерна, зараженного головней — заболеванием
зерновых и бобовых культур, трав, а также луковичных растений, вызываемым
более чем 700 видами паразитических грибков. Особенно опасна головня зла-
ковых культур, поскольку зерновые — один из важнейших источников пищи
людей. В качестве иллюстрации другой области применения на рис. 1.8(в) по-
казано изображение Петли Лебедя в высокочастотной полосе ультрафиолето-
вого диапазона.
1.3.4. Изображения в видимом и инфракрасном диапазонах
Учитывая, что видимый диапазон электромагнитного спектра для нас наибо-
лее привычен, неудивительно, что область использования изображений этого
диапазона оказывается намного шире, чем всех остальных вместе взятых. Ин-
фракрасные изображения часто используются совместно с видимыми, поэтому
для иллюстрации мы объединили оба эти диапазона в одном разделе. В ниже-
следующем обсуждении в качестве примеров областей использования будут об-
суждаться: световая микроскопия, астрономия, дистанционное зондирование,
промышленность и правоохранительная деятельность.
На рис. 1.9 показано несколько примеров изображений, полученных с помо-
щью оптического микроскопа. Диапазон примеров простирается от фармацев-
тики и микроскопических методов производственного контроля до определе-
ния характеристик материалов. Даже в пределах одной микроскопии множество
возможных прикладных областей слишком обширно, чтобы его детально опи-
сать. Несложно вообразить варианты обработки, которые могут потребоваться
в применении к таким изображениям, от улучшения их визуального качества
до проведения различных измерений.
Еще одна важная область обработки видимых изображений — дистанцион-
ное зондирование земной поверхности, охватывающее обычно несколько зон
в видимом и инфракрасном диапазонах спектра. В табл. 1.1 перечислены такие
тематические зоны, в которых осуществляет зондирование спутник LANDSAT,
Таблица 1.1. Тематические зоны американского спутника LANDSAT
№ Наименование Длины
волн (мкм)
Характеристики и назначение
1 Видимый синий цвет 0,45—0,52 Максимальное проникание воды
2 Видимый зеленый цвет 0,52—0,60 Измерение плотности растительного
покрова
3 Видимый красный цвет 0,63—0,69 Различение формы растительности
4 Ближнее ИК-излучение 0,76—0,90 Съемка береговой линии и распределе-
ния биомассы
5 Средний ИК-диапазон 1,55—1,75 Содержание влаги в почве и раститель-
ности
6 Тепловое ИК-излучение 10,4—12,5 Влажность почвы и температурная карта
7 Средний ИК-диапазон 2,08—2,35 Поиск полезных ископаемых
1.3. Примеры областей применения цифровой обработки изображений 37
запущенный агентством NASA. Главная задача LANDSAT состоит в получении
и передаче изображений Земли из космоса с целью глобального экологическо-
го мониторинга. Интервалы спектра представлены длинами волн в микронах
(мкм); напомним, что 1 мкм = 10–6 м (длины волн, отвечающих различным диа-
пазонам электромагнитного спектра, подробно обсуждаются в главе 2). Обра-
тим внимание на указанные в таблице характеристики и назначение каждой
из тематических зон.
Чтобы получить начальное представление о возможностях таких многозо-
нальных изображений, взглянем на рис. 1.10, где приведено по одному изображе-
Рис. 1.9. Примеры изображений в оптической микроскопии. (а) Таксол (про-
тивораковый препарат), увеличение 250×. (б) Холестерин, увеличение
40×. (в) Микропроцессор, увеличение 60×. (г) Тонкая пленка окиси ни-
келя, увеличение 600×. (д) Поверхность музыкального компакт-диска,
увеличение 1750×. (е) Органический сверхпроводящий материал, уве-
личение 450×. (Изображения предоставил д-р Майкл У. Дэвидсон, уни-
верситет шт. Флорида)
г а
д б
е в
нию для каждой из зон таблицы. Изображен район г. Вашингтон, округ Колум-
бия; видны здания, дороги, участки растительности и протекающая через город
крупная река Потомак. Изображения населенных пунктов часто (и давно) ис-
пользуются для оценки роста численности населения, динамики загрязнений
и прочих факторов, вредно влияющих на экологию. Примечательна разница
между видимым и инфракрасным изображениями на этих снимках. Обратим,
например, внимание, насколько хорошо выделяется река на фоне берегов в изо-
бражениях, соответствующих 4-й и 5-й зонам.
Наблюдение за погодой и составление прогнозов также является важ-
ным применением многозональных спутниковых изображений. Например,
на рис. 1.11 приводится изображение урагана Катрина — одного из самых разру-
шительных ураганов в западном полушарии за последнее время. Оно было по-
лучено спутником Национальной океанографической и атмосферной службы
США (NOAA) с помощью датчиков, работающих в видимом и инфракрасном
1 2 3
4 5
6 7
Рис. 1.10. Полученные со спутника LANDSAT изображения г. Вашингтон,
округ Колумбия. Номера снимков соответствуют номерам тематиче-
ских зон в табл. 1.1. (Изображения предоставлены агентством NASA)
1.3. Примеры областей применения цифровой обработки изображений 39
диапазонах. На этом снимке хорошо виден так называемый «глаз» урагана (со-
ответствует центру циклона).
Рис. 1.12 и 1.13 демонстрируют применение инфракрасных изображе-
ний. Эти снимки были получены инфракрасной системой регистрации изо-
бражений, установленной на спутнике DMSP, запущенном по оборонно-
метеорологической программе службы NOAA, и представляют собой фрагменты
обширного набора данных «Ночные огни Земли» — глобального реестра насе-
ленных пунктов. Устройство регистрации инфракрасных изображений у этого
спутника работает в диапазоне длин волн 10,0—13,4 мкм и обладает уникаль-
ной способностью фиксировать находящиеся на земной поверхности слабые
источники ближнего инфракрасного излучения, в том числе города, поселки,
деревни, газовые факелы и пожары. Даже не будучи специалистом в обработке
изображений, легко представить себе компьютерную программу, которая ис-
пользовала бы такие изображения для оценки относительной доли электроэ-
нергии, потребляемой в различных районах Земли.
Важной областью применения изображений, регистрируемых в видимом
диапазоне, является автоматический контроль выпускаемой продукции.
На рис. 1.14 даны несколько примеров такого применения. Рис. 1.14(а) демон-
стрирует плату контроллера дисковода CD-ROM. Для подобных изделий ти-
пичной задачей обработки изображений может быть контроль наличия всех
компонентов (на данном примере черный квадрат в правой верхней части
изображения демонстрирует отсутствие микросхемы). На рис. 1.14(б) показа-
на упаковка таблеток. Здесь задача состоит в компьютерном визуальном кон-
троле отсутствия пустых мест в упаковке. Рис. 1.14(в) иллюстрирует пример
обработки изображений для выявления недостаточно заполненных бутылок
на производственной линии. На рис. 1.14(г) показана прозрачная пластмас-
совая деталь с недопустимым содержанием пузырьков воздуха. Обнаружение
подобных аномалий составляет важную область промышленного контроля
Рис. 1.11. Спутниковое изображение урагана Катрина, полученное 29 августа
2005 г. (Изображение предоставлено службой NOAA)
различных материалов, например тканей и дерева. На рис. 1.14(д) изображен
пакет кукурузных хлопьев, проходящий контроль по цвету и наличию брака
в виде отдельных подгоревших хлопьев. Наконец, на рис. 1.14(е) показано изо-
бражение внутриглазного имплантата (вживляемого в глаз искусственного
хрусталика) при специальном структурированном освещении. Эта техноло-
Рис. 1.12. Инфракрасные спутниковые изображения американского континен-
та. Для наглядности рядом приведена небольшая карта. (Изображе-
ние предоставлено службой NOOA)
1.3. Примеры областей применения цифровой обработки изображений 41
гия применяется для простоты визуального обнаружения плоских деформа-
ций имплантата. Следы в положениях «1 час» и «5 часов» (по аналогии с часо-
вым циферблатом) — повреждения, оставленные пинцетом, а большинство
других мелких пятнышек на изображении созданы пылинками и остатками
материала. Цель данного вида контроля состоит в автоматическом обнаруже-
нии бракованных или поврежденных имплантатов перед упаковкой готовой
продукции.
В качестве заключительной иллюстрации обработки изображений видимо-
го спектра рассмотрим рис. 1.15. На рис. 1.15(а) изображен отпечаток большого
пальца. Изображения отпечатков пальцев в массовом порядке подвергаются
компьютерной обработке как с целью их улучшения, так и для поиска призна-
ков, помогающих автоматически выбирать из базы данных похожие отпечатки.
На рис. 1.15(б) приведено изображение бумажной купюры. Цифровая обработка
таких изображений находит применение при автоматическом подсчете налич-
ности и в правоохранительной деятельности для чтения номеров купюр с целью
Рис. 1.13. Инфракрасные спутниковые изображения населенных регионов
на других континентах. Для наглядности рядом приведена небольшая
карта. (Изображение предоставлено службой NOOA)
их прослеживания и идентификации. Два изображения транспортных средств,
показанные на рис. 1.15(в, г), являются примерами автоматического чтения ре-
гистрационных номеров. Светлые прямоугольники указывают области, в кото-
Рис. 1.14. Некоторые примеры промышленной продукции, часто контроли-
руемой с помощью цифровой обработки оптических изображений.
(а) Печатная плата контроллера. (б) Упаковка таблеток. (в) Бутылки.
(г) Пузырьки воздуха в изделии из прозрачной пластмассы. (д) Куку-
рузные хлопья. (е) Изображение искусственного хрусталика. (Изо-
бражение (е) предоставил Пит Сайтс, Perceptics Corporation)
д в а
е г б
1.3. Примеры областей применения цифровой обработки изображений 43
рых система обработки изображений опознала номер транспортного средства,
а в черных прямоугольниках выводятся результаты автоматического распознава-
ния этой системой содержимого номера. Чтение автомобильных номеров и дру-
гие применения автоматического распознавания символов широко используют-
ся для контроля дорожного движения и надзора правоохранительных органов.
1.3.5. Изображения в микроволновом диапазоне
Изображения микроволнового диапазона применяются главным образом в ра-
диолокации. Уникальным качеством радиолокации является возможность по-
лучения изображения любого района независимо от условий освещения и по-
годы. Микроволновое излучение некоторых диапазонов способно проникать
Рис. 1.15. Некоторые дополнительные примеры обработки изображений види-
мого спектра. (а) Отпечаток пальца. (б) Бумажная купюра. (в, г) Ав-
томатическое чтение номерных знаков. (Изображения предоста-
вили: (а) Национальный институт стандартов и технологии США;
(в, г) д-р Хуан Херрера, Perceptics Corporation)
г в
а б
даже сквозь облака, растительность, лед и сухой песок. Во многих случаях ра-
диолокация остается единственным способом исследования труднодоступных
районов Земли. Применяемый для получения изображения радиолокатор ра-
ботает аналогично фотоаппарату со вспышкой, в том смысле, что он использу-
ет собственный источник освещения (микроволновые импульсы), которое на-
правляется на снимаемый участок поверхности. Роль объектива фотоаппарата
в радиолокаторе играет антенна, сигнал от которой проходит через компью-
терную систему, осуществляющую регистрацию и обработку изображения.
Радиолокационное изображение отображает распределение интенсивностей
отраженной энергии микроволнового диапазона, которую уловила антенна
локатора.
На рис. 1.16 показано полученное из космоса радиолокационное изобра-
жение труднодоступного горного массива в юго-восточном Тибете, приблизи-
тельно в 90 км к востоку от г. Лхаса. В правом верхнем углу видна широкая
долина реки Лхаса, населенная тибетскими фермерами, разводящими яков;
в этой долине расположена деревня Менба. Высота гор в этом районе достигает
5800 м над уровнем моря, а дно долины располагается на высоте около 4300 м.
Обратим внимание на четкость изображения и качество воспроизведения де-
талей, независимо от облаков и других атмосферных неоднородностей, кото-
рые обычно мешают получить изображение сходного качества в оптическом
диапазоне.
1.3.6. Изображения в диапазоне радиоволн
Как и в случае изображений, получаемых на противоположной стороне элек-
тромагнитного спектра (гамма-лучи), основными областями применения изо-
бражений в диапазоне радиоволн выступают медицина и астрономия. В меди-
Рис. 1.16. Космическое радиолокационное изображение горного массива
на юго-востоке Тибета. (Изображение предоставлено агентством
NASA)
1.3. Примеры областей применения цифровой обработки изображений 45
цине радиоволны используются для получения изображений методом ядерного
магнитного резонанса (ЯМР). По этой технологии пациента помещают в силь-
ное магнитное поле, и через его тело пропускают радиоволны в форме коротких
импульсов. В ответ на каждый такой импульс ткани тела пациента реагируют,
излучая свои радиоволновые сигналы. Место возникновения и сила этих сиг-
налов регистрируются компьютерной системой обработки, генерирующей дву-
мерное изображение среза тела пациента. С помощью ЯМР можно получить
срез вдоль любой плоскости. На рис. 1.17 показаны ЯМР-изображения челове-
ческого коленного сустава и позвоночника.
В гамма-лучах Рентгеновское Оптическое
Инфракрасное Радиоволновое
Рис. 1.18. Изображения пульсара Крабовидной туманности (находится в цен-
тре снимков) в различных диапазонах электромагнитного спектра.
(Изображения предоставлены агентством NASA)
Рис. 1.17. ЯМР-изображения человеческого (а) колена и (б) позвоночника.
(Изображения предоставили: (а) д-р Томас Р. Гест, отделение анато-
мии медицинской школы университета шт. Мичиган; (б) д-р Дэвид
Р. Пикенс, департамент радиологии медицинского центра универси-
тета Вандербилта)
а б
Крайний справа снимок на рис. 1.18 демонстрирует изображение пульса-
ра Крабовидной туманности в диапазоне радиоволн. Интересно сравнить его
с приведенными на этом рисунке изображениями того же района, получен-
ными в других обсуждавшихся ранее диапазонах электромагнитного спектра.
Заметим, что каждое изображение дает свой, совершенно отличающийся вид
этого пульсара.
1.3.7. Примеры, иллюстрирующие другие способы
формирования изображений
Хотя чаще всего используются изображения, полученные в электромагнитном
спектре, существует ряд других важных способов формирования изображений.
В частности, в этом разделе мы обсудим акустические изображения, электрон-
ную микроскопию и искусственные изображения, синтезированные с помо-
щью компьютеров.
Построение изображений с помощью звуковых волн находит применение
в геологических изысканиях, промышленности и медицине. В геологии исполь-
зуются звуковые колебания с частотами у нижней границы звукового спектра
(до сотен герц), а в других областях для получения изображений применяют-
ся ультразвуковые колебания с частотами порядка мегагерц (миллионов герц).
Наиболее важные коммерческие применения обработки изображений в геоло-
гии касаются поисков нефти и других полезных ископаемых. При формирова-
нии изображения, несущего информацию о земных недрах, один из основных
методов состоит в использовании тяжелого грузовика и большой плоской сталь-
ной платформы. Грузовик давит на землю через платформу и одновременно яв-
ляется источником вибраций в спектре частот до 100 Гц. Мощность и скорость
распространения отраженных звуковых волн определяются геологическим со-
ставом грунта под поверхностью. В результате компьютерного анализа этих зву-
ковых колебаний строится цифровое изображение.
В морской геологии для получения изображений в звуковом диапазоне
обычно используют источник энергии в виде пары пневмопушек, буксируе-
мых позади судна. Отраженные звуковые волны детектируются гидрофона-
ми, помещенными внутрь кабелей, которые либо также буксируются судами,
либо укладываются на океанское дно или вертикально подвешиваются к буям.
Пневмопушки поочередно выстреливают, создавая импульс давления порядка
150 атмосфер. Картина отраженных звуковых волн в совокупности с постоян-
ным движением судна (что дает продольную составляющую) используется для
формирования трехмерной карты состава земной коры под дном океана.
На рис. 1.19 изображено поперечное сечение известной трехмерной модели,
на которой проверяются характеристики алгоритмов построения изображений
по данным сейсморазведки. Стрелка указывает на углеводородный пласт (ме-
сто залегания нефти и/или газа). Указываемое место выглядит ярче окружаю-
щих пластов, поскольку изменения плотности в этом месте оказываются выше.
Анализ изображений при сейсморазведке состоит в поиске подобных «ярких
пятен», соответствующих вероятным нефтяным и газовым месторождениям.
Вышележащие пласты также выделяются своей яркостью, однако в этих слу-
чаях изменения яркости в поперечном направлении не столь сильны. Многие
1.3. Примеры областей применения цифровой обработки изображений 47
алгоритмы реконструкции данных сейсморазведки испытывают трудности при
обнаружении отмеченной области именно из-за ошибок, возникающих в вы-
шележащих областях.
Хотя ультразвуковые изображения широко используются в промышлен-
ности, наиболее известно применение этой технологии в медицине, особенно
в акушерстве, где изображения еще не рожденных детей изучаются на предмет
отсутствия аномалий их развития. Дополнительным результатом такого иссле-
дования является определение пола будущего ребенка. Ультразвуковые изобра-
жения формируются следующим образом:
1. Ультразвуковая система (состоящая из компьютера, ультразвукового
зонда с излучателем и приемником и дисплея) передает в тело ультра-
звуковые импульсы высокой частоты (от 1 до 5 МГц).
2. Звуковые волны проходят сквозь тело пациента, и на границах между
тканями (например между жидкостью и мягкой тканью, мягкой тканью
и костью скелета) происходит частичное отражение. Часть звуковых
волн отражается обратно в сторону зонда, часть волн затухает, а осталь-
ные распространяются дальше, пока не достигнут следующей границы
раздела и снова частично отразятся и т. д.
3. Отраженные волны улавливаются приемником зонда и передаются
в компьютер.
4. Исходя из времени прихода каждого эхо-сигнала и известной скорости
звука в тканях (1500 м/с), компьютер вычисляет расстояние от зонда
до соответствующей границы ткани или внутреннего органа.
5. Вычисленные расстояния и интенсивности принятых отраженных сиг-
налов выводятся на дисплее в виде двумерного изображения.
В типичных ультразвуковых исследованиях ежесекундно генерируются
и принимаются миллионы звуковых импульсов и эхо-сигналов. Зонд можно
двигать вдоль поверхности тела и наклонять, получая изображения в различ-
ных проекциях. На рис. 1.20 приводятся несколько примеров таких изобра-
жений.
Рис. 1.19. Поперечное сечение модели данных сейсморазведки. Стрелкой ука-
зан пласт углеводородов (место залегания нефти и/или газа). (Изо-
бражение предоставил д-р Кертис С. Обер, Sandia National Laboratories)
Мы продолжим обсуждение других способов получения изображений
на примерах из электронной микроскопии. Электронный микроскоп действует
аналогично оптическому с той разницей, что вместо световых лучей для полу-
чения изображения исследуемого объекта применяется сфокусированный пу-
чок электронов. Работа электронного микроскопа складывается из следующих
основных шагов. Источник испускает поток электронов, которые, благодаря
приложенному положительному напряжению, движутся с ускорением в направ-
лении исследуемого образца. С помощью металлических щелевых диафрагм
и магнитных линз этот поток ограничивается и фокусируется, образуя тонкий
пучок, сфокусированный на образце. Внутри облучаемого образца происходит
взаимодействие, оказывающее влияние на прохождение пучка электронов, эф-
фект от которого обнаруживается и преобразуется в изображение аналогично
тому, как свет отражается или поглощается объектами наблюдаемой сцены.
Перечисленные основные шаги имеют место во всех электронных микроскопах
независимо от их типа.
Принцип работы просвечивающего электронного микроскопа (ПЭМ) во мно-
гом аналогичен проектору слайдов. Проектор направляет (передает) пучок света
на слайд; при проходе этого пучка сквозь слайд свет модулируется содержимым
слайда. После этого пучок света проецируется на экран, формируя увеличен-
ное изображение слайда. ПЭМ работает точно так же, за исключением того, что
сквозь образец, играющий роль слайда, направляется пучок электронов. Часть
Рис. 1.20. Примеры ультразвуковых изображений. (а) Ребенок. (б) Ребенок
в другой проекции. (в) Щитовидная железа. (г) Мышечные слои с за-
метным повреждением. (Изображения предоставила группа по уль-
тразвуку компании Siemens Medical Systems, Inc.)
в а
г б
1.3. Примеры областей применения цифровой обработки изображений 49
пучка, прошедшая сквозь исследуемый образец, проецируется на экран из фос-
форесцирующего материала. Взаимодействие электронов с этим материалом
приводит к появлению света и, следовательно, видимого изображения.
Сканирующий (растровый) электронный микроскоп (СЭМ или РЭМ) осущест-
вляет действительное сканирование образца электронным пучком и запись от-
раженного результата взаимодействия электронного пучка с каждой точкой
поверхности образца. Полное изображение формируется путем растрового ска-
нирования образца электронным пучком аналогично телевизионной развертке.
Отраженные электроны при попадании на фосфоресцирующий экран создают
на нем видимое изображение. СЭМ лучше подходят для объемных образцов,
тогда как для ПЭМ необходим очень тонкий образец.
Электронные микроскопы способны дать очень большое увеличение.
Если в оптической микроскопии кратность увеличения ограничена приблизи-
тельно 1000×, то в электронной микроскопии достигается увеличение 10000×
и более. На рис. 1.21 показаны полученные с помощью СЭМ два изображения
образцов с дефектами, возникшими вследствие температурных перегрузок.
Завершим обсуждение различных способов формирования изображений,
кратко рассмотрев изображения, полученные не от какого-то физического объ-
екта или явления, а сгенерированные компьютером. Примечательным при-
мером изображений, синтезированных с помощью компьютеров, являются
фракталы [Lu, 1997]. По существу, фракталы представляют собой не что иное,
как повторяющееся воспроизведение некоторого исходного образа по опреде-
ленным математическим правилам. Например, мозаика из квадратных элемен-
тов является одним из простейших способов генерации фрактальных изобра-
жений. Квадрат можно разделить на четыре квадратные подобласти, каждую
из которых, в свою очередь, можно разбить снова на четыре еще более мелких
квадрата и так далее. В зависимости от сложности правил заполнения каждой
Рис. 1.21. (а) Изображение поврежденной при перегреве вольфрамовой нити на-
каливания, полученное на СЭМ при увеличении 250× (обратите вни-
мание на осколки в левом нижнем углу). (б) СЭМ-изображение вы-
шедшей из строя интегральной микросхемы при увеличении 2500×.
Белые нити — это полосы окалины, возникшие при тепловом разру-
шении. (Изображения предоставили: (а) Майкл Шаффер, факультет
геологии университета шт. Орегон, г. Юджин; (б) д-р Джон М. Хью-
дек, университет Мак-Мастер, г. Гамильтон, шт. Онтарио, Канада)
а б
50 Глава 1. Введение
квадратной подобласти, таким способом могут быть получены некоторые кра-
сивые мозаичные изображения. Разумеется, геометрия может быть произволь-
ной. Например, фрактальное изображение может вырастать из одной централь-
ной точки — такой пример изображен на рис. 1.22(а). Рис. 1.22(б) демонстрирует
другое фрактальное изображение («лунный ландшафт»), являющееся интерес-
ной аналогией некоторых космических снимков, приведенных в качестве ил-
люстрации в предыдущих разделах.
Фрактальные изображения, при всей их художественности, несут в себе
элементы математического описания процесса «выращивания» изображения
из его более мелких элементов в соответствии с некоторыми правилами. Иногда
они находят применение в качестве случайных текстур. Более систематический
подход к генерации изображений с помощью компьютеров состоит в построе-
нии трехмерных моделей объектов. Именно эта важная область, находящаяся
на стыке обработки изображений и компьютерной графики, является основой
для построения множества систем трехмерной визуализации (например авиа-
ционных тренажеров). Рис. 1.22(в, г) демонстрируют примеры изображений,
синтезированных с помощью компьютерных программ. Поскольку объекты
моделировались как трехмерные, с помощью плоской проекции трехмерного
объема можно построить изображения этих объектов в любом ракурсе. Изобра-
жения подобного вида используются в медицинском образовании, а также как
Рис. 1.22. (а, б) Фрактальные изображения. (в, г) Изображения, построенные
по трехмерным компьютерным моделям показанных объектов. (Изо-
бражения предоставили: (а, б) Мелисса Д. Байнд, Swarthmore College;
(в, г) агентство NASA)
в а
г б
1.4. Основные стадии цифровой обработки изображений 51
основа для решения других прикладных задач, например в криминалистике,
судебной медицине или для создания спецэффектов.
1.4. Îñíîâíûå ñòàäèè öèôðîâîé îáðàáîòêè
èçîáðàæåíèé
Было бы полезно разделить изложенный в последующих главах материал на две
большие категории, упомянутые в разделе 1.1: методы, в которых на входе и на
выходе имеются изображения, и методы, где на вход поступают изображения,
а на выходе возникают признаки и атрибуты, выделенные на основании этих
изображений. Такая организация материала книги сведена в схему, изображен-
ную на рис. 1.23. Эта схема не подразумевает, что к изображению применяется
каждый из описанных процессов, напротив, целью было донести принципы
всех методов обработки, которые могут применяться к изображениям в раз-
личных целях и, возможно, с различными получаемыми результатами. Прово-
димое в данном разделе обсуждение можно рассматривать как краткий обзор
материала, представленного в остальной части книги.
Регистрация изображения — первый из процессов, показанных на рис. 1.23.
Обсуждение, проведенное в разделе 1.3, дает некоторую информацию относи-
тельно возможных источников цифровых изображений, однако значительно
более подробно эта тема рассматривается в главе 2, где также вводится ряд ба-
зовых понятий, относящихся к цифровым изображениям и используемых далее
База знаний
ГЛАВА 7
Вейвлеты и
кратномасштаб-
ная обработка
ГЛАВА 6
Обработка
цветных
изображений
Результатом этих процедур обычно являются изображения
ГЛАВА 5
Восстановление
изображений
ГЛАВЫ 3 и 4
Фильтрация
и улучшение
изображений
Проблемная
область
Результатом этих процедур обычно являются атрибуты изображений
ГЛАВА 8
Сжатие
изображений
ГЛАВА 2
Регистрация
изображения
ГЛАВА 9
Морфологиче-
ская обработка
изображений
ГЛАВА 10
Сегментация
изображений
ГЛАВА 11
Представление
и описание
ГЛАВА 12
Распознавание
объектов
Рис. 1.23. Основные стадии цифровой обработки изображений. Внутри блоков
указаны главы, в которых рассматривается соответствующий материал
52 Глава 1. Введение
на протяжении всей книги. Заметим, что регистрация изображения может ока-
заться предельно простой, как в случае, когда исходное изображение уже пред-
ставлено в цифровой форме. В общем случае стадия регистрации изображения
включает некоторую предобработку, например масштабирование.
Улучшение изображения — это процесс манипулирования изображени-
ем, в результате которого оно становится более подходящим для конкретного
применения, чем оригинал. Здесь важно слово «конкретного», поскольку оно
с самого начала устанавливает, что методы улучшения изображений являются
проблемно-ориентированными. Так, например, метод, который весьма полезен
для улучшения рентгеновских изображений, может оказаться не лучшим под-
ходом для улучшения спутниковых изображений, снятых в инфракрасном диа-
пазоне электромагнитного спектра.
Общей «теории» улучшения изображений не существует. Если изображе-
ние обрабатывается с целью визуальной интерпретации, то оценку, насколько
хорошо работает конкретный метод, дает в конечном счете наблюдатель. Ме-
тоды улучшения настолько разнообразны и используют так много различных
подходов к обработке изображения, что трудно собрать осмысленную совокуп-
ность подходящих для улучшения методов в одной главе, не проводя отдельное
обширное исследование. Для новичков в области обработки изображений все
связанное с улучшением изображений представляется визуально привлека-
тельным, интересным и относительно простым для понимания. По указанным
выше причинам мы используем улучшение изображений в качестве примеров,
когда вводим в рассмотрение новые концепции в части главы 2, а также в гла-
вах 3 и 4. Материал двух последних глав охватывает многие методы, традици-
онно применяемые для улучшения изображений. Таким образом, привлекая
примеры из области улучшения изображений для представления новых мето-
дов обработки изображений уже в этих начальных главах, мы не только избав-
ляемся от необходимости включения в книгу особой главы об улучшении изо-
бражений, но, что еще важнее, эффективно вовлекаем начинающих в детали
методов обработки изображений на ранней стадии изучения. Однако, как будет
видно по мере освоения остальной части книги, введенный в этих главах ма-
териал применим для намного более широкого класса задач, чем только лишь
улучшение изображений.
Восстановление изображений — это область, также связанная с повышением
визуального качества изображения, однако, в отличие от собственно улучше-
ния, критерии которого субъективны, восстановление изображения является
объективным в том смысле, что методы восстановления изображений опира-
ются на математические или вероятностные модели искажений изображения.
Напротив, улучшение изображений основано на субъективных предпочтениях
человеческого восприятия, которые связаны с тем, что именно считается «хоро-
шим» результатом улучшения.
Обработка цветных изображений приобрела особую важность в связи со зна-
чительным расширением использования цветных изображений в Интернете.
В главе 6 излагается ряд фундаментальных понятий, относящихся к цветовым
моделям и основным видам цифровых преобразований цветов. Цвет также ис-
пользуется в последующих главах как основа для выделения из изображения
некоторых интересующих признаков.
1.4. Основные стадии цифровой обработки изображений 53
Вейвлеты образуют фундамент для представления изображений в несколь-
ких масштабах одновременно. В частности, этот аппарат используется в книге
применительно к сжатию данных изображения, а также для построения пира-
мидального представления, при котором изображение поэтапно разбивается
на все более мелкие фрагменты.
Сжатие, как следует из самого названия, относится к методам уменьшения
объема памяти, необходимого для хранения изображения, или сужения поло-
сы пропускания канала, требуемой для его передачи. Хотя техника запоминаю-
щих устройств за последнее десятилетие была значительно усовершенствова-
на, этого нельзя сказать в отношении пропускной способности линий связи.
Это особенно справедливо по отношению к информации в Интернете, где изо-
бразительная составляющая является существенным элементом содержимого.
Со сжатием изображений знакомы (возможно, не отдавая себе в этом отчета)
большинство пользователей компьютеров, встречающих в именах графических
файлов определенные расширения; например, jpg используется в стандарте
сжатия изображений, разработанном Объединенной группой экспертов по фо-
тографии (Joint Photographic Experts Group — JPEG).
Морфологическая обработка связана с инструментами для извлечения таких
компонентов изображения, которые могут быть полезны для представления
и описания формы. Приведенный в этой главе материал дает основы перехода
от процессов, имеющих на выходе изображение, к процессам, имеющим на вы-
ходе атрибуты изображения, как это указывалось в разделе 1.1.
Сегментация разделяет изображение на составные части или объекты.
В целом автоматическая сегментация принадлежит к числу самых трудных за-
дач цифровой обработки изображений. Излишне подробная сегментация на-
правляет процесс на длинный путь решения задачи, требуя идентификации
объектов по отдельности. С другой стороны, недостаточно подробная или же
неверная сегментация почти неизбежно приведет к возникновению ошибок
на финальной стадии обработки. В общем, чем точнее сегментация, тем больше
шансов на успех при распознавании.
Представление и описание почти всегда следуют непосредственно за этапом
сегментации, на выходе которого обычно имеются лишь необработанные дан-
ные о пикселях, которые либо образуют границу области (т. е. дается множество
пикселей, отделяющих одну область изображения от другой), либо представля-
ют все точки самих областей. В обоих случаях необходимо преобразовать дан-
ные в форму, пригодную для компьютерной обработки. Первое решение, кото-
рое следует принять, — должны ли эти данные представляться в форме только
границ областей или областей целиком. Представление в виде границ подходит
для тех случаев, когда в центре внимания находятся внешние характеристики
формы областей, например углы и изгибы. Представление в виде областей яв-
ляется предпочтительным, если акцент делается на внутренних свойствах объ-
ектов, например текстуре или форме скелета. В некоторых приложениях эти
представления дополняют друг друга. Выбор способа представления — лишь
часть принятия решения по преобразованию «сырых» пиксельных данных
в подходящую для дальнейшей компьютерной обработки форму. Должен быть
еще указан метод описания данных, при котором бы выдвигались на передний
план интересующие признаки. Построение описания, иначе называемое выбором
54 Глава 1. Введение
признаков, связано с выделением атрибутов, которые бы выражали интересую-
щую информацию в количественном виде или бы могли служить основой для
различения классов объектов.
Распознавание представляет собой процесс, который присваивает некоторо-
му объекту идентификатор (например «транспортное средство») на основании
его описателей. Как подробно разъяснялось в разделе 1.1, мы считаем, что сфера
цифровой обработки изображений заканчивается разработкой методов распо-
знавания отдельных объектов.
До настоящего момента ничего не говорилось о необходимости априорных
знаний или, в терминах рис. 1.23, о взаимосвязи между базой знаний и модуля-
ми обработки. На самом деле знание о проблемной области (т. е. база знаний)
некоторым образом закодировано внутри самой системы обработки изображе-
ний. Это знание может быть очень простым, как, например, детальное указание
участков изображения, где должна находиться интересующая информация, что
позволит сузить область ее поиска. База знаний может быть и очень сложной,
как, например, взаимосвязанный список всех наиболее вероятных дефектов
в задаче контроля материалов либо база данных спутниковых изображений не-
которого района с высоким разрешением в прикладных задачах мониторинга.
Помимо того, что база знаний руководит работой каждого модуля обработки,
она также управляет взаимодействием между модулями. Эта особенность по-
казана на рис. 1.23 с помощью двунаправленных стрелок между обрабатываю-
щими модулями и базой знаний.
Хотя мы не обсуждаем в этом месте задачу визуализации изображений, важ-
но иметь в виду, что на выходе любой из показанных на рис. 1.23 стадий может
выполняться отображение результатов обработки. Отметим также, что не во
всех прикладных задачах обработки изображений требуется вся сложность
взаимодействия, подразумеваемого рис. 1.23. На самом деле во многих случаях
даже не все эти модули необходимы. Например, улучшение изображений для
визуальной интерпретации человеком редко нуждается в использовании каких-
либо других стадий из числа показанных на рис. 1.23. В общем случае, однако,
чем выше сложность задачи обработки изображений, тем большее число про-
цессов требуется привлекать для решения этой задачи.
1.5. Êîìïîíåíòû ñèñòåìû îáðàáîòêè èçîáðàæåíèé
Еще в середине 1980-х гг. большинство поступающих на рынок образцов си-
стем обработки изображений были относительно крупными периферийными
устройствами, которые соединялись со столь же громоздкими компьютерами.
Позднее — в конце 1980-х — начале 1990-х гг. — на рынке произошел переход
к аппаратуре обработки изображений в виде одиночной платы, конструктив-
но совместимой с какой-либо из ставших стандартом магистралей и пригодной
для установки в индустриальные и персональные компьютеры. Наряду со сни-
жением стоимости такой аппаратуры рынок также стал катализатором для воз-
никновения значительного числа новых компаний, ориентированных на раз-
работку программного обеспечения специально для обработки изображений.
1.5. Компоненты системы обработки изображений 55
Хотя для массовой обработки изображений большого размера (например
спутниковых) еще производятся крупные системы цифровой обработки, об-
щая тенденция направлена в сторону миниатюризации и оснащения обычных
малых компьютеров специализированным оборудованием для решения за-
дач обработки изображений. На рис. 1.24 изображены основные компоненты,
из которых состоит типичная универсальная система цифровой обработки изо-
бражений, а ниже обсуждаются функции каждого из ее компонентов начиная
с системы регистрации.
Что касается регистрации, то для получения цифровых изображений в об-
щем случае необходимы два элемента. Первый из них — это чувствительный
элемент (сенсор), т. е. физическое устройство, обладающее чувствительностью
к тому виду излучаемой объектом энергии, который мы хотим отобразить.
Второй элемент, аналого-цифровой преобразователь (АЦП), представляет собой
устройство, преобразующее аналоговый выходной сигнал чувствительного эле-
мента в цифровую форму5. Например, в цифровой видеокамере элементы све-
точувствительной матрицы вырабатывают электрический сигнал, пропорцио-
5 Здесь необходимо отметить, что для преобразования непрерывного сигнала
в цифровую форму необходимы два, вообще говоря, независимых процесса: дискрети-
зация, т. е. пространственное разложение непрерывного сигнала на некоторое число от-
счетов, и квантование — перевод непрерывного значения сигнала каждого из отсчетов
в конечный диапазон значений. — Прим. ред. перев.
Подсистема
отображения Компьютер Подсистема
массовой памяти
Подсистема
выдачи
твердой копии
Специализированные
устройства
обработки
изображений
Подсистема
регистрации
изображений
Проблемная область
Программы
обработки
изображений
Сеть
Рис. 1.24. Компоненты универсальной системы обработки изображений
56 Глава 1. Введение
нальный силе света. Цифровой преобразователь трансформирует эти сигналы
в цифровые данные. Более подробно эта тема рассматривается в главе 2.
Специализированные устройства для обработки изображений обычно вклю-
чают вышеупомянутый цифровой преобразователь, а также оборудование,
с помощью которого выполняются другие элементарные операции, как напри-
мер, арифметико-логическое устройство (АЛУ), которое позволяет выполнять
арифметические и логические операции параллельно для всего изображения.
Один из вариантов использования АЛУ — локальное усреднение изображе-
ний одновременно с оцифровкой — может быть полезен для снижения уровня
шума. Оборудование такого типа иногда называют подсистемой предобработки
(или препроцессором); ее отличительной характеристикой является высокая ско-
рость работы. Иначе говоря, этот блок выполняет функции обработки данных,
требующие высокой производительности (например оцифровка и усреднение
видеоизображений со скоростью 25 кадров в секунду), с чем не справляется ти-
пичный управляющий компьютер системы.
Под компьютером в системе обработки изображений подразумевается уни-
версальная ЭВМ в диапазоне от обычного персонального компьютера (ПК)
до суперкомпьютера. В специализированных приложениях для достижения
требуемой производительности иногда используются компьютеры специаль-
ной конструкции, однако мы рассматриваем здесь именно универсальную си-
стему обработки изображений. В таких системах практически любой хорошо
оснащенный ПК пригоден для решения задач обработки изображений, не тре-
бующих работы в реальном масштабе времени.
Программное обеспечение для обработки изображений состоит из специали-
зированных модулей, выполняющих конкретные операции. В развитых паке-
тах программ имеются также средства, позволяющие пользователю самостоя-
тельно разрабатывать программы, которые как минимум запускают в работу
специализированные модули системы. Более сложные программные пакеты
позволяют сочетать вызов этих модулей с обычными операторами какого-либо
из универсальных языков программирования.
Наличие массовой памяти большого объема обязательно для практических
задач обработки изображений. Для хранения изображения размером 1024×1024
пикселя, в котором яркость каждого пикселя представляется 8-битовой вели-
чиной, необходим один мегабайт памяти, если не используются средства сжа-
тия изображений. При работе с тысячами или даже миллионами изображений
наличие достаточной внешней памяти в системе обработки изображений может
оказаться проблематичным. Цифровые запоминающие устройства для задач об-
работки изображений делятся на три основные категории: (1) временная память
для краткосрочного использования в ходе обработки, (2) внешняя память, об-
ладающая относительно коротким временем обращения, и (3) архивная память,
для которой характерны редкие обращения. Емкость запоминающих устройств
измеряется в байтах (8 бит), килобайтах (тысяча байтов), мегабайтах (миллион
байтов), гигабайтах (миллиард байтов) и терабайтах (триллион байтов)6.
6 Зачастую при выражении емкости памяти в байтах коэффициент увеличения
при переходе в каждый следующий класс принимается равным 210 = 1024, а не 103 = 1000,
что, впрочем, здесь несущественно. — Прим. перев.
1.5. Компоненты системы обработки изображений 57
Одним из вариантов реализации временной памяти может быть оператив-
ная память компьютера. Другой вариант состоит в использовании специальных
плат, называемых буферами кадров, которые хранят одно или более изображе-
ний, обеспечивая высокую скорость чтения/записи, обычно соответствующую
частоте кадров видеосигнала (например 25 кадр/с). Этот способ позволяет
практически мгновенно выполнять увеличение изображения либо сдвигать его
в вертикальном (прокрутка) или горизонтальном (панорамирование) направ-
лениях. Буферы кадров обычно расположены в показанном на рисунке блоке
«Специализированные устройства обработки изображений». Внешняя память,
как правило, представлена накопителями на магнитных или оптических дис-
ках и характеризуется частыми обращениями к хранящейся информации; т. е.
важнейшим для нее является фактор быстродействия. Напротив, обращение
к архивной памяти за информацией происходит редко, но требуется очень боль-
шая емкость памяти. В запоминающих устройствах, используемых в качестве
архивной памяти, в качестве носителей информации обычно применяются
магнитные ленты и оптические диски внутри многодисковых хранилищ с авто-
матической установкой и сменой дисков (jukebox).
Графические дисплеи, используемые в настоящее время, в основном осна-
щаются электронно-лучевыми трубками по типу телевизионных, предпочти-
тельно с плоским экраном. Сигнал на монитор подается с платы отображения
(видеоадаптера), входящей в состав компьютера. В редких случаях к системе
отображения предъявляются такие требования, которым не отвечают встроен-
ные видеоадаптеры современных компьютеров. Иногда необходим стереоско-
пический режим отображения; это может достигаться с помощью закрепляе-
мой на голове гарнитуры с двумя малогабаритными дисплеями, встроенными
в оправу, похожую на защитные очки, в которые и смотрит пользователь.
К числу устройств получения твердых копий относятся лазерные и струй-
ные принтеры, устройства термопечати, пленочные фотокамеры и цифровые
устройства, например оптические диски7. Максимальное разрешение дости-
гается при выводе на пленку, однако для письменных и печатных материалов
более естественным носителем является бумага. Для показа в ходе презента-
ций изображения выводятся на прозрачную пленку или цифровой носитель
(если используется подключаемый к компьютеру проектор). Последний ва-
риант постепенно становится общепринятым стандартом презентации изо-
бражений.
Соединение с телекоммуникационной сетью уже стало почти подразумевае-
мой функцией в любой сегодняшней компьютерной системе. Учитывая большие
объемы данных, связанные с задачами обработки изображений, важнейшим
фактором для передачи изображений является пропускная способность сети.
В локальных сетях и на выделенных каналах телекоммуникации трудностей
обычно не возникает, однако обмен информацией с удаленными пунктами че-
рез Интернет далеко не всегда оказывается столь же эффективным. К счастью,
в результате развития оптоволоконных сетей и других технологий широкопо-
лосной связи положение в этой сфере быстро исправляется.
7 Оптические диски, вообще говоря, относятся к устройствам хранения информа-
ции. — Прим. перев.
58 Глава 1. Введение
Çàêëþ÷åíèå
Главной целью материала этой главы было показать в исторической перспекти-
ве истоки возникновения цифровой обработки изображений и, что более важ-
но, нынешние и будущие возможности применения этой технологии. Хотя эти
вопросы невозможно исчерпывающе рассмотреть в пределах одной главы, у чи-
тателя должно остаться ясное ощущение широты области практических при-
менений цифровой обработки изображений. Поскольку последующие главы
книги посвящены теории и приложениям обработки изображений, мы привели
большое число примеров, чтобы более четко представлять перспективы и поль-
зу от применения таких методов. Закончив изучение последней главы книги,
читатель должен прийти к такому уровню понимания предмета, который явля-
ется фундаментом для большинства работ, ныне проводимых в этой области.
Ññûëêè è ëèòåðàòóðà äëÿ äàëüíåéøåãî èçó÷åíèÿ
В конце последующих глав даются относящиеся к конкретным темам каждой
из этих глав ссылки на общий список литературы, приведенный в конце книги.
Однако в этой главе использована другая форма, чтобы собрать в одном месте
всю совокупность научных журналов, публикующих материалы по обработ-
ке изображений и смежным вопросам. Приводится также список книг, по ко-
торым читатель легко может представить себе историческую и современную
перспективу деятельности в этой области. Таким образом, приводимый в этой
главе список литературных источников следует рассматривать как доступный
путеводитель по изданной литературе в области обработки изображений.
К числу наиболее важных реферируемых журналов, публикующих статьи
по обработке изображений и смежным вопросам, относятся: IEEE Transactions
on Image Processing; IEEE Transactions on Pattern Analysis and Machine Intelligence;
Computer Vision, Graphics, and Image Processing (до 1991 г.); Computer Vision and Image
Understanding; IEEE Transactions on Systems, Man and Cybernetics; Artifi cial Intelligence;
Pattern Recognition; Pattern Recognition Letters; Journal of the Optical Society of America
(до 1984 г.); Journal of the Optical Society of America — A: Optics, Image Science and Vision;
Optical Engineering; Applied Optics — Information Processing; IEEE Transactions on
Medical Imaging; Journal of Electronic Imaging; IEEE Transactions on Information Theory;
IEEE Transactions on Communications; IEEE Transactions on Acoustics, Speech and Signal
Processing; Proceedings of the IEEE; а также выпуски журнала IEEE Transactions
on Computers до 1980 г. Также представляют интерес публикации Международ-
ного общества по оптической технике (SPIE).
Следующие книги, перечисленные в обратном хронологическом порядке
(и с уклоном в сторону более свежих публикаций), содержат материал, допол-
няющий наш взгляд на цифровую обработку изображений. Эти книги дают об-
щую картину обсуждаемой области за последние 30 с лишним лет и были вы-
браны так, чтобы представить разнообразие существующих трактовок. В списке
присутствуют и учебники, излагающие фундаментальный материал, и руковод-
Ссылки и литература для дальнейшего изучения 59
ства по применению определенных методов, и, наконец, научные монографии,
представляющие достигнутый уровень исследований в этой области.
Prince J. L., Links J. M. [2006]. Medical Imaging, Signals, and Systems, Prentice Hall,
Upper Saddle River, NJ.
Bezdek J. C. et al. [2005]. Fuzzy Models and Algorithms for Pattern Recognition and
Image Processing, Springer, New York.
Davies E. R. [2005]. Machine Vision: Theory, Algorithms, Practicalities, Morgan Kaufmann,
San Francisco, CA.
Rangayyan R. M. [2005]. Biomedical Image Analysis, CRC Press, Boca Raton, FL.
Umbaugh S. E. [2005]. Computer Imaging: Digital Image Analysis and Processing,
CRC Press, Boca Raton, FL.
Gonzalez R. C., Woods R. E., Eddins S. L. [2004]. Digital Image Processing Using
MATLAB, Prentice Hall, Upper Saddle River, NJ. [Имеется перевод: Гонсалес Р.,
Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. — М.: Тех-
носфера, 2006.
Snyder W. E., Qi Hairong [2004]. Machine Vision, Cambridge University Press, New
York.Klette R., Rosenfeld A. [2004]. Digital Geometry — Geometric Methods for Digital
Picture Analysis, Morgan Kaufmann, San Francisco, CA.
Won C. S., Gray R. M. [2004]. Stochastic Image Processing, Kluwer Academic/Plenum
Publishers, New York.
Soille P. [2003]. Morphological Image Analysis: Principles and Applications, 2nd ed.,
Springer-Verlag, New York.
Dougherty E. R., Lotufo R. A. [2003]. Hands-on Morphological Image Processing,
SPIE — The International Society for Optical Engineering, Bellingham, WA.
Gonzalez R. C., Woods R. E. [2002]. Digital Image Processing, 2nd ed., Prentice Hall,
Upper Saddle River, NJ.
Forsyth D. F., Ponce J. [2002]. Computer Vision — A Modern Approach, Prentice
Hall, Upper Saddle River, NJ.
Duda R. O., Hart P. E., Stork D. G. [2001]. Pattern Classifi cation, 2nd ed., John Wiley
& Sons, New York.
Pratt W. K. [2001]. Digital Image Processing, 3rd ed., John Wiley & Sons, NY. [Име-
ется перевод 1-го издания: Прэтт У. Цифровая обработка изображений. — М.:
Мир, 1982. Кн. 1 и 2.]
Ritter G. X., Wilson J. N. [2001]. Handbook of Computer Vision Algorithms in Image
Algebra, CRC Press, Boca Raton, FL.
Shapiro L. G., Stockman G. C. [2001]. Computer Vision, Prentice Hall, Upper Saddle
River, NJ.
Dougherty E. R. (ed.) [2000]. Random Processes for Image and Signal Processing,
IEEE Press, New York.
Etienne E. K., Nachtegael M. (eds.). [2000]. Fuzzy Techniques in Image Processing,
Springer-Verlag, New York.
Goutsias J., Vincent L., Bloomberg D. S. (eds.). [2000]. Mathematical Morphology
and Its Applications to Image and Signal Processing, Kluwer Academic Publishers, Boston,
MA.Mallot A. H. [2000]. Computational Vision, The MIT Press, Cambridge, MA.
60 Глава 1. Введение
Marchand-Maillet S., Sharaiha Y. M. [2000]. Binary Digital Image Processing: A Discrete
Approach, Academic Press, New York.
Mitra S. K., Sicuranza G. L. (eds.) [2000]. Nonlinear Image Processing, Academic
Press, New York.
Edelman S. [1999]. Representation and Recognition in Vision, The MIT Press, Cambridge,
MA.
Lillesand T. M., Kiefer R. W. [1999]. Remote Sensing and Image Interpretation, John
Wiley & Sons, New York.
Mather P. M. [1999]. Computer Processing of Remotely Sensed Images: An Introduction,
John Wiley & Sons, New York.
Petrou M., Bosdogianni P. [1999]. Image Processing: The Fundamentals, John Wiley
& Sons, UK.
Russ, J.C. [1999]. The Image Processing Handbook, 3rd ed., CRC Press, Boca Raton,
FL.
Smirnov A. [1999]. Processing of Multidimensional Signals, Springer-Verlag, New
York.
Sonka M., Hlavac V., Boyle R. [1999]. Image Processing, Analysis, and Computer Vision,
PWS Publishing, New York.
Haskell B. G., Netravali A. N. [1997]. Digital Pictures: Representation, Compression,
and Standards, Perseus Publishing, New York.
Jahne B. [1997]. Digital Image Processing: Concepts, Algorithms, and Scientifi c Applications,
Springer-Verlag, New York.
Castleman K. R. [1996]. Digital Image Processing, 2nd ed., Prentice Hall, Upper
Saddle River, NJ.
Geladi P., Grahn H. [1996]. Multivariate Image Analysis, John Wiley & Sons, NY.
Bracewell R. N. [1995]. Two-Dimensional Imaging, Prentice Hall, Upper Saddle River,
NJ.
Sid-Ahmed M. A. [1995]. Image Processing: Theory, Algorithms, and Architectures,
McGraw-Hill, NY.
Jain R., Rangachar K., Schunk B. [1995]. Computer Vision, McGraw-Hill, New
York.Mitiche A. [1994]. Computational Analysis of Visual Motion, Perseus Publishing, New
York.Baxes G. A. [1994]. Digital Image Processing: Principles and Applications, John Wiley
& Sons, New York.
Gonzalez R. C., Woods R. E. [1992]. Digital Image Processing, Addison-Wesley,
Reading, MA.
Haralick R. M., Shapiro L. G. [1992]. Computer and Robot Vision, vols. 1 & 2, Addison-
Wesley, Reading, MA.
Pratt W. K. [1991] Digital Image Processing, 2nd ed., Wiley-Interscience, New York.
[Имеется перевод 1-го издания: Прэтт У. Цифровая обработка изображений. —
М.: Мир, 1982. Кн. 1 и 2.]
Lim J. S. [1990]. Two-Dimensional Signal and Image Processing, Prentice Hall, Upper
Saddle River, NJ.
Jain A. K. [1989]. Fundamentals of Digital Image Processing, Prentice Hall, Upper
Saddle River, NJ.
Литература, добавленная при переводе 61
Schalkoff R. J. [1989]. Digital Image Processing and Computer Vision, John Wiley &
Sons, New York.
Giardina C. R., Dougherty E. R. [1988]. Morphological Methods in Image and Signal
Processing, Prentice Hall, Upper Saddle River, NJ.
Levine M. D. [1985]. Vision in Man and Machine, McGraw-Hill, New York.
Serra J. [1982]. Image Analysis and Mathematical Morphology, Academic Press, New
York.Ballard D. H., Brown C. M. [1982]. Computer Vision, Prentice Hall, Upper Saddle
River, NJ.
Fu K. S. [1982]. Syntactic Pattern Recognition and Applications, Prentice Hall, Upper
Saddle River, NJ. [Имеется перевод более ранней книги: Фу К. Структурные
методы в распознавании образов. — М.: Мир, 1977.]
Nevatia R. [1982]. Machine Perception, Prentice Hall, Upper Saddle River, NJ.
Pavlidis T. [1982]. Algorithms for Graphics and Image Processing, Computer Science
Press, Rockville, MD.
Rosenfeld R., Kak A. C. [1982]. Digital Picture Processing, 2nd ed., vols. 1 & 2, Academic
Press, New York.
Hall E. L. [1979]. Computer Image Processing and Recognition, Academic Press, New
York.Gonzalez R. C., Thomason M. G. [1978]. Syntactic Pattern Recognition: An Introduction,
Addison-Wesley, Reading, MA.
Andrews H. C., Hunt B. R. [1977]. Digital Image Restoration, Prentice Hall, Upper
Saddle River, NJ.
Pavlidis T. [1977]. Structural Pattern Recognition, Springer-Verlag, New York, 1977.
Tou J. T., Gonzalez R. C. [1974]. Pattern Recognition Principles, Addison-Wesley,
Reading, MA, 1974.
Andrews H. C. [1970]. Computer Techniques in Image Processing, Academic Press,
New York.
Ëèòåðàòóðà, äîáàâëåííàÿ ïðè ïåðåâîäå
Ниже приводится список литературы по вопросам цифровой обработки изобра-
жений, который, по нашему мнению, будет способствовать расширению круго-
зора читателя данной книги. Из российских специализированных периодиче-
ских изданий, посвященных рассматриваемой проблематике, следует отметить
журнал «Компьютерная оптика», и журнал Pattern Recognition and Image Analysis;
к сожалению, последний публикуется издательством Pleiades Publishing исклю-
чительно на английском языке. К числу отечественных периодических изда-
ний, в которых достаточно регулярно публикуются научные работы по данной
тематике, относятся журналы «Автометрия», «Исследование Земли из Космоса»
и «Кибернетика». Большинство современных результатов публикуются в трудах
различных научных конференций, симпозиумов, ведомственных изданий, или
же в виде сборников статей, издаваемых институтами Российской Академии
наук или иными научными и учебными учреждениями. Из их числа без со-
мнения следует отметить такие сборники как «Иконика» и «Цифровая оптика»,
издававшиеся Институтом проблем передачи информации РАН, а также сбор-
62 Глава 1. Введение
ники «Вопросы кибернетики», издаваемые научным советом по комплексной
проблеме «Кибернетика» РАН.
Ранее (до начала 1990 гг.) издавался перевод ежемесячного журнала «Труды
института инженеров по электротехнике и радиоэлектронике (ТИИЭР)», в кото-
ром с достаточной регулярностью появлялись как отдельные статьи, так и тема-
тические выпуски, посвященные обработке изображений. Без сомнения, осо-
бого внимания заслуживают следующие тематические выпуски ТИИЭР.
Сокращение избыточности. — ТИИЭР, 1967, т. 55, № 3.
Цифровая обработка изображений. — ТИИЭР, 1972, т. 60, № 7.
Распознавание образов и обработка изображений. — ТИИЭР, 1979, т. 67, № 5.
Цифровое кодирование. — ТИИЭР, 1980, т. 68, № 7.
Обработка изображений. — ТИИЭР, 1981, т. 69, № 5.
Системы видеосвязи. — ТИИЭР, 1985, т. 73, № 4 и № 5.
Реконструктивная и вычислительная томография. — ТИИЭР, 1983, т. 71, № 3.
Из числа изданных на русском языке книг, представляющих интерес при
изучении вопросов цифровой обработки изображений (как оригинальных, так
и переводных изданий), можно рекомендовать следующие.
Ахмед Н., Рао К. Р. Ортогональные преобразования при обработке цифровых
сигналов. — М.: Связь, 1980.
Александров В. В., Горский Н. Д. Представление и обработки изображений:
Рекурсивный подход. — Л.: Наука, 1985.
Бейтс Р., Мак-Доннелл М. Восстановление и реконструкция изображений. —
М.: Мир, 1989.
Бендат Дж., Пирсол А. Прикладной анализ случайных данных. — М.: Мир,
1989.Бонгард М. М. Проблема узнавания. — М.: Наука, 1967.
Быстрые алгоритмы в цифровой обработке изображений: Преобразования
и медианные фильтры / Хуанг Т. С., Эклунд Дж.-О., Нуссбаумер Г. Дж. и др. Ред.
Хуанг Т. С. — М.: Радио и связь, 1984.
Василенко Г. И. Теория восстановления сигналов: О редукции к идеальному
прибору в физике и технике. — М.: Сов.радио, 1979.
Василенко Г. И., Тараторин А. М. Восстановление изображений. — М: Радио
и связь, 1986.
Ватолин Д. С. Алгоритмы сжатия изображений. Методическое пособие. М.:
МГУ, 1999.
Введение в цифровую фильтрацию / Ред. Богнер Р., Константинидис А. — М.:
Мир, 1976.
Виттих В. А., Сергеев В. В., Сойфер В. А. Обработка изображений в автома-
тизированных системах научных исследований. — М.: Наука, 1982.
Возенкрафт Дж., Джейкобс И. Теоретические основы техники связи. — М.:
Мир, 1968.
Голд Б., Рэйдер Ч. Цифровая обработка сигналов. — М.: Сов. радио, 1973.
Гонсалес Р., Вудс Р. Цифровая обработка изображений, М.: Техносфера, 2005
Горелик А. Л., Скрипкин В. А. Методы распознавания: Учебное пособие. — М.:
Высшая школа, 1989.
Литература, добавленная при переводе 63
Гренандер У. Лекции по теории образов. — М.: Мир. т. 1: Синтез образов. —
1979. т. 2: Анализ образов. — 1981. т. 3: Регулярные структуры. — 1983.
Даджион Д., Мерсеро Р. Цифровая обработка многомерных сигналов. — М.:
Мир, 1988.
Добеши И. Десять лекций по вейвлетам. — Ижевск: НИЦ «Регулярная и хао-
тическая динамика», 2001.
Дуда Р., Харт П. Распознавание образов и анализ сцен. — М.: Мир, 1976.
Жуков А. И. Метод Фурье в вычислительной математике. — М.: Наука, 1992.
Завалишин Н. В., Мучник И. Б. Модели зрительного восприятия и алгоритмы
анализа изображений. — М.: Наука, 1974.
Ковалевский В. А. Методы оптимальных решений в распознавании изображе-
ний. — М.: Наука, 1976.
Кодирование и обработка изображений / Ред. Лебедев Д. С., Зяблов В. В. — М.:
Наука, 1988.
Коды с обнаружением и исправлением ошибок. — М.: ИЛ, 1956.
Лебедев Д. С., Цуккерман И. И. Телевидение и теория информации. М. — Л.:
Энергия, 1965.
Марр Д. Зрение. Информационный подход к изучению представления и обра-
ботки зрительных образов. — М.: Радио и связь, 1987.
Методы компьютерной обработки изображений / Ред. Сойфер. В.А. — М.:
Физматлит, 2001.
Методы передачи изображений. Сокращение избыточности / Прэтт У. К., Са-
крисон Д. Д., Мусман Х. Г. Д. и др. / Ред. Прэтт У. К. — М.: Радио и связь, 1983.
Минский М., Пейперт С. Персептроны. — М.: Мир, 1971.
Нильсон Н. Искусственный интеллект. Методы поиска решений. — М.: Мир,
1973.Н ильсон Н. Обучающие машины. — М.: Мир, 1967.
Обработка изображений и цифровая фильтрация. / Ред. Хуанг Т. — М.: Мир,
1979.О бработка изображений при помощи цифровых вычислительных машин / Ред.
Эндрюс Г., Инло Л. — М.: Мир, 1973. (См. также ТИИЭР, 1972, т. 60, № 7).
Оппенгейм А. В., Шафер Р. В. Цифровая обработка сигналов. — М.: Связь,
1979.
Осовский С. Нейронные сети для обработки информации. — М.: Финансы
и статистика, 2002.
Павлидис Т. Алгоритмы машинной графики и обработки изображений. — М.:
Радио и связь, 1986.
Применение цифровой обработки сигналов / Ред. Оппенгейм Э. — М.: Мир,
1980.
Прэтт У. Цифровая обработка изображений. — М.: Мир, 1982. Кн. 1 и 2.
Психология машинного зрения / Ред. Уинстон П. — М.: Мир, 1978.
Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. — М.:
Мир, 1978.
Распознавание образов при помощи цифровых вычислительных машин / Ред.
Хармон Л. — М.: Мир, 1974. (См. также ТИИЭР, 1972, т. 60, № 10).
Реконструкция изображений / Ред. Старк Г. — М.: Мир, 1992.
64 Глава 1. Введение
Розенблатт Ф. Принципы нейродинамики. Персептрон и теория механизмов
мозга. — М.: Мир, 1966.
Розенфельд А. Распознавание и обработка изображений с помощью вычисли-
тельных машин. — М.: Мир, 1972.
Столниц Э., ДеРоуз Т., Салезин Д. Вейвлеты в компьютерной графике. Теория
и приложения. — Ижевск: НИЦ «Регулярная и хаотическая динамика», 2002.
Теория информации и ее приложения. М.: Физматгиз, 1959.
Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач. — М.:
Наука, 1979.
Ту Дж., Гонсалес Р. Принципы распознавания образов. — М.: Мир, 1978.
Ульман Ш. Принципы восприятия подвижных объектов. — М.: Радио и связь,
1983.
Фу К. Последовательные методы в распознавании образов и обучении машин. —
М.: Наука, 1979.
Фу К. Структурные методы в распознавании образов. — М.: Мир, 1977.
Фукунага К. Введение в статистическую теорию распознавания образов. —
М.: Наука, 1979.
Хермен Г. Восстановление изображений по проекциям. Основы реконструк-
тивной томографии. — М.: Мир, 1983.
Хорн Б. К. П. Зрение роботов. — М.: Мир, 1989.
Хэмминг Р. В. Теория кодирования и теория информации. — М.: Радио и связь,
1983.
Цифровая обработка изображений: Специальный выпуск. — Зарубежная ради-
оэлектроника. 1985, № 10.
Цифровая обработка изображений в информационных системах: Учебное посо-
бие / Грузман И. С., Киричук В. С. и др. — Новосибирск, НГТУ, 2002.
Цифровая обработка телевизионных и компьютерных изображений / Дворко-
вич А. В., Дворкович В. П., Зубарев Ю. Б. и др. — М.: Международный центр на-
учной и технической информации, 1997.
Цифровое кодирование телевизионных изображений / Цуккерман И. И.,
Кац Б. М., Лебедев Д. С. и др. — М.: Радио и связь, 1981.
Чисар И., Кёрнер Я. Теория информации: теоремы кодирования для дис-
кретных систем без памяти. — М.: Мир, 1985.
Чуи К. Введение в вэйвлеты. — М.: Наука, 2001.
Шашлов Б. А. Цвет и цветовоспроизведение. — М.: МГАП «Мир книги»,
1995.
Эндрюс Г. Применение вычислительных машин для обработки изображений. —
М.: Энергия, 1977.
Яне Б. Цифровая обработка изображений. — М.: Техносфера, 2007.
Яншин В. В. Анализ и обработка изображений: принципы и алгоритмы. — М.:
Машиностроение, 1994.
Ярославский Л. П. Введение в цифровую обработку изображений. — М.: Сов.
радио, 1979.
Ярославский Л. П. Цифровая обработка сигналов в оптике и голографии: Вве-
дение в цифровую оптику. — М.: Радио и связь, 1987.
ÃËÀÂÀ 2
ÎÑÍÎÂÛ ÖÈÔÐÎÂÎÃÎ
ÏÐÅÄÑÒÀÂËÅÍÈß
ÈÇÎÁÐÀÆÅÍÈÉ
Желающий добиться успеха должен задавать правильные
предварительные вопросы.
Аристотель
Ââåäåíèå
Цель этой главы — познакомить читателя с набором основных понятий в обла-
сти цифровой обработки изображений, которые используются на протяжении
всей книги. В разделе 2.1 описывается действие зрительной системы человека,
включая механизмы формирования изображения в глазу, и возможности зрения
в плане яркостной адаптации и контрастной чувствительности. В разделе 2.2
обсуждается свет и другие составляющие электромагнитного спектра, а также
их характеристики в отношении формирования изображений. Раздел 2.3 посвя-
щен обсуждению различных чувствительных элементов и способов регистра-
ции цифровых изображений. В разделе 2.4 вводятся понятия равномерной про-
странственной дискретизации изображений и квантования по яркости. Кроме
того, в этом разделе обсуждаются вопросы представления цифровых изображе-
ний и эффекты при изменении частоты дискретизации и количества уровней
квантования. Вводятся понятия пространственного и яркостного разрешения
и рассматриваются принципы интерполяции изображений. В разделе 2.5 рас-
сматриваются некоторые основные взаимоотношения между пикселями. На-
конец, раздел 2.6 служит введением в основной математический аппарат, ис-
пользуемый на протяжении всей книги. Другая цель этого раздела — помочь
читателю почувствовать, как эти инструменты используются при решении раз-
нообразных элементарных задач обработки изображений. Область рассмотре-
ния и применения указанных инструментов по мере необходимости расширя-
ется в оставшейся части книги.
2.1. Ýëåìåíòû çðèòåëüíîãî âîñïðèÿòèÿ
Хотя цифровая обработка изображений как прикладная дисциплина строится
на основе математических и вероятностных формулировок, человеческая ин-
туиция и анализ играют центральную роль при выборе того или иного метода
66 Глава 2. Основы цифрового представления изображений
среди других, и этот выбор часто совершается на основе субъективного визуаль-
ного оценивания. Поэтому первым шагом нашего путешествия по этой книге
будет приобретение элементарных знаний о зрительном восприятии человека.
Понимая сложность и широту этой темы, мы сможем охватить лишь самые на-
чальные аспекты зрения человека. В частности, мы опишем физические меха-
низмы и параметры, связанные с процессом формирования изображения и его
восприятия человеком. Нам также интересно рассмотреть физические ограни-
чения человеческого зрения с точки зрения факторов, используемых при работе
с цифровыми изображениями. Поэтому такие вопросы, как соотношение чело-
веческого и электронного зрения по разрешающей способности и возможности
адаптироваться к изменениям освещенности, не только представляют познава-
тельный интерес, но и важны в практическом плане.
2.1.1. Строение человеческого глаза
На рис. 2.1 в упрощенном виде показано горизонтальное сечение человеческо-
го глаза. Глаз имеет почти сферическую форму со средним диаметром около
20 мм. Глаз окружен тремя оболочками: роговица со склерой образуют внеш-
нюю оболочку, под которой последовательно расположены сосудистая оболоч-
ка (хороидея) и нейроглиальная оболочка (сетчатка). Роговица — это плотная
прозрачная ткань, закрывающая переднюю поверхность глаза. Продолжением
ее является склера — непрозрачная оболочка, закрывающая остальную часть
оптической сферы глаза.
Хороидея расположена непосредственно под склерой. В этой оболочке рас-
положена сеть кровеносных сосудов, обеспечивающих питание глаза. Даже
незначительное повреждение хороидеи, часто кажущееся неопасным, может
привести к серьезному нарушению зрения из-за воспаления, препятствующе-
го нормальному кровотоку. Поверхностный слой хороидеи сильно пигменти-
рован, что снижает интенсивность попадающего через склеру внешнего света,
мешающего восприятию из-за его отражения и рассеяния внутри оптической
сферы. Передняя область (зубчатая линия) хороидеи непосредственно впле-
тена в цилиарное тело и радужную оболочку (или радужку). Отверстие в центре
радужной оболочки (зрачок) может сужаться или расширяться, регулируя тем
самым количество попадающего через роговицу света. Диаметр зрачка может
изменяться в пределах от 2 до 8 мм. От цвета пигмента на передней поверхности
радужки зависит цвет глаза человека, а пигмент на задней поверхности радуж-
ки имеет черный цвет, что также снижает внутреннее рассеяние света.
Хрусталик (хрусталиковая линза), состоящий из наружной капсулы и вну-
трихрусталикового вещества, закреплен внутри глаза с помощью передней
и задней порций волокон ресничного пояска хрусталика, которые проходят
между отростками цилиарного тела и вплетаются в зубчатую линию хороидеи.
Капсула и внутрихрусталиковое вещество состоят из коллагеновых волокон
и содержат от 60 % до 70 % воды, около 6 % жиров и больше белков, чем любые
другие ткани глаза. Внутрихрусталиковое вещество имеет слабо-желтую пиг-
ментацию, которая с возрастом усиливается. Ускоренное помутнение вещества
хрусталика, связанное с нарушением его питания, приводит к заболеванию, на-
зываемому катарактой, при котором ухудшается цветовое восприятие и остро-
2.1. Элементы зрительного восприятия 67
та зрения. Хрусталик поглощает около 8 % света в видимом диапазоне спектра
и практически не пропускает более коротковолновое излучение. Свет инфра-
красного и ультрафиолетового диапазонов существенно поглощается белком
хрусталика и при высокой интенсивности может привести к необратимому на-
рушению зрения.
Самая внутренняя оболочка глаза — сетчатка — выстилает изнутри за-
дний отдел глаза. При правильной оптической фокусировке глаза свет от на-
ружного объекта проецируется в виде изображения на сетчатку. Зрительное
восприятие образов становится возможным благодаря распределению дис-
кретных светочувствительных клеток (рецепторов) по внутренней поверхно-
сти сетчатки. Существуют рецепторы двух видов — колбочки и палочки. В глазу
насчитывается от 6 до 7 миллионов колбочек, которые обладают высокой чув-
ствительностью к спектральным составляющим света и располагаются преи-
мущественно в центральной области сетчатки, называемой желтым пятном.
В центре желтого пятна имеется так называемая центральная ямка — область
наибольшей остроты зрения. Человек различает мелкие детали изображения
в основном благодаря колбочкам, поскольку каждая из них соединена с от-
дельным нервным окончанием. Наружные мышцы глаза обеспечивают вра-
щение глазного яблока так, чтобы изображение интересующего объекта попа-
дало в область желтого пятна. Колбочки обеспечивают фотопическое зрение,
или зрение в ярком свете.
Сетчатка
Слепое пятно
Склера
Хороидея
Зрительный нерв
и его оболочка
Центральная
ямка
Стекловидное тело
Ось зрения
Ресничный поясок
хрусталика
Ресничная мышца
Радужная оболочка
Роговица
Хрусталик
Передняя камера
Цилиарное тело
Рис. 2.1. Упрощенная схема глаза человека в разрезе
68 Глава 2. Основы цифрового представления изображений
Количество палочек в глазу намного больше: по поверхности сетчатки их
распределено от 75 до 150 миллионов. Бóльшая, чем у колбочек, область рас-
пределения и тот факт, что к одному нервному окончанию присоединено сра-
зу несколько палочек (в среднем около 10), уменьшают возможности различе-
ния деталей с помощью этих рецепторов. Палочки позволяют сформировать
общую картину всего поля зрения. Они наиболее чувствительны при низких
уровнях освещенности и не участвуют в обеспечении функций цветного зре-
ния. Например, предметы, имеющие яркую окраску при дневном свете, при
сумеречном освещении выглядят как лишенные цветов образы, поскольку воз-
буждаются только палочки. Это явление известно как скотопическое (или су-
меречное) зрение.
Рис. 2.2 иллюстрирует зависимость плотности распределения палочек
и колбочек по сетчатке в зависимости от величины угла между зрительной
осью и линией, проведенной из центра хрусталика до сетчатки. Изображено
горизонтальное сечение правого глаза в месте выхода зрительного нерва. От-
сутствие рецепторов в этой области приводит к появлению так называемого
слепого пятна (см. рис. 2.1). В остальной области сетчатки распределение ре-
цепторов центрально симметрично относительно центра желтого пятна.
Из рис. 2.2 видно, что максимальная плотность колбочек наблюдается в центре
сетчатки (в центральной ямке), а плотность палочек возрастает от этой точки
приблизительно до угла в 20°, после чего плавно снижается вплоть до перифе-
рии сетчатки.
Центральная ямка представляет собой углубление круглой формы в сетчат-
ке с диаметром около 1,5 мм. В контексте дальнейшего обсуждения более есте-
ственно говорить о прямоугольных массивах чувствительных элементов. В не-
сколько вольной интерпретации можно рассматривать центральную ямку как
квадратный массив чувствительных элементов на площади 1,5 × 1,5 мм. Плот-
ность колбочек в этой области сетчатки приблизительно равна 150 тыс. на 1 мм2,
следовательно, общее количество колбочек в области наибольшей остроты зре-
Слепое пятно Колбочки
Палочки
Число рецепторов на мм2
Угол от оси зрения (от центра желтого пятна)
180000
135000
90000
45000
80° 60° 40° 20° 0° 20° 40° 60° 80°
Рис. 2.2. Распределение палочек и колбочек по сетчатке
2.1. Элементы зрительного восприятия 69
ния составляет около 337 тыс. элементов. Если рассуждать только в терминах
разрешающей способности, то широко применяемые в современной технике
светочувствительные матрицы среднего разрешения на основе приборов с за-
рядовой связью (ПЗС) содержат такое же количество чувствительных элементов
при площади кристалла не более 5 × 5 мм. Однако такое чисто количественное
сравнение было бы несколько поверхностным, поскольку не учитывает способ-
ность человека объединять зрение с интеллектом и опытом. В дальнейшем бу-
дем просто иметь в виду, что глаз человека по своей разрешающей способности
вполне сопоставим с современными электронными устройствами получения
изображений.
2.1.2. Формирование изображения в глазу
В обычном фотоаппарате объектив имеет постоянное фокусное расстояние,
и фокусировка на различную дальность достигается изменением расстояния
от объектива до плоскости изображения, в которой расположена фотоплен-
ка (или светочувствительная матрица в случае цифровой камеры). Напротив,
в человеческом глазу расстояние между линзой (хрусталиком) и местом фор-
мирования изображения (сетчаткой) постоянное, а необходимое для получе-
ния четкой картины фокусное расстояние достигается за счет вариации формы
хрусталика. Это осуществляется с помощью волокон ресничного пояска, при-
дающих хрусталику уплощенную или округленную форму для фокусировки
зрения, соответственно, на удаленном или близкорасположенном предмете.
Расстояние от центра хрусталика до сетчатки вдоль оси зрения составляет при-
близительно 17 мм, а диапазон изменения фокусного расстояния — от 14 мм
до 17 мм (последнее значение соответствует расслабленному состоянию рес-
ничной мышцы, когда глаз сфокусирован для рассматривания предметов
на удалении более 3 м.
Рис. 2.3 иллюстрирует, как вычислить размеры изображения некоторого
объекта на сетчатке. Пусть, например, наблюдатель смотрит на дерево высотой
15 м с расстояния 100 м. Обозначая h высоту изображения дерева на сетчатке
(в мм), получаем пропорцию 15/100 = h/17, откуда h = 2,55 мм. Как указыва-
лось в разделе 2.1.1, проецирующееся на сетчатку изображение воспринимает-
ся главным образом областью желтого пятна. Расположенные в ней рецепторы
возбуждаются в соответствии с интенсивностью падающего света, что приво-
дит к преобразованию энергии светового излучения в электрические нервные
импульсы, которые в конечном счете декодируются в мозге человека.
15 м
C
100 м 17 мм
Рис. 2.3. Схематическое изображение глаза, наблюдающего дерево (точка С —
оптический центр хрусталика)
70 Глава 2. Основы цифрового представления изображений
2.1.3. Яркостная адаптация и контрастная чувствительность
Поскольку цифровые изображения воспроизводятся как дискретное множе-
ство элементов с различной яркостью, при представлении результатов об-
работки изображений необходимо учитывать способность глаза различать
отличающиеся уровни яркости. Зрительная система человека способна адап-
тироваться к огромному, порядка 1010, диапазону яркостей — от порога чув-
ствительности скотопического зрения до предела ослепляющего блеска. Экс-
перименты со всей очевидностью показывают, что субъективная яркость (т. е.
яркость как она воспринимается зрительной системой человека) является ло-
гарифмической функцией от физической яркости света, попадающего в глаз.
На рис. 2.4 изображен график этой зависимости субъективной яркости от ис-
тинной яркости. Длинная сплошная кривая представляет диапазон яркостей,
в котором способна адаптироваться зрительная система. При использовании
одного фотопического зрения этот диапазон составляет около 106. Постепен-
ный переход от скотопического зрения к фотопическому происходит в диа-
пазоне приблизительно от 0,003 до 0,3 кд/м2 (соответствует диапазону от –3
до –0 на графике), что показано в виде двух ветвей кривой адаптации в этом
диапазоне яркостей.
Для правильной интерпретации столь впечатляющего динамического диа-
пазона, изображенного на рис. 2.4, важно понимать, что зрительная система
не способна работать во всем этом диапазоне одновременно. Вместо этого она
охватывает такой большой диапазон за счет изменения общей чувствительно-
сти. Это явление известно как яркостная адаптация. Общий диапазон одновре-
менно различаемых уровней яркости относительно мал по сравнению со всем
диапазоном адаптации. Для любого данного набора внешних условий текущий
уровень чувствительности зрительной системы, называемый уровнем яркост-
ной адаптации, соответствует некоторой яркости, например точке Ba на рис. 2.4.
Порог
ослепляющего
блеска
Субъективная яркость
Диапазон адаптации
Скотопический
порог
Логарифм истинной яркости
Скотопи-
ческое
зрение
Фотопическое
зрение
–6 –4 –2 0 2 4
Ba
Bb
Рис. 2.4. Диапазон субъективно воспринимаемой яркости и конкретный уро-
вень адаптации
2.1. Элементы зрительного восприятия 71
Короткая кривая, пересекающая основной график, представляет диапазон
субъективной яркости, которую способен воспринимать глаз при адаптации
к указанному уровню. Этот диапазон достаточно ограничен: все уровни ярко-
сти ниже Bb субъективно воспринимаются зрением как черное и, значит, нераз-
личимы. Верхняя часть этой кривой реально не ограничена, но теряет смысл
при большой длине, поскольку при повышении яркости просто повышается
уровень адаптации Ba.
Способность зрения различать изменения яркости при данном уровне адапта-
ции также представляет значительный интерес. Классический эксперимент для
определения способности зрительной системы человека различать разные уров-
ни яркости состоит в том, что испытуемый смотрит на плоский равномерно осве-
щенный экран достаточно больших размеров, такой, что он занимает все поле
зрения. Как правило, это рассеиватель из матового стекла, освещаемый со сторо-
ны, противоположной наблюдателю, световым источником, яркость I которого
можно регулировать. На это равномерное поле накладывается добавочная яр-
кость ΔI в форме кратковременной вспышки в области круглой формы, располо-
женной в центре равномерно освещенного экрана, как изображено на рис. 2.5.
Если приращение ΔI недостаточно велико (неразличимо), испытуемый го-
ворит «нет», указывая тем самым на отсутствие видимых изменений. По мере
увеличения ΔI в какой-то момент он начнет говорить «да», подтверждая тем са-
мым восприятие изменений яркости. Наконец, при достаточно большом значе-
нии ΔI испытуемый станет говорить «да» на каждую вспышку. Величина ΔIс / I,
где ΔIс — величина приращения яркости, различимая в 50 % случаев на фоне
яркости I, называется отношением Вебера. Малое значение ΔIс / I означает, что
различаются очень малые относительные изменения яркости, т. е. имеет место
«высокая» контрастная чувствительность. Наоборот, большое значение ΔIс / I
означает, что требуется большое относительное изменение яркости, чтобы его
заметить; это говорит о «низкой» контрастной чувствительности.
График зависимости величины log(ΔIс / I) от log I имеет общую форму, изо-
браженную на рис. 2.6. Эта кривая показывает, что низкая контрастная чувстви-
тельность (т. е. большое отношение Вебера) наблюдается при малых уровнях
яркости, и контрастная чувствительность заметно возрастает (т. е. отношение
Вебера уменьшается) при увеличении фоновой яркости. Наличие двух ветвей
кривой отражает тот факт, что при малых уровнях яркости зрение осущест-
вляется благодаря действию палочек, тогда как при больших уровнях яркости
(которым соответствует высокая контрастная чувствительность) зрительные
функции выполняют колбочки сетчатки.
I
I + ΔI
Рис. 2.5. Постановка простого эксперимента для определения характеристик
контрастной чувствительности
72 Глава 2. Основы цифрового представления изображений
Если поддерживать фоновую яркость постоянной, а яркость добавочного
источника варьировать не вспышками, а ступенчатым изменением яркости
от неотличимого до заметного всегда, то типичный наблюдатель способен раз-
личить всего 10—20 различающихся ступеней яркости. Грубо говоря, этот ре-
зультат относится к числу различных уровней яркости, которые человек спо-
собен различить в произвольной точке монохромного изображения. Это не
означает, что изображение может быть представлено таким небольшим числом
градаций яркости, так как по мере движения взгляда по изображению меняется
–1,5
–2,0
–4 –3 –2 –1 0
log I
log ΔIc/I
1 2 3 4
–1,0
–0,5
0,5
1,0
0
Рис. 2.6. Типичная зависимость отношения Вебера как функции яркости
Истинная яркость
Воспринимаемая яркость
Рис. 2.7. Пример, показывающий, что воспринимаемая яркость не является
просто функцией от истинной яркости
в б а
2.1. Элементы зрительного восприятия 73
среднее значение яркости фона, что позволяет обнаруживать различные множе-
ства относительных изменений яркости для каждого нового уровня адаптации.
Конечным следствием является способность глаза различать яркости в намного
более широком общем диапазоне. В действительности, как мы покажем в раз-
деле 2.4.3, глаз способен обнаруживать нежелательные ложные контуры в мо-
нохромных изображениях, общий диапазон яркостей которых представляется
значительно большим количеством, чем 20 уровней.
Известны два явления, ясно доказывающие, что воспринимаемая яркость
не является простой функцией истинной яркости. Первое основывается на том
факте, что вблизи границ соседних областей с отличающимися, но постоянны-
ми яркостями зрение человека склонно «подчеркивать» яркостные перепады,
как бы добавляя несуществующие выбросы яркости, что убедительно демон-
стрирует пример на рис. 2.7(а). Хотя яркость каждой из полос постоянна, мы,
кроме действительно ступенчатого изменения яркости, видим характерные вы-
бросы вблизи краев полос (рис. 2.7(в)). Эти полосы с кажущимися изменениями
яркости на краях называются полосами Маха в честь Эрнста Маха, впервые опи-
савшего этот феномен в 1865 г.
Второе явление, называемое одновременным контрастом, связано с тем фак-
том, что воспринимаемая яркость некоторой области не определяется просто
ее яркостью, как показывает рис. 2.8. Здесь все центральные квадраты имеют
в точности одинаковую яркость, однако зрительно воспринимаются тем более
темными, чем светлее фон. Еще более знакомым примером является лист бу-
маги, который кажется белым, когда он лежит на столе, но может показаться
совершенно черным, если им закрывать глаза, глядя на яркое небо.
Другими примерами феноменов человеческого зрительного восприятия
являются оптические иллюзии, в которых глаз восполняет несуществующую
информацию или ошибочно воспринимает геометрические свойства объектов.
Некоторые примеры оптических иллюзий изображены на рис. 2.9. На рис. 2.9(а)
ясно видны очертания квадрата, вопреки тому факту, что на изображении от-
сутствуют линии, определяющие такую фигуру. Аналогичный эффект, на этот
раз в виде круга, виден на рис. 2.9(б); заметим, как всего нескольких линий
достаточно для получения иллюзии полного круга. Два горизонтальных от-
резка на рис. 2.9(в) имеют одинаковую длину, но один кажется короче друго-
го. Наконец, все проведенные под углом 45° линии на рис. 2.9(г) параллельны
Рис. 2.8. Примеры одновременного контраста. Яркость всех центральных ква-
дратов одинакова, но они кажутся все темнее, чем светлее становится
фон
а б в
74 Глава 2. Основы цифрового представления изображений
и расположены на одинаковых расстояниях друг от друга. Однако штриховка
создает иллюзию, что эти линии далеки от параллельности. Оптические иллю-
зии относятся к числу не вполне понятных характеристик зрительной системы
человека.
2.2. Ñâåò è ýëåêòðîìàãíèòíûé ñïåêòð
Электромагнитный спектр был кратко представлен в разделе 1.3; теперь мы рас-
смотрим эту тему более подробно. В 1666 г. сэр Исаак Ньютон открыл, что при
прохождении луча солнечного света сквозь стеклянную призму возникает све-
товой пучок, который имеет не белый цвет, а состоит из непрерывного цветово-
го спектра, цвет которого меняется от фиолетового на одном конце до красного
на другом. Как видно из рис. 2.10, диапазон цветов, которые мы воспринима-
ем как видимый свет, составляет очень малую часть спектра электромагнит-
ного излучения. На одном конце этого спектра находятся радиоволны, длина
которых в миллиарды раз превышает длины волн видимого света, а на другом
конце — гамма-лучи, длина волны которых в миллионы раз меньше длины све-
товых волн. Компоненты электромагнитного спектра можно выражать в терми-
нах длины волны, частоты колебаний или энергии. Длина волны (λ) и частота
(ν) связаны соотношением
Рис. 2.9. Некоторые хорошо известные оптические иллюзии
в а
г б
2.2. Свет и электромагнитный спектр 75
λ
ν
= c, (2.2-1)
где c — скорость света (2,998 ⋅ 108 м/с). Энергия составляющей электромагнитно-
го спектра определяется выражением
E h = ν, (2.2-2)
где h — постоянная Планка. Длина волны измеряется в метрах, но столь же ча-
сто в качестве единиц измерения употребляются микрон (1 мкм = 10–6 м) и на-
нометр (1 нм = 10–9 м)1. Частота измеряется в герцах (Гц); 1 Гц соответствует
колебанию с частотой один период в секунду. Общеупотребительной единицей
измерения энергии фотонов является электрон-вольт (эВ).
Электромагнитные волны можно трактовать как распространяющиеся си-
нусоидальные колебания с длиной волны λ (рис. 2.11), а можно — как поток ча-
стиц с нулевой массой, движущихся со скоростью света. Каждая такая частица
не имеет массы, но обладает определенной энергией и называется квантом из-
лучения (фотоном). Из соотношения (2.2-2) видно, что энергия пропорциональ-
на частоте, поэтому электромагнитные колебания более высокой частоты (т. е.
с более короткой длиной волны) обладают большей энергией фотона. Таким
образом, радиоволны характеризуются малой энергией фотона, у микроволн
энергия больше, у инфракрасного излучения еще больше, далее энергия фотона
1 Весьма распространенной единицей измерения длины световой волны является
также ангстрем (1 Å = 10–10 м). — Прим. перев.
Радиоволны
Видимый спектр
Гамма-
лучи
Рентге-
новское
излучение
0,4 × 10–6 0,5 × 10–6 0,6 × 10–6 0,7 × 10–6
1021 1020 1019 1018 1017 1016 1015 1014 1013 1012 1011 1010 109 108 107 106 105
Частота (Гц)
106 105 104 103 102 101 1 10–1 10–2 10–3 10–4 10–5 10–6 10–7 10–8 10–9
Энергия одного фотона (эВ)
10–12 10–11 10–10 10–9 10–8 10–7 10–6 10–5 10–4 10–3 10–2 10–1 1 101 102 103
Длина волны (м)
Инфра-
красное
излучение
Ультра-
фиолетовое
излучение
Фиолетовый
Синий
Зеленый
Желтый
Красный
Оранжевый
Голубой
Инфра-
красное
излучение
Ультра-
фиолетовое
излучение
Микроволны
Рис. 2.10. Спектр электромагнитных колебаний. Видимый спектр показан
в растянутом виде, но следует подчеркнуть, что он занимает весьма
узкий участок всего электромагнитного спектра
76 Глава 2. Основы цифрового представления изображений
последовательно возрастает для диапазонов видимого спектра, ультрафиоле-
тового излучения, рентгеновских лучей и, наконец, гамма-лучей, обладающих
самой большой энергией. Именно по этой причине гамма-излучение так опасно
для живых организмов.
Свет является особым видом электромагнитного излучения, которое вос-
принимается человеческим глазом. Видимый (цветовой) спектр приведен
на рис. 2.10 в растянутом виде только для сведения; более подробно цвет рассма-
тривается в главе 6. Этот видимый диапазон электромагнитного спектра охва-
тывает длины волн приблизительно от 0,43 мкм (фиолетовый цвет) до 0,79 мкм
(красный цвет). Для удобства цветовой спектр делят на семь широких полос
(цветов): фиолетовый, синий, голубой, зеленый, желтый, оранжевый и крас-
ный; но это разграничение не резкое, а скорее, один цвет плавно переходит
в другой, как показано на рис. 2.10, подобно любой другой составляющей элек-
тромагнитного спектра.
Различаемые зрением человека цвета предметов определяются характером
света, отраженного от этих предметов. Тело, которое отражает свет приблизи-
тельно одинаково во всем видимом диапазоне волн, представляется наблюдате-
лю белым, тогда как тело, отражающее свет в каком-то ограниченном диапазоне
длин волн, воспринимается с некоторым цветовым оттенком. Например, зеле-
ный предмет в основном отражает свет с длинами волн 500—570 нм, поглощая
большинство энергии в других интервалах длин волн.
Свет, лишенный цветовой окраски, называется монохроматическим или
ахроматическим. Единственным параметром такого освещения является его
интенсивность, или яркость. Для описания монохроматической яркости также
используется термин уровень серого, поскольку яркость изменяется от черного
до белого, с промежуточными серыми оттенками. В дальнейшем термины «яр-
кость» и «уровень серого» будут использоваться в одинаковом значении. Диа-
пазон измеренных значений монохроматической яркости от черного до белого
принято называть шкалой полутонов, и монохроматические изображения часто
называют полутоновыми изображениями.
Хроматический (цветной) свет охватывает, как уже отмечалось, спектр элек-
тромагнитного излучения в диапазоне длин волн приблизительно от 0,43 мкм
до 0,79 мкм. Помимо частоты, хроматические источники света характеризуют-
ся тремя основными величинами: энергетическим потоком, световым потоком
и (субъективной) яркостью. Энергетический поток — это общее количество
энергии, излучаемой источником света, обычно измеряемое в ваттах (Вт). Све-
товой поток, измеряемый в люменах (лм), характеризует количество энергии,
которое наблюдатель воспринимает от светового источника. Например, свето-
вой источник, работающий в дальнем инфракрасном диапазоне, может давать
λ
Рис. 2.11. Графическое представление длины волны колебаний
2.2. Свет и электромагнитный спектр 77
значительный энергетический поток, но наблюдатель его практически не ощу-
щает, так что световой поток такого источника почти нулевой. Наконец, как уже
обсуждалось в разделе 2.1, яркость описывает субъективное восприятие света
и практически не поддается измерению. Она олицетворяет понятие интенсив-
ности в ахроматическом случае и является одним из ключевых факторов при
описании цветового ощущения.
Продолжая обсуждение рис. 2.10, заметим, что коротковолновая сторона
спектра электромагнитного излучения представлена гамма- и рентгеновскими
лучами. Мы уже обсуждали в разделе 1.3.1 важность использования изображе-
ний в гамма-лучах для медицины, астрономии и ядерной энергетики. Жесткое
(с более высокой энергией) рентгеновское излучение используется для получе-
ния изображений в промышленности. Для получения рентгеновских изобра-
жений грудной клетки и в стоматологии используется мягкое рентгеновское
излучение (с меньшей энергией). Мягкие рентгеновские лучи плавно переходят
в дальний ультрафиолетовый диапазон, длинноволновый участок которого,
в свою очередь, — в видимый спектр. Двигаясь дальше в сторону увеличения
длин волн, мы встретим инфракрасный диапазон, в котором излучается теп-
ло, что делает его полезным для получения изображений на основе тепловой
картины объекта. Участок инфракрасного диапазона, соседствующий с ви-
димым спектром, называется ближним инфракрасным диапазоном, а противо-
положный участок — дальним инфракрасным диапазоном. Последний плавно
переходит в микроволновый диапазон, хорошо известный благодаря кухонным
микроволновым печам, но также используемый во многих других целях, в том
числе для связи и радиолокации. Наконец, в диапазоне радиоволн осуществля-
ется теле- и радиовещание, а в области высоких энергий этого диапазона прово-
дятся астрономические наблюдения радиосигналов, испускаемых некоторыми
звездными телами. Примеры изображений для большинства перечисленных
диапазонов излучения были приведены в разделе 1.3.
В принципе, если сконструировать чувствительный элемент, способный
обнаруживать излучаемую энергию в некотором диапазоне электромагнитного
спектра, то можно получить изображение интересующих объектов в этом диа-
пазоне. Однако важно заметить, что длина электромагнитных волн, используе-
мых для «наблюдения» некоторого объекта, должна быть меньше его размера.
Например, размер молекулы воды равен порядка 10–10 м, поэтому для исследо-
вания этих молекул необходимо применять источник излучения в диапазонах
ультрафиолетового или мягкого рентгеновского излучения. Подобные ограни-
чения, наряду с физическими свойствами материала, из которого изготовлен
чувствительный элемент, определяют физические пределы возможностей сен-
соров, применяемых для регистрации изображений, в частности оптических,
инфракрасных или других.
Хотя подавляющее большинство получаемых цифровых изображений осно-
вано на энергии излучения электромагнитных волн, это не единственный способ
генерации изображений. Например, как говорилось в разделе 1.3.7, отраженные
от объектов звуковые волны могут использоваться для построения ультразвуко-
вых изображений. Другие важные источники цифровых изображений — элек-
тронные пучки, применяемые в электронной микроскопии, и компьютерный
синтез, используемый для визуализации и в компьютерной графике.
78 Глава 2. Основы цифрового представления изображений
2.3. Ñ÷èòûâàíèå è ðåãèñòðàöèÿ èçîáðàæåíèÿ
Большинство интересующих нас изображений есть двумерное отображение
наблюдаемой сцены (как правило, двух- или трехмерной), возникающее как
результат регистрации лучистой энергии, исходящей из наблюдаемой сцены,
с помощью некоторого устройства — сенсора (или совокупности сенсоров одно-
временно). Мы предполагаем, что регистрируемый сенсором сигнал возникает
в результате взаимодействия источника «освещения» с элементами изображае-
мой «сцены» в условиях эффектов отражения и поглощения энергии этого ис-
точника. Мы берем слова освещение и сцена в кавычки, чтобы подчеркнуть тот
факт, что они носят значительно более общий характер, чем в привычной ситу-
ации, когда источник видимого света освещает обычную трехмерную бытовую
сцену. Например, освещение не только может порождаться источником друго-
Чувствительный материал
Сигнал выходного напряжения
Фильтр
Энергия излучения
Приложенная
электроэнергия
Корпус
Рис. 2.12. (а) Одиночный чувствительный элемент. (б) Линейка чувствитель-
ных элементов. (в) Матрица чувствительных элементов
в б а
2.3. Считывание и регистрация изображения 79
го диапазона электромагнитного излучения, например радиолокационным,
инфракрасным или рентгеновским, но и происходить из менее традиционных
источников, например ультразвукового или даже виртуального, синтезирован-
ного компьютерной программой. В роли элементов сцены могут выступать зна-
комые предметы, но вполне могут быть и молекулы, структуры подземных пла-
стов или мозг человека. В зависимости от природы источника и особенностей
сцены, энергия освещения отражается от объектов сцены или проходит сквозь
них. Примером первого вида может быть свет, отраженный от поверхности
предметов. Второй вид взаимодействия имеет место, например, при пропуска-
нии рентгеновских лучей через тело пациента для получения диагностического
рентгеновского снимка на пленке. В некоторых прикладных задачах отражен-
ная или проходящая энергия направляется на фотопреобразователь (например
экран, покрытый флюоресцирующим материалом), который преобразует эту
энергию в видимый свет. Такой подход обычен для электронной микроскопии
и регистрации изображений в гамма-лучах.
На рис. 2.12 изображены три основные схемы размещения чувствитель-
ных элементов (сенсоров), которые используются для преобразования энергии
«освещения» в цифровое изображение. Сама идея преобразования очень про-
ста: падающая энергия преобразуется в напряжение благодаря сочетанию ма-
териала, обладающего чувствительностью к интересующему виду излучения,
и приложенной к нему электрической энергии. В ответ на энергию внешнего
излучения такой чувствительный элемент выдает сигнал выходного напряже-
ния, который затем преобразуется в цифровую форму. В этом разделе мы рас-
смотрим основные способы получения и регистрации изображений, а вопросы
дискретизации и квантования изображений обсуждаются в разделе 2.4.
2.3.1.