Научная статья на тему 'Разработка баз данных архивных изображений на основе современных технологий их обработки и хранения'

Разработка баз данных архивных изображений на основе современных технологий их обработки и хранения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
798
117
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бокштейн Илья Михайлович, Карнаухов Виктор Николаевич, Мерзляков Николай Степанович, Рубанов Лев Израилевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка баз данных архивных изображений на основе современных технологий их обработки и хранения»

РАЗРАБОТКА БАЗ ДАННЫХ АРХИВНЫХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ СОВРЕМЕННЫХ ТЕХНОЛОГИЙ ИХ ОБРАБОТКИ И ХРАНЕНИЯ

И.М. Бокштейн, В.Н. Карнаухов, Н.С. Мерзляков, Л.И. Рубанов Институт проблем передачи информации РАН

Введение

Значение изображений как важнейшего источника информации невозможно переоценить. В настоящее время изображения широко применяются в медицине, рентгенографии, томографии, геологии и геосистемах, экологических исследованиях, дистанционном зондировании поверхности Земли и других планет и т.д. Трудно назвать область знания, где бы изображение не использовалось для анализа информации и принятия решений. В процессе передачи по каналам связи изображения искажаются, а во время хранения изображения, зарегистрированные на фотографиях, негативах, фотопластинках, подвергаются естественному старению; их оптико-физические параметры необратимо ухудшаются даже при "идеальных" условиях хранения. При обычных условиях хранения эти необратимые процессы протекают еще быстрее. Механические повреждения являются еще одним источником необратимых разрушений таких изображений. Бурное развитие вычислительной техники, цифровых запоминающих устройств открывает реальную возможность хранения изображений на цифровых запоминающих устройствах в цифровой форме, которой неведомо понятие "старение".

В данной работе представлена система цифрового ввода, обработки и архивирования бинарных, многоградационных черно-белых и цветных изображений, описаны методы и программные средства обработки архивных изображений и их сокращенного описания. Применение эффективных средств обработки и хранения видеоданных обеспечивает компактность базы данных, малое время доступа к ее содержимому, а также удобные для пользователя способы просмотра и отбора необходимой информации. Создаваемая база данных является многофункциональной, но ориентирована в первую очередь на решение задач информатизации культурного и исторического наследия.

Цифровая обработка архивных фотодокументов

В процессе создания и хранения изображения претерпевают различные искажения. Наиболее распространенными видами этих искажений являются: точечные и/или протяженные черные и белые пятна, царапины произвольной формы, разрывы, обусловленные различными механическими повреждениями, возникшими в процессе их создания и архивного хранения. Очевидно, что эти виды искажений являются очень критичными для визуального восприятия изображений и поэтому должны быть устранены. Другим распространенным ви-

дом искажений являются яркостные искажения. Они обусловлены изменением оптико-физических свойств носителей, на которых записаны фотодокументы, и проявляются в виде падения контраста изображений и/или их яркости. Во многих случаях эти изменения неравномерны по полю изображения, что вносит дополнительные искажения фотоизображений.

Подавление этих искажений требуется практически для всех исходных архивных фотодокументов и поэтому представляется крайне желательным разработать некоторые автоматические и/или адаптивные полуавтоматические методы обработки архивных фотоизображений и создать программные средства, реализующие эти методы. В данном разделе рассматриваются цифровые методы коррекции искажений архивных фотодокументов и представлена подсистема цифровой обработки фотодокументов, реализующая рассмотренные методы. Эта подсистема входит в состав математического обеспечения верхнего уровня всей системы цифровой реставрации и архивирования фотодокументов, обеспечивающего диалоговое взаимодействие с пользователем.

Подавление импульсного шума

Импульсный шум является одним из наиболее распространенных видов искажений архивных фотодокументов. На рис. 1 и 2 представлены два типичных изображения: “Портрет” и “Факсимиле”, которые были использованы в качестве тестовых исходных изображений в данной работе. Каждый из представленных фотодокументов имеет основные виды искажений, перечисленные выше.

Точечные механические повреждения негатива и/или фотодокумента, посторонние точечные объекты на них, попавшие на разных этапах их создания и хранения (пыль, небольшие пятна химически активных жидкостей, ворсинки и т.п.), приводят к появлению контрастных черных и/или белых пятен на фотодокументе. Этот вид искажений может быть отнесен к тому распространенному виду искажений изображений, который обычно называют импульсным шумом. Для его подавления были использованы разработанные ранее алгоритмы, основанные на сочетании глобальных пороговых процедур с некоторыми локально-адаптивными ранговыми алгоритмами [1]. Ранговые алгоритмы подавления импульсного шума базируются на анализе некоторой пространственной окрестности обрабатываемого отсчета изображения. Полная локальная адаптивность, робастность и возможность рекурсивной организации обработки являются основными достоинствами ранговых алгоритмов [2]. Коррекция яркостных искажений фотодокументов.

Рис. 1. Исходное изображение фотодокумента «Портрет».

Рис. 2. Исходное изображение фотодокумента «Факсимиле».

Создаваемая в рамках данной работы база данных фотодокументов основывается на архиве фотоизображений, накопленном в ЛАФОКИ РАН, поэтому в данной работе в качестве исходных фотодокументов используются, в основном, фотонегативы. Для таких фотодокументов помимо импульсных шумов характерны искажения, которые обусловлены техническими характеристиками фотографических систем и фотоматериалов [3], в первую очередь:

• зернистостью фотоматериала,

• нелинейностью характеристической кривой фотоматериала,

• неравномерностью освещенности по полю изображения.

Коррекция этих искажении также необходима, и проводится с помощью традиционных процедур улучшения качества изображений: сглаживание

изображения, улучшение локального контраста изображения, коррекция “виньетирования” и т.п. Эти методы и алгоритмы ориентированы, как правило, на интерактивный режим обработки.

Следует особо подчеркнуть, что объектами обработки в данной работе являются архивные фотодокументы, большая часть из которых уникальна. Многие из них являются авторскими работами известных фоторепортеров и фотохудожников. В силу этого, процесс обработки таких фотодокументов должен быть направлен на устранение только тех искажений, которые заведомо являются таковыми, как например, импульсный шум и/или искажения, обусловленные отмеченными выше процессами изменений оптико-физических свойств фотоматериалов. Очевидно, что локализация таких объектов на изображении случайна, они могут перекрываться с сюжетными деталями фотодокумента и поэтому коррекция подобных искажений осуществляется пользователем в интерактивном режиме обработки.

На рис. 3 и 4 представлены результаты обработки исходных фотодокументов, показанных на рис. 1 и 2, соответственно.

Рис. 3. Результат обработки изображения документа «Факсимиле».

Рис. 4. Система ввода, обработки и архивации фотодокументов.

Методы и алгоритмы подавления шумов и улучшения качества фотодокументов, упомянутые выше, реализованы в рамках прототипа системы ввода, обработки и архивации фотодокументов, разработанного авторами данной работы. Система состоит из четырех подсистем:

• подсистема ввода;

• цифровой обработки фотодокументов;

• подсистема архивации в базе данных;

• рабочее место пользователя базы данных фотодокументов.

Все подсистемы реализованы на базе персональных компьютеров класса РС-486 или выше и взаимодействуют друг с другом в рамках локальной вычислительной сети, развернутой в ИППИ РАН.

Подсистема ввода является первым звеном в процессе преобразования фотодокумента в цифровую форму, его обработки и последующего хранения в базе данных. Она реализована на базе РС и сканера UMAX Power Look II. Достоинством этого сканера является адаптер для ввода изображений с полупрозрачных материалов (поставляемый по заказу), наличие которого было абсолютно необходимо для разрабатываемой системы. Сканер обладает следующими техническими характеристиками:

• оптическое разрешение 600 х 1200 dpi;

• максимальное разрешение 9600 х 9600 dpi;

• максимальная оптическая плотность сканируемого материала 3.3;

• количество уровней квантования: 24 бит/отсчет для цветного и 8 или 12 бит/отсчет для черно-белого режима;

• максимальный размер зоны сканирования 212 х 297 мм.

Современный уровень развития технологии производства сканеров и программного обеспечения к ним достаточно высок, поэтому в подсистеме ввода фотодокументов было решено использовать фирменное математическое обеспечение, поставляемое в комплекте со сканером. Результаты работ по вводу нескольких сотен фотодокументов, выполненных с помощью указанной подсистемы, подтвердили правомерность сделанного выбора.

Подсистема цифровой обработки фотодокументов

Второй этап преобразований фотодокументов осуществляется в подсистеме цифровой обработки фотодокументов, которая получила сокращенное название PDPS (от английского наименования PhotoDocument Processing System). Она реализована на базе 32-разрядного персонального компьютера с процессором Pentium в 32-разрядной операционной среде Microsoft Windows 95. выбора.

Эта система представляет собой интегрированную рабочую среду пользователя, в которой сосредоточены все основные процессы обработки фотодокументов, описанные выше. В рамках данной интегрированной среды реализуется диалог пользователя с системой.

Диалог осуществляется через графический интерфейс пользователя (GUI), дизайн и структура которого построены в традиционном стиле, принятом в операционной среде MS Windows. Этот интерфейс построен и реализован таким образом, что диалог пользователя с системой практически сводится к его работе по выбору на экране монитора некоторого раздела меню или другого управляющего графического элемента и его активизации. Такой выбор пользователь может осуществлять либо с помощью курсора, управляемого системной “мышкой”, либо с клавиатуры, причем некоторые управляющие элементы могут непосредственно активизироваться с помощью так называемых “горячих клавиш” - некоторых специальных комбинаций клавиш, определенных в системе PDPS.

Рассмотрим подробнее структуру и свойства подсистемы обработки фотодокументов и ее графического интерфейса пользователя. На рис. 5 схематично показана структура взаимодействия пользователя с системой.

Вызов системы обработки осуществляется через системный графический интерфейса пользователя операционной среды Windows. При ее вызове активизируется графический интерфейс системы PDPS, выполняется инициализация ее параметров и все дальнейшее управление системой PDPS осуществляется через этот интерфейс. Основные органы управления образуют первый уровень графического интерфейса пользователя:

• блок управления вводом/выводом данных;

• блок управления функциями Clipboard;

• блок инициализации вспомогательных органов управления графического интерфейса пользователя;

ЛВС

Исходный фотодокумент

PC

IMS-VGA

Улучшение

качества

Обработка

Адаптивная импульсная ------фильтрация--------

Повышение контраста Интерактивная

обработка

PC

Сжатие без потерь

Конвертер

Microsoft

Access

7

Архив(ы)

изображений

Логическая связь

Вв тек од ста

Ч 3 ар зе ав анных я PC)

Архивация

Тиражирование

Прочие

версии

ГТ7Г2\

Узел WWW

О ) Комплект CD-ROM

PC

Microsoft

Access

Поиск

Фильтрация

Сортировка

Процедура на УВА

БЬЬ для конверсии

Рабочее место на РС

Временный

ВМР

ЛВС

Экспорт в файл

Текст

Фото

Показ

формы

Печать

отчета

Рис. 5. Общая структура системы.

• вызов сервисных программ работы с системой РБР8;

• вызов основных программ обработки фотодокументов;

• селекция активного окна;

• вызов справочной системы;

• получение информации о системе РБР8.

Все эти основные блоки управления имеют свою внутреннюю структуру блоков управления, каждый из которых также может иметь некоторую

вложенную структуру, причем эта вложенность структур управления в системе РБР8 обычно не превышает трех уровней. Активизация управляющих блоков взаимозависима, возможность и очередность их активизации контролируется системой РБР8. Так, например, до вызова одной из основных программ обработки фотодокументов необходимо определить названия входного и выходного файлов, определить требуемые параметры обработки, открыть рабочие окна для визуализации входного и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

з

2

1

выходного изображений, активизировать органы управления процессом обработки и т.п. Система PDPS сконструирована таким образом, что многие параметры, необходимые для работы системы и обработки фотодокументов, получают свои исходные значения “по умолчанию” в процессе запуска и инициализации системы и/или программы обработки. Пользователь в праве использовать эти значения параметров “по умолчанию” или изменить их. При изменении значений параметров их новые значения становятся значениями “по умолчанию” при дальнейшей работе с системой PDPS. Такой подход позволил ввести специальные графические органы управления, так называемые быстрые кнопки (Speed Buttons), которые осуществляют прямой вызов наиболее часто выполняемых функций со значениями параметров “по умолчанию”, что освобождает пользователя от повторения некоторых рутинных операций и, как следствие, повышает во многих случаях эффективность работы пользователя в системе.

На рис. 6 показан образец графической формы диалога системы с пользователем, полученный как копия изображения рабочего экрана пользователя при его работе в системе PDPS.

Рис. 6. Образец графической формы интерфейса

пользователя систем PDPS (копия изображения рабочего экрана пользователя).

Эта экранная форма имеет пять основных зон, расположенных по вертикали. В первой из них расположены название системы “Photo-Document Processing System” и кнопки управления размером, локализацией и статусом самой формы. Основные органы управления, описанные выше, расположены во второй строке верхней части рабочего экрана. Они представлены следующими разделами основного меню графической формы интерфейса системы PDPS:

• File

• Edit

• View

• Tools

• Processing

• Windows

• Help

• ?

В третьей строке рабочего экрана расположены “быстрые кнопки”. Затем следует так называемая клиентская зона рабочего экрана, которая в приведенном примере занимает большую часть всей рабочей зоны. В ней расположены активизированные графические формы, которых в данном примере пять:

• “Photo-Document Image” - окно обрабатываемого фотодокумента;

• “Noise Suppression” - окно задания параметров и контроля выполнения процесса фильтрации импульсного шума;

• “Preferences” - окно задания параметров системы, используемых “по умолчанию”;

• “About” - информация о системе PDPS;

• “Background Image” - окно фонового изображения; в это окно обычно загружается изображение исходного необработанного фотодокумента для визуального сопоставления его с обработанным изображением, всегда отображаемом в окне “Photo-Document Image”.

В нижней части графической формы интерфейса системы PDPS расположена строка состояния, в которую помещается название файла фотодокумента, обрабатываемого в данный момент. И наконец, в самой нижней части экрана находится панель задач, выполняемых операционной средой Microsoft Windows.

Для полноты восприятия возможностей системы PDPS рассмотрим еще один пример графической формы, полученной как копия изображения образца рабочего экрана пользователя для другой конфигурации системы. Эта форма, представленная на рис.

7, была получена в тот момент работы системы PDPS, когда пользователь активизировал трехуровневое выпадающее (PullDown) меню:

File/Preferences/Resolution.

ечмм ЮМАМ

Рис. 7. Образец графической формы интерфейса пользователя системы PDPS с применением трехуровневого выпадающего (PuUDown) меню; File/Preferences/Resolution.

На представленных примерах нетрудно видеть, что система PDPS поддерживает многооконный режим работы. При этом пользователь имеет возможность простого управления размерами и положением каждого из активизированных окон, включая и окно с основной графической формой системы PDPS. При любом изменении масштаба (Zoom) обрабатываемого фотодокумента система осуществляет контроль за сохранением пропорции его горизонтального и вертикального размеров.

Для быстрого освоения работы пользователя с системой PDPS в ней реализована функция всплывающих подсказок, принятая и поддерживаемая в операционной среде Windows. Таким образом, при попадании курсора в площадь управляющего элемента графической формы пользователь получает краткую справку о данном объекте.

Система PDPS обладает также функцией контекстно-зависимых меню. Это позволяет пользователю одним и тем же простым способом, нажатием правой кнопки системной “мышки”, вызывать различные меню в зависимости от текущего положения курсора на том или другом активизированном графическом объекте.

Разработка математического обеспечения верхнего уровня системы цифровой обработки фотодокументов была осуществлена методами объектно-ориентированного программирования с использованием интегрированной среды разработки Borland C++Builder. Работоспособность системы была апробирована при работе в операционных средах Windows 95 и Windows NT 4.0

Подсистема архивации изображений

Для сокращенного описания двухградационных черно-белых изображений (печатные и рукописные документы) использован известный метод двумерного кодирования длин серий [4,5], однако его эффективность была улучшена примерно на 5% по сравнению с обычной неадаптивной процедурой за счет адаптивной конструкции кодовой книги для кода Хаффмана [6]. Дополнительное сжатие было получено за счет раздельного хранения отличающихся кодовых книг для серий черных и белых битов. Алгоритм сжатия полутоновых изображений построен на основе оригинального интерполяционно-пирамидального метода и позволяет достичь степени сжатия 2-3 (без потерь) в зависимости от изображения [7]. Метод сжатия цветных изображений основан на так называемом преобразовании компонент с интерполяцией по отсчетам (ПКИО), а для обеспечения дополнительного сжатия находятся различные комбинации результатов этого преобразования [8]. В результате рассмотрения некоторых возможностей поиска оптимальных комбинаций выбран наиболее удачный способ - адаптивное формирование комбинаций результатов ПКИО, при котором используется вычисление попарных разностей разностных компонент преобразования. Эксперименты с типичными полутоновыми и цветными архивными изображениями показали, что во всех

случаях этот алгоритм дает выигрыш 15-20% в степени сжатия по сравнению с лучшими из известных стандартных программ архивации файлов без потери содержащейся в них информации (РК21Р, АШ, ЬИА). Эти методы сокращенного описания изображений реализованы в подсистеме архивации (см. среднюю часть рис.5).

Математическое обеспечение верхнего

уровня системы, реализующее диалог с конечным пользователем

В этой разделе мы подробнее рассмотрим реализацию подсистемы, образующей верхний уровень описываемой системы ввода, цифровой реставрации и архивации изображений, которая обеспечивает взаимодействие с конечными пользователями архивной базы данных изображений после того, как она наполнена. Эта подсистема устанавливается на рабочих местах пользователей (см. нижнюю часть рис. 5). На данном этапе работы в качестве рабочих мест планировалось использование только 1ВМ-совместимых персональных компьютеров (РС), хотя, как уже отмечалось выше, при разработке структуры базы данных и архивов изображений особое внимание было уделено тому, чтобы обеспечивалась переносимость создаваемой базы данных на другие платформы - как программные (основанные на других операционных системах и СУБД), так и аппаратные (иные семейства компьютеров и рабочих станций). Благодаря этому, при смене компьютерного парка в будущем сохраняется возможность работы с накопленным архивом введенных и отреставрированных изображений [4-5].

В зависимости от местонахождения и программно-аппаратного оснащения рабочего места пользователя архива, реализованы различные способы его взаимодействия с базой данных. Несмотря на различия в скорости доступа к базе данных, эти способы сходны с точки зрения пользователя и не требуют специфических знаний и навыков.

В наиболее простом случае рабочее место пользователя подключается к локальной вычислительной сети (ЛВС) системы, т.е. программное обеспечение рабочей станции имеет непосредственный доступ к файл-серверу, на дисковом массиве которого размещаются база данных и относящиеся к ней архивы изображений (этот способ доступа обозначен "1" на рис. 5). При этом прикладное и системное программное обеспечение также может размещаться на файл-сервере, что снижает требования к применяемым рабочим станциям, позволяя, в частности, использовать в качестве таковых бездисковые РС, направляя освобождающиеся ресурсы на повышение быстродействия процессора и наращивание объема оперативной памяти рабочей станции.

Второй вариант организации взаимодействия пользователя с базой данных применяется на изолированных рабочих станциях, не связанных с локальной сетью основного архивного хранилища, например, находящихся в других населенных пунктах (та-

кой способ доступа обозначен "2" на рис.5). Здесь база данных и архивы сжатых изображений хранятся на комплекте дисков CD-ROM, выпускаемых необходимым тиражом и распространяемых по схеме, зависящей от назначения архива (через сеть централизованного снабжения отрасли, библиотечную или торговую сеть). Структура и формат представления информации на таком носителе принципиально не отличается от организации базы данных и архива изображений на файл-сервере локальной сети, но имеется ряд особенностей в организации работы пользователей. Так, в ходе последовательного просмотра базы данных или целенаправленного поиска требуемых изображений по тем или иным ключам программа при необходимости просит пользователя установить дисковый том с указанным номером, после чего продолжает работу обычным образом). Для того, чтобы свести к минимуму необходимое число перестановок дисков, на каждом CD-ROM продублирована постоянно необходимая для работы информация (собственно база данных с текстовыми описаниями изображений и поисковыми ключами, программное обеспечение и т. п.), которая занимает относительно небольшой объем по сравнению с архивом собственно изображений.

Наконец, в перспективе предусматривается обеспечить возможность доступа пользователей к создаваемой базе данных по сети Интернет. Этот способ доступа (обозначен "3" на рис. 5) стоит несколько особняком. С одной стороны, он позволяет использовать архивные ресурсы исключительно широкому кругу пользователей в России и за рубежом. С другой стороны, возникают проблемы контроля доступа и сохранения авторских прав на содержимое базы изображений. К счастью, решение здесь подсказывает сама жизнь, а именно, крайне ограниченная пропускная способность существующих каналов связи. Маловероятно, чтобы в ближайшее время появилась возможность регулярно передавать по сети Интернет полноразмерные архивные изображения объемами порядка мегабайт. Поэтому на соответствующих домашних страницах целесообразно представлять лишь изображения, уменьшенные в 5-8 раз и подвергшиеся дополнительному сжатию по используемым в Интернет алгоритмам кодирования изображений с потерями (типа JPEG). Для этой цели применимы уменьшенные копии архивных изображений, которые включены в структуру архива и в настоящее время используются для ускорения просмотра базы данных на рабочих станциях недостаточной мощности. Позволяя легко оценить сюжет изображения визуально, эти копии в то же время ввиду малого размера и низкого качества непригодны для дальнейшего коммерческого использования, например, издания полиграфическим способом. Таким образом, доступ к архиву через Интернет может послужить для целей рекламы и популяризации того или иного собрания изображений, а также предварительного подбора необходимого материала для его заказа. В целом, некоторые предпосылки для такой организации доступа в

базу данных цифровых архивных изображений нами заложены, и соответствующие разработки при необходимости могут быть проведены в будущем.

Перейдем теперь к описанию разработанного нами программного обеспечения верхнего (пользовательского) уровня системы взаимодействия с существующим цифровым архивом. Напомним, что в результате сравнительного анализа возможностей и степени распространенности общесистемного программного обеспечения, проведенного в ходе работы, для платформы РС мы остановили выбор на следующем сочетании: операционная система Microsoft Windows 95 и входящая в состав программного пакета Microsoft Office 97 СУБД Access 97. При необходимости может использоваться и предшествующая редакция 32-разрядной СУБД Microsoft (Access for Windows 95, версия 7.0), однако для нее потребуется установить распространяемый корпорацией Microsoft пакет обновления, который позволяет обращаться к базе данных Access 97. Все перечисленные программные продукты широко распространены и доступны в локализованных (русифицированных) версиях.

Разработанное нами программное обеспечение верхнего уровня существенно ориентировано на указанное системное окружение, поскольку многие из необходимых конечному пользователю функций реализованы с использованием встроенных средств СУБД и операционной системы.

Как обычно в системе Access, работа конечного пользователя с базой данных протекает в одном из двух основных режимов: в табличном режиме и режиме формы. В режиме таблицы на экране рабочей станции выводится текстовая информация из полей базы данных, сопровождающая и комментирующая хранящееся в цифровом архиве изображение. При этом приводятся данные для нескольких десятков записей базы данных одновременно и обеспечиваются все необходимые средства поиска и фильтрации записей (по значениям ключевых полей, по наличию текста и т.п.), а также их сортировки (алфавитная, хронологическая и пр.). Необходимые для этого средства обеспечиваются внутренними возможностями СУБД Access.

Вторым, основным режимом работы с базой данных является режим формы, в котором на экран выводятся данные только одной (текущей) записи базы данных вместе с соответствующим изображением из цифрового архива. В зависимости от конкретных требований, для одной и той же базы может разрабатываться множество различных форм, из которых пользователь выбирает нужную ему. На рис. 8 приводится пример одной из таких разработанных форм. При работе в этом режиме также поддерживаются средства поиска, фильтрации, сортировки, причем выбранные записи (если их более одной) могут просматриваться как поочередно, в прямом и обратном направлениях, так и в произвольном порядке - по номеру.

Рис. 8. Пример формы для работы с базой данных (копия с экрана).

Информация в текстовые окна формы выводится непосредственно из соответствующих полей базы данных. Вывод графического изображения осуществляется с помощью разработанного программного обеспечения, по следующей схеме. При переходе к очередной (или первой) записи просматриваемого пользователем подмножества записей (или всей базы данных) возникает предусмотренное в СУБД Access внутреннее событие ON CURRENT.

Программа-обработчик этого события, написанная в виде процедуры языка Visual Basic for Application (VBA), обращается к скрытым от пользователя полям текущей записи базы данных, где записано местонахождение изображения в архиве. При этом, в зависимости от используемого режима доступа к базе данных, анализируются либо поля, указывающие имя архива и изображения на файл-сервере локальной сети основного хранилища, либо поля с именем тома CD-ROM и именами архива и изображения на этом томе (в последнем случае пользователю может выдаваться сообщение, требующее установить нужный том, если стоит другой).

После того, как локализован архивный файл с изображением, подлежащим показу в окне формы, процедура на VBA вызывает специально разработанную библиотеку динамического вызова (DLL). Собранные в ней функции написаны на языках С++ и Ассемблер. Они обеспечивают, в частности, декодирование черно-белых двухградационных и полутоновых, а также цветных изображений по описанным в предшествующих главах алгоритмам, с преобразованием их во внутренний формат изображения системы Windows - так называемую "битовую карту" (bitmap). Этот формат изображения уже легко отображается средствами СУБД Access, причем предусмотрены три способа показа:

1) в натуральном масштабе (элемент изображения соответствует элементу экрана) с дополнением до края окна пустым фоном или потерей фрагментов, выходящих за границу графического окна ("режим кадрирования");

2) с равномерным геометрическим сжатием (растяжением) изображения до ближайшей границы окна, если оно имеет больший (меньший) размер ("режим увеличения ");

3) с растяжением (сжатием) до границ окна, если изображение имеет меньший (больший) размер ("режим приведения ").

Пользователь может оперативно переключать эти режимы вывода, для чего на форме имеются органы управления ("радио-кнопки"). Предусмотрена также кнопка, нажатием на которую пользователь может выполнить распечатку текущего изображения на принтере, который в данный момент установлен в системе Windows 95 в качестве "принтера по умолчанию".

Очевидно, что сколь бы разнообразны ни были возможности демонстрации архивного изображения, они не могут исчерпать все существующие и перспективные потребности конечных пользователей широкого круга: исследователей, журналистов, художников, писателей, издателей и др. Поэтому в разработанной форме предусмотрена возможность сохранения демонстрируемого изображения в одном из стандартных графических форматов путем нажатия специальной кнопки. Получаемый при этом файл может в дальнейшем загружаться в графический редактор (например, для детального рассмотрения фрагментов изображения в увеличенном виде, кадрирования, ретуши и т.п.), настольную издательскую систему (для подготовки к изданию полиграфическим способом) или иное прикладное программное обеспечение по выбору пользователя.

Качественные цифровые архивные изображения имеют высокое разрешение и, следовательно, большой объем. Это не могло не сказаться на скорости их декодирования. При работе на мощных рабочих станциях, оснащенных процессорами Pentium MMX с тактовой частотой 200 МГц и выше, время декодирования и показа изображения составляет единицы секунд и не мешает эффективной работе пользователей, однако на более медленных компьютерах задержки оказываются раздражающе велики. Поэтому для повышения скорости просмотра записей базы данных предусмотрено два режима отображения - нормальный, когда в графическое окно формы выводится декодированное полноразмерное архивное изображение, и ускоренный, когда отображаются не сами архивные изображения, а их уменьшенные (прореженные) копии, хранимые в архиве вместе с оригиналом. Эти копии представлены в стандартном графическом формате и не требуют декодирования. Они демонстрируются исключительно быстро, не тормозя работу пользователей, разумеется, ценой некоторой потери качества. Впрочем, пользователь, встретив в ходе просмотра заинтересовавшее его изображение, может нажатием соответствующей кнопки перейти в нормальный режим, рассмотреть полноценное изображение, при желании - распечатать его, сохранить в виде стандартного графического файла и т.д., а потом опять

вернуться в ускоренный режим и продолжить просмотр и поиск необходимого документа.

Все описанные выше возможности реализованы путем привязки соответствующих процедур на VBA к имеющимся в форме органам управления, а в тех случаях, когда требуется особо эффективная реализация, эти процедуры обращаются к функциям DLL. Эксперименты показали, что реализованный набор решений обеспечивает необходимое быстродействие и удобство работы.

Заключение

Таким образом, разработаны методы и алгоритмы цифровой обработки изображений для реализации процессов подавления импульсного шума и улучшения их качества. Созданы программные средства, реализующие разработанные алгоритмы. Разработано математическое обеспечение верхнего уровня системы цифровой обработки фотодокументов, реализующее диалог с пользователем в ходе создания и наполнения цифрового архива фотодокументов (в качестве таких пользователей выступают специалисты по цифровой реставрации архивных изображений). Эффективность всех разработанных алгоритмов и программных средств подтверждена экспериментально при создании базы данных фотодокументов архива ЛАФОКИ РАН.

Предложены и практически реализованы прототипы двух программных комплексов, предназначенных для эксплуатации на двух рабочих местах общей технологической цепочки создания и эксплуатации цифрового архива. Первый из комплексов можно охарактеризовать как "рабочее место реставратора"; с его помощью выполняется анализ и предварительная обработка введенных изображений перед их занесением в архив. Этот программный комплекс объединяет в единое целое то алгоритмическое и математическое обеспечение процесса цифровой реставрации изображений, которое было ранее разработано авторами. Второй из разработанных программных комплексов предназначен для рабочего места конечного пользователя цифрового архива изображений. Он обеспечивает интерфейс пользователя с разработанной базой данных, возможности поиска и подбора необходимой информации по ключевым полям, фрагментам текста и визуально - путем показа архивных изображений на экране рабочей станции. Разработанное математическое обеспечение носит универсальный характер: оно предусматривает различные способы физической связи рабочего места конечного пользователя с архивом (локальная сеть, комплект дисков CD-ROM) и учитывает возможный диапазон производительностей рабочих станций, обеспечивая возможность эффективной работы даже на компьютерах, недостаточно мощных по современным меркам. С

этой целью, в частности, в составе разработанного цифрового архива изображений наряду с высококачественными полноразмерными документами содержатся и их уменьшенные копии, которые могут использоваться для ускорения работы программного обеспечения в ходе предварительного отбора информации. Особое внимание было обращено на обеспечение переносимости создаваемой базы данных на будущие программно-аппаратные платформы. Этому способствует особая организация архива в виде двух логически связанных, но хранимых раздельно компонент - реляционной базы данных с текстовой информацией и собственно архива изображений, сжатых с помощью разработанных методов. Опытная эксплуатация разработанного программного обеспечения показала, что оно обладает достаточной эффективностью, удобством для пользователей и обеспечивает не только сиюминутные потребности авторов, но и решение ряда перспективных задач, которые уже возникают и могут возникнуть в будущем.

Работа поддержана Российским фондом фундаментальных исследований: грант 96-07-89028.

Литература

1. Karnaukhov V.N., Wenger E., Merzlyakov N.S., Haidinger A., and Lackner F. Thematic processing and retrieving of watermarks. // Image Processing and Computer Optics (DIP-94) // Proceed. SPIE, 1994, Vol.2363, pp.32-39.

2. Yaroslavsky L.P. Linear and rank adaptive filters for picture processing // Digital Image Processing and Computer Graphics, Ed. by E.Wenger and L.Dimitrov / R.Oldenbourg, pp.327-372, Wien, 1991.

3. Pratt W.K. Digital Image Processing // John Wiley and Sons, New York, 2nd edition, 1991.

4. Бокштейн И.М., Кузнецов Н,А., Мерзляков Н.С., Рубанов Л.И. Возможности и средства цифровой реставрации архивных рукописных текстов. Информационные технологии и вычислительные системы. ИВВС РАН, н.1, стр1-15, М, 1997-11-24.

5. Bockstein I.M., Kuznetsov N.A., Merzlyakov N.S., Rubanov L.I., Bogatova G.A. Digital restoration of archival handwritten texts. Pattern Recognition and Image Analysis, Vol.7, No.3, pp.379-390, 1997.

6. Huffman D.A. A method for the construction of minimum redundancy codes. Proceedings of the IRE, 1952, Vol.40, No. 9.

7. Бокштейн И.М. Метод сжатия изображений без потери информации. Автометрия, 1994, № 1.

8. Бокштейн И.М. Адаптивные варианты метода преобразования компонент с интерполяцией по отсчетам // Автометрия.-1990.- №3.

i Надоели баннеры? Вы всегда можете отключить рекламу.