Научная статья на тему 'Цифровые методы обработки изображений в задачах идентификации средневековых водяных знаков'

Цифровые методы обработки изображений в задачах идентификации средневековых водяных знаков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
151
35
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Карнаухов В. Н., Мерзляков Н. С., Венгер Э., Хайдингер А.

В данной работе представлена реляционная мультимедийная база данных (изображения и текстовые данные), разработанная для водяных знаков средневековых манускриптов. Представлена также специализированная интегрированная система, предназначенная для цифровой обработки изображений водяных знаков и управления этой базой данных. В настоящее время база данных содержит более 2000 водяных знаков. Основная часть этих водяных знаков взята из рукописей и инкунабул, хранящихся в монастыре Клостерноебург (Klosterneuburg, Austria).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Карнаухов В. Н., Мерзляков Н. С., Венгер Э., Хайдингер А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Цифровые методы обработки изображений в задачах идентификации средневековых водяных знаков»

ЦИФРОВЫЕ МЕТОДЫ ОБРАБОТКИ ИЗОБРАЖЕНИЙ В ЗАДАЧАХ ИДЕНТИФИКАЦИИ

СРЕДНЕВЕКОВЫХ ВОДЯНЫХ ЗНАКОВ

В.Н. Карнаухов1, Н.С. Мерзляков1, Э. Венгер2, и А. Хайдингер3 1 Институт проблем передачи информации Российской Академии Наук Россия, 101447, Москва, ГСП-4, Б.Каретный пер. д.19, e-mail: victor.karnaukhov@iitp.ru или nick@iitp.ru 2Комиссия научной визуализации Австрийской Академии Наук 19/2, Sonnenfelsgasse, Vienna A-1010, Austria, e-mail: emanuel.wenger@,oeaw.ac.at 3Комиссия палеографии и кодикологии средневековых рукописей Австрийской Академии Наук, Postgasse 7-9 / 4 / 3, Vienna A-1010, Austria e-mail: alois. haidinger@peaw.ac.at

В данной работе представлена реляционная мультимедийная база данных (изображения и текстовые данные), разработанная для водяных знаков средневековых манускриптов. Представлена также специализированная интегрированная система, предназначенная для цифровой обработки изображений водяных знаков и управления этой базой данных. В настоящее время база данных содержит более 2000 водяных знаков. Основная часть этих водяных знаков взята из рукописей и инкунабул, хранящихся в монастыре Клостерноебург (Klosterneuburg, Austria).

1. Введение

Водяные знаки играют существенную роль в исторических исследованиях при решении задач датирования исторических документов. Средневековые рукописи и инкунабулы представляют важную часть нашего культурного наследия. Во многих случаях эти документы не датированы, но знание даты, когда они были написаны или напечатаны, крайне необходимо для исторических исследований. Сравнение датированных водяных знаков с недатированными является главным методом для определения возраста средневековых (бумажных) рукописей и инкунабул. Существуют несколько стандартных каталогов водяных знаков, содержащих тысячи контурных копий водяных знаков, полученных ручным срисовыванием (на просвет) видимых изображений на кальку1'2. Идентичность водяного знака с одним из опубликованных в стандартных каталогах является хорошим индикатором для оценки возраста и водяного знака, и самого исследуемого документа.

Проблемы существующих методов идентификации водяных знаков на основе использования стандартных каталогов водяных знаков известны. Во многих случаях водяные знаки исследуемого документа маскированы текстом этого документа настолько сильно, что невозможно произвести достоверное ручное срисовывание (на просвет) видимых изображений на кальку. Даже в тех случаях, когда возможно сделать достоверную копию водяного знака, процедура поиска идентичного водяного знака среди многих сотен подобных водяных знаков того же самого мотива в каталогах является трудоемкой, низко эффективной и утомительной. Кроме того, все каталоги неполны и нет никакой гарантии, что поиск идентичного водяного знака приведет к положительному результату. Более того, доказательство идентичности исследуемого водяного знака с одним стандартного каталога часто не является достаточным для достоверного датирования документа. В таких случаях необходимо использовать некоторые дополнительные данные. Один из воз-

можных путей преодоления перечисленных недостатков существующих методов состоит в использовании компьютеров, которые являются идеальными инструментальными средствами для получения, сравнения и каталогизации огромных объемов данных. Для решения этой проблемы требуется разработка мультимедийной базы данных (изображения и текстовые данные) и специальных программных средств обработки изображений и управления этой базой данных.

2. Получение и цифровая обработка изображений водяных знаков

Водяные знаки представляют собой небольшие девиации в толщине бумажной страницы рукописи или инкунабулы. Водяные знаки видимы "на просвет". Поэтому процессу преобразования изображения водяного знака в цифровую форму должна предшествовать некая процедура получения его копии в виде некоторого изображения. Такая копия может быть получена, например, с помощью рентгенографии, бета радиографии, электронной радио -графии или ручным срисовыванием. В настоящее время бета радиография и электронная радиография представляются наилучшими среди методов достоверной регистрации водяных знаков, в смысле высокого качества полученных копий. Небольшие девиации в плотности бумаги зарегистрируются этими методами достаточно хорошо. Однако, изображения водяных знаков, полученные даже этими методами, обычно имеют низкий контраст за исключением некоторых очень ярких или очень темных пятен и фрагментов, обусловленных дырками в бумаге или некоторыми специальными чернилами.

Цифровая обработка изображений начинается со ввода копии водяного знака в компьютер. Чувствительный планшетный сканер с модулем для ввода прозрачных материалов (transparency unit) обычно используется для сканирования таких изображений. Визуальное качество введенных копий, полученных различными методами, существенно различается и, следовательно, специальная предварительная обра-

ботка изображений должна предшествовать их использованию и хранению в мультимедийной базе данных.

Наиболее важный этап в процессе предварительной обработки - повышение качества изображений, поскольку изображения обычно имеют низкий контраст и испорчены шумом. Предварительная обработка направлена на получение изображения водяного знака с некоторым нормализованным набором визуальных характеристик3'4'5.

В общем случае, каждое изображение водяного знака содержит три графических рисунка: водяной знак или филигрань, понтюзо и вержеры. Эти рисунки, выделенные из изображения водяного знака, образуют его контурную копию. Типичное изображение водяного, полученное путем сканирования его бета радиографической копии, представлено на Рис.1 Оно содержит три типа графических объектов, глобальные метрические параметры которых обычно используются для идентификации водяного знака: филигрань (1), понтюзо (2) и вержеры (3).

Рис.1. Типичное изображение водяного знака: 1-филигрань, 2 - пантюзо и 3- вержеры.

3. Автоматизированное выделение контуров водяного знака

Попытки разработки автоматических методов

выделения контуров или сегментации водяных знаков не дали положительных результатов из-за крайне низкого качества изображений водяных знаков. Для решения этой проблемы была выбрана полуавтоматическая процедура. Основной критерий при ее разработке состоял в минимизации взаимодействия пользователя с разрабатываемыми программными средствами и оптимизации качества выделения контура.

Процедура выделения контура водяного знака реализована как интерактивная. Вначале, мотив водяного знака должен быть определен пользователем. Мотив водяного знака (например, колокол, весы,

лук со стрелой, голова вола и т.д.) с подтипами до четырех уровней выбираются из иерархической структуры пользователем в интерактивном режиме. Выбор мотива водяного знака определяет количество опорных точек контура водяного знака, которые должны быть заданы пользователем. Количество этих точек для каждого мотива водяного знака поддерживается на минимально возможном уровне и обычно составляет от десяти до двадцати точек. Кроме того, для каждого мотива устанавливаются геометрические ограничения на вариабельность контура.

Разработанная процедура основывается на использовании параметрических кубических кривых Бециера6. Кривые Бециера (Б&1ег) определяются следующим выражением:

Р(Г) =£ ркБк„ (4 0 < I < 1, к=0

где рк (/) - векторные коэффициенты, опорные точки, Бк п (0 - многочлены Бернштейна:

Бкпп Ц) = С(п, к)Гк (1 - Г)п-к, и С(п, к) - биномиальные коэффициенты:

Опорные точки, определенные пользователем, делят контуры водяного знака на некоторые наборы смежных сегментов. Кубические кривые Бециера используют 4 опорных точки для представления каждого сегмента контура; две из них задаются пользователем, а две другие вычисляются программно. Результирующая кривая Бециера интерполирует две смежные опорные точки каждого контурного сегмента и аппроксимирует две других. Эти дополнительные опорные точки рассчитываются на основе критерия аппроксимации контура водяного знака настолько близко насколько это возможно. Два основных шага этой процедуры демонстрируются на Рис.2: (а) - изображение водяного знака с прорисованным контурным изображением и всеми опорными точками; (б) - выделенное контурное изображение водяного знака.

После программного вычисления дополнительных опорных точек, пользователь имеет возможность для дополнительной подстройки полученных контуров за счет перемещения эти опорных точек. Результирующий набор опорных точек сохраняется в реляционной базе данных водяных знаков.

Известно, что кривая Бециера инвариантна относительно аффинных преобразований. Это означает, что любое линейное преобразование или перенос опорных точек определяет новую кривую Бециера, которая является только преобразованием или переносом первоначальной кривой. Таким образом, выделенный контур водяного знака может быть легко преобразован для других водяных знаков того же самого мотива.

Рис.2: Два основных этапа процедуры выделения контурного изображения водяного знака.

4. Реляционная база данных средневековых водяных знаков

Различные базы данных водяных знаков и системы их обработки в настоящее время разрабатываются в нескольких центрах исследований водяных знаков578. Анализ этих баз данных и систем обработки показал, что существуют некоторые различия между ними, но имеется также много общих элементов. Существующие базы данных отражают научные интересы исследовательских групп, но обычно они содержат некий набор основных данных, который является практически одним и тем же для любой базы данных водяных знаков. В общем случае, полное описание водяного знака требует нескольких десятков различных параметров9. Например, набор метрических параметров, используемый для идентификации водяного знака, данные о его источнике: инкунабуле или рукописи, месте их создания и многие другие. Процедуры классификации водяных знаков и датирования средневековых рукописей требуют интенсивного использования этих параметров и данных. Эффективное хранение и использование всех этих данных может быть реализовано путем создания мультимедийной база данных и разработки программных средства для их обработки.

Реляционная модель данных была выбрана для разработки базы данных водяных знаков. Таким образом, все данные в базе данных организованы в виде некоторой совокупности связанных таблиц. Разработанная база данных содержит две основные части. Одна из них содержит данные, связанные с классификацией водяных знаков на основе их текстового описания. Она создает и осуществляет управление иерархической структурой мотивов водяных знаков, содержащей до четырех уровней подтипов водяных знаков. На основе этой структуры, для каждого типа водяного знака, зарегистрированного в базе данных, программно генерируется уникальный одиннадцатиразрядный цифровой код. Код

содержит три первых разряда для регистрации мотива водяного знака и четыре пары последующих разрядов для соподчиненных кодов четырех подтипов. Емкость этого кода достаточна для кодирования до 999 мотивов водяных знаков и до 99 подтипов водяных знаков в каждом из четырех возможных соподчиненных уровней.

Вторая часть разработанной базы данных предназначена для регистрации и использования конкретных водяных знаков. Эта часть базы данных содержит большой набор взаимосвязанных данных, требуемых для идентификации и полного описания водяных знаков. Все введенные изображения водяных знаков регистрируются в этой части базы данных. В настоящее время база данных содержит более 2000 водяных знаков. Основная часть этих водяных знаков взята из рукописей и инкунабул, хранящихся в монастыре Клостерноебург (Klosterneuburg, Austria).

5. Программное обеспечение

Все описанные выше методы и программные средства реализованы в рамках интегрированной системы цифровой обработки изображений водяных знаков и управления базой данных. Взаимодействие пользователя с этой системой осуществляется через графический интерфейс пользователя, содержащий широкий набор меню, управляющих кнопок и других управляющих средств. Графический интерфейс пользователя разработан в Windows-стиле и содержит несколько десятков различных графических форм, обеспечивающих взаимодействие пользователя с системой.

Специальные программы разработаны для обработки и визуализации изображений водяных знаков и их контуров. Созданы специальные графические формы, поддерживаемые прикладным программным обеспечением, которые используются для формирования комплексных запросов к базе данных. Разработаны также программные средства для автомати-

зированного измерения метрических параметров, выделения контуров водяных знаков, классификации водяных знаков и автоматизации другой рутинной работы с базой данных. Система реализована на платформе PC и работает под операционной системой Windows 95/98/NT-4.0 или выше. В качестве примера на Рис.3 представлена копия экрана поль-

зователя. Она содержит три открытые графические формы: форма для визуализации обрабатываемого изображения водяного знака (слева), контрольная панель для управления процессом выделения контурного изображения водяного знака (в центре) и информационная форма обрабатываемого изображения водяного знака (справа).

Рис.3. Графический интерфейс пользователя б. Выводы

Разработаны методы и инструментальные средства для цифровой обработки изображений водяных 4. знаков и создана реляционная база данных водяных знаков. Все предложенные методы и инструментальные средства реализованы в рамках одной интегрированной системы. Такой подход предоставля- 5. ет пользователю возможность эффективного выполнения всех необходимых задач по идентификации средневековых водяных знаков в рамках одной системы.

7. Благодарности 6.

Эта работа поддержана Российским Фондом Фундаментальных Исследований в рамках проекта 99-07-90017. 7.

Литература

1. Briquet Ch. M., Les Filigranes. Dictionnaire historique des marques du papier dés leur apparition vers 1282 jusqu'en 1600. Paris 1907. 8.

2. Piccard G., Die Wasserzeichenkartei Piccard im Hauptstaatsarchiv Stuttgart. Findbuch I-XV, W. Kohlhammer, Stuttgart, 1966-1987.

3. Wenger E., Karnaukhov V., Haidinger A., Mer- 9. zlyakov N., Digital image analysis for dating of

old manuscripts. In: Image Analysis Applications and Computer Graphics. (R. T. Chin, H. H. S. Ip,

с тремя открытыми формами.

S. Ip, A. C. Naiman, T.-C. Pong, eds.). Lecture Notes in Computer Science 1024, 522-523, Springer, Berlin, 1995.

Karnaukhov V. N., Wenger E., Merzlyakov N. S., Haidinger A., and Lackner F., Thematic processing and retrieving of watermarks. Proceedings of SPIE Vol. 2363, 1995, pp.32-39; Карнаухов В.Н., Мерзляков Н.С., Венгер Е., Хайдингер А. и Лакнер Ф., Цифровой анализ водяных знаков средневековых рукописей. Компьютерная оптика, вып. 14-15, 1995, сс. 11-24.

Bezier P., Numerical Control: Mathematics and Applications, translated by A. R. Forrest and A. F. Pankhurst, John Wiley & Sons, London, 1972.

Rauber C., Tschudin P., Startchik S., Pun T., Archival and retrieval of historical watermarks. ICIP 1996 International conference on image processing, Lausanne. IEEE, 1996.

Rauber C., Ruanaidh J., Pun T., Secure distribution of watermarked images for a digital library of ancient papers. Second ACM international conference on digital libraries, Philadelphia, ACM, 1997. International Association of Paper Historians -IPH, International Standard for the Registration of Watermarks, P. F. Tschudin, ed., Rienen, Switzerland, 1997.

i Надоели баннеры? Вы всегда можете отключить рекламу.