Научная статья на тему 'Опыт цифровой реставрации рукописных книг в ГПНТБ со РАН'

Опыт цифровой реставрации рукописных книг в ГПНТБ со РАН Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
417
71
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВАЯ РЕСТАВРАЦИЯ / РУКОПИСНЫЕ КНИГИ / ЦИФРОВЫЕ БИБЛИОТЕКИ / ОБРАБОТКА ИЗОБРАЖЕНИЙ / DIGITAL RESTORATION / RUSSIAN MANUSCRIPTS / DIGITAL LIBRARIES / IMAGE PROCESSING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шабанов Андрей Васильевич

Рассмотрены задача цифровой реставрации рукописных книг и опыт ее решения в ГПНТБ СО РАН

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The experience of manuscripts digital restoration in SPSTL SB RAS

The article is devoted to manuscripts digital restoration of the Siberian holdings. First it describes the state of digital library «Book monuments of Siberia», and main steps of creating high-quality digital copies. Part of this library is available at www.spsl.nsc.ru/rbook. Then two examples of complex image processing digital restoration are given.

Текст научной работы на тему «Опыт цифровой реставрации рукописных книг в ГПНТБ со РАН»

БИБЛИОСФЕРА, 2017, № 2, с. 101-104 / BIBLIOSPHERE, 2017, no 2, pp. 101-104

Информатика

УДК 091:7.025.4:004 ББК 76.10+78.35

DOI 10.20913/1815-3186-2017-2-101-104

ОПЫТ ЦИФРОВОЙ РЕСТАВРАЦИИ РУКОПИСНЫХ КНИГ В ГПНТБ СО РАН

© А. В. Шабанов, 2017

Государственная публичная научно-техническая библиотека Сибирского отделения Российской академии наук, Новосибирск, Россия; e-mail: shabanov@spsl.nsc.ru

Рассмотрены задача цифровой реставрации рукописных книг и опыт ее решения в ГПНТБ СО РАН

Ключевые слова: цифровая реставрация, рукописные книги, цифровые библиотеки, обработка изображений.

Для цитирования: Шабанов А. В. Опыт цифровой реставрации рукописных книг в ГПНТБ СО РАН // Библиосфера. 2017. № 2. С. 101-104. DOI: 10.20913/1815-3186-2017-2-101-104.

The experience of manuscripts digital restoration in SPSTL SB RAS A. V. Shabanov

State Public Scientific Technological Library of the Siberian Branch of the Russian Academy of Sciences, Novosibirsk, Russia; e-mail: shabanov@spsl.nsc.ru

The article is devoted to manuscripts digital restoration of the Siberian holdings. First it describes the state of digital library «Book monuments of Siberia», and main steps of creating high-quality digital copies. Part of this library is available at www.spsl.nsc.ru/rbook. Then two examples of complex image processing - digital restoration - are given.

Keywords: digital restoration, Russian manuscripts, digital libraries, image processing.

Citation: Shabanov A. V. The experience of manuscripts digital restoration in SPSTL SB RAS // Bibliosphere. 2017. № 2. P. 101-104. DOI: 10.20913/1815-3186-2017-2-101-104.

Задача получения цифровой копии рукописной книги, адекватно отображающей источник, является комплексной и включает в себя целый ряд разнородных этапов - первичная оцифровка, хранение архивов изображений, обработка данных, генерация электронной версии, предоставление пользователям доступа к информации, включение в цифровую копию научного описания [1-6].

В результате создается цифровая библиотека «Книжные памятники Сибири».

Состав библиотеки на декабрь 2016 г. приведен в таблице (см. раздел «Материалы к опубликованным статьям» / № 2-2017/ Шабанов А. В. : Таблица на сайте http://www.spsl.nsc.ru/professionalam/bibliosfera/ materialy-k-statyam/).

Рассмотрим наиболее ответственный и сложный этап - обработку первичных изображений.

Оцифровка редких книг и рукописей в ГПНТБ СО РАН в различные годы проводилась на четырех установках: две - типа ПланСкан фирмы ЭЛАР, одна -на основе цифрового фотоаппарата фирмы Canon (Canon 500D с объективами EF 24 mm f/1.4L II USM и EF-S 18-55 f/3.5-5.6 IS) и двух источников рассеянного света фирмы FalconEyes Softbox SBQ-7575 и, наконец, четвертая - книжный сканер Microbox book2net Cobra (рис. 1).

Основная проблема прошлого этапа работ по оцифровке рукописных и старопечатных книг - отсутствие специализированной системы для фиксации ветхих рукописных и старопечатных книг - решена с помощью использования системы фиксации

Рис. 1. Установки для сканирования Fig. 1. Scanning facilities used in SPSTL SB RAS

ИНФОРМАТИКА I INFORMATICS

источников при угле раскрытия 110 градусов. Книжная колыбель регулируется по горизонтали и вертикали. Также регулируется поддержка корешка книги. Подробнее про самую новую установку оцифровки см. http://www.book2net.net/index.php/ru/products/book-scanners/a2/cobra-a2-book-scanner.

Основные шаги при «доводке» первичного изображения до конечного следующие:

• корректировка цвета и яркости,

• повышение резкости,

• кадрирование.

Как правило, ведется потоковая обработка сотен изображений, индивидуальная «шлифовка» каждого из них возможна только для небольшого круга уникальных источников.

При цветокоррекции на первый план выходит тщательная подготовка помещения, где ведется оцифровка - создание режима «темной комнаты». Периодически проводится калибровка аппаратуры. Для каждого вида оборудования отработаны несколько программных сценариев «доводки» изображения до необходимого уровня качества средствами Adobe Photoshop и FastStone Image Viewer.

Цифровая реставрация изображения возможна разными способами. Можно выделить следующие:

• использование фильтра Unsharp Mask (нерезкая маска);

• изменение контурной резкости;

• анализ каждого из трех каналов на шумы в цветовом пространстве RGB и «очистка» от них изображения;

• перевод изображения в цветовое пространство Lab, выбор канала Lightness (яркость) и применение для него фильтров, повышающих резкость [7].

Кадрирование для рукописей выливается в отдельную «ручную» операцию, довольно трудоемкую и не допускающую автоматизации.

Пример конечного изображения приведен на рис. 2.

Г

L N

h

NMJKMMWHN НЙЖИуМАЛМ!*» "I rirMHirUfmtiJ^i-'KHli^M. Hilf и

аъмм'пгт^'Ёмтршк»! * iwii J ,ы M Л'к i с Ti м Ii*< 'iff* H ИЛ \ Í Р ' V M Aviffc ММНАЪШШЛИ r»KIJKi|M'l|

,1>МИ "f * ИМ'р-ЦН 1»ЛЧ'Г|НШ Urtlï.Klit • fljMMimuif nirH H MïàrlH Hilf WAIT* * «»^«N'ttfi/niTI

ufljütH«im ll(l|Uh UI'l't • wílMl^HIUM M№W Ul|llttWIH«Vn * fl^íMWriOMÍlf.

ÍAt#Vittl«'* ÍTIVПрИЛ'гН tw

I«Ц í ЧШ1МЛ N "W 'WW «M» 14 .

£ Ч'ЦЛЧОт1 MUflïTIT [Лр. A^tutiu » MU

fe.

Рис. 2. Фрагмент № 16. Евангелие-тетр. Рукопись конца XV в. из собрания М. Н. Тихомирова

Fig. 2. Fragment № 16. Gospel-Tetra. A manuscript of the late XV century from M. N. Tikhomirov's collection

Для ряда источников требуются сравнительно сложные алгоритмы обработки изображений. Рассмотрим их на примере рукописей с угасающим текстом. Проблема является весьма актуальной, поскольку, во-первых, при этом фиксируется текущий образ источника, то есть проводится своеобразная «цифровая консервация» и, во-вторых, появляется возможность улучшить читаемость текста («цифровая реставрация»). В качестве основы для создания полноцветных цифровых копий использовались методы восстановления, ретуши фотографий, изложенные, например, в работе [7].

Перейдем к изложению процесса обработки изображения применительно к рукописи № 373 из собрания академика М. Н. Тихомирова - сборнику с летописными статьями конца XVI - начала XVII в. Этот источник имеет дефекты и сложности прочтения текста, связанные с «прожиганием» чернилами бумаги и сильным ее загрязнением.

Обработка изображений состоит из трех этапов:

• корректировка цвета и яркости [3];

• удаление шума, корректировка резкости;

• отделение текста от фона.

По нашему мнению, основным здесь является создание режима «темной комнаты», то есть стабилизация условий освещения. Без этого потоковая обработка исходных изображений невозможна или, по крайней мере, будет весьма затруднена.

На втором этапе изучаются красный, зеленый и синий каналы, как показано на рис. 3 (л. 367 об. -л. 368). Для этого:

• создаем корректирующий слой как Channel Mixer сложением 60% красного и 40% зеленого каналов (флажок Monochrome) и режимом наложения Screen;

• убираем шум операцией «пыль и царапины», улучшаем резкость, используя операцию «умная резкость» [6].

На третьем этапе для отделения текста от букв, просвечивающих с обратной стороны бумаги, и ее загрязнений делаем следующие операции. Выбираем красный канал, переводим изображение в градации серого и анализируем распределение уровней, которое имеет два четко выраженных пика - рисунок 4. Подбираем новое значение белого (равное в нашем случае 160), которое удаляет фон бумаги, просвечивающие с обратной стороны буквы и, как побочный эффект, красные киноварные буквы. Это во многих случаях помогает лучше читать основной текст, состоящий из букв черного цвета. Естественно, что для каждого источника, в зависимости от характера лишних, ненужных деталей, выбор каналов и уровней индивидуален. (Для подробного самостоятельного анализа полученных результатов обратитесь к файлам по адресу http://www.spsl.nsc.ru/rbook/examples/Tix-373/index.html)

Аналогичная процедура цифровой консервации и реставрации была проделана для рукописи № 284 из собрания М. Н. Тихомирова. Здесь ценность работы была увеличена тем, что по оценке лаборатории реставрации ГПНТБ СО РАН настоящая (физическая) консервация источника невозможна из-за проблемы растекающихся чернил.

А. В. Шабанов, 2017, № 2, с. 101-104 / A. V. Shabanov, 2017, no 2, pp. 101-104

Рис. 3. Три канала исходного изображения для л. 367 об. - л. 368 (фрагменты)

Fig. 3. Three channels of the original image for fragments L. 367 ob. - L. 368

Рис. 4. Уровни, установка белого равного 160 Fig. 4. Levels, setting the white equal to 160

Примеры исходного и «реставрированного» изображений приведены на рисунке 5.

Рис. 5. Лист 1 Fig. 5. Sheet 1

Для досконального изучения описанных выше схем можно обратиться к сценариям, доступным по адресу http://www.spsl.nsc. ru/rbook/examples/index1. html.

Использование современных методов обработки изображений позволяет осуществлять цифровую реставрацию рукописных книг.

Список источников

Шабанов А. В. Факторы, влияющие на выбор технологии оцифровки русских старопечатных и рукописных книг // Библиосфера. 2008. № 4. С. 46-48.

Дергачёва-Скоп Е. И., Алексеев В. Н., Бородихин А. Ю., Шабанов А. В. Создание цифровой библиотеки древнерусских рукописных и старопечатных книг современных сибирских хранилищ как единого информационно-коммуникационного пространства и использование ее в учебном процессе гуманитарного факультета НГУ // Регионы России для устойчивого развития: образование и культура народов Российской Федерации : материалы Меж-дунар. науч.-практ. конф. (Новосибирск, 25-27 марта 2010 г.). Новосибирск, 2010. С. 297-306.

3. Шабанов А. В. Сравнение установок для оцифровки русских старопечатных и рукописных книг и методы обработки изображений // Библиосфера. 2010. № 2. С. 30-32.

4. Бородихин А. Ю., Шабанов А. В. Цифровые копии учительного Евангелия ранней рукописной и печатной традиции // Библиосфера. 2012. Спецвып. С. 94-96.

5. Шабанов А. В. Технология создания полнотекстовой базы данных «Рукописи из собрания академика М. Н. Тихомирова» // Библиосфера. 2014. № 3. С. 73-76.

6. Баженов С. Р., Бородихин А. Ю., Шабанов А. В. Цифровая библиотека «Книжные памятники Сибири»: создание электронных версий рукописей территориальных собраний ГПНТБ СО РАН // Книга. Культура. Образование.

ж ж ж

ИНФОРМАТИКА / INFORMATICS

Инновации : материалы II международ. проф. форума (4-12 июня 2016 г., г. Судак) ; Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса : материалы 23-й междунар. конф. «Крым 2016». Москва, 2016. 1 электрон. опт. диск (CD-ROM).

7. Айсманн К., Палмер У. Ретуширование и обработка изображений в Photoshop. Москва : Вильямс, 2008. 560 с.

References

1. Shabanov A. V. Factors influencing the choice of technology of digitizing Russian old printed books and manuscript. Bib-liosfera, 2008, 4, 46-48. (In Russ.).

2. Dergacheva-Skop E. I., Alekseyev V. N., Borodikhin A. Yu, Shabanov A. V. The creation of digital libraries of Russian old printed books and manuscript modern Siberian repositories as a single information and communication space and its use in the teaching process of humanitarian faculty of NSU. Regiony Rossii dlya ustoichivogo razvitiya: obrazovanie i kul'-tura narodov Rossiiskoi Federatsii : materialy Mezhdunar. nauch.-prakt. konf. (Novosibirsk, 25-27 marta 2010 g.). Novosibirsk, 2010, 297-306. (In Russ.).

3. Shabanov A. V. Comparison of systems for digitizing Russian old printed books and manuscript and image processing techniques. Bibliosfera, 2010, 2, 30-32. (In Russ).

4. Borodikhin A. Yu, Shabanov A. V. Digital copies of the didactic gospel of the early manuscript and printed tradition. Bibliosfera, 2012, sp. iss., 94-96. (In Russ).

5. Shabanov A. V. The technology of creating full-text database «Manuscripts from the collection of academician M. N. Ti-khomirova». Bibliosfera, 2014, 3, 73-76. (In Russ).

6. Bazhenov S. R., Borodikhin A. Yu, Shabanov A. V. Digital library «Book monuments of Siberia»: the creation of electronic versions of manuscripts territorial assembly of SPSTL SB RAS. Kniga. Kul'tura. Obrazovanie. Innovatsii: materialy II mezhdunarod. prof. foruma (4-12 iyunya 2016 g., g. Sudak) ; Biblioteki i informatsionnye resursy v sovremennom mire na-uki, kul'tury, obrazovaniya i biznesa : materialy 23-i mezhdunar. konf. «Krym 2016». Moscow, 2016. 1 CD-ROM . (In Russ).

7. Aismann K., Palmer U. Retushirovanie i obrabotka izobra-zhenii v Photoshop [Retouching and image processing in Photoshop]. Moscow, Williams, 2008. 560 p. (In Russ).

Материал поступил в редакцию 13.02.2017 г.

Сведения об авторе: Шабанов Андрей Васильевич - кандидат технических наук, старший научный сотрудник отдела редких книг и рукописей

i Надоели баннеры? Вы всегда можете отключить рекламу.