Научная статья на тему 'Факторы, влияющие на выбор технологии оцифровки русских старопечатных и рукописных книг'

Факторы, влияющие на выбор технологии оцифровки русских старопечатных и рукописных книг Текст научной статьи по специальности «Прочие технологии»

CC BY
367
87
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Библиосфера
ВАК
Область наук
Ключевые слова
РЕДКИЕ КНИГИ И РУКОПИСИ / ЦИФРОВЫЕ БИБЛИОТЕКИ / ОБРАБОТКА ИЗОБРАЖЕНИЙ

Аннотация научной статьи по прочим технологиям, автор научной работы — Шабанов Андрей Васильевич

Рассмотрены технические вопросы в создании цифровых библиотек русских старопечатных и рукописных книг.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Факторы, влияющие на выбор технологии оцифровки русских старопечатных и рукописных книг»

Информатика

УДК 002.2+02 : 004 ББК 76.10 + 78.34 (2)

ФАКТОРЫ, ВЛИЯЮЩИЕ НА ВЫБОР ТЕХНОЛОГИИ ОЦИФРОВКИ РУССКИХ СТАРОПЕЧАТНЫХ И РУКОПИСНЫХ КНИГ

© А.В. Шабанов, 2008

Государственная публичная научно-техническая библиотека Сибирского отделения Российской академии наук 630200, г. Новосибирск, ул. Восход, 15

Рассмотрены технические вопросы в создании цифровых библиотек русских старопечатных и рукописных книг.

Ключевые слова: редкие книги и рукописи, цифровые библиотеки, обработка изображений.

Процесс получения высококачественной цифровой копии редкой книги является весьма трудоемким и требует тщательного учета многих (десятков) факторов.

В настоящей работе подробно характеризуются только самые основные факторы, влияющие на конечный результат оцифровки на примере русских старопечатных и рукописных книг: функции системы, состав коллекции, аппаратура, прикладное программное обеспечение, форматы данных, система резервирования первичного архива, связь с научным описанием источника, учет возможности развития как по функциям, так и по объемам.

1. Функции системы

Цифровая копия редкой книги может создаваться с различными целями и, соответственно, функции создаваемой информационной системы также различаются.

Можно выделить пять базовых вариантов, для которых требования к оцифровке существенно отличаются:

1. Общая характеристика книжного памятника.

2. Культурно-просветительские задачи.

3. Научно-исследовательская и учебная деятельность.

4. Полиграфическое воспроизведение первоисточника.

5. Создание страховой копии.

При этом во время процедуры оцифровки требуется контролировать следующие параметры: разрешение, адекватность цветопередачи, необходимость хранения архива первичных изображений, полноту оцифровки источника, форматы данных, коррекцию геометрических искажений страниц, степень воздействия на источник.

Приведенные выше варианты расположены в основном по степени усложнения процесса получения качественной цифровой копии.

В таблице (с. 47) сведены вместе все рассматриваемые нами случаи. Оценка степени воздействия на источник не включена в таблицу, так как это отдельная проблема, требующая комплексного изучения совместно с задачами реставрации. Кратко отметим только, что в первых двух вариантах степень воздействия обычно невелика, для 4-го и 5-го вариантов - одна из главных сложностей технического плана, требующая особых «колыбелей» для книги, расшивки источника и т. п. Третий вариант является промежуточным, т. е. иногда это резко усложняет оцифровку, а иногда - малосущественно.

2. Состав коллекции

При выборе технологии оцифровки состав коллекции влияет посредством необходимости учета следующих параметров: объем коллекции, форматы книг, сохранность страниц и качество переплета, степень раскрытия источника, размеры полей, соотношение размеров шрифтов и страниц, наличие различных записей на полях, отображение фактуры бумаги, следов воздействия времени на бумагу и краски.

Влияние части этих параметров очень понятно и легко связывается с необходимым разрешением при оцифровке и общим временем, требуемым на проведение всех работ. Однако главным при выборе являются опыт и значительное количество проб на самых разных книжных памятниках.

3. Аппаратура

Современные технические средства оцифровки охватывают широкий диапазон самых различных

Значения параметров в зависимости от варианта оцифровки

№ варианта Разрешение (dpi) Требования к адекватности цветопередачи Необходимость архива Полнота Форматы Коррекция геометрических искажений

1 Не более 200 Нет, несущественна Нет Нет jpeg, большое сжатие Не нужна

2 200 Умеренные Нет Нет jpeg, среднее сжатие Не нужна

3 200-400 Умеренные Да Да jpeg, jpeg 2000, tiff Умеренная

4 400-600 Высокие Нет Да tiff, raw, dng Обязательна, полная

5 Более 600 Предельные Да Да tiff, raw, dng и, возможно, внедрение новых форматов Обязательна, полная

потребностей. Для специалиста, создающего цифровые копии редких книг и рукописей, существенны следующие моменты: общая стоимость комплекса, требования к техническому обслуживанию и квалификации персонала, возможность работы со всеми (или хотя бы многими) единицами коллекции, требующими перевода в цифровую форму, предельно бережное обращение с первоисточниками, адекватная цветопередача. Скорость работы обычно менее важна.

На середину 2008 г. общая стоимость аппаратуры, способной качественно решать поставленную задачу, лежит (в зависимости от цели и коллекции) в диапазоне от 100 тыс. до 5 млн р. Требования к персоналу: грамотное использование персонального компьютера, особое внимание к обработке изображений и резервированию данных, весьма полезен опыт в области цифровой фотографии, необходима предельная аккуратность в работе.

«Универсальный» выбор технического комплекса пока невозможен. В качестве основного следует отметить все более широкое использование цифровых фотоаппаратов, хотя при этом также появляется целый шлейф сопутствующих технических проблем.

4. Прикладное программное обеспечение, форматы данных, система резервирования первичного архива

Основными задачами при «доводке» первичного изображения до конечного, адекватного поставленным целям, являются: цветокоррекция, повышение резкости, устранение геометрических искажений страницы и обрезка (кадрирование). В зависимости от вышеперечисленных пяти вариантов решать часть этих задач не требуется или они не очень существенны. Устранение геометрических

искажений страницы и обрезка (кадрирование) производятся или вручную, или с помощью специальных программных утилит. Частичная цветокоррекция возможна чисто программными средствами, но в целом это решается только с помощью отдельных технических средств и тщательной подготовки помещения, где ведется оцифровка. Повышение резкости возможно разными способами. Из чисто программных выделяется следующий: изображение переводят в цветовое пространство Lab, выбирают канал Lightness и для него применяют фильтры, повышающие резкость.

Следует особо отметить, что для решения многих задач обработки первичных изображений далеко не всегда необходимо использовать такие «тяжелые» программы, как Adobe Photoshop, -очень часто вполне достаточно и гораздо более простых средств по пакетной обработке изображений, например предлагаемых фирмой FastStone.

Форматы данных для оцифровки редких книг и рукописей сейчас делятся на обязательные (общепризнанные) и перспективные. Обязательные форматы - TIFF и JPEG (разных степеней сжатия). Перспективные - RAW, DNG, JPEG 2000.

Система резервирования первичных архивов изображений (если она нужна для достижения поставленной цели) обычна для современных хранилищ данных. На 2008 г. в идеале она состоит из трех частей: копии на DVD, копии в локальной сети и дублирование в удаленных глобальных системах поддержки сохранности информации.

5. Связь с научным описанием источника, учет возможности развития системы оцифровки

Высококачественная оцифровка позволяет существенно повысить уровень и возможности научного описания книжного памятника. Каких-либо

программных проблем при этом не возникает. Достаточно использовать современные языки разметки и сценариев.

Если задачи оцифровки стоят перед организацией на достаточно длительную перспективу, то следует тщательно продумать и оценить влияние рассмотренных нами факторов, чтобы расширять состав электронных коллекций, переходить к созданию цифровых библиотек.

Выводы

Возможности современных аппаратных и программных средств позволяют перейти к оцифровке собраний редких книг и рукописей широкому кругу фондов, библиотек, организаций России.

Материал поступил в редакцию 22.09.2008 г.

Сведения об авторе: Шабанов Андрей Васильевич - кандидат технических наук, старший научный сотрудник отдела редких книг и рукописей, тел.: (383) 266-10-91, e-mail: shabanov@spsl.nsc.ru

Информация

СИБИРСКИИ РЕГИОНАЛЬНЫЙ библиотечныи центр НЕПРЕРЫВНОГО ОБРАЗОВАНИЯ ГПНТБ СО РАН

Продолжение. Начало на с. 21

20. «Экономический потенциал библиотек сибирских территорий». Цель: научить слушателей определять место библиотеки в базовых экономических и социально-культурных процессах территории, выявлять факторы, формирующие внутреннее экономическое пространство библиотеки; обучить их методике проектирования библиотечной ситуации территории. Преподаватель: д-р пед. наук Л.А. Кожевникова (отдел научно-исследовательской и методической работы).

21. «Издательская деятельность библиотеки». Цель: ознакомление слушателей с действующими законодательными актами, нормативами, стандартами издательского дела, правилами издания и распространения печатной продукции, основами редакционно-издательской подготовки рукописей к печати (литературное и техническое редактирование, верстка, корректура, оформление), специфическими особенностями реализации собственной издательской продукции; дать представление об особенностях менеджмента и маркетинга, опыте использования компьютерных технологий в издательской и книготорговой деятельности ГПНТБ СО РАН. Преподаватель: канд. ист. наук Н.В. Вишнякова (редакционно-издательский отдел).

22. Научно-исследовательская работа в библиотеке. Семинар для аспирантов и соискателей; специалистов, участвующих в научно-исследовательской работе (НИР). Цель: формирование у слушателей представлений о научной работе (в том числе о диссертационном исследовании) в области библиотековедения, библиографоведения, книговедения и

прикладной информатики. Рассматриваются вопросы: методология, методика проведения научной работы; оформление научных результатов - подготовка текста, иллюстраций, списка литературы к научной работе, в том числе с применением компьютерных инструментов для их оформления; методика подготовки презентации (Power Point); ГОСТы СИБИД. Преподаватели: д-р пед. наук О.Л. Лаврик, д-р пед. наук Л. А. Кожевникова, д-р ист. наук С.Н. Лютов, д-р ист. наук А. Л. Посадсков, канд. ист. наук И. А. Гуз-нер, канд. пед. наук Е.Б. Артемьева, канд. пед. наук Т.А. Калюжная, канд. техн. наук С.Р. Баженов, Л.А. Мандринина (отдел научно-исследовательской и методической работы; лаборатория книговедения; лаборатория информационно-системного анализа; отдел автоматизированных систем; научно-организационный отдел; отдел научной библиографии).

23. «Крупнейшие библиотеки России, мира. Общественные библиотечные организации». Цель: ознакомление слушателей с историей создания и основными направлениями деятельности крупнейших библиотек мира; деятельностью международных, национальных, региональных библиотечных объединений. Преподаватель: канд. пед. наук Е.Б. Артемьева (отдел научно-исследовательской и методической работы).

24. Организация справочно-поискового аппарата библиотеки». Цель: ознакомление слушателей с системой справочно-поискового аппарата (традиционные каталоги и картотеки), методикой его организации. Преподаватель: А.А. Стукалова (отдел научной обработки документов).

продолжение на с. 55

i Надоели баннеры? Вы всегда можете отключить рекламу.