Научная статья на тему 'Обеспечение доступности информации в системах современного документооборота'

Обеспечение доступности информации в системах современного документооборота Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
715
70
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕКТРОННЫЕ АРХИВЫ / КАЧЕСТВО ИЗОБРАЖЕНИЯ / ТЕКСТОВАЯ ИНФОРМАЦИЯ / КОМПОЗИТНЫЕ ТЕХНОЛОГИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Талалаев А. К., Чечуга О. В., Череватый Р. С.

Анализируются преимущества и недостатки хранения документации с помощью микрографических архивов. Рассмотрены вопросы сохранения качества сканированной информации, построения поисковой системы, а также возможность использования композитных технологий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Обеспечение доступности информации в системах современного документооборота»

Список литера туры!

1. Абламейко С.В., Лагуновский Д.М. Обработка изображений: технология, методы, применение. Минск : Ин-т технической кибернетики НАН Беларуси, 1999. 300 с.

2. Царик С. Автоматизация Photoshop CS2. Санкт-Петербург : Питер, 2007, 288 с.

3. The Society For The Study Of Manga Techniques. How to Draw Manga Volume 2 Compiling Techniques. Tokio: Graphic-sha Publishing Co., 2000.120 p.

A. Ageeva

Image information processing technology via using screentones

Current methods of screentones using in prepress processing of monochrome graphic were described. Their development stages were analysed and new method of screentones using is proposed.

Получено 19.01.09

УДК 778.1

А.К. Талалаев, д-р. техн. наук, проф., зав. кафедрой, (4872) 35-24-93, tppzi@uic.tula.ru (Россия, Тула, ТулГУ),

О.В. Чечуга, канд. техн. наук, доц.,(4872) 35-24-93, tppzi@uic.tula.ru (Росси, Тула, ТулГУ),

Р.С. Череватый, канд. техн. наук, доц., (4872) 35-24-93, tppzi@uic.tula.ru (Росси, Тула, ТулГУ)

ОБЕСПЕЧЕНИЕ ДОСТУПНОСТИ ИНФОРМАЦИИ В СИСТЕМАХ СОВРЕМЕННОГО ДОКУМЕНТООБОРОТА

Анализируются преимущества и недостатки хранения документации с помощью микуорафическир архивов. Рассмотрены вопросы сохранения качества сканированной информации, построения поосковой системы, а также возможность использования композитных технологий.

Ключевые слова: электронные ауххвы, качество изображения, текстоваяин-фоумация, композитные технологи.

Для целей фиксации информации, ее обмена и хранения используются различные носители:

аналоговые (бумага, аудио- и видеоносители);

цифровые (диски, оптические и магнитные устройства и т.д.).

С точки зрения использовани информацию можно раз делить на: оперативной (срок хранения до 1- 5 лет);

среднесрочной (срок хранения от 5 до 75 лет);

долговременной (срок ханения от 75 лет и, в идеале, неограниченно). Основным носителем информации до сих пор является бумажного носителя, достоинствами которой являются:

возможность использования без дополнительных технических средств;

факсимильность; относительна дешевизна.

К недостаткам бумажного носителя можно отнести: потерю физических свойств с течением времени и в зависимости от условий хранения;

большие площади, занимаемые под хранение документов; ручной поиск и трудности передач информации по канаам связи. Для целей сохранности бумажных документов в настоящее время используется технология микрофильмирования, котора позволяет:

обеспечить сохранность информации до 300 - 500 лет, при условии соблюдения стандартов по съемке и хранению;

сократить площади, занимаемые под хранение документации, в 10-20 ра;

использовать микрофильм в качестве подлинника при решении ра-личного рода юридических вопросов (ГОСТ 13.1.101-93. «Микрофильм на правах подлинника»).

К недостаткам можно отнести трудности с оперативным доступом к информации на микрофильме и ее передачи по каналам связи.

В связи с бурным равитием средств вычислительной техники значительные объемы информации (базы данных, программные средства и др.) хранятся в электронной (цифровой) форме. Для хранения цифровой информации используются различного рода магнитные, магнитнооптические, оптические и др. носители информации.

К преимуществам хранения информации в цифровой форме относятся оперативный, многопользовательски доступ к информации по каналам связи; копирование информации без потери качества в каждом поколении копи; автоматическая индексация и поиск информации; возможность редактировать информацию с использованием компьютера.

К недостаткам можно отнести: неопределенность в сроках сохранности информации (по некоторым данным от 2...3 лет до 20...30 лет и более); большую стоимость оборудования и сетевой инфраструктуры, требующих специаистов для работы с ними; необходимость замены новыми продуктами и методами средств, процессов, программ для записи и хранения информации с регулярностью рав 3.5 лет; трудности юридических аспектов использования цифровой информации.

Вопросы сохранности информации в настоящее время являются очен актуаьными. По данным International Data Corporation и журнаа «Document Management», в мире насчитывается более 8 млрд чертежей

и только 15 % из них находится в CAD-формате (т.е. пригодны для работы в CAD-системах) (без учета данных по Росси).

Большие массивы документации хранятся на бумажных но сете лях в государственных архивах, архивах министерств и ведомств, хранилищах страхового фонда, библиотек, музеев, предприятий и т. д. Оценка хранимых объемов документации затруднительна (например, только в Российской национальной библиотеке хранится около 40 миллионов ед.).

В связи с тем, что для долговременного хранения документации в настоящее время основной остается технологи микрофильмирования, большие объемы информации хранятся в виде микроформ.

Доступность информации определяется двумя факторами:

возможностью найти источник хранен ия информации;

возможностью доступа к соответствующему источнику.

В традиционной технологи с использованием бумажных носителей первую задачу решают различного рода каталоги и информационнопоисковые системы. Втора задача решается путем поиска необходимого документа в хранилище архива (библиотеки, организации) и выдачи его или его копии (на бумаге, микрофильме) потребителю.

Этой технологии присущи определенные недостатки: неоперативный доступ (off-line) к информации; длительное время поиска требуемого источника данных; упрощенный поисковый аппарат; значительные трудности при последующей обработке получены данных с использованием вычислительной техники.

Современное состояние средств вычислительной тех ники позволяет устранить многие из вышеперечисленных недостатков, однако требует предварительного перевода документа в электронную форму и предъявляет определенные требования к качеству сканированного изображения документа.

С точки зрения качества изображения сканированного документа можно выделить три уровня представ лени.

1. Уровень просмотра, когда можно определить сущность хранимой информации, однако при этом может быть потеряно много мелких и важных деталей. Этот уровень характерен для работы на персональном компьютере в локальной сети учреждения или сети Интернет и характеризуется разрешением отображения 70.100 dpi с некоторой потерей полутонов (уровень разрешения стандартного монитора персонального компьютера). Основными ограничениями в этом случае являются объем и время передачи данных по сети (чем выше разрешение, тем больше объем файла изображения. Увеличение разрешения в 2 раза влечет увеличение файла в 4 раза).

2. Уровень детализации. Этот уровень характеризуется возможностью отображения большинства мелких деталей изображения и требует разрешения не менее 600 dpi, однако для большеформатных изданий (чертежи, газеты) может потребоваться разрешение более 600 dpi.

3. Уровень факсимильности. Этот уровень характеризуется адекватной передачей всех деталей документа и требует высокого разрешения и качества воспроизведения полутонов.

Сканирование документов с целью обеспечения возможности последующего использования и обработки средствами вычислительной техник дает на выходе изображение в растровой (цифровой) форме с качеством, соответствующим рассмотренному выше уровню детализации (в основном). Это позволяет осуществлять визуальный просмотр документа, хранение, обработку и передачу его по каналам связи. Существенными недостатками подобного способа представления информации являются невысокое качество получаемого изображения; большие объемы получаемых данных; невозможность проводить поиск информации внутри файла изображения.

Для обеспечения возможности работы с текстовой информацией, хранящейся в файле изображения, необходимо осуществить ее выделение и преобразование в текстовую форму. Подобное преобразование осуществляется программами распознавания текста (программа оптического распознавания символов, ил OCR).

В настоящее время существует широкая номенклатура систем OCR, обеспечивающих точность распознавания кириллических текстов до 99,5 % в зависимости от качества исходного изображения. Подобные системы требуют сканирования текстов с разрешением от 200 до 600 dpi, что определяется минимальным размером используемого в документе шрифта.

В качестве примера подобных систем, хорошо зарекомендовавши себя на российском рынке, можно привести программу CuneiForm фирмы «Cognitive Technologies Ltd» (Росси), FineReader фирмы «Bit Software» (Россия).

Преобразование цифрового изображения документа в текстовую форму позволяет проводить его просмотр и обработку широко распространенными стандартными текстовыми редакторами, а также выполнять поиск информации внутри такого документа с помощью различных поисковых систем.

Существующие поисковые системы условно можно разделить на следующие классы:

1. Построенные по классификационному принципу;

2. Использующие ключевые слова;

3. С возможностью полнотекстового поиска;

4. С использованием гипертекстовых ссылок.

Первый класс обеспечивает доступ к документации по стою регламентированным классификационным признакам, набор которых может варьироваться от системы к системе, но внутри каждой из них они фиксированны. Примером подобной системы может служить организация библиотечных фондов, архивов и т.п. Существенный недостаток - для успеш-

ного поиска документа необходимо знать все его классификационные признаки.

Поисковые системы второго класса позволяют искать иформацию по комбинации признаков (ключевых слов), которые, по мнению составляющего запрос, содержатся в искомом документе (ии группе документов). Ключевые слова в запросе могут объединяться с помощью операторов булевой алгебры. Ключевые слова могут быть заданы не полностью, что расширяет область поиска и особенно ценно в русски текстах.

Основными достоинствами подобных систем являются компактность базы ключевых слов и высока скорость поиск. Недостатки - необходимость предварительного создани базы ключевых слов и соответственно невысока точность поиска.

В системах третьего класса поиск документа проводится путем задания в запросе «обрацов» - слов, частей слов или целых понятий, которые ищутся в теле документа. Основные достоиства подобных систем -высока точность поиск и гибкость языка запросов. Недостатки - значительное время реакци системы и возможный высоки информационный «шум» в результатах поиска, а также необходимость наличия полных текстов документов в электронной форме (как следствие, высока трудоемкость выделени текстов из бумажных документов, значиельные объемы хранимой иформации).

Поисковые (справочные) системы четвертого класса используются при построении энцилопеди, справочниов, словарей. Особенно часто они стали использоваться пи появлении мультимединых энцилопеди на СБ-КОМ и широко применяются в сети Интернет. Они характеризуются возможностью гиертекстовых (надтекстовых) переходов между частями текста, связанными каким-либо общим понятием ии признаком.

Достоиством систем четвертого класса является удобство использования. Недостатки: сложность организаци гипертекстовых связей.

Особый интерес для применени в рассматриваемой области могут представлять так наываемые двухконтурные информационно-поисковые системы, в которых функции поиск и хранени информаци разделены. Для поиска иформации используются баы данных, организованные по одному или нескольким рассмотренным выше способам. Просмотр документов осуществляется с использованием второго контура, в котором хранятся факсимиьные изображени документов. Второй контур может быть организован на бае средств мирографи ии вычислиельной технии, т.е. изображени документов могут быть замикрофиьмированы ии ск-ниовны и записаны в архивы цифровых изображени на компьютерных носителях.

Перспективно использование композиных технологий, когда долговременное хранение документов организовано средствами микрографии, а для оперативного доступа и обработки иформации используются электронные архивы цифровых изображений.

Список литера туры!

1. Наймарк А. Микрофототехника - предмет и праетика. М. : Мир, 1974. 75 с.

2. Талалаев А.К. Диалоги о репрографии. Тула : Пересвет, 2001. 109 с.

A. Talalaev, O. Chechuga, R. Cherevaty

Maintenance of availability of the information in systems of modern document circulation

In given clause the analysis of advantages and lacks of storage of the documentation by means of micrographic archives is lead. Questions of preservation of quality of the scanned information, construction of search system, and as an opportunity of use of composit technologies are considered.

Получено 19.01.09

УДК 621.396.2

В.А. Селшцев, канд. техн. наук, доц., (4872) 35-24-93, tppzi @uic .tula.ru (Росси, Тула, ТулГУ),

О.В. Чечуга, канд. техн. наук, доц., (4872) 35-24-93, tppzi @uic .tula.ru (Росси, Тула, ТулГУ),

М.Н. Наседкин, канд. техн. наук, доц., (4872) 35-24-93, tppzi @uic .tula.ru (Росси, Тула, ТулГУ)

ПОСТРОЕНИЕ СИСТЕМЫ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ ПРЕДПРИЯТИЯ

Рассматриваются следующие этапы построения системы информационной безопасности предприятия: определение целей создания информационной безопасности, анализ источников проблем, идентификация уязвимостей, оценка рисков, принятие решения.

Ключевые слова: информационная безопасность, идентификация уязвимостей, оценка рисков, модель злоумышленника, модельугроо.

Определение целей создания информационной безопасности

Специалисты в области защиты информации в своей практике сталкиваются с решением большого количества вопросов, самым первым из которых является определение цели. Можно попытаться при помощи руководства и работников организации понять, что же на самом деле нужно защищать и от кого. С этого момента начинается специфическая деятельность на стыке технологий и основного бизнеса, которая состоит в определении того направления деятельности и (если возможно) целевого состояния обеспечения информационной безопасности (ИБ), которое будет сформулировано одновременно и в бизнес-терминах, и в терминах ИБ. В

152

i Надоели баннеры? Вы всегда можете отключить рекламу.