Научная статья на тему 'Применение формализованных методов аналитико-синтетической переработки информации в библиотечно-библиографической деятельности'

Применение формализованных методов аналитико-синтетической переработки информации в библиотечно-библиографической деятельности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
556
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение формализованных методов аналитико-синтетической переработки информации в библиотечно-библиографической деятельности»

С целью учета использования распределенного учебного каталога корпорации внешними пользователями должна вводиться система лицензирования, т. е. продажа возможности использования электронного каталога на определенный срок, либо использование, неограниченное во времени.

Одним из условий работоспособности всей корпоративной системы является использование единого стандарта, причем, использование его должно быть по единым правилам для всех библиотек-участниц корпорации, т. к. это позволит сформировать электронную образовательную среду как ресурсно-технологическую базу при подготовке специалистов информационной среды.

Литература:

1. Морозов, Д. А. Использование информационных технологий во взаимодействии библиотек как фактор модернизации образовательной деятельности [Текст]/ Д. А. Морозов // III международная научно-практическая конференция «Пути модернизации научно-исследовательской и образовательной деятельности в сфере культуры и искусств»», 5 апреля 2013. -Краснодар, 2013. - С. 165-167.

2. Сидоренко, В. С. Мобильный компьютинг в модернизации образовательных систем [Текст] / В. С. Сидоренко, Д. А. Морозов // Международная научно-практическая конференция молодых ученых. - Краснодар, 2012. - С. 244-246.

В. В. Салий, Э. В. Кузьмина ПРИМЕНЕНИЕ ФОРМАЛИЗОВАННЫХ МЕТОДОВ АНАЛИТИКО-СИНТЕТИЧЕСКОЙ ПЕРЕРАБОТКИ ИНФОРМАЦИИ В БИБЛИОТЕЧНО-БИБЛИОГРАФИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ

Происходящие изменение в современной информационной среде повлекли за собой изменения в работе библиотек и библиотечно-библиографической деятельности. Большинство процессов библиотечно-библиографической деятельности требуют умения ориентироваться в документальном потоке, устанавливать связи между документами, определять распространенность документов разной тематики, видов, предприятий и организаций. Усиливается тенденция обращений к электронным ресурсам и электронным документам в процессе спра-вочно-библиографического обслуживания в деятельности библиотек.

Цель смыслового анализа документального потока состоит в том, чтобы установить, какими именно структурными единицами выражаются фрагменты связного текста, понять, как они располагаются, и уметь проводить с ними нужные операции. Рассмотрим в этой связи некоторые подходы к смысловому анализу.

Для текстов документов, как правило, характерна более или менее регулярная организация. Большинство из них состоит из частей, которые между собой тесно связаны: введение, основной части и заключения. Разделение текста на части отражает логику и специфику исследования проблемы. В результате связи частей текста образуется такое его свойство, как целостность.

Не менее важной характеристикой связного текста является то, что называется его денотативной структурой.

Различаются внешняя и внутренняя форма при рассмотрении текста как целостного комплекса. Внешняя форма состоит из языковых средств, с их помощью реализуется замысел автора текста. Внутренняя форма представляет содержание, которое формируется в процессе понимания и соотношения с внешней формой не поэлементно, а в целом.

Содержание текста как результат понимания соответствует денотативному уровню отражения (предметному значению). Единицы текста, которые формируются в интеллекте человека, когда он читает и осмысливает текст, соответствуют денотатам.

Таким образом, существенным элементом понимания текста является выделение и описание соответствующих ему денотатов. Процедура выделения денотатов не зависит ни от членения текста на предложения, ни от того, какими терминами обозначаются в разных предложениях описываемые объекты. Анализ, позволяющий получить такое описание, называется денотативным.

В зависимости от цели исследования можно выделить несколько подходов к такому анализу. Один из них связан с решением задач, которые принято относить к области искусственного интеллекта. С этой точки зрения адекватным средством представления денотативной структуры текста является язык семантических сетей. Трактовка понятия «семантическая сеть» у разных авторов различна, однако общим положением является то, что семантическая сеть есть ориентированный граф, узлы которого представляют объекты, о которых речь идет в тексте, и, возможно, их свойства и отношения между ними. При одних трактовках дуги семантических сетей могут изображать смысловые позиции объектов относительно представленных в семантических сетях отношений, а в других трактовках - сами эти отношения. В последнем случае дуги помечаются именами отношений, а узлы - именами свойств; узлы при этом представляют объекты описания, различаемые в тексте.

Веб-сайты, в том числе и фирменные веб-сайты, образованные в результате не только документографического или фактографического анализов, но и анализа концептографическо-го, предусматривают исследование (на основе существующего знания) содержащихся в документах фактов и концепций с точки зрения их достоверности и истинности. При этом устройства, способы и материалы анализируются с точки зрения непротиворечия знанию, лежащему в их основе, а также в аспектах технико-экономической целесообразности, эффективности и перспективности.

Назначение формализованного подхода к процедуре свертывания заключается в повышении качества подготавливаемых вторичных документов, сокращении временных и интеллектуальных затрат на их подготовку.

Значительно увеличивается необходимость в справочно-библиографической деятельности библиотек предоставления специалистам фирменной информации на основе свертывания фирменных веб-сайтов, что позволяет в краткой форме получить представление о данной отрасли и сфере деятельности предприятия.

Однако только оперативно выявленные сведения об изменениях внешней среды в сопоставлении с внутриорганизационной информацией, дают возможность точно сформулировать ответ на полученный запрос от специалиста, что является важной составляющей в аналити-ко-синтетической переработке информации.

При свертывании информации человеку постоянно приходится решать очень сложную интеллектуальную задачу: как отделить в тексте первичного документа основное смысловое содержание от не основного, главное - от не главного, существенное - от не существенного. Качество вторичных документов существенно зависит от личностных характеристик человека, осуществляющего свертывание информации: образования, знания предметной области, стажа и опыта работы и др. Как уже указывалось, на один и тот же текст разные люди, как правило, составляют разные рефераты и аннотации; в то же время, один и тот же человек на один и тот же текст в разное время составляет различные вторичные документы.

Свертывание информации - сложный интеллектуальный процесс, на который существенным образом влияют такие факторы, как тип и вид, жанр, отрасль, особенности структуры и содержания первичного документа. Так, например, с точки зрения типа структуры можно условно поделить тексты на тексты с «гибкой» (не четкой, свободной) и «жесткой» структурой. Жесткая структура означает наличие в тексте повторяющихся в обязательном порядке элементов.

Отличительной особенностью на этом этапе является использование формальных текстовых признаков: маркеры используются для распознавания всех имеющихся в тексте аспектов содержания, индикаторы - для выявления информации, которую автор первичного документа выделяет как наиболее значимую и подытоживающую, коннекторы используются для определения смысловых связей в анализируемом документе.

Формализованный синтез предполагает отбор и включение в состав вторичного документа наиболее важных в смысловом отношении аспектов содержания.

Отличительная особенность этой сложной интеллектуальной процедуры состоит в том, что действия человека, осуществляющего свертывание информации и, прежде всего, отбор наиболее значимых аспектов, ограничены перечнем тех аспектов содержания, которые подлежат включению в составляемый вторичный документ: аннотацию или реферат, обзор.

Следует подчеркнуть, что данная методика носит формализованный, а не формальный характер. Формализация действий человека при свертывании информации проявляется в следующем:

- составление библиографического описания документа осуществляется в строгом соответствии с требованиями ГОСТ 7.1-2003 Библиографическая запись. Библиографическое описание. Общие требования и правила составления;

- анализ текста (поиск и выявление аспектов содержания) ведется по заранее заданному перечню аспектов содержания;

- распознавание аспектов в тексте осуществляется на основании заданного перечня маркеров;

- структура вторичных документов жестко регламентирована: в его состав могут входить только те аспекты, которые имеются в заданном перечне;

- оформление текста аннотаций и рефератов ведется в соответствии с требованиями ГОСТ 7.9-95 «Реферат и аннотация. Общие требования».

Однако использование формализованной методики не исключает интеллектуальных действий человека. Прежде всего, это касается процедуры редактирования текста вторичных документов, предполагающей такие интеллектуальные действия, как устранение дублирования в тексте, достижение связности и логичности текста, четкости и лаконичности изложения.

Наиболее широкое распространение формализованные методы свертывания нашли в деятельности издательств, органов информации, библиографических служб и библиотек, поскольку, именно там, в массовом масштабе осуществляется аналитико-синтетическая переработка информации, а реферирование и аннотирование рассматриваются как массовые технологические процессы. Вместе с тем, знание методов формализованного анализа и формализованного синтеза весьма полезно любому человеку, перед которым стоит задача овладения продуктивными способами работы с текстом документов и извлечения наиболее ценной смысловой информации.

Необходимость формализации свертывания информации и применения формализованных методов влечет:

1. Массовость, масштабность процессов аналитико-синтетической переработки (индексирования, аннотирования, реферирования), осуществляемых в современных издательствах, библиотеках и службах информации. Поток информации, подлежащий свертыванию, измеряется сотнями тысяч первичных документов.

2. Субъективность процессов анализа и синтеза информации при свертывании информации, порожденная сложностью объектов аналитико-синтетической переработки - текстов первичных документов.

Характеристику формализованного метода свертывания информации целесообразно начать с выяснения смысла понятия «формализация».

Формализация - это такой путь исследования каких-либо объектов (процессов), когда их содержание познается с помощью выявленных элементов его формы. В качестве объектов исследования при аналитико-синтетической переработке и свертывании информации выступают тексты документов. При этом происходит замена реального объекта или процесса его формальным описанием, т. е. его информационной моделью.

Таким образом, формализация связана с моделированием. Формализовать можно как оформление текста, так и его содержание.

Формализация оформления сводится к использованию бланков, формуляров, шаблонов заранее определённой и часто законодательно утверждённой формы.

Целью формализации содержания текста является его однозначное понимание. Для этого используются различные способы, включая и аспектно-маркерный метод анализа.

Автоматизация процессов аналитико-синтетической переработки информации и развитие информационно-поисковых систем тесно связано с формализацией процессов свертывания документов.

К направлению автоматизированного свертывания относятся работы по автоматическому реферированию. Это направление занимает промежуточное положение между минимальным уровнем свертывания - переводом и максимальным - индексированием, однако оно по своему характеру очень специфично, поскольку сводится к экстрагированию (извлечению) из

документов минимальных релевантных фрагментов, некоторая совокупность которых и образует широкий спектр вторичных документов - различные виды аннотаций, рефератов, реферативных аннотаций, самостоятельных фрагментов и их синтезируемых производных -реферативных указателей, дайджестов, реферативных обзоров, квазихристоматий и пр.

Все эти вторичные документы, являющиеся результатом аналитико-синтетической переработки первичного документального потока, рассчитаны на удовлетворение как частных (индивидуальных), так и типовых (потенциальных) информационных потребностей различных категорий специалистов.

Литература

1. Аналитико-синтетическая переработка информации [Текст]: учеб. - метод. пособие / сост. Л. Р. Вахрушева. - Ижевск: Изд-во «Удмуртский университет, 2011. - 100 с.

2. Захарчук, Т. В. Аналитико-синтетическая переработка информации [Текст]: учеб. -практ. пособие / Т. В. Захарчук, И. П. Кузнецова. - СПб: Профессия, 2011. - 103 с. - (Азбука библиотечной профессии).

3. Салий В. В. Аналитико-синтетическая переработка фирменных веб-сайтов в справочно-библиографической деятельности библиотек: автореф. дис.... канд. пед. наук: 05.25.03 / Салий Виктория Владимировна; [Место защиты: Краснодар. гос. ун-т культуры и искусств]. - Краснодар, 2011. - 25 с.

Э. В. Кузьмина, В. В. Салий

МЕТОДОЛОГИЯ «АРХИТЕКТУРА ПРЕДПРИЯТИЯ» В КОНЦЕПЦИИ ПРОЕКТИРОВАНИЯ АВТОМАТИЗИРОВАННЫХ БИБЛИОТЕЧНЫХ СИСТЕМ

Характерной чертой современного общества является высокая скорость изменения внешней среды, влияющей на бизнес-структуры. Автоматизированные системы, обслуживающие и реализующие бизнес-процессы организации, являются определяющими в обеспечении конкурентоспособности любой структуры. Поэтому в проект информационной системы должен быть заложен определенный запас прочности, обеспечивающий динамику ее развития и требуемую функциональность на перспективу. Для решения данной проблемы в настоящее время используется новый подход к автоматизации предприятия, основывающийся на методологии «архитектура предприятия». Концепция архитектуры предприятия является воплощением комплексного применения методов системного, функционального и структурного анализа, для обеспечения целостного представления организации с разных точек зрения.

Современная библиотека любого уровня может быть рассмотрена как предприятие исходя из сложившегося подхода к определению предприятия. В рамках данного подхода понятие «предприятие» трактуется достаточно широко. Это может быть целая организация или отдельная бизнес-структура, или корпорация, состоящая из цепочки организаций, объединенных выпуском группы рыночных продуктов. Предприятием может считаться любая структура, имеющая следующие признаки:

- наименование с указанием организационно-правовой формы;

- собственное имущество, которым структура отвечает по обязательствам, возникающим в процессе финансового взаимодействия, в том числе и перед бюджетом;

- право заключать все виды сделок;

- право выступать в суде в качестве истца и ответчика;

- самостоятельный финансовый баланс и предоставление отчетности в фискальные органы.

Соответствие библиотеки данным признакам позволяет при проектировании архитектуры автоматизированной библиотечной информационной системы (АБИС) рассматривать библиотеку как предприятие, реализующее собственные бизнес-процессы.

В то же время до сих пор не существует информационных систем комплексной реализации бизнес-процессов в библиотеке. Комплексная автоматизированная библиотечная информационная система выстраивается в настоящее время как набор программных продуктов,

i Надоели баннеры? Вы всегда можете отключить рекламу.