Научная статья на тему 'Категория сложности запросов при проектировании аналитических технологий'

Категория сложности запросов при проектировании аналитических технологий Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
277
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИТИЧЕСКАЯ ТЕХНОЛОГИЯ / ВЕБОМЕТРИЯ / ЗАПРОСЫ / КАТЕГОРИЯ СЛОЖНОСТИ ЗАПРОСА / ПРОЕКТИРОВАНИЕ / РЕСУРСЫ / СТАДИИ ПРОЕКТИРОВАНИЯ / БЛОК-СХЕМА / ТРУДОЗАТРАТЫ / ANALYTICAL TECHNOLOGY / WEBOMETRICS / QUERIES / CATEGORIES OF COMPLEXITY OF THE QUERY / DESIGNING / RESOURCES / STAGES OF DESIGNING / FLOWCHART / EXPENDITURES OF LABOR

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Гордукалова Галина Феофановна

Показана роль технологической школы С. А. Сбитнева в постановке проблемы типизации сложных запросов в 1970-е годы. Выделены категории сложности аналитических запросов: локальные, ассоциативные, комплексные. Определены характеристики каждой категории запросов по признакам числа используемых источников и методов, временных трудозатрат. Описаны основные средства, ресурсы и этапы проектирования аналитических технологий. Приведены примеры реализованных блок-схем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE CATEGORY OF THE COMPLEXITY OF QUERIES WITH THE DESIGN OF ANALYTICAL TECHNOLOGIES

The role of technological school of S. A. Sbitnev is shown in statement of the problem of typification of complex queries in the 1970s. The issue of Internet-analytics is discussed. The main course of its development is characterized as webometrics, technical measurements of streams by provider’s services, analysis on demand, videometrics. The active usage of Zipf-Bradford law is shown. The number of participants of Internet analytics is rapidly expanding. The problem of interpretation of measurements online is highlighted. The process of analysis and design tools in the intellectual technology and machine performance for complex queries is shown. The categories of queries were identified as local, associative, and complex. The characteristics of each category of queries is defined on the grounds of the sources used and the methods and by time limits of temporary labor. The basic tools, resources and design stages of analytical technologies are described. There are examples of completed flowcharts.

Текст научной работы на тему «Категория сложности запросов при проектировании аналитических технологий»

2. Elizarov A. M., Hohlov Y. E. Matematitseskie metody v bibliotetsnoj rabote: utsebno-metoditseskoe posobie. - Kazan: Izdatelstvo Kazanskogo universiteta, 1987. - 270 s.

3. Klyutsenko T. I. Matematika v bibliotetsnoj professii: uchebno-prakticheskoe posobie. - M.: Libereya-Bibinform, 2009. - 160 s.

4. Klyutsenko T. I. Matematizatsja bibliotetsnogo obrazovanija: avtoref. dis... d-ra pedagogitseskih nauk: 05.25.03. - SPb.: Sankt-Peterburgskay gosudarstvennaja academija kul’tury, 1997. - 295 s.

5. Motylev V. M. Statistitseskie metody v bibliotetsnoj rabote. - L.: LGIK im. N. K. Krupskoj, 1979. - 95 s.

6. Sbitnev S. A., Gendina N. I. Osobennosti podgotovki tehnologa avtomotizirovannykh bibliotetsnykh sistem // Obthee i spetsifitheskoe v kriterijah i metodah othenki bibliotethnyh sistem: sb. nauth. tr. / GPB. - L., 1983. - Vyp. 4. - S. 50-55.

7. Skipor I. L. Podgotovka kadrov v sfere sozdanija jelektronnykh informatsionnyh resursov: formirovanije professional’nyh kompetentsij // Mezhvedomstvennoe i mezhprofessionalnoe vzaimodejstvije v oblas-ti sozdanija i ispolzovanija elektronnyh resursov: mat-ly VII Vserossiyskoy naythno-praktitheskoy conf. «Electronnye resursy bibliotek, museev, arhivov», 9-10 noybrja, 2012 g., St. Peterburg / TsGPB im. V. V Majakovskogo; red.-sost. I. E. Prozorov. - SPb.: Polittehnika-servis, 2012. - S. 154-162.

УДК 001.8

Г. Ф. Гордукалова

КАТЕГОРИЯ СЛОЖНОСТИ ЗАПРОСОВ ПРИ ПРОЕКТИРОВАНИИ АНАЛИТИЧЕСКИХ ТЕХНОЛОГИЙ

Показана роль технологической школы С. А. Сбитнева в постановке проблемы типизации сложных запросов в 1970-е годы. Выделены категории сложности аналитических запросов: локальные, ассоциативные, комплексные. Определены характеристики каждой категории запросов по признакам числа используемых источников и методов, временных трудозатрат. Описаны основные средства, ресурсы и этапы проектирования аналитических технологий. Приведены примеры реализованных блок-схем.

Ключевые слова: аналитическая технология, вебометрия, запросы, категория сложности запроса, проектирование, ресурсы, стадии проектирования, блок-схема, трудозатраты.

G. F. Gordukalova

THE CATEGORY OF THE COMPLEXITY OF QUERIES WITH THE DESIGN OF ANALYTICAL TECHNOLOGIES

The role of technological school of S. A. Sbitnev is shown in statement of the problem of typification of complex queries in the 1970s. The issue of Internet-analytics is discussed. The main course of its development is characterized as webometrics, technical measurements of streams by provider’s services, analysis on demand, videometrics. The active usage of Zipf-Bradford law is shown. The number of participants of Internet analytics is rapidly expanding. The problem of interpretation of measurements online is highlighted. The process of analysis and design tools in the intellectual technology and machine performance for complex queries is shown. The categories of queries were identified as local, associative, and complex. The characteristics of each category of queries is defined on the grounds of the sources used and the methods and by time limits of temporary labor. The basic tools, resources and design stages of analytical technologies are described. There are examples of completed flowcharts.

Keywords: analytical technology, webometrics, queries, categories of complexity of the query, designing, resources, stages of designing, flowchart, expenditures of labor.

Предисловие - Как Ваше слово отзовется? Стас Андреевич Сбитнев (1918— 2002) - инициатор и первый практик автоматизированного поиска в стране, создатель системы поиска информации «Квантор», за которую он был награжден золотой медалью ВДНХ СССР. Заслуженный работник культуры РСФСР, Стас Андреевич создавал институт культуры в 1969 году, затем кафедру научно-технической информации, был ее бессменным заведующим и профессором Кемеровской государственной академии культуры и искусств, где и родилась первая технологическая школа в библиотечном деле с сотнями его учеников и единомышленников [5, с. 75-92].

Яркая, эффективная, отвечающая всем критериям научной школы, она уже в далекие семидесятые выделилась в самостоятельную исследовательскую школу, потеряла региональный оттенок, а в последние годы активно выступает законодательницей и «точкой роста» для библиотечных технологий. Это не просто именная «школа С. А. Сбит-нева», но и со своим четко прописанным назначением - «Кемеровская технологическая школа», с высоким темпом развития - от подготовки последователей до «центра» современного научного мышления [1].

Из каких истоков черпал уверенность в правоте информационных идей, аналогий и предположений Стас Андреевич Сбитнев -морской пехотинец, командир огневого взвода при обороне Севастополя? Каким образом он мог в одной лекции выдать целую волну прогнозов без масштабных «предпрогноз-ных» ориентиров? Одновременно студенческой аудитории дарилась и убежденность в их реализации. Ответить на эти вопросы можно лишь какой-нибудь придуманной теорией невероятного и здравого смысла.

Профессиональная жизнь идей Стаса Андреевича Сбитнева заслуживает специального исследования, а предметное поле его замыслов охватывает все актуальные направ-

ления современного информационного обеспечения специалистов. В их числе - сервисный подход, российский вариант маркетинга информационных продуктов, предвосхищенный им в условиях плановой экономики и органично построенный на изучении информационных потребностей и запросов. В качестве наиболее неожиданного варианта приведу пример: московское издательство обратилось в этом году с просьбой написать книгу по теме дипломной работы 1973 года: «Технико-экономическое обоснование средств автоматизации и механизации массовой библиотеки»...

Полно реализованной оказалась лишь основная мечта Стаса Андреевича - автоматизация информационного поиска по ключевым словам. Все иные направления - щедро подаренные всем поколениям студентов, нам еще предстоит освоить. Поэтому лучший ответ - попытка разобраться в одной из задач, которые были прямо поставлены Стасом Андреевичем в 1971-1972 годах. Она состоит из трех проблем - формализация интеллектуальных процессов, их проектирование в ответ на определенный тип запроса пользователей информации. Последняя из проблем - типизация запросов - практически решалась нами в учебном курсе, а теоретическая ее разработка была предпринята нашим сокурсником, ныне профессором, доктором наук В. И. Грачевым.

Категория сложности запросов пользователей. Анализ информации об объекте может осуществляться в беззапросной форме, когда аналитик предвидит потребность в обобщении сведений по конкретному вопросу и передает потенциальным пользователям готовый аналитический продукт. В данном же случае мы обсуждаем вопросы проектирования аналитической технологии для режима «запрос - ответ», в рамках которого аналитик работает в строго ограниченных условиях: объект и аспекты его анализа, время выполнения и даже форма передачи результатов диктуются запросом или договорными от-

ношениями с пользователем. Следовательно. проектируемая технология должна отвечать вполне определенным требованиям:

• соответствовать цели и характеру запроса;

• быть экономичной по временным и ресурсным затратам;

• представляться в наглядной форме и быть воспроизводимой, чтобы ее выполнение могли обеспечить разные участники;

• позволить получать нетривиальную синтезированную информации об объекте.

Тип запросов в специальной литературе определяется характером запрашиваемой информации об объекте: адресные, иные фактографические, библиографические запросы, включая запросы на уточнение сведений о документе, отбор документов по теме.

Вопросом оценки сложности запросов занимались информационные специалисты и библиографы в 1970-1980-е годы. -В. И. Грачев, И. В. Гудовщикова, Н. М. Розова, Л. М. Герасимова. Выявленные типы запросов были ориентированы на проблему поиска информации или разыскания неявных сведений о документе. Поэтому сложность запросов определялась через используемые методы и формы свертывания, которые используются в процессе поиска ответа на запрос. Так, В. И. Грачев впервые в стране (1975) разграничил три категории сложности запросов: первая категория требует семантического сравнения информации по запросу, вторая - просмотра библиографического описания, аннотации или реферата, третья - простейшая - ограничивается основными элементами описания (автор и заглавие) при информационном поиске [2].

В удивительно интересной книге, обобщающей опыт уникальных библиографов Библиотеки Российской академии наук Н. М. Розовой и Л. М. Герасимовой, к сложным запросам отнесены те, в которых не просматриваются традиционные пути разыскания документов/данных. Авторы отметили, что особенно трудоемки запросы,

выполняемые в отсутствии читателей: нельзя уточнить, дешифровать запрос, совместно с читателем найти дополнительные поисковые признаки. Значительную часть этих запросов представляют «отказы» - невыполненные другими библиотеками и информационными центрами запросы [3].

Из приведенных в книге примеров можно увидеть широкий круг действительно сложных библиографических задач-запросов: расшифровка нестандартных сокращений в тексте; идентификация старых книг по отдельным листам без титула - актуальная задача для старых фондов библиотек при разборке дарственных фондов и архивов; атрибуция бестекстовых фрагментов изданий (листов карт, планов, альбомов, чертежей, иконографических материалов), которая осуществляется на основе тщательного отбора данных для паспорта признаков с последующим обращением к топонимическим, ономастическим персоналиям, предметным изображениям и т. д.

Судя по примерам, к числу наиболее сложных относятся запросы ученых-гуманитариев, которые часто просят помощи в разыскании давних публикаций на основе неполных или искаженных ссылок на них. Особенно интересен предложенный комплекс приемов поиска по аналогии, введение в поисковый запрос ассоциированных фактографических данных. Библиограф может оказаться «в плену ложных ассоциаций», но ряд сложнейших запросов при точно выбранном направлении реализуются как «блиц-поиск» с одношаговым выходом к релевантному библиографическому источнику. Выпол-

нение таких запросов глубокой ретроспекции требует поиска в массивах малотиражных, ведомственных, архивных материалах, не имеющих машиночитаемых росписей, и на долгие годы останется одной из сложнейших интеллектуальных задач библиотек.

В аналитической практике нередко встречается и феномен ложности просто-

го запроса. Это подтверждает богатейший в мире библиографический опыт. Каждый практикующий аналитик в своем личном опыте имеет десятки примеров, когда поиск простейших сведений об объекте превращается в многочасовое их разыскание, со сравнением найденных противоречивых данных, установлением и оценкой источника фактов. Следовательно, во всех ситуациях аналитик должен уметь прогнозировать категорию сложности запроса и учитывать общие принципы анализа информации.

Особенность подхода к проблеме типизации сложных запросов аналитического характера состоит в том, что задача поиска также решается нетиповыми средствами (требует выявления репрезентативного круга источников с определенными ценностными свойствами), но основной акцент должен быть сделан на сравнительном, многоаспектном анализе и синтезе найденных данных об объекте. При этом за простой формулировкой запроса может быть скрыто масштабное исследование вопроса с участием опытных библиографов, аналитиков информационных ресурсов. Например, «Достижения отечественной математики в 2012 году», «Фотодиоды: тенденции развития», «Современные молодежные объединения» и т. д.

При этом категория сложности запроса в нашем случае должна оцениваться до проведения анализа, чтобы была спроектирована убедительная технологическая схема анализа. В этой связи предлагается трехтактная оценка категории сложности запроса, включающая три последовательно примененных критерия:

► наличие этапа содержательной интерпретации запроса с анализом его предметного поля;

► количество источников информации и предполагаемых для использования методов анализа информации;

► необходимость этапа итогового синтезирования полученных данных об объекте.

Для учебных целей вполне достаточным оказалось подразделение запросов на три категории сложности: локальные, ассоциативные, комплексные (табл. 1). Большая их дифференциация возможна в аналитической практике.

Таблица 1 Категория сложности запроса

Категория сложности запроса Примеры запросов

1. Локализованные запросы Перечень действующих стандартов на библиографическое описание электронных документов. Производители бытовых вентиляторов в Санкт-Петербурге. Размер налогового сбора на жилую недвижимость в Болгарии

2. Ассоциативные запросы Обзор рынка биржевой информации в стране. Новые тенденции в развитии выставочной деятельности для эксклюзивных товаров. Причины снижения спроса на офисную недвижимость в Санкт-Петербурге в ... году

3. Комплексные запросы Оценка состояния и тенденций развития отечественной науки. Новые пищевые добавки: сфера и риски их применения. Зарубежный опыт продвижения инноваций в промышленности

Первая категория сложности - локальный запрос - не требует содержательной интерпретации, ограничен процедурами поиска искомых, четко выраженных в запросе сведений в 1-3 источниках информации. Например, «Сколько административных районов сейчас в Санкт-Петербурге?». Время выполнения локализованных запросов -от нескольких минут до трех часов.

Запросы средней степени сложности требуют от аналитика ассоциативного мышления на этапах интерпретации запроса, анализа и синтеза данных; многоаспектного, расши-

ренного поиска данных об объекте по широкому кругу профильных и смежно профильных регулярных источников информации (от 3 до 20). В технологию включается хотя бы один основной и несколько дополнительных методов анализа текстов - от по-аспектного, смыслового, казуального анализа текстов, элементов интент-анализа до формализованных - частотного, факторного, кластерного анализа ключевых слов. Результаты анализа фиксируются в развернутой форме обзорной справки конкретной разновидности, выбранной пользователем или аналитиком. Выводное знание формулируется в точном соответствии с целью запроса, даются рекомендации по его практическому использованию. Не исключен информационный прогноз по отдельным формализованным индикаторам развития объекта. Выполняются за 1-7 рабочих дней, либо ежедневно -по часу с еженедельной или ежемесячной мониторинговой справкой.

Сложные и сверхсложные запросы названы здесь условно «комплексными». Их выполнение требует от аналитика тщательного анализа предметного поля объекта с составлением проблемно ориентированного рубрикатора, творческого многоэтапного поиска данных в широком круге источников (более 20), развитого набора индикаторов оценки объекта, составления разноаспектных сравнительных таблиц, анализа оценочных высказываний, прогноза или выбора прогнозного сценария. Их выполнение занимает более 7 дней, чаще всего для этого создается рабочая (проектная) группа аналитиков. Так, в 2011 году завершен этап исследования по гранту РФФИ [4]. В течение двух месяцев был проведен анализ по теме «Оценка состояния и тенденций развития петербургской науки». В сборе материала приняли участие студенты библиотечно-информационного факультета СПбГУКИ. С их помощью собраны фактографический и полнотекстовый массивы документов/данных по теме. Потребо-

вался комплекс методов для обработки собранных данных - частотный анализ полных текстов по теме; корреляционный, факторный и кластерный анализ частотных словарей; смысловой поаспектный анализ оценочных высказываний о петербургской науке. Впервые в нашей практике был использован метод главных компонент, который позволил в предметном поле выделить устойчивые тенденции в развитии анализируемого объекта.

В выводное знание по сложным запросам включается синтезированная, нетривиальная, а также избыточная, но потенциально полезная информация об объекте. Иногда в прогнозно-аналитическом исследовании разрабатываются несколько сценариев развития объекта с учетом влияющих факторов. В приложении к справке приводятся сравнительные таблицы, иногда - объектноориентированные рубрикаторы, онтологии, избранные тексты или дайджесты оценочных высказываний.

Средства проектирования. В основе технического проектирования лежат эскиз, чертеж, конструкторская документация, подготовленные с учетом действующих стандартов, технических условий. В техническом проектировании широко используются прикладные программы компьютерного проектирования.

При проектировании аналитических технологий основные средства - интеллектуальные, ориентированные на способность проектировщика к методическому алгоритмизированному восприятию профессиональной работы. В их числе формальнологические приемы проектирования - умение сопоставить и соподчинить единичные приемы и процедуры анализа информации. Они используются при интерпретации запроса, уточнении границ объекта, цели и задач аналитического проекта. С их помощью осуществляется оценка типичного и особенного в запросе, а также логическое соподчинение отдельных процессов.

Содержательное и графическое проектирование технологий включает разнообразные формы фиксации интеллектуальных технологий: методика и вербальные алгоритмы (маршрутизаторы), стратегии, сценарии, прогнозы. Для визуализации блок-схем широко применяются графические формы: дерево целей, ресурсов и проблем; технологическая схема; организационные диаграммы. В результате даются рекомендации исполнителю по выполнению конкретного типа запросов. При длительном использовании блок-схемы уже составляется должностная инструкция для аналитика - краткая форма фиксации апробированной технологии.

Ресурсы технологического проекта. Обязателен учет имеющихся ресурсов при проектировании аналитической технологии. Особенностью аналитических технологий является четкое планирование информационных, интеллектуальных и коммуникативных ресурсов. Именно они составляют основу планирования аналитической технологии. Включен в проектирование технологический и организационный потенциал организации, кадровый и мотивационный ресурсы, обеспечивающие качество обзорно-аналитической продукции. Правовой ресурс отражается в проекте как основа соблюдения авторского и смежных прав в обзорно-аналитической продукции. Учет демографического и экономического ресурса региона важен для получения повторных запросов для проектируемой технологии.

Технико-экономическое обоснование проекта. Любой проект требует обоснования. Для этого используются временные нормативы в аналитической деятельности, методики для оценки трудозатрат, прямых и косвенных издержек. Проектировщик должен быть ориентирован на снижение издержек в планируемой технологии и подготовку экономически обоснованных типовых схем, а также на создание дополнительной стоимости продукта за счет креативного сервиса, по-

тенциально полезных рекомендаций и даже формы представления данных.

Основные этапы проектирования аналитической технологии. Специалисты выделяют следующие этапы проектирования социальных технологий: концептуальный,

моделирование, конструирование, адаптация. В аналитической практике более апробированы следующие стадии:

Предпроектная стадия: уточнение объекта и цели проекта по запросам потребителей информации. Поиск технологий-аналогов, выявление стереотипного и особенного в технологии. Оценка ее востребованности в организации. Выбор участников и соисполнителей, определение сроков предоставления проекта.

Стадия разработки технологической схемы: описание этапов, соподчинение интеллектуальных и вспомогательных процессов. Информационное моделирование объекта. Апробация отдельных технологических решений. Локализация предметного поля объекта и масштаба использования технологии. Технико-экономическое обоснование технологии. Разработка основной технологической блок-схемы.

Стадия подготовки рабочей документации: локальные и сводные ведомости материальных ресурсов, методические рекомендации или пояснительные записки, должностная инструкция.

В процессе подготовки технологической схемы формируется ключевая профессиональная компетенция: способность самостоятельно приобретать новые знания и умения в области проектирования технологий.

Факторы успеха и риски при проектировании аналитических технологий. Главные факторы успеха - накопленные информационные ресурсы по профилю учреждения, финансовая поддержка проекта, квалифицированные кадры с мотивацией на нововведения, стабильный приток однотипных запросов. Уникальность и разнообразие запросов

iig

на аналитическую информацию предполагают сочетание типовых и специализированных технологий.

Факторы риска - выбор неадекватных технологий, отсутствие опыта технологических преобразований, пассивная позиция руководителей учреждения. Особая зона риска - слабая информационная база для анализа объекта. Неструктурированная, латентная и оперативная информация об объекте должна быть включена в технологическую схему сбора и анализа сведений об объекте. Это требует от аналитика творческого отношения к планируемой совокупности информационных ресурсов уже на этапе интерпретации запроса.

Рассмотрим риски проектирования на конкретном примере локального запроса -«Информационная реконструкция сценической судьбы оперы Н. А. Римского-Корсакова “Ночь перед Рождеством”». Анализ проведен в 2011 году студенткой Шестопаловой Н. К. для проверки проектируемой технологии «ретроспективный поаспектный анализ текстов» на базе Научной библиотеки Санкт-Петербургской консерватории [6]:

Предпроектная стадия. Конкретизирована цель запроса - оценка отношения к опере в ее различных постановках. Выявлена точка рождения анализируемого объекта (первая постановка оперы в 1895 году), определен хронологический период сбора материала -115 лет (до 2010 года). Выбран жанр анализируемых материалов об опере - критические материалы - опубликованные рецензии и отзывы. Осуществлен поиск фоновых событий - оперные постановки по мотивам произведений Н. В. Гоголя (оперы Н. Лысенко (1874), П. И. Чайковского (1874-1875),

Н. А. Римского-Корсакова (1895)).

Определено, что за столь длительный период времени в качестве основного метода оптимален поаспектный анализ текстов, позволяющий отбирать информацию в заранее заданных аспектах. Так как в запрос заложен

оценочный аспект (отношение к опере музыкальной критики), то сделан вывод о дополнительных методах анализа оценочных высказываний. Для выделения оценочных высказываний включены элементы смысловой фрагментации текстов, интент-анализа, частотного анализа оценок, а также казуального анализа для выявления отдельных причинно-следственных связей.

Оценка востребованности проектируемой аналитической технологии «ретроспективный поаспектный анализ» показал, что преподаватели вуза и студенты самостоятельно восстанавливают историю ведущих исполнителей музыкального произведения при каждом выборе произведения для учебного репертуара, конкурсных и публичных выступлений. Месячный срок выполнения запроса был условно обозначен, так как аналитик параллельно выполнял иную учебную и профессиональную работу [6].

Стадия разработки технического проекта. Первичная блок-схема поаспектного анализа текстов носит весьма обобщенный характер трех типовых этапов: пилотажное исследование: выбор аспектов анализа ► составление сравнительных таблиц ► обработка данных и вывод результатов анализа.

Затем осуществлены следующие процессы:

• дополнение схемы вспомогательными процессами,

• детализация блок-схемы,

• обогащение технологии оценочными методами.

В число вспомогательных процессов были внесены: ретроспективный библиографический поиск сведений о публикациях по теме, разыскание и копирование полных текстов в фондах библиотеки, отбор и оценка релевантности текстов для анализа.

На разных этапах поаспектного анализа текста используются различные приемы и действия аналитика: разметка (фрагментация) текста, извлечение и формализация ин-

формации, анализ тематического поля ключевых слов, хронологический анализ развития темы, классификация объектов в пределах предметного поля, частотный анализ ключевых слов, ранжирование данных об объекте, визуализация информации (построение графиков, диаграмм, структурных схем, таблиц).

Уровень детализации блок-схемы зависит от личного опыта аналитика. После многократного использования технологии опытному аналитику достаточно перечислить основные рабочие процессы в алгоритме их реализации. Аналитик-стажер должен получить методическую роспись блок-схемы на естественном языке с фиксацией итоговых форм представления информации.

В итоге аналитический модуль станет многоэтапным, но более продуктивным (рис. 1).

ные (мыслительные) процессы. Например, размышление об уровне анализа текстов при выборе его аспектов, поиск решения при преобразовании таблиц, непростой отбор фрагментов со смешанными аспектами рассмотрения постановки и др.

На предпроектном этапе была отмечена необходимость использования дополнительных методов для анализа оценочных высказываний - элементы смысловой фрагментации текстов, интент-анализа, частотного анализа оценок, а также казуального анализа для выявления отдельных причинно-следственных связей. Они реализуются последовательно, после основного метода. В результате проектирования даже для локального запроса мы имеем весьма развернутую технологическую блок-схему.

Рис. 1. Блок-схема «Модуль 2. Аналитический»

Если детализировать блок-схему для одного метода, то она также достаточно сложна (рис. 2).

Естественно, что в блок-схему не включены многие вспомогательные процессы (подготовка и нумерация перечня текстов для анализа, формализация и фиксация данных в таблице и др.). Не отражены также в схеме слабо формализованные интеллектуаль-

Условными обозначениями в ней выделяются этапы, основные и вспомогательные рабочие процессы, которые указываются в логическом алгоритме их применения. Условные обозначения проектировщик аналитической технологии избирает самостоятельно, с учетом традиций технического проектирования.

Кроме того, в итоговую блок-схему вносятся временные нормативы выполнения

Рис. 2. Фрагмент блок-схемы «Поаспектный анализ»

работы, фиксируются формы промежуточных и итоговых результатов - дайджест оценочных высказываний, сравнительная таблица, корреляционная матрица, частотный словарь, обзорная справка и т. д. Например, для интент-анализа сначала был составлен дайджест оценочных высказываний в авторской формулировке, который затем был преобразован в наглядную хронологическую таблицу результатов интент-анализа - кратких оценочных суждений музыкальных критиков, а также высказанного ими мнения публики (табл. 2).

Таблица 2

Результаты интент-анализа критических публикаций о постановках оперы

Н. А. Римского-Корсакова «Ночь перед Рождеством»

Положительные Отрицательные

прелестная опера (1895) опера не удалась ее автору (1895)

крупный успех (1895) в опере мало жизни (1895)

внешний успех (1895) публика скучала (1896)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Продолжение таблицы 2

Положительные Отрицательные

прелестная быль-колядка (1898) скучная опера (1896)

громадный успех комических эпизодов (1898) никакого успеха (1896)

множество превосходных, вдохновенных страниц (1898) не имела выдающегося успеха(1896)

одна из удачнейших опер Римского-Корсакова (1938) слабость музыкального содержания (1896)

опера по-настоящему близкая и нужная народу (1938) не имеет отношения к сказке Гоголя (1896)

значительность музыкального содержания (1938) напыщенность и претенциозность оперы (1896)

отмечена печатью выдающегося мастерства (1940) получилось что-то тяжелое, угловатое и всегда мертвящее (1896)

соединение большой музыки и большой литературы (1990) по силе и цельности впечатления уступает другим операм Римского-Корсакова (1898)

Окончание таблицы 2

Положительные Отрицательные

«Ночь...», безусловно, принадлежит к числу наиболее адекватных Гоголю музыкальнодраматических произведений (1991) «Ночь», конечно же, произведение неровное (1991)

«Ночь...», несомненно, обладает немалой самостоятельной ценностью (1991) опера уступает другим творениям Римского-Корсакова (1991)

В обзорную же справку войдут лишь основные выводы. Например:

Наибольшее количество отрицательных суждений относится к XIX веку, положительные распределены равномерно по времени. Современные критики вообще уклоняются от общей оценки оперы.

Музыкальные критики высказывают полярно противоположные суждения не только о художественных достоинствах оперы, но и о том, как она была встречена публикой: «никакого успеха» - «крупный успех»; «слабость музыкального содержания» - «множество превосходных, вдохновенных страниц»; «опера не удалась ее автору» - «одна из удачнейших опер Римского-Корсакова»; «не имеет отношения к сказке Гоголя» - «безусловно, принадлежит к числу наиболее адекватных Гоголю музыкально-драматических произведений». Некоторые из этих суждений (первые две пары) были высказаны примерно в одно время - в 90-е годы XIX века и т. д.

При планировании аналитической работы важно оценить примерно будущие трудозатраты аналитика, а затем сравнить их с реально затраченным временем. Приведем результаты предпринятого Н. К. Шестопа-ловой хронометрирования реальных затрат времени: на ретроанализ информации о столетней жизни оперы потребовалось примерно 40 часов рабочего времени. В том чис-

ле на пилотажное исследование - 6 часов, на подготовку сводной таблицы поаспект-ного анализа - 8 часов, на преобразование таблиц - 5 часов. На проведение интент-анализа по уже готовой таблице был затрачен 1 час, а на подготовительный количественный анализ кратких текстов (отзывов и рецензий о постановках оперы) - 8 часов. Этап синтезирования результатов (интерпретация данных, формулировка выводов и рекомендаций) в связи с первым таким опытом занял 11 часов рабочего времени.

Подготовительные работы (поиск полных текстов публикаций, их заказ в фонде библиотеки, копирование и др.) из-за сложности выявления рецензий второй половины XIX века продолжались в течение 30 часов (без учета технологических перерывов и непродуктивно потраченного времени). Таким образом, реализация аналитической технологии по локальному запросу в целом предполагает около 70 часов напряженной и интересной работы. Накопление опыта позволит существенно сократить трудозатраты для этапов выбора методов, аспектов анализа, фрагментирования текстов, а также частично упростит процессы синтезирования данных.

На основе итоговой блок-схемы осуществляется расчет необходимых трудозатрат: к суммированному объему времени для одного исполнителя добавляется «страховая» доля трудозатрат на непредвиденные обстоятельства - отсутствие полного текста и его дополнительный поиск, необходимость его сканирования, появление в массиве объемных текстов, консультации у специалистов и др. Случай существующего в документальном потоке, но ненайденного текста обязательно отмечается в подстрочной сноске обзорной справки.

Страховочная часть может составлять от 10 до 30 % от планируемого рабочего времени в зависимости от категории сложности запроса. Сумма рабочего и страховочного (резервного) времени позволяет оценить время

выполнения запроса (в часах, днях), необходимость в соисполнителях или помощниках для выполнения вспомогательных процессов.

Если запрос выполняется на договорных условиях, то определяется его ценовая характеристика, в которую закладывается себестоимость выполнения аналитической и вспомогательной работы, дополнительные расходы (оплата доступа к источникам информации, стоимость расходных материалов и др.), НДС и планируемая прибыль исполнителя (дополнительно 5-20 %). Цена аналитического продукта согласовывается с заказчиком на этапе подписания договора.

Стадия подготовки рабочей документации о проектируемой технологии может ограничиться пояснениями условных обозначений к итоговой блок-схеме и методическими рекомендациями ее исполнителю по рискам отдельных этапов работы. Должностная инструкция аналитика - наиболее свернутая форма управления аналитическим проектом. Составляется она лишь после достаточной апробации и доработки блок-схемы. Важно помнить о том, что проектируемая технология - интеллектуальный потенциал организации, ее коммерческая тайна, а также профессиональный приоритет аналитика.

В отличие от технических, интеллектуальные методики носят весьма обобщенный характер, а также имеют целый ряд ограничений при использовании. Причина - множество влияющих факторов, низкий уровень формализации интеллектуальных процессов. По этой причине методики анализа информации формируются длительный период времени, как правило, на основе обобщения личного опыта участников. Переход от методики к технологии, требующей алгоритмизации, тем более затруднен. Впервые задача получения выводного знания на основе уже известного была поставлена Аристотелем в его книгах «Первая.» и «Вторая аналитика». Несмотря на успехи компьютерной лингвистики и робототехники, основная часть аналитических процессов до сих пор есть не что иное как «размышление», которое лишь частично может быть алгоритмизировано. В этой связи значительная часть когнитивных процессов не только не поддается автоматизации, но даже не обозначается строгими понятиями. Зачем же искать ответ на неразрешимые задачи? От развития и разнообразия технологий зависит качество -уникальность и воспроизводимость полученного аналитиком выводного знания.

Литература

1. Гордукалова Г. Ф. Первая технологическая: О научной школе С. А. Сбитнева // Библиотечное дело. - 2010. - № 12; Библиотечная технология. - № 4. - С. 2-7.

2. Грачев В. И. К вопросу об исследовании категории сложности информационных запросов потребителей информации // Проблемы библиографии, библиотековедения, детской литературы. - Л.: ЛГИК им. Н. К. Крупской, 1975. - С. 85-98.

3. Розова Н. М., Герасимова Л. М. Традиционный библиографический поиск в библиотеке Российской академии наук: метод. пособие. - СПб.: Б-ка РАН, 1997. - 113 с.

4. Социологический взгляд на современную отечественную науку (На примере Санкт-Петербурга) / Институт истории естествознания и техники РАН; Науч. рук.: проф. С. А. Кугель. - СПб.: ИИЕТ РАН, 2011. - 106 с. - (Грант РФФИ 09-06-00078).

5. Стас Анреевич Сбитнев: Жизнь, отданная людям. Хроника. Воспоминания. Исследования. -Кемерово: Кемеров. гос. акад. культуры и искусств, 2003. - 344 с.

6. Шестопалова Н. К. Поаспектный информационный анализ текста (по материалам музыковедческих публикаций): дипломная работа / науч. рук. Г. Ф. Гордукалова; рец. Т. В. Захарчук. - СПб.: СПбГУКИ, 2011. - С. 32-97.

Literatura

1. Gordukalova G. F. Pervaja tehnologicheskaja: O nauchnoj shkole S. A. Sbitneva // Bibliotechnoe delo. -2010. - № 12; Bibliotechnaja tehnologija. - № 4. - S. 2-7.

2. Grachev V I. K voprosu ob issledovanii kategorii slozhnosti informacionnyh zaprosov potrebitelej in-formacii // Problemy bibliografii, bibliotekovedenija, detskoj literatury. - L.: LGIK im. N. K. Krupskoj, 1975. - S. 85—98.

3. Rozova N. M., Gerasimova L. M. Tradicionnyj bibliograficheskij poisk v biblioteke Rossijskoj akademii nauk: metod. posobie. - SPb.: B-ka RAN, 1997. - 113 s.

4. Sociologicheskij vzgljad na sovremennuju otechestvennuju nauku (Na primere Sankt-Peterburga) / Institut istorii estestvoznanija i tehniki RAN; nauchn. ruk.: prof. S. A. Kugel'. - SPb.: IIET RAN, 2011. -106 s . - (Grant RFFI 09-06-00078).

5. Stas Anreevich Sbitnev: Zhizn', otdannaja ljudjam. Hronika. Vospominanija. Issledovanija. - Kemerovo: Kemerov. gos. akad. kul'tury i iskusstv, 2003. - 344 s.

6. Shestopalova N. K. Poaspektnyj informacionnyj analiz teksta (po materialam muzykovedcheskih publikacij): diplomnaja rabota / nauchn. ruk. G. F. Gordukalova; rec. T. V. Zaharchuk. - SPb.: SPbGUKI, 2011. - S. 32-97.

УДК: 004.738. 5+027.7

М. Н. Демина, Л. Г. Тараненко

ЭЛЕКТРОННЫЕ ИНФОРМАЦИОННО-ОБРАЗОВАТЕЛЬНЫЕ РЕСУРСЫ БИБЛИОТЕК ВУЗОВ КУЛЬТУРЫ И ИСКУССТВ

В статье рассматривается опыт предоставления доступа к электронным информационнообразовательным ресурсам на сайтах библиотек вузов культуры и искусств. Обозначены проблемы локального и удаленного доступа к образовательным электронным ресурсам. Выявлен ассортимент собственных и внешних электронных информационных ресурсов, представленных на сайтах библиотек. Рассматриваются электронные библиотечные системы, используемые в вузах культуры и искусств. Представлен опыт тестирования в библиотеке Кемеровского государственного университета культуры и искусств электронных библиотечных систем «КнигаФонд» и «Университетская библиотека online», выявлены проблемы эксплуатации.

Ключевые слова: электронные информационно-образовательные ресурсы, сайты библиотек, электронные библиотечные системы, библиотеки вузов культуры и искусств, собственные электронные ресурсы, электронные каталоги, базы данных, внешние электронные ресурсы, локальный доступ, удаленный доступ.

M. N. Demina, L. G. Taranenko

ELECTRONIC INFORMATIONAL AND EDUCATIONAL RESOURCES OF THE LIBRARIES OF THE UNIVERSITIES OF CULTURE AND ARTS

The article stresses the importance of the use of electronic information resources (EIR) in the educational process at the universities of culture and arts. The problems of local access to EIR are discussed. The requirements to local and network EIR of the educational purpose are given: the didactic and ergonomic indicators, for local EIR and information security requirements, scientific trustworthiness, didactic and pedagogical significance for the network of a training purpose.

i Надоели баннеры? Вы всегда можете отключить рекламу.