Научная статья на тему 'Многопользовательский подход к созданию систем автоматической обработки текстов'

Многопользовательский подход к созданию систем автоматической обработки текстов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
82
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Многопользовательский подход к созданию систем автоматической обработки текстов»

интегральная квадратичная ошибка скорости вращения ротора.

В качестве возмущений были реализованы: 1 -трехфазное КЗ на землю в конце линии электропередачи; 2 - однофазное КЗ на землю в конце линии электропередачи; 3 - трехфазное КЗ на землю в начале линии электропередачи; 4 - однофазное КЗ на землю в начале линии электропередачи; 5 - увеличение генерации на 25 %; 6 -уменьшение генерации на 25 %.

Результаты, представленные на рисунке 4, показывают превосходство нечеткого стабилизатора

над Generic PSS и Multi-Band PSS для всех моделируемых нарушений.

По результатам проведенных модельных экспериментов можно заключить, что применение нейро-нечетких методов позволяет эффективно решать задачу стабилизации ЭЭС. C помощью нейро-нечеткой сети возможно копирование обычного регулятора с последующей его реализацией на основе нечеткой логики. Это позволяет в первом приближении создать работоспособный нечеткий регулятор и далее осуществлять его настройку.

МНОГОПОЛЬЗОВАТЕЛЬСКИЙ ПОДХОД К СОЗДАНИЮ СИСТЕМ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВ

А.В. Чередниченко (Москва)

Активное распространение однопользовательских систем для обработки текстов в настоящее время постепенно приводит к тому, что совместная работа нескольких пользователей над одним текстом в один момент времени практически невозможна. Многопользовательские же системы автоматической обработки текстов носят коммерческий характер. Соответственно, при создании коммерческих систем разработчики закладывают в архитектуру системы использование конкретной реализации лингвистических процессоров и анализаторов. При таком подходе все сложности по использованию и сопровождению подобных систем являются непреодолимым препятствием как на пути реального развития компьютерной лингвистики в целом, так и при полноценной функциональной автоматизации бизнес-процессов, связанных с автоматической обработкой текстов.

Одним из главных принципов работы системы является независимость ядра от конкретных задач. Механизмы анализа текстов реализованы при помощи динамического подключения внешних анализаторов. Конкретным решением является подключение произвольного анализатора к динамически подключаемой библиотеке, входящей в состав системы. Объекты, с которыми необходимо работать для решения конкретных лингвистических задач, определяются при разработке структуры базы данных. При обработке текстов предлагается использовать последовательность действий (далее шаблон анализатора, или шаблон), объединенных общей идеей обработки. Шаблоны могут объединяться в цепочки, могут быть применены циклически к одному и тому же множеству предложений, могут осуществлять вызовы друг друга с передачей параметров в любой момент выполнения. Подобная схема позволяет обработать различные участки текста с применением различных шаблонов. Например, при обработке текста из интернет-

источников (статьи с новостных сайтов, результаты поисковых запросов, результаты голосований) требуется общий предварительный морфологический анализ и конкретный синтаксический. Анализ подобных текстов требует различных подходов, однако должен предваряться одинаковым морфологическим анализом, соответственно, после выполнения работы одного общего анализатора по результатам его работы могут быть вызваны различные синтаксические шаблоны. Поскольку под шаблоном понимается лишь последовательность действий, а не конкретная реализация какой-либо модели анализа, то он является независимым от этой реализации.

При обработке текстов последовательно выполняются шаги различных шаблонов с различными типами действий (по сути, в результате выполнения шага будет изменяться текущее состояние исходного текста или базы данных). Параметры этих действий создаются и редактируются администратором системы. В момент выполнения шаблона возможно обращение к результатам выполнения предыдущих шагов (возможна относительная или абсолютная адресация). Также при выполнении шага шаблона можно указать условия выполнения данного шага, что позволяет создать схему, в которой задействованные шаблоны или их части будут выполняться в зависимости от некоторых определенных условий (статических или динамически изменяющихся).

После окончания работы всех шаблонов исходный текст может быть представлен в виде семантически связанных объектов с некоторыми свойствами, связями и характеристиками этих связей либо в виде реферата, либо в виде преобразованного текста по типу репрезентативной системы конкретного пользователя. Способы преобразования и анализа исходного текста зависят лишь от администратора системы, который на-

страивает цепочку шаблонов. Шаблоны не являются жестко закодированными, могут требовать ввода текста или принятия решения пользователем, могут целиком выполняться автономно, сохраняя результаты своей работы либо в базу данных, либо во внутренние переменные сервера анализа для работы других шаблонов над этим же текстом. Реализованная схема позволяет комбинировать виды анализа в необходимой последовательности. Рассмотрим схему, в которой использование каждого из шагов анализа (синтаксис, морфология и семантика) представлено отдельным шаблоном анализа. Аналогичная схема описана в работе С.А. Крылова и С.А. Старостина «Интегрированная информационная среда STARLING и ее использование в сфере корпусной лингвистики» (М. РГГУ. 2006). В такой схеме возможно использование одинаковых схем морфологического и синтаксического анализа, в то время как шаблон семантического анализа будет реализовываться для каждой из поставленных задач отдельно. Например, анализ новостей с целью поиска и выделения информации о новых процессорах и анализ текущей ситуации на дорогах будут представлены двумя различными шаблонами семантического анализа.

Выполнение шаблонов может осуществляться параллельно сразу несколькими пользователями. Максимальное число пользователей, которое может обслуживать один сервер, может быть ограничено физическими параметрами сервера приложений либо сервера базы данных. Синхронизация доступа к базе данных должна быть предусмотрена при создании шаблонов. Выполнение различных шаблонов может быть разделено между несколькими группами пользователей. Таким обра-

зом, возможно выполнять анализ однородных данных одной постоянной группой пользователей.

1. Необходимо отметить, что многопользовательский подход в контексте системы, работающей с текстами, может быть реализован с точки зрения индивидуального интерфейса, а также представления результатов работы. Данная идея получила воплощение в виде реализации специального теста и программного интерфейса к компьютерной версии словаря, позволяющего подбирать синонимы к используемым словам с учетом психологических особенностей пользователей (Л. Алекторова, С. Баженова, Г. Галаванова. Словарь синонимов русского языка. Л. 1971). При вводе информации в систему и при проведении анализа сохраненных данных возможно применение словаря синонимов, с помощью которого анализируются психологические характеристики обрабатываемых текстов (http://www.vaal.ru/proekt/ vaal2000. php). Эти характеристики имеет смысл использовать при анализе предметных областей, имеющих неформальное описание объектов, а также при описании объектов, характеристики которых могут быть интерпретированы несколькими аналитиками различными способами. Использование данного словаря допускается не только при анализе текстов, но и при построении интерфейсов пользователей и выводе результатов.

В заключение отметим тот факт, что описываемая система реализована как платформа, которая позволяет создавать различные анализаторы текстов. Система содержит все механизмы по администрированию ресурсов, что позволяет использовать ее как средство интеграции различных анализаторов с минимальными доработками.

НЕЧЕТКОЛОГИЧЕСКИЙ ПОДХОД К РАЗРАБОТКЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ КОМПЬЮТЕРНОГО ОБУЧЕНИЯ

И.Ю. Сарвилина, к.т.н., О.В. Пухарева (Пенза)

Настоящий этап развития системы образования связан с внедрением в учебный процесс информационных обучающих систем (ИОС) в качестве средств организации и проведения учебных занятий. Использование подобного программного обеспечения позволяет выстроить для каждого учащегося индивидуальную образовательную траекторию независимо от его территориального нахождения и, следовательно, расширить круг обучающихся. Однако ряд причин препятствует широкому использованию ИОС в школах, вузах и различных организациях. Основной причиной является малая возможность индивидуальной настройки обучающей системы на пользователя и предметную область, что наблюдается у большинства ИОС. Это обусловлено исследованием про-

цессов создания, накопления, обработки информации и разработкой средств представления в ИОС знаний о процессе обучения без учета лингвистической неопределенности субъективных суждений эксперта о качественных характеристиках объектов предметной области и отношений между ними. По этой причине возможность отражения личного профессионального опыта педагога в обучающей системе значительно ограничена.

Можно сделать вывод об актуальности разработки моделей и средств создания, накопления, обработки в ИОС знаний эксперта с учетом их лингвистической неопределенности. В данной статье рассмотрена авторская ИОС «Educate», которая позволяет разрабатывать педагогические программные средства в естественных лингвисти-

i Надоели баннеры? Вы всегда можете отключить рекламу.