ИСПОЛЬЗОВАНИЕ ИЕРАРХИЧЕСКИ ОРГАНИЗОВАННОГО ТЕКСТОВОГО ФОРУМА КАК СРЕДСТВА ONLINE ПОДДЕРЖКИ НАУЧНО-ТЕХНИЧЕСКОГО ПРОЕКТИРОВАНИЯ Н.Ф. Гусарова, М.Н. Коваленко, А.В. Маятин, В.А. Петров, И.В. Шилов
Компьютерный дискурс как средство реализации научно-технического проектирования
Сегодня научно-техническое проектирование (НТП) все чаще организуется как процесс, распределенный в пространстве и во времени. Формирование процессов распределенного проектирования (цепочек информационного взаимодействия) ускоряет процессы согласования решений на всех стадиях ведения проекта. Существенным моментом распределенного проектирования является организация единого информационного пространства и системы хранения информации. Их использование подразумевает развитую компьютерную инфраструктуру, обусловливает применение новейших компьютерных средств и версий программных продуктов.
Но не менее важную роль в процессе НТП, в особенности на его начальных, концептуальных этапах, играет непосредственное общение между членами коллектива. Именно в процессе такого общения формируются и оттачиваются основные идеи проекта, находящие затем свое воплощение в формальных схемах, чертежах и программных кодах. Поддержать компьютерными технологиями этот, наиболее слабо формализуемый этап научно-технического проектирования - важная задача, во многом определяющая результативность и скорость работы команды проекта.
Основной информационный обмен при НТП происходит посредством речевого общения - дискурса [1] - в его письменной или устной форме. При этом дискурс рассматривается не только как набор изолированных единиц языковой структуры «больше предложения». Согласно [2], любое осмысленное высказывание содержит пропозицию (семантический инвариант) - то, ради чего производится высказывание. В ходе речевой коммуникации участники общения извлекают из памяти, конструируют и обрабатывают изменяющееся множество пропозиций, формирующее основу для интерпретации вновь поступающей информации. Тема дискурса обычно представлена в виде макропропозиции или макроструктуры, в отличие от темы отдельного предложения или высказывания, как правило, представленной именной группой подлежащего.
В работе [3] рассматриваются лингвистические аспекты компьютерного дискурса применительно к компьютерным конференциям (форумам), которые представляют собой дистантное общение с помощью компьютера по какой-либо проблеме. Отмечается их сходство с научной конференцией в ее неформальной (кулуарной) части, вне жестких рамок протокольных официальных выступлений, т.е. отход от жестко логической структуры диалога [4].
Проведенный обзор позволяет говорить о том, что структурирование дискурса, необходимое для поддержки НТП, лежит на уровне тема-рематического членения и выделения пропозиций, т.е. требует не только грамматического и лингвистического, но и семантического анализа, а также последующего синтеза дискурса.
Возможности поддержки НТП средствами информационных технологий. Постановка задачи
Современные информационные системы (ИС), связанные с анализом текстовой информации в контексте on-line поддержки НТП, можно условно разделить на три группы.
ИС автоматического анализа текста [5], задачей которых является реструктуризация уже имеющейся в тексте информации, вполне удовлетворительно реализуют лексемный и синтаксический анализ, но, как правило, останавливаются на уровне семантического анализа в рамках относительно небольшого набора предопределенных контекстов. Ни тема-рематического, ни, тем более, пропозиционального структурирования текста эти методы не поддерживают.
В большинстве ИС, ориентированных на работу с текстом, поддерживается режим редактирования. Так, пакет Word компании Microsoft имеет встроенную систему внесения исправлений. Для внесения исправлений может быть выбран любой элемент текстового блока, а выбранные элементы могут пересекаться. При этом внесенные исправления могут быть вложенными. Однако данная система внесения изменений предназначена исключительно для редакторской работы и ускорения создания полностью законченного текстового продукта (заметки, статьи, книги), а наличие возможности вложения исправлений может эту работу затруднить.
Проект Wikipedia [6] дает возможность совершения пользователем определенных действий, таких как создание нового текстового блока, дальнейшая его модификация и слежение за состоянием. Любой желающий может принять участие в проекте, следить за историей изменения состояния какого-либо описания и, по необходимости, возвращать описание на предыдущие этапы. Однако в проекте не реализована возможность создания «временного среза» истории изменений, после которого возврат к предыдущим состояниям, предшествовавшим моменту создания «временного среза», невозможен. Кроме того, проект имеет целью адекватное описание уже существующих фактов и знаний, а для создания новых знаний и принятия решений по ним он непригоден.
Наконец, активно развиваются ИС, созданные для проектирования и сопровождения программных продуктов, типичным примером которых является ИС Jira компании Atlassian [7]. Эта ИС предоставляет возможность координации участников проекта при его проектировании, разработке и дальнейшем сопровождении, а также планирования и распределения задач среди заданного круга участников. Однако ИС Jira не предоставляет возможность непосредственного общения между участника проекта, ведения дискуссии и принятия решений по ее итогам, так как наличие нескольких конкурирующих мнений в системе не предусмотрено, а координация участников проекта ограничена передачей флагов состояний типа «найдена проблема», «решение назначено», «проблема решена», «решение проверено».
Проведенный обзор показывает, что на сегодняшнем уровне развития информационных технологий задачу on-line поддержки НТП целесообразно решать путем построения человеко-машинной системы, сочетающей в себе алгоритмы синтаксического анализа как автоматизированную часть и ЛПР как носителя контекста. При этом система поддержки распределенного формирования текстовой информации (далее - система) должна предоставлять следующие возможности:
• многопользовательский доступ;
• публикация текстовых блоков;
• ведение дискуссии;
• подведение итогов;
• автоматическое функционирование.
Структура системы распределенного управления текстовой информацией
Этапы работы системы представлены на рис. 1.
Начальный этап включает в себя публикацию автором исходного текста, автоматическое разбиение текста на структурные составляющие и запись в базу данных. Исходный текст представляется в виде дерева, составными частями которого являются
структурные элементы трех уровней - абзаца (/), предложения (/) и слова (к). При записи в БД каждому элементу присваивается номер вида (/, /, к) , который не только является уникальным идентификатором данного элемента в пределах текста, но и содержит информацию об исходной структуре текста. Структура предложений сохраняется за счет того, что знаки препинания считаются частью слова, после которых они стоят, а отдельные символьные конструкции считаются отдельными словами. Такой прием, с одной стороны, увеличивает избыточность БД, но, с другой стороны, уменьшает количество необходимых таблиц в БД и упрощает реализацию программной части системы.
Этап обсуждений
Визуализация текста Ведение обсуждений участниками
Заключение
Формирование конечного варианта
/\
Подведение итога
Окончание обсуждений Выбор вариантов
Голосование Вынесение итога
Рис. 1. Этапы работы системы формирования текстовой информации
На этапе обсуждений происходит построение и визуализация исходного текста на сформированной специальным образом веб-странице браузера пользователя (рис. 2). Все действия по составлению предложений и абзацев, а также сворачиванию и развертыванию структурных блоков текста осуществляются на клиентской стороне при помощи скрипта, написанного на языке JavaScript. Пользователь имеет возможность высказать свою точку зрения, если таковая имеется, по любому структурному элементу текста любого уровня, а также продолжить уже начатую дискуссию. Новая дискуссия может быть создана на любой логический элемент текста при условии отсутствия уже начатой или оконченной дискуссии на данный элемент. Время дискуссии ограничено и задается администратором в конфигурационном файле системы.
По истечении времени дискуссии система переходит на этап подведения итога. Итог может быть определен либо участниками дискуссии методом голосования (рис. 3), либо автоматически. В первом случае участники сами выбирают конкурирующие варианты и назначают их на голосование. По завершении времени, отведенного на голосование, вариант, набравший наибольшее количество сторонников, считается итогом дискуссии. Второй случай возможен при наличии предварительно проголосовавших участников: вариант с максимальной оценкой считается итогом, а дискуссия - закрытой без проведения голосования. При наличии нескольких вариантов с минимальной разницей весов среди всех опубликованных пользователями вариантов проводится выбор тех, которые будут приняты к голосованию.
На основе итогов дискуссий автор (или другое ЛПР, например, руководитель проекта) принимает решение об изменении оригинального текста либо о полной его модификации с учетом мнений участвовавших в дискуссии.
&"уйге. Магьны Н! Спадать текст Профиль польэователч Регистрация Вернутьси иа глзвн)ги> страницу
Для системы. ис пользующей <1еуГз|5|. вышеуказанные настроики будут сделаны автоматически
прозрачно для пользователя.
Ли конца дискуссии осталось 14 часов 35 минп
Рис. 2. Внешний вид страницы открытой дискуссии
тания одного с вето диода АЛ20&Г составляет 2,1В, конденсатор £14 н блоке выпрямит чныи с емкостью ЮООмкФ. а резисторы Р21 и 9 заменить на аналогичные с мощное
По ¿ЭинрМу &Л0ку ПрпеаЩТС Д ГйЯКФ8*нн? быберкг? ОДин 14 [1,1 |1иДмТ(: [I. кОТОрьш, >4Х вы м^иГоло-?
достоверен и к¿уииге ¥ммк/ Твтоев' Гщ>0СвБЗ>Ъ МОЖНО ТСАЬКГ> ОЛ" р«
Дд юнщ голе с анднич ссталссь 12 чаедяв минут
| Готово | | Сбррнлъ ]
Рис. 3. Общий вид страницы голосования
Экспериментальные результаты
Разработанная система была использована при выполнении проекта по созданию образовательного Интернет-ресурса. В ходе работы с системой было проведено 14 дискуссий по наиболее спорным вопросам, возникающим при планировании работ, по 10 из них был подведен итог (рис. 4), в том числе по 6 с помощью предварительного голосования. Во всех случаях было сформировано итоговое мнение, удовлетворяющее максимальному количеству участников, которое в дальнейшем рассматривалось всеми разработчиками как внутренний документ.
Так как напряжение питания одного светодиода АЛ205Г составляет 2.1В. конденсатор С14 в блоке выпрямителя нужно заменить на аналогичный с емкостью ЮООмкФ. а резисторы R21 и R19 заменить на аналогичные с мощностью
1Вт,
По дачному ijiûKy была про ведена дискуссия и полосование, по эавершвннк >ито|>ога был подьед£>г итог, и одни вариант был л [пина **h6MÎÎ AOtrottpHfà
Так как напряжение питания одного светодиода АЛ205Г составляет2.1 В, конденсатор С14 в блоке выпрямителя нужно заменить нэ аналогичный с емкостью ЮООмкФ. резисторы Р21 и ПИ 9 заменить на аналогичные с мощностью 1 Вт, а резистор Я В исключить и 5
схемы,
Аыйр: Переяслйв СЕ
Квиимиармй: и» свегоди . А,'1й5Г раечо 1,10 т импорт ' -нужно ставить большой емкости, так как амшил-уда пул ьс з и пЛП ИЯ^емнИ помет ДССТиЧТЬ бОЛьШИ* ЕгйИчии
Рис. 4. Общий вид страницы дискуссии после подведения итога
Заключение
Построена система поддержки формирования текстовой информации, помогающая коллективу разработчиков сформировать и вербализовать макропропозицию текущего состояния проекта в целом и/или ключевых его вопросов. Система успешно опробована как средство поддержки НТП. Дальнейшее развитие системы связывается с подключением к ней графических модулей, а также с модификациями пользовательского интерфейса.
Литература
1. Макаров М.Л. Основы теории дискурса. М.: ИТДГК «Гнозис», 2003. 280 с.
2. Фреге Г. Смысл и денотат // Семиотика и информатика. Вып. 8. М., 1977. С. 181— 210.
3. Галичкина Е.Н. Специфика компьютерного дискурса на английском и русском языках (на материале жанра компьютерных конференций). Автореф. к. филол. н. Волгоград, 2001. http://www.vspu.ru/~axiology/index.htm
4. Федоров Б.И., Джалиашвили З.О. Логика компьютерного диалога. М.: Онега, 1994. 240 с.
5. http://www.osp.ru/os/2003/12/048.htm
6. http://www.wikipedia.org
7. http://www.atlassian.com/software/jira/