Научная статья на тему 'Структуризация управления правовой составляющей социокультурной системы на основе автоматизированного исследования эффективности с использованием онтологии моделирования лингвистической среды'

Структуризация управления правовой составляющей социокультурной системы на основе автоматизированного исследования эффективности с использованием онтологии моделирования лингвистической среды Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
105
67
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНГВИСТИЧЕСКАЯ СРЕДА / СОЦИОКУЛЬТУРНАЯ СИСТЕМА / УПРАВЛЕНИЕ СОЦИОКУЛЬТУРНЫМ РАЗВИТИЕМ / ОНТОЛОГИЯ СИСТЕМЫ / АВТОМАТИЗАЦИЯ ИССЛЕДОВАНИЙ / LINGUISTIC ENVIRONMENT / SOCIO-CULTURAL SYSTEM / CONTROL AND MANAGEMENT IN A SOCIAL SYSTEM / THE ONTOLOGY OF THE SYSTEM / AUTOMATION OF THE RESEARCH

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Воронина И. Е., Львович Я. Е.

Проверкой эффективности результатов лингвистических исследований является применение полученной лингвистической теории и выработанных подходов для реализации управления конкретными социокультурными процессами, в частности, правовой составляющей социокультурной системы. Рассматриваются проблемы онтологического моделирования в правовой сфере и их зависимость от эффективности лингвистических исследований

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Воронина И. Е., Львович Я. Е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STRUCTURING THE MANAGEMENT OF THE LEGAL COMPONENT OF THE SOCIO-CULTURAL SYSTEM BASED ON THE COMPUTER-AIDED RESEARCH OF THE EFFECTIVENESS OF USING AN ONTOLOGY MODELING LINGUISTIC ENVIRONMENT

Test effectiveness of results of the linguistic research is the application of linguistic theory and developing approaches for implementation of the management of specific socio-cultural processes, in particular, the legal component of the socio-cultural system. Under consideration problems of ontological modeling in the legal field and their dependence on the effectiveness of linguistic research

Текст научной работы на тему «Структуризация управления правовой составляющей социокультурной системы на основе автоматизированного исследования эффективности с использованием онтологии моделирования лингвистической среды»

УДК 001.103:002

СТРУКТУРИЗАЦИЯ УПРАВЛЕНИЯ ПРАВОВОЙ СОСТАВЛЯЮЩЕЙ СОЦИОКУЛЬТУРНОЙ СИСТЕМЫ НА ОСНОВЕ АВТОМАТИЗИРОВАННОГО ИССЛЕДОВАНИЯ ЭФФЕКТИВНОСТИ С ИСПОЛЬЗОВАНИЕМ ОНТОЛОГИИ МОДЕЛИРОВАНИЯ ЛИНГВИСТИЧЕСКОЙ СРЕДЫ

И.Е. Воронина, Я.Е. Львович

Проверкой эффективности результатов лингвистических исследований является применение полученной лингвистической теории и выработанных подходов для реализации управления конкретными социокультурными процессами, в частности, правовой составляющей социокультурной системы. Рассматриваются проблемы онтологического моделирования в правовой сфере и их зависимость от эффективности лингвистических исследований

Ключевые слова: лингвистическая среда, социокультурная система, управление социокультурным развитием, онтология системы, автоматизация исследований

Для информационного общества характерны высокие скорости протекания социальных процессов, которые могут приводить к кардинальным изменениям структуры отдельных частей информационного пространства. К ресурсообразующим компонентам

информационного пространства следует отнести как информацию, которая порождается

непосредственно в процессе мыслительно-духовной деятельности человека в его сознании, но и массовое и индивидуальное сознание, а также совокупность культурных, духовных, нравственных, религиозных ценностей, представлений, установок, стереотипов и т. п., существующих в сознании социума в целом и отдельных людей в частности и созданных в процессе исторического развития [1].

В ХХ веке управление информационными потоками превращается в решающий фактор завоевания, сохранения и удержания власти [2].

Однако процесс перехода к информационному обществу, безусловно, порождает ряд проблем. К важнейшим из них следует отнести наличие огромных и не всегда упорядоченных объемов информации, не позволяющих человеку эффективно

ориентироваться в растущих информационных

потоках, а также появление научных проблем, связанных с производством, накоплением, передачей и потреблением информации [3]. В связи с вышесказанным представляется совершенно

закономерным появление такой разновидности менеджмента как информационный, коротко

определяемого как управление информацией и управление с помощью информации. Кроме того, актуальными остаются вопросы правового регулирования и совершенствования

образовательного пространства.

Воронина Ирина Евгеньевна ВГУ, канд. техн. наук, доцент, тел. (473)2208698

Львович Яков Евсеевич - ВГТУ, д-р техн. наук, профессор, тел. (473)243-77-04

В будущем реально защищенным в социальном плане будет только широко образованный человек, способный гибко перестраивать направление и содержание своей деятельности в связи со сменой технологий и требованиями рынка.

Информационная среда сейчас настолько насыщенна, что возникает реальная проблема отбора, эффективного использования информации для скорейшего прогресса в соответствии с индивидуальными способностями и целями. Интернет-технологии еще более ужесточают эти требования, делая безусловной прерогативой умение ориентироваться в глобальных информационных ресурсах [4].

Современные развитые страны находятся в состоянии «информационного взрыва». Среди показателей, характеризующих динамику информационной ситуации, приведшей к «взрыву» называются уровень доступных информационных ресурсов и уровень активных информационных потребностей человечества. Однако, «быстрый рост информационных ресурсов «на определенном этапе ограничивается зоной насыщения информационных потребностей. Человеку, который не готов к избытку информации, грозит стресс - основная проблема информационной эпохи», более точно -«информационный тромбоз» [5]. Чтобы избежать подобной ситуации необходимо одновременное решение сразу двух задач: интеллектуализации среды обитания человека, то есть перевод часть информации и человеческих знаний на уровень бытовых устройств и телекоммуникационной инфраструктуры, и «технологизации» человеческих знаний, то есть разработки технологий для работы со знаниями для эффективного отбора и появления новых полезных знаний. В любом случае речь неизбежно будет идти об информационных технологиях и взаимодействии с компьютером. Современные информационные технологии включают растущее число автоматизированных информационных систем, средств массовой коммуникации, систем информационного поиска, систем машинного перевода. Общение с компьютером развивается в сторону использования

удобного для человека языка. Для нормального и эффективного взаимодействия необходимы технические устройства, способные к общению на национальном языке и созданию образа партнера [6].

Язык - важнейшее средство коммуникации и выражения мысли, инструмент познания,

постоянного осмысления мира человеком и превращения опыта в знание. Язык является не только средством для передачи и хранения информации, но и инструментом для формирования новых понятий, во многом определяющих сам способ человеческого мышления. Выбор конкретных языковых средств оказывает влияние на структуру мышления и тем самым на процесс восприятия и воспроизведения действительности

Выполняя функции источника и хранителя информации, язык одновременно является способом выражения накопленного знания и базой для формирования нового. Как «носитель информации» конкретный язык выступает в качестве инструмента социальной наследственности, благодаря которому человек может обращаться к знаниям и опыту предыдущих поколений, чтобы затем получать новые знания.

По мере развития новых информационных технологий острота вопроса, касающаяся проблем естественно-языкового общения, становится только ощутимее. Вступление мирового общества в эру информационной цивилизации обусловило ускорение и интенсификацию информационных процессов в сфере профессиональной коммуникации. В образовательной среде должны создаваться условия развития личности, максимально благоприятные для выявления и раскрытия творческих способностей. Актуален поиск путей реализации лингвистической среды для поддержки высокой эффективности технологии обучения. Кроме того, личностные качества специалиста формируются в современной социокультурной ситуации, в которой возникает необходимость развития профессиональной

коммуникативной компетенции, обусловленной потребностью аккумулировать информацию для установления информационного обмена.

Информационная среда сейчас настолько насыщенна, что перед обучаемым ним возникает реальная проблема ее отбора, эффективного использования для скорейшего прогресса в соответствии с индивидуальными способностями и целями. Интернет-технологии еще больше ужесточают ситуацию, требуя обязательное умение ориентироваться в глобальных информационных ресурсах. И здесь уместно вспомнить о тех проблемах, которые касаются поиска релевантной информации. Запрос на поиск представлен на естественном языке. Низкая эффективность поиска обусловлена в значительной мере проблемами анализа и формализации языка общения. Создание онтологий, использование терминологических словарей, поддержка настраиваемых баз данных по темам поиска и результатам не решают задачу поиска в полной мере. Даже применение

онтологического теста, использующего

морфологический и синтаксический анализ предложений лишь на несколько шагов продвинет ситуацию в направлении повышения эффективности поиска, поскольку позволяет лишь «наложить» анализируемый текст на онтологию конкретной предметной области. Очевидный вывод заключается в том, что без моделирования языковой среды нельзя в полной мере обеспечить эффективность реализации электронных образовательных

процессов. Адекватное моделирование языковой среды, в свою очередь, невозможно без выявления правил организации естественного языка в том виде, при котором мы можем говорить о вероятности максимально допустимой на текущий момент его формализации.

При построении систем автоматизации областей человеческой деятельности возникает необходимость проведения анализа предметной области и происходящих в ней процессов. Поэтому очень важно на этапе анализа построить исчерпывающую модель предметной области, или, другими словами, фиксировать онтологию этой предметной области, выделить структуру связей и понятий. Самое главное преимущество онтологического моделирования заключается в том, что эксперт, не обладая знаниями программиста, может с помощью интуитивно понятного

программного обеспечения задать спецификацию терминов предметной области, определить отношения между ними и логику высказываний. Далее на основе имеющихся высказываний аппарат логического вывода, представляющий собой

отдельный сложный программный продукт,

позволит делать выводы о новых знаниях из уже имеющихся. Таким образом реализуется и разделение труда в сфере формализации знаний.

Но для доказательства преимуществ онтологического подхода необходимо проводить сравнение реально действующих проектов, ставить эксперименты. Такая задача не под силу какой-либо одной организации. Важно привлечение ресурсов многих предприятий в рамках одной инициативы. Наиболее крупной «площадкой» для экспериментов с семантическими технологиями в настоящее время является проект Semantic Web. Суть его состоит в автоматизации «интеллектуальных» задач обработки значения (в семантическом смысле) тех или иных ресурсов, имеющихся в сети Интернет. Хотя за время, прошедшее со старта проекта в 2001 году, в концептуальном виде структура сети (World Wide Web) не изменилась, появился ряд критически важных средств, технологий и языков описания онтологий, необходимых для дальнейшего развития Semantic Web.

Второй по масштабу задач можно условно считать область информационного поиска (Information Retrieval). В современных поисковых системах тексты автоматически индексируются по набору составляющих эти тексты слов. Такое представление текстов как простого набора слов (bag of words) имеет большое количество очевидных

недостатков, затрудняющих поиск релевантных текстов, таких как:

1) избыточность — в пословном

индексе используются слова-синонимы,

выражающие одни и те же понятия;

2) независимость слов текста друг от друга, что не соответствует свойствам связного текста;

3) многозначность слов — поскольку многозначные слова могут рассматриваться как дизъюнкция двух или более понятий, выражающих различные значения многозначного слова, то маловероятно, что все элементы этой дизъюнкции интересуют пользователя.

Этих недостатков лишено так называемое концептуальное индексирование, то есть такое индексирование, когда текст индексируется не по словам, а по понятиям, которые обсуждаются в данном тексте. При такой технологии:

1) все синонимы сведены к одному и тому же понятию;

2) многозначные слова отнесены к разным понятиям;

3) связи между понятиями и соответствующими словами описаны и могут быть использованы при анализе текста.

Для того, чтобы попытаться реализовать схему автоматического концептуального индексирования и концептуального поиска необходимо иметь ресурс, описывающий систему понятий данной предметной области, то есть онтологию в данной предметной области.

Нужно отметить, что использование онтологий для информационного поиска в реальных широких предметных областях имеет ряд особенностей:

1) онтология должна быть очень большой величины;

2) понятия онтологии должны иметь аккуратно установленные связи с языковыми единицами — терминами предметной области;

3) онтология реальной предметной области не может быть полной, поэтому методы информационного поиска на основе онтологий должны сочетаться с методами информационного поиска на основе пословных методов в едином поисковом механизме;

4) задача информационного поиска предполагает использование онтологий для анализа свободных неограниченных связных текстов, для которых не существует хорошо развитых методов автоматической обработки.

Все эти факторы ограничивают внедрение онтологий в поисковые механизмы информационнопоисковых систем. Сложившаяся ситуация означает, что необходимы новые исследования для выяснения, онтологии какого типа могут быть наиболее эффективными при их использовании в задачах информационного поиска. Также необходима разработка комбинированных технологий информационного поиска, сочетающих методы на базе знаний, описанных в онтологиях, так и пословные методы, а также методов «быстрого»

создания онтологий для широких предметных областей на основе интеграции знаний уже

существующих онтологий.

И, наконец, достаточно трудоемкой в

исполнении, но очень привлекательной является задача использования онтологий для логического вывода, то есть для получения новых знаний из уже имеющихся. При этом следует различать reasoning и inference (оба эти понятия переводятся с

английского как «логический вывод», но в контексте практики онтологической разработки носят несколько различный смысл). Reasoner — это аппарат логического вывода, которые по

существующим аксиомам OWL выводит новые, причем эта задача сводится к задаче классификации, то есть распределения экземпляров по новым классам в добавление к уже существующим. Reasoning происходит путем добавления аксиом и отрицаний аксиом к существующей онтологии и последующей проверке полученной онтологии на непротиворечивость. Inference относится же, например, к выполняемым SWRL-правилам и представляет более сложную задачу, в частности, позволяет использовать для логического вывода композиции фактов

Необходимо отметить, что онтологическим моделированием правовых систем занимаются преимущественно не сами юристы, а специалисты в области искусственного интеллекта. Среди наиболее известных можно назвать таких исследователей, как Aldo Gangemi, Giovanny Sartor, Joost Breuker, Yorick Wilks, Trevor Bench-Capon и многие другие.

В России, однако, в широком доступе нет информации о наличии масштабных онтологических исследований в правовой области. В рамках Университетской информационной системы РОССИЯ (НИВЦ МГУ) используется Тезаурус по общественно-политической тематике АНО Центр информационных исследований, однако нельзя сказать, что данный ресурс имеет именно правовой характер.

Специфика российского права и незначительное распространение онтологического моделирования в правовой сфере России делают это направление для исследования очень привлекательным, не умаляя его сложности.

Принятие решений в юриспруденции носит субъективный характер (например, при вынесении приговора, судья должен руководствоваться помимо материалов дела, действующего законодательства, также своим внутренним убеждением -субъективным восприятием), что обусловлено недостаточной степенью формализации материала. В подобных условиях, как следствие, не приходится говорить не только о какой-либо автоматизации принятия решений, но даже о написании обучающих программ, позволяющих, например, проверять правильность решения учебных юридических задач, не говоря уже о задачах-казусах.

Исследование проблем принятия решений в юриспруденции может оказать влияние на совершенствование юридической техники.

Существует еще один аспект актуальности подобных исследований. Дело в том, что современные справочно-правовые системы

позволяют осуществлять поиск правовой информации, но для работы с ними необходимо иметь соответствующую подготовку. Формализация принятия решений может стать шагом к созданию принципиально иных автоматизированных юридических систем, которыми смогут пользоваться люди, не обладающие юридическими знаниями.

В [7] в качестве объекта исследования выбрана отдельная отрасль уголовное право. Выделение отношений между понятиями в уголовном законодательстве выполнено с учетом ряда их особенностей, таких как связывание большей части понятий отношениями классификации, качественный характер отношений, практическое отсутствие временных,

пространственных и информационных отношений, а также наличие специфических отношений, характерных только для юриспруденции. в рамках правовой составляющей социокультурной системы, зависящей от лингвистической среды,

сформирована модель предметной области (Уголовное право) для учебных задач квалификации преступлений с использованием методологии

проведения исследований лингвистических

процессов.

Таким образом, проверкой эффективности результатов лингвистических исследований

является применение полученной лингвистической теории и выработанных подходов для реализации управления конкретными социокультурными

процессами: в этой ситуации применение

лингвистического знания обозначит степень

Воронежский государственный университет Воронежский государственный технический университет

соответствия требованиям развития и произвести

коррекцию управления.

Литература

1. Манойло А.В. Государственная

информационная политика в условиях информационно-психологической войны / А.В. Манойло, А.И. Петренко, Д.Б. Фролов. . - 2-е изд., стереотип. - М.: Горячая линия - Телеком, 2006. - 541 с.

2. Панарин И.Н. Информационная война и геополитика / И.Н. Панарин. - М.: Изд-во «Поколение», 2006. - 560 с.

3. Зубов А.В. Основы искусственного интеллекта для лингвистов: Учеб. пособие./ А.В. Зубов, И.И. Зубова. - М.: Университетская книга; Логос, 2007. - 320 с.

4. Борзов Е.Ю. Перспективы и задачи

лингвистического образования в новой информационной среде.. -

(http://www.isuct.ru/konf/shcherba/trud/borzov.htm ).

5. Потапова Р. К. Введение в лингвокибернетику / Р. К. Потапова. - М. : Изд-во Моск. гос. лингв. унта, 1990. - 140 с.

6. Горелов И. Н. Основы психолингвистики : учебное пособие / И. Н. Горелов, К. Ф. Седов. -М. : Лабиринт, 1998. - 256 с.

7. Воронина И.Е. Создание базовой онтологии для Российской системы права на основе онтологии ЬК1Р_СОКБ / И.Е. Воронина, Е.А. Пигалкова // Вестн. Воронеж. гос. ун-та. Серия Системный анализ и информационные технологии. - 2010. -№ 1. - С. 154-159.

STRUCTURING THE MANAGEMENT OF THE LEGAL COMPONENT OF THE SOCIOCULTURAL SYSTEM BASED ON THE COMPUTER-AIDED RESEARCH OF THE EFFECTIVENESS OF USING AN ONTOLOGY MODELING LINGUISTIC ENVIRONMENT

I.Ye. Voronina, Ya.E. Lvovich

Test effectiveness of results of the linguistic research is the application of linguistic theory and developing approaches for implementation of the management of specific socio-cultural processes, in particular, the legal component of the socio-cultural system. Under consideration problems of ontological modeling in the legal field and their dependence on the effectiveness of linguistic research

Key words: linguistic environment, socio-cultural system, control and management in a social system, the ontology of the system, automation of the research

i Надоели баннеры? Вы всегда можете отключить рекламу.