Научная статья на тему 'Концепция самообучающегося агента в мультиагентной системе корпоративного обучения'

Концепция самообучающегося агента в мультиагентной системе корпоративного обучения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
90
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Концепция самообучающегося агента в мультиагентной системе корпоративного обучения»

Концепция самообучающегося агента в мультиагентной системе корпоративного

обучения

А.Н. Швецов, ФГБОУВПО «Вологодский государственный технический университет», декан факультета заочного и дистанционного обучения, профессор, д. т. н., smithv@mail.ru; В.И. Летовальцев, ООО «Эр-Стайл Софтлаб Северо-Запад», руководитель группы разработки IBRS департамента систем электронного банковского обслуживания, letovaltsevvictor@gmail.com; А.М. Куртасов, ФГБОУ ВПО «Вологодский государственный технический университет», аспирант, akurtasov@gmail.com

Введение

Под корпоративным обучением понимается обучение сотрудников в рамках отдельной компании с учетом ее специфических требований. Без такого обучения ни один специалист, даже самый квалифицированный, не будет полностью отвечать нуждам компании. Кроме того, в современных условиях, многие компании стремятся привить сотрудникам особую корпоративную культуру, корпоративные ценности, особый стиль решения производственных задач и т. п. По этим причинам корпоративное обучение является необходимым для любой компании, а иногда принимает стратегическое значение.

В 2011 г. компания «Амплуа» провела комплексное исследование систем корпоративного обучения и развития (СКО) в России и Украине под названием Trainings INDEX [1]. В этом исследовании выделен ряд тенденций, позволяющих говорить о том, что компании проявляют все больший интерес к корпоративному обучению и готовы вкладывать в эту сферу значительные инвестиции.

Помимо прочего, в исследовании была оценена тенденция использования технологий электронного обучения и систем управления обучением (LMS). Бюджет российских компаний на такие средства составил в 2010 году 5,4% от общего бюджета, затрачиваемого на обучение. Даже несмотря на неизбежный рост этого показателя, следует признать, что на данный момент вложения в системы электронного обучения ничтожно малы по сравнению с традиционными видами обучения. Поэтому актуальной представляется проблема повышения эффективности электронных средств, применяемых для корпоративного обучения.

Как правило, СКО создаются для решения следующих задач:

• обучение и оценка персонала;

• внедрение корпоративной культуры;

• построение и развитие карьеры;

• управление эффективностью деятельности сотрудников;

• управление знаниями.

Первые две задачи легко решаются как традиционными, так и электронными средствами обучения. Третья и четвертая задачи требуют личностного подхода. Пятая задача, которой посвящена данная статья, связана с проблемами извлечения знаний из неформализованных источников и представления знаний в информационных системах.

В Вологодском государственном техническом университете разрабатывается проект интеллектуального агентно-ориентированного учебного комплекса (ИАОУК). Указанные задачи в ИАОУК решаются посредством мультиагентной технологии.

1. Постановка задачи

Основным источником полезной с точки зрения обучения информации являются тексты на естественном языке, хранимые в файловом архиве компании. Эффективная обработка и хранение информации не возможны без учета семантики. Большинство современных хранилищ данных не оперируют данными на смысловом уровне. Результатом этого является избыточность и пересечения хранимых данных, сложность организации эффективного поиска и доступа к интересующим пользователя данным.

В ИАОУК предполагается наличие таких интеллектуальных возможностей, как периодическое тестирование персонала по знаниям, накопленным в компании; подбор информации по конкретным вопросам; а также формирование индивидуальных траекторий обучения сотрудников. Для этих возможностей требуется структурированная база знаний, из которой соответствующие интеллектуальные агенты могли бы получать необходимую информацию.

Таким образом, возникает идея создания интеллектуального агента, предназначенного для извлечения смысла из текста с целью формирования базы знаний, основанной на семантических сетях.

2. Семантическая обработка текстов для заполнения базы

знаний

Логический подход к семантическому анализу естественных языков интенсивно исследуется в работах лингвистов и логиков и, по мнению авторов, имеет большой потенциал при эффективной реализации средствами современных программных интеллектуальных систем.

При создании моделей и методов семантического анализа могут использоваться различные логические формализмы: семантика смысла и денотата Г. Фреге; теория объектов и пропозиций Б. Рассела; теория

истины А. Тарского; семантика возможных миров С. Крипке; теория типов Б. Рассела и К. Айдукевича.

Новое направление в этой области, получившее название формальная семантика, сформировали работы Ричарда Монтегю. Основная идея данного направления выражена в названии одного из его основополагающих трудов - «English as a formal language» [2]. Любой естественный язык предлагается понимать как формальный логический язык, который является более сложным по отношению к существующим формальным языкам. При описании естественного языка предлагается использовать такие же понятия и конструкции, как для других логических языков.

В данной концепции предлагается метод семантической обработки информации на основе логики Р. Монтегю [3].

Выделяются следующие модули единой системы обработки текстовой информации в формальной семантике (рис. 1).

Преобразование _____

Текст на естественном языке

Языковая Формальное

составляющая представление

Набор категории Типы

Правила трансформации Правила пребразования формул

Набор формул

высказываний +

Meaning Postulates

Рис. 1. Обработка текстовой информации в формальной семантике на основе логики Монтегю

Входные данные для системы - это текст на естественном языке. На основе лингвистической обработки текста строится набор категорий интенсиональной логики для дальнейшего применения правил трансформации (ПТ) синтаксических конструкций в элементы единой формулы, отражающей смысл высказывания. Формальное представление не зависит от конкретного естественного языка и представляет собой набор типов и операций над формулами. Результатом обработки является формализованное представление смысла текста в виде набора формул, отражающих смысл предложений и множества постулатов значений, представляющих фоновые знания о мире. Метод заключается в применении алгоритмов формализации смысла естественно-языковых текстов, заполнении базы знаний и интерпретации на ней запросов пользователей (обучаемых, преподавателей, тьюторов) или интеллектуальных агентов (рис. 2) [4]-[5].

Рис. 2. Метод семантической обработки информации на основе логики Монтегю

Первые три этапа объединены единым алгоритмом формализации естественно-языковой фразы (рис. 3). Сначала проводится лингвистическая обработка фразы языковым процессором с целью построения синтаксического дерева. Дерево синтаксических категорий, построенное синтаксическим анализатором представляется в виде множеств Syn и Morph.

Morph= {тагркэЛеМ | morph3JieM = (Uf,Bf,PoS,NiS,SN)},

где Uf (used form) - используемая форма слова, Bf (begin form) - начальная форма слова, PoS (part of speech) - часть речи, NiS (number in sentence) - номер юнита в предложении, NS - номер предложения в тексте, которому принадлежит юнит.

Множество синтаксических описаний определим следующим образом:

Syn = {упг | syn = (SynN,SubS,synJsynk)

где SynN (syntactic name) - имя синтаксической категории анализатора, SubS - упорядоченное множество синтаксических подкатегорий данного синтаксического узла, определяемое так:

SubS = {subs | subs e Morph v subs e Syn}.

Множество SubS упорядочено на основе порядка следования синтаксических элементов и слов в предложении. При этом ни один узел дерева не может быть собственным подузлом или подузлом его потомков.

}

Далее осуществляется рекуррентный обход узлов дерева с целью применения функции генерации формулы на основе ПТ:

/гаер = {(Кат1ов1 ,SubME,Form) | SubME с ME л Form e ME л fKa^i ,SubME,Form) e /г=н

где KaTlogic - множество категорий интенсиональной логики (или их идентификаторов), SubME - множество подформул данного узла, Form - результирующая формула узла, ME - множество правильных формул интенсиональной логики.

Для определения категории узла синтаксического дерева используется табличная функция отображения категорий синтаксического анализатора в категории интенсиональной логики:

Уотобр , Klogic) 1 K-syn e Кат5упк1с^1с e Ка-т\0£1с(квуп>к\0£1с) S /отобр}

где Kaтsyn - множество категорий синтаксического анализатора, Кать^ -множество категорий интенсиональной логики.

В целом функцию формализации ЕЯ выражения представим в виде

/форм = f Фраза ЕЯ, Form) | Form e ME л (Фраза ЕЯ, Form) e /фоРм }

где ФрaзaEЯ - фраза на естественном языке.

Под интерпретацией формулы в формальной семантике понимается установление ее истинностного значения на основе представленной теоретико-множественной картины мира. Для корректного применения функции интерпретации в технической системе представляется необхо-

г бз

димым разделение данных о состоянии мира (J int erp ) и процедур

интерпретации фрагментов языка логики (fn erp 8).

Пусть формула представлена в виде множества узлов FNS. Каждый узел представляет собой кортеж элементов (rule,nodeStr,SFNS), где rule - применяемое синтаксическое правило, nodeStr - строковое представление узла, SFNS - множество подузлов данного узла.

Г БЗ

Тогда функцию интерпретации на базе знаний Лй erp можно представить в виде

Рис. 3. Алгоритм формализации ЕЯ-фразы

где № - узел синтаксического дерева формулы, для которого производится интерпретация, - упорядоченное множество результа-

1

тов интерпретации всех подузлов интерпретируемой формулы; Геяглегр -результат интерпретации /-той подформулы; ге8ыегр - общий результат

г БЗ

интерпретации формулы; } д - функция доступа к базе знаний.

Графическое представление алгоритма интерпретации приведено на рис. 4.

Рис. 4. Алгоритм интерпретации формулы формальной семантики

Интерпретации правил уровня языка логики определим как функцию функций вида А«, -«■орег^Ке

где егр 8 - функция интерпретации подформулы уровня языка,

■] -' - ТвЛ*гр }

°рег - символьное обозначение операции, А10р - множество всех имен операций, определенных в данном варианте языка логики, гезы егр - общий результат интерпретации формулы, ^-^^твгр - упорядоченное множество результатов интерпретации всех подформул интерпретируемой формулы.

I

3

Получение множества формул

FSet |

Получение

целевой семантической сети SemNet

Клонировать семантическую сеть

Ух| х е Г8е1

Заполнить_базу

М

Для реализации механизма заполнения базы знаний предлагается расширить толкование термина «интерпретация», используемого в формальной семантике. Под интерпретацией будем понимать не просто вычисление истинностного значения формулы, а отображение знакового представления выражения на определенную картину мира. При этом может проводиться, как интерпретация с целью вычисления выражения, так и интерпретация для изменения модели предметной области, на которой производится отображение.

Для заполнения базы знаний на основе данных текста строится формальное представление ЕЯ-текста в виде множества набора формул интенсиональной логики. Затем определяется целевая семантическая сеть и происходит её клонирование с помощью операции Результатом такого клонирования является семантическая сеть, имеющая пометы на всех узлах, показывающие её принадлежность к определенному тексту (рис. 5).

Далее происходит интерпретация каждой формулы с целью нанесения признаков объектов, представленных в формуле на семантическую сеть. Для этого все узлы интерпретируются стандартно, кроме узлов правила S3: если abеTYF оеМ^, РеМЕа, то

Эти узлы применяются для добавления свойств семантическим объектам, получаемым в качестве значения их подформул. Если в качестве подформул выступают переменные, то такие узлы интерпретируются также стандартно.

Заключение

В рамках представленной концепции могут быть построены программные интеллектуальные агенты, способные извлекать новые знания из естественно-языковых текстов и формировать многоуровневые базы знаний по взаимосвязанным предметным областям. К таким базам знаний будут обращаться интеллектуальные агенты, осуществляющие процессы обучения сотрудников корпорации, что позволит обеспечить накопление и эффективную передачу корпоративных знаний. Новые

Конец

Рис. 5. Заполнение БЗ

интеллектуальные способности самообучающихся агентов открывают перспективы существенного повышения эффективности компьютерных систем корпоративного обучения.

Литература

1. Корпоративные системы обучения в России: взгляд Trainings INDEX 2011. URL: http://www.slideshare.net/Trainings/trainings-index-2011 (дата обращения: 01.11.2011).

2. Montague, R., "English as a formal language," in Formal Philosophy, edited by R. H. Thomason, Yale University Press, 1974. Originally published 1969.

3. Летовальцев В. И. Программная формализация естественного языка средствами формальной семантики / В. И. Летовальцев, А. Н. Швецов // Программные продукты и системы - 2010. - №3. - C. 85-90.

4. Швецов А. Н., Летовальцев В. И. Агентный семантический поиск в корпоративных информационных хранилищах / Автоматизация и энергосбережение машиностроительного производства, технология и надежность машин, приборов и оборудования. Материалы третьей международной научной -технической конференции В 2-х т. - Вологда: ВоГТУ, 2007. - Т. 2. С. 147150.

5. Швецов А. Н., Летовальцев В. И., Агент семантического поиска информации на основе онтологий. //Научный сервис в сети Интернет: многоядерный компьютерный мир. 15 лет РФФИ: Труды Всероссийской научной конференции. - М.: Изд-во МГУ, 2007. - С. 295-299.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.