Научная статья на тему 'Задача коррекции поведения системы взаимодействующих автоматов'

Задача коррекции поведения системы взаимодействующих автоматов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
50
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА ЭЛЕКТРОННОГО ДИСТАНЦИОННОГО ОБУЧЕНИЯ / ЛОГИЧЕСКОЕ УРАВНЕНИЕ / ВИРТУАЛЬНЫЙ ПРЕПОДАВАТЕЛЬ ELECTRONIC DISTANCE LEARNING SYSTEM / BOOLEAN EQUATION / VIRTUAL TEACHER

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Герман Юлия Олеговна, Гурин Николай Иванович, Герман Олег Витольдович

В статье рассматривается формальная задача коррекции поведения «Учителя» в системе интерактивных взаимодействующих автоматов «Ученик» и «Учитель», образующих систему электронного дистанционного обучения. Процесс обучения моделируется как взаимодействие двух автоматов «Ученик» и «Учитель» с конечным числом возможных состояний. Приводится алгоритм коррекции поведения «Учителя», основанный на решении системы логических уравнений, преобразованных к виду, в котором участвуют только переменные состояния системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The paper considers a formal specification of a problem connected to a «Teacher’s» behavior correction in the system of interacting automata representing a «Teacher» and a «Student». The learning process is modeled as interaction of two automata with the finite number of states. A correction algorithm is based on solving a logical equation system reduced to a form involving state variables only.

Текст научной работы на тему «Задача коррекции поведения системы взаимодействующих автоматов»

ТРУДЫ БГТУ. 2012. № 6. Физико-математические науки и информатика. С. 161-164 161

УДК 512.8, 681.55

Ю. О. Герман, ассистент (БНТУ);

Н. И. Гурин, кандидат физико-математических наук, доцент (БГТУ);

О. В. Герман, кандидат технических наук, доцент (БГТУ)

ЗАДАЧА КОРРЕКЦИИ ПОВЕДЕНИЯ СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ АВТОМАТОВ

В статье рассматривается формальная задача коррекции поведения «Учителя» в системе интерактивных взаимодействующих автоматов «Ученик» и «Учитель», образующих систему электронного дистанционного обучения. Процесс обучения моделируется как взаимодействие двух автоматов «Ученик» и «Учитель» с конечным числом возможных состояний. Приводится алгоритм коррекции поведения «Учителя», основанный на решении системы логических уравнений, преобразованных к виду, в котором участвуют только переменные состояния системы.

The paper considers a formal specification of a problem connected to a «Teacher's» behavior correction in the system of interacting automata representing a «Teacher» and a «Student». The learning process is modeled as interaction of two automata with the finite number of states. A correction algorithm is based on solving a logical equation system reduced to a form involving state variables only.

Введение. Системы взаимодействующих автоматов находят важное практическое применение, например, в параллельном программировании [1], реализации электронных виртуальных обучающих сред [2, 3] и др. В электронной обучающей среде взаимодействуют два автомата - ведущий («Учитель») и ведомый («Ученик»). Специфика такой системы состоит в том, что «Учитель» организует свое поведение, опираясь на поступающие от «Ученика» сигналы, но состояние «Ученика» «Учителю» достоверно не известно и определяется предположительно.

В этой статье мы рассматриваем систему из двух автоматов: ведущего и ведомого. Поведение этой системы можно описать правилами следующего вида:

<> ак ^ <3£т> {Рг}, (1)

читаемых так: «если состояние ведущего автомата есть 8, ведомого автомата - Qj и на вход ведущего автомата поступает сигнал а, то ведущий автомат переходит в состояние 81, а ведомый (гипотетически) - в состояние Qm и при этом реализуется поведенческий сценарий (алгоритм управления) Рг».

Суть рассматриваемой нами задачи состоит в следующем. Имеется набор правил типа (1). Заданы: последовательность сигналов SQAi = <а1г-, а2г, ..., ай>, полученных от ведомого автомата, начальные состояния 80 и Qo ведущего и ведомого автоматов соответственно и последовательность совершенных переходов:

SQTrг = {<Яо, Qo>, <Я, QlI■>, ..., <8_ы, Qí-U>},

приведших к текущему состоянию системы <%_

1,1, Qt-1,i>.

В этом последнем состоянии поступил сигнал ай, для которого не обнаружено подходя-

щее правило (1). Таким образом, ведущий автомат не может среагировать на сигнал от ведомого автомата. Подобная ситуация в системе электронного обучения означает необходимость коррекции поведения «Учителя», поскольку в каком-то месте он не верно идентифицировал состояние «Ученика». Это возможно в двух случаях:

1) система правил (1) является недетерминированной, что означает наличие, по крайней мере, двух правил вида

<ад>а ^ <ад> {Р,},

<>ас ^ <> {Рг2},

так что ведущий автомат может произвести ошибочный выбор одного из этих двух правил;

2) если переходы в SQTr выполнялись детерминировано, то система правил (1) является неполной или некорректной (либо и то, и другое). Этот случай в данной статье не рассматривается.

Таким образом, возникает задача выбора новой последовательности SQTr, которая допускает сигнал Ой и переход в новое состояние.

Идентификация состояний по сигналам. Прежде чем перейти к решению сформулированной задачи, коротко рассмотрим проблему идентификации состояний по сигналам. Полагая, что каждое состояние ведомого автомата может быть связано с набором признаков а (сигналов), будем идентифицировать состояния как

Q] < а}1, ..., . (2)

Проблема идентификации возникает тогда, когда, скажем, два состояния Qr и Qs имеют общие признаки и именно эти признаки поступают

на вход ведущего автомата. Эта задача идентична задаче поиска документа по ключевым словам, где ключевые слова и играют роль признаков, а документы характеризуются наборами специфических ключевых слов, которым могут быть приписаны веса. В этой постановке задача идентификации рассмотрена, например, в [4], так что ее дальнейшее обсуждение выводит нас за рамки работы.

Иллюстративный пример и обсуждение. Для удобства пара состояний <Si, Qj> далее нами заменена на одно состояние Wp. Рассмотрим следующую систему правил:

(a) w0aj ^ w,,

(b) Wo а ^ w2,

(c) Woa2 ^ W3,

(d) w,a2 ^ w3,

(e) w,a2 ^ W4,

f wa ^ Wo, (3)

(g) W2 аз ^ W4,

(h) W2«4 ^ Wo,

(i) W3«5 ^ W2,

j) W3«5 ^ W4,

(k) w3a6 ^ STOP, (l) w4a6 ^ STOP.

Пусть SQA = <аь а2, а5>, SQTr = <w0, w,, w4>.

В состоянии w4 сигнал а5 не обрабатывается. Следовательно, необходимо переопределить SQTr. С этой целью мы составляем систему логических уравнений (в форме дизъюнктов), решением которой будет одно или несколько новых вариантов SQTr (при допущении, что система (3) корректна), которые допускают сигнал а5 на третьем такте работы. Достоверно известно, что система стартовала из w0 по сигналу а,. В (3) имеются только два правила (a) и (b), относящиеся к этому случаю. Поэтому можно записать

Wo(1) ла, ^Wj(2), Wo(1) ла, ^ W2 (2).

В скобках указываем номер шага. Ясно, что может иметь место только одно из состояний w,(2) или w2(2), т. е. получаем

w, (2) v W2(2), —w, (2) v-w2(2).

Кроме того, имеем дизъюнкты а1;

Продолжаем наращивать систему дизъюнктов со второго шага. У нас есть два состояния ^1(2) и ^2(2) и сигнал а2. Выписываем следующие дизъюнкты:

«2,

(2) ла2 ^^4(3).

Из ^2(2) сигнал а2 не обрабатывается. Значит, имеем дизъюнкт

—2(2).

Далее по аналогии получаем

а2,

^з(3) V ^4(3),

—^3(3) V—(3).

На третьем шаге имеем только два возможных состояния ^3(3) и ^4(3). Получаем

^3 (3) л а5 ^^2(4),

^3 (3) л«5 ^^4(4),

—^4(3),

а5,

^2(4) V ^4(4),

—^2(4) V—^4(4).

Теперь запишем окончательно всю систему в форме системы дизъюнктов:

(a) —и>0(1) v—al V^(2),

(b) —^о(1) V —а V ^2(2), (с) ^1(2) V ^2(2),

(О) —^1(2) V— ^2(2), (е) а1,

(/) ^о(1),

(Я) —^1(2) v—a2 V^3(3), (И) —^1(2) v—a2 V^4(3), (О —^2(2), (/) а 2, (к) Wз (3) V *4(3), (/) — wз(3) V—w4(3),

(4)

Задача коррекции поведения системы взаимодействующих автоматов

163

(т) —(3) V —а5 V w2 (4),

(и) —^(3) V—а 5 V ^(4),

(о) 1^4 (3),

(Р) а5,

к) ^(4) V ^(4), (г) —^(4) V—^(4).

Наша задача свелась к тому, чтобы исключить из системы (4) литеры аь а2, а5, а для оставшейся системы дизъюнктов найти все подходящие решения. Операция исключения литер описана в [5, 6].

Пусть исключается Тогда пометим все дизъюнкты в (4), содержащие а^—а^. Оставшиеся дизъюнкты без изменений перепишем в новую систему. Найдем все возможные резольвенты с отсекаемой литерой а^—а^ среди помеченных дизъюнктов. Если эта резольвента не тавтологическая, то перепишем ее в новую систему (родительские дизъюнкты, участвующие в резолюционировании, в новую систему не добавляются). Так, при исключении а^—а^ выпишем

а1,

—и>о(1) v—а1 V w1(2), —и>о(1) v—а1 V *2(2).

Они дают две резольвенты

—^о(1) V ^(2), —^о(1) V w2(2),

которые мы и перепишем в новую систему. Затем избавимся аналогично от а2 и а5. Результирующая система дизъюнктов будет такой

—^о(1) V ^(2), —^о(1) V w2(2), ^х(2) V ^(2),

—м>1 (2) V—^2(2), ^о(1), —^2(2), ^(3) V ^(3),

—^3 (3) V—^(3), ^(4) V *4(4),

—^2(4) V—^4(4).

(5)

Найдем решение системы (5): w0(1), Wi(2), w3(3), (w2(4) v w4(4)), при этом получим два продолжения:

SQT'r =<Wo, Wi, W3, W2 >,

SQT" = <Wo, Wi, W3, W4 >.

Необходимо произвести выбор между w2 и w4, что должно выполняться с учетом специфики решаемой задачи.

Заключение. Предложенные алгоритмы взаимодействия системы «Ученик» - «Учитель» как автоматов с конечным множеством состояний из их поведенческой базы реализуют функции виртуального преподавателя, что обеспечивает процесс обучения в системе ДО. Описанная методика может найти применение в системах электронного обучения, в синтезе поведения интеллектуальных роботов, в экспертных системах. Ее преимущество перед прямым перебором в очевидном сокращении затрат на выбор правильного решения.

Любопытно перейти к модальному исчислению типа Крипке для описания гипотетических знаний. Именно такого рода язык требуется для описания поведения «Ученика». Рассмотренная методология сохраняет силу, если модальные формулы интерпретировать формулами трехзначного исчисления Я. Лукасе-вича, в котором значения x определены так val (x) ={0; 0,5; 1}. Тогда модальности необходимости и возможности интерпретируются следующим образом:

□ x ^ val (x) = 1, 1

откуда

0x ^ val( x) > —, 2

-iOx = □ — x ^ val(x) = 0.

Используем эти соотношения, например, для интерпретации формулы

◊x v □ —y.

(6)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Имеем

Ох = |!(X) > 2, □ —у = Ц(—у) = 1.

Таким образом, формулу (6) можно переписать таким образом:

ц( х) > 2 у) = 1.

Последнее выражение относится к нечеткой логике и требует соответствующего математического аппарата, который здесь не рассматривается.

Важной остается общая идея замены модальных формул формулами нечеткой (или многозначной) логики. Это является предметом дальнейшего анализа.

Литература

1. Хоар, Ч. Взаимодействующие последовательные процессы / Ч. Хоар. - М.: Мир, 1989. -264 с.

2. Гурин, Н. И. Интеллектуальный анализатор запросов к базе знаний мультимедийного электронного учебника / Н. И. Гурин, О. В. Герман // Труды БГТУ. Сер. VI, Физ.-мат. науки и информатика. - 2010. - Вып. XVIII. -С. 167-170.

3.Моделирование процессов обучения /

B. В. Кудрявцев [и др.] // Фундаментальная и прикладная математика. - 2oo9. - Т. 15, № 5. -

C.111-169.

4. Герман, О. В. Java и интернет-бизнес / О. В. Герман, Ю. О. Герман. - Минск: Бест-принт, 2o1o. - 384 с.

5. Герман, О. В. Экспертные системы / О. В. Герман. - Минск: БГУИР, 2oo5. - 92 с.

6. Герман, О. В. Одна полиномиально разрешимая задача синтеза поведения интеллектуального робота / О. В. Герман, Д. В. Семерюк // Автоматика и телемеханика. - 2oo1. - № 2. - С. 15-21.

Поступила 28.02.2012

i Надоели баннеры? Вы всегда можете отключить рекламу.