Научная статья на тему 'Компьютерные системы управления поиском решения задач'

Компьютерные системы управления поиском решения задач Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
120
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Компьютерные системы управления поиском решения задач»

ний. Обозначим навигационное выражение как path=[s1...sM...sN], где si - i-й шаг; M - индекс шага с широкой вспомогательной осью, для которого будет проводиться преобразование. Обозначим каждый шаг как si = ai ::ni, где ai - ось; ni -

условие перехода, а ось descendant-or-self как ds. Тогда для расчета селективности навигационного выражения используем следующую формулу:

M-1

s(path) = Zs([s!...s,,aM::*,ds::nM,sM+1-sN]), где

i=2

apM - узкая вспомогательная ось, соответствующая aM .

Экспериментальные оценки

Для оценки свойств полученного обобщения использовались три набора тестовых данных, отличающихся структурой.

1. XHTML-страницы (спецификации W3C) как пример документ-ориентированных нерегулярных XML-данных. Особенностью этих данных является относительно большое количество узлов с различными именами.

2. Описание университетских курсов в виде XML как пример регулярных данных.

3. Пьесы Шекспира в виде XML в качестве компромисса между предыдущими двумя.

Эксперименты показали, что размер получившейся структуры для нерегулярных данных первого типа составил 20 % от размера исходного документа (измерялось количество узлов), а для последних двух типов - 0,08 % и 0,75 % соответственно.

Для определения точности методов оценки были сгенерированы все возможные XPath-запро-сы, содержащие по одному шагу по одной из вспомогательных осей. Эти запросы были разделены на четыре класса в зависимости от того, где

располагался шаг по вспомогательной оси - в конце (t) или в середине (m), и от типа самого шага (широкий или узкий). В таблице приведены результаты вычисления точности оценки. Здесь выражения с шагами по широким осям обозначены как major, а по узким - как minor.

Средняя относительная погрешность

оценки селективности

Шаги Тестовые данные, %

XHTML Шекспир Курсы

Minor_t 0 0 0

Minor_m 4,94 0,39 0

Major_t 77,08 3,25 0,02

Major_m 30,56 1,08 0,06

Из результатов экспериментов видно, что предложенная техника является достаточно компактной и точной для относительно регулярных данных, потребность выполнения запросов к которым встречается на практике наиболее часто. Таким образом, она может быть применена при построении оптимизаторов запросов, использующих стоимостные оценки.

Литература

1. Yannis E. Ioannidis. The history of histograms. The VLDB Journal, 2003, pp. 19-30.

2. Ashraf Aboulnaga, Alaa R. Alameldeen, and Jeffrey F. Naughton. Estimating the selectivity of XML path expressions for internet scale applications. The VLDB Journal, 2001, pp. 591-600.

3. Wei Wang, Haifeng Jiang, Hongjun Lu, and Jeffrey Xu Yu. Bloom histogram: Path selectivity estimation for xml data with updates. VLDB'04: Proceedings of the Thirtieth International Conference on Very Large Data Bases, 2004, pp. 240-251.

4. Roy Goldman and Jennifer Widom. Dataguides: Enabling query formulation and optimization in semistructured databases. In VLDB '97: Proceedings of the 23-rd International Conference on Very Large Data Bases, 1997, pp. 436-445.

5. Yury Soldak and Maxim Lukichev. Enabling xpath optional axes cardinality estimation using path synopses. ADBIS, 2008, pp. 279-294.

КОМПЬЮТЕРНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ ПОИСКОМ РЕШЕНИЯ ЗАДАЧ

П.П. Дъячук, к.ф.-ж.н.; П.П. Дъячук (мл.), к.пед.н.; Ю.С. Николаева

(Красноярский государственный педагогический университет им. В.П. Астафьева,

[email protected])

Рассматривается система управления учебной деятельностью с ограничениями на ресурсы: количество действий, время выполнения деятельности. Получены условия саморегуляции процесса научения, времени выполнения действий.

Ключевые слова: учебная деятельность, управление, саморегуляция, пространство поиска, ресурсы.

В системах искусственного интеллекта [Рассел С., Норвиг П.] проблема поиска решения задач состоит в нахождении алгоритма и соответствующей программы поиска допустимого пути в пространстве состояний из начального в целевое состояние. В настоящей работе предлагается ис-

пользовать этот подход для организации процесса научения решению задач не искусственного, а естественного разума, осуществляющего реальный поиск решения задачи в пространстве состояний. Для этого используются возможности информационных технологий, которые позволяют отобра-

зить пространство состоянии задачи в виде множества ситуаций и задать функцию определения преемника системой кнопок. Нажатие кнопки соответствует тому или иному действию, которое переводит задачу из текущей ситуации в следующую. Последовательность действий и ситуаций в графовом представлении можно рассматривать как путь, который проходит обучающийся в процессе поиска решения задачи. При этом он не обязан быть оптимальным.

Однако по мере научения путь, проходимый обучающимся, приближается к оптимальному, то есть со временем его деятельность становится безошибочной. В подходе, использующем пространство состояний, предполагается существование счетного множества s-состояний и множества o-операторов, которые отражают состояния множества s в себя. Решение задачи рассматривается как передвижение в пространстве, определяемом множеством этих состояний, для достижения желаемого множества целевых состояний.

Задача решена, когда найдется такая последовательность операторов

o=o(1),o(2),...,o(k), (1)

-о(к)(о(к-1)(...о(2)^0))...) ,

что sg = o( ) (o

(2)

где So - некоторое состояние из множества начальных состояний, а sg - из множества целевых состояний.

В качестве простого примера опишем граф пространства состояний задачи по преобразованию линейной функции y=kx+b. Данное пространство представляет собой граф, вершины которого находятся в узлах квадратных решеток. Каждой вершине соответствуют два числа (к, Ь). Первое число, к, соответствует тангенсу угла наклона графика, второе, Ь, показывает, насколько поднят или опущен график линейной функции вдоль оси Oy. Квадратные решетки соответствуют разным знакам к. Любая вершина графа может быть начальным состоянием графика линейной функции, как и любая вершина может служить целевым состоянием. Например, задача по преобразованию графика линейной функции из начального состояния (1, 0) в целевое (-3, -1).

Применим подход поиска решения задач обучающимися в пространстве состояний в компьютерной системе управления учебной деятельностью при научении решению задач. Наложим ограничения на ресурсы: количество учебных действий Y, время их выполнения Т. Если воспользоваться приближением равных «стоимостей» действий, то ресурс Y можно рассматривать как сумму денег, которую имеет обучающийся на начало учебной деятельности. Каждое выполняемое действие уменьшает эту сумму на единицу независимо от правильности или неправильности действия. Задача обучающегося состоит в минимизации трат ресурса Y, то есть перехода в процессе научения к

оптимальным траекториям деятельности по поиску целевого состояния.

Рассмотрим организацию учебной деятельности, в которой полезным результатом является минимум неправильных действий, а ресурс Y выделяется на каждую итерацию (или период работы) отдельно. Итерация под номером i соответствует i-му периоду работы, или i-заданию. Обозначим Yi ресурс, определяющий количество учебных действий в i-м периоде времени для обучающегося. Минимальное число действий, требуемых для решения задач в i-м периоде, обозначим Zi. Если интерпретировать тип обучающегося Rie [0; 1] как долю его успешных действий, то, выполняя в i-м периоде объем работ Yi* < Yi за время Ti, обучающийся достигнет результата Z* = RiYi*, при этом Z* ^Zi. В модели фигурируют три макропараметра: объем учебных действий Yi*, совершенных в i-й период Ti, соответст-*

вующий результат ZI, искомая переменная траектории обучения Rj.

Для того чтобы обучающийся мог изменять свое внутреннее состояние и таким образом перестраивать свою деятельность в процессе научения решению задач, необходимо, чтобы компьютерная система управления обеспечивала дополнительные петли обратной связи, дающей обучающемуся информацию о протекании процесса поиска решения текущей задачи, состоянии имеющихся ресурсов, функции ценности состояния обучающегося. Эта информация подается на вход обучающемуся с помощью таких датчиков, как «расстояние до цели», расхода ресурсов, значений функции ценности состояния обучающегося. Кроме информационных и мотивационных управлений, в системе имеется внедренный агент, который может активно вмешиваться в деятельность обучающегося, выполняя, как и обучающийся, те или иные действия. Воздействия внедренного агента носят институциональный характер.

Датчик «расстояние до цели» относится к информационному управлению, которое не препятствует совершению неправильных действий. Частота появления датчика «расстояние до цели» изменяется согласно результатам деятельности обучающегося. Кроме подсистемы, осуществляющей информационное управление в системе, имеется подсистема институциональных управлений. Если обучающийся в процессе работы так расходовал свой ресурс Yi, что его остатка хватает только на то, чтобы дойти до цели и при этом не сделать ни одной ошибки, то, следуя принципу последовательности, система управления включает институциональные управляющие воздействия. Деятельность подсистемы информационных управляющих воздействий сменяется деятельностью подсистемы институциональных управляющих

воздействий. Институциональные управляющие воздействия - это целенаправленное ограничение множества возможных действий обучающегося. Вероятно, что первыми управляющими воздействиями, формирующими поведение ребенка, являются институциональные. Они ликвидируют неправильные действия, не позволяя ребенку совершать действия, которые могут нанести ему вред. Решение об этих управляющих воздействиях принимают родители, с этой целью они должны постоянно наблюдать за поведением ребенка и незамедлительно отменять или ликвидировать его неверные действия. По мере взросления ребенка подобного рода управления применяются к нему все реже и реже, уступая место информационному воздействию. Однако в ситуациях, когда действия обучающегося угрожают его здоровью, подобного рода институциональные управления могут применяться. Например, инструктор по вождению автомобиля или самолета, наблюдая за обучающимся, оказывает мягкие информационные воздействия, давая ему возможность совершать действия, не вмешиваясь в них. Как только обучающийся начинает совершать действия, которые могут привести к роковым последствиям, инструктор немедленно отменяет или ликвидирует эти неправильные действия.

Каждое действие обучающегося фиксируется системой управления и записывается в специальный протокол. По достижении цели или исчерпании ресурсов система вычисляет долю успешных

действий: К, — ^, строится кривая научения. Для

запуска процесса научения в первом периоде работ ресурс Y1—Ъ1, а ресурс времени Т1 определяется по факту завершения работы. Для второго и последующих периодов работы ресурсы вычисляются рекуррентным образом:

. Z.

Yi+1 = Zi+1 + Y,(l-Z-),

(3)

Т.*

T = Y —

Ti+1 Yi+! Y* '

(4)

где 1, - фактическое количество успешных действий; Т.* - фактически затраченное время. Предельный переход 1 , ^Ъ.х означает, что количество фактически совершенных правильных действий меньше, чем необходимо для решения задач. Полное решение задачи может не состояться из-за нехватки временного ресурса Т1. Если временного ресурса достаточно, то, используя институциональное управление, система принудит обучающегося использовать ресурс Yj так, что он обязательно придет в целевое состояние. Поэтому, если фактическое количество правильных действий будет меньше необходимого, связано это будет с нехваткой временного ресурса Т1. В то же время из рекуррентной формулы (4) следует, что временной ресурс регулируется темпом выполнения действий обучающимся. Если обучающийся «медленный», то временной ресурс будет больше, если «быстрый», то ресурс будет, соответственно, меньше. То есть временной ресурс будет определяться темпом деятельности обучающегося, что является важной характеристикой его поведения. По мере научения ошибочные действия будут совершаться все реже и реже. Когда Yj будет равным 1, в течение нескольких периодов подряд, можно сделать вывод о том, что обучающийся научился решать поставленные задачи в условиях оптимальных ресурсов. В предлагаемых компьютерных системах управления из-за наличия дополнительных петель обратной связи деятельность обучающихся является саморегулируемой и взаимосвязанной с проблемной средой и личностью обучающегося.

Литература

Рассел С., Норвиг П. Искусственный интеллект: современный подход. 2-е изд.; пер. с англ. М.: Издат. дом «Виль-ямс», 2006. 1408 с.

СИСТЕМА КОМПЬЮТЕРНОГО КОНТРОЛЯ ЗНАНИЙ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ

А.М. Титов (Московский государственный институт радиотехники, электроники и автоматики (технический университет), [email protected])

Рассматриваются алгоритмы обучения и интерпретации нейронной сети, предназначенной для компьютерного контроля знаний. Нейросетевая технология может быть применена не только при моделировании отношения «обу-чаемый-педагог» при компьютерном контроле знаний, но и при рассмотрении других отношений «человек-человек». Рассмотрены вопросы программной реализации созданных алгоритмов.

Ключевые слова: Java, нейронные сети, генетические алгоритмы, контроль знаний.

В статье рассматриваются вопросы реализации нейросетевых технологий компьютерного контроля знаний (ККЗ). Нейросетевой алгоритм

ККЗ предполагает использование нейронных сетей (НС) для определения качества подготовки обучаемого (выставления оценки) [1].

i Надоели баннеры? Вы всегда можете отключить рекламу.