УДК 681.3.06+37.01:014.544+629.7.066 Г.С. Курганская
Иркутский государственный университет
АНАЛИЗ ИНТЕЛЛЕКТУАЛЬНЫХ ИНТЕРНЕТ -РЕСУРСОВ ИНФОРМАЦИОННОЙ ОБРАЗОВАТЕЛЬНОЙ СРЕДЫ
В статье представлен подход к анализу интеллектуальных ресурсов в облаках Интернет -обучения, который позволяет эффективно в динамике пересчитывать коэффициенты соответствующей сети доверия Байеса.
Ключевые слова. Интернет-технологии, мультиагентные системы, самоорганизация, сети доверия Байеса
G.S. Kurganskaya
Irkutsk State University
ANALYSIS OF INTELLECTUAL INTERNET-RESOURCES INFORMATION EDUCATIONAL ENVIRONMENT
The article presents an approach to the analysis of intellectual resources in the Internet - training clouds, which allows efficiently in the dynamic to recalculate the coefficients of the corresponding Bayesian belief network.
Keywords. Information educational environment? Internet technologies, multi-agent systems, self-organization, Bayesian belief network.
Облачные технологии стали уже общепринятым инструментом работы в Интернет. Главным образом это относится к организации хранения информации пользователей и, соответственно, доступа к ней, а также простых инструментов по ее обработке. На наш взгляд, наибольший - синерге-тический - эффект может дать интегрированное использование всех возможностей облачных технологий, что освобождает как «профессора»- разработчика интеллектуальных ресурсов, так и «студента» - потребителя от необходимости знать «где» и «как», и позволит сосредоточиться на главных вопросах: «что» и «зачем». Именно такой подход реализуется в интеллектуальной Интернет - платформе ГЕКАДЕМ Иркутского государственного университета [3].
Архитектура Интернет - платформы представляет собой интегрированную мультиагент-ную систему, функционирующую в динамично меняющемся Интернет - облаке интеллектуальных ресурсов [4]. В основу реализации самоорганизующейся системы Интернет - обучения заложен мультиагентный подход [1]. Принципиально различаются два класса агентов платформы: владельцы ресурсов и пользователи ресурсов. Внутри классов агенты делятся по типам, и соответственно видам [5]. При этом поведение тех и других агентов будет определяться логикой, построенной на теории игр, где параметры стратегий игроков (агентов) динамически пересчиты-ваются по сетям доверия в соответствии с байесовским подходом [6].
Такой подход полностью соответствует принципам адаптивного поведения и самоорганизации, и реализован в прототипе системы. При этом предполагается, что пересчет коэффициентов доверия для каждого узла сети выполняется как при каждом обращении к нему, так и при появлении нового ресурса [5].
В процессе работы выявились серьезные трудности алгоритмического и вычислительного характера, о которых, конечно, было известно до начала работы, но их масштаб был явно недооценен автором.
В частности, для пересчета коэффициентов конкретного узла сети необходимо построить дерево по некоторому подграфу сети доверия - окрестности этого узла. Это позволяет избежать явной рекурсии, но требует «заморозить» текущее состояние подсети, и, следовательно, временно заблокировать использование соответствующих ресурсов облака. Хотя принципиально эта проблема разрешима, но уже понятно, что при реальной работе это может приводить к существенному замедлению процесса в системе. Не исключена также вероятность полного зависания в случае, если агенты не могут договориться при «дележе» сети для построения деревьев пересчета.
Такие опасения нельзя считать преувеличенными, поскольку следует помнить, что параллельно идет множество таких процессов пересчета, а также процессов более высокого уровня, в том числе распределения интеллектуальных ресурсов между агентами. В частности, автор столкнулся с подобными трудностями уже на прототипе системы, где количество ресурсов немного выходило за сотню, а агентов - несколько десятков.
На наш взгляд, приемлемым решением этой проблемы будет подход, который используется в наукометрике для подсчета ценности научной статьи - индекс цитирования. Он стал одним из основных критериев оценки работы как отдельных ученых, так и деятельности научных и образовательных организаций. В настоящее время используется несколько видов этого показателя: индекс Хирша, Российский индекс научного цитирования, Web of Science, Scopus и другие. Каждый из них имеет свои достоинства и недостатки, но все они рассчитывается по объективным данным о публикациях и ссылках на них из других работ. Это относится в основном к статьям из периодической печати [2].
Весьма примечательно, что подобный подход использовали авторы поисковой системы GOOGLE, но для подсчета рейтинга сайта они учитывают не только количество ссылок на него из других сайтов, но также и рейтинг этих сайтов [7].
Собственно формула расчета рейтинга сайта проста:
m
RR(A) = (1 - d) + (d * £ RR(T) / С(T) (1)
i=1
где:
A - оцениваемый сайт
PR(A) -PageRank(A) - вычисляемый ранг (рейтинг) этого сайта
Ti - сайты, на которых есть ссылки на оцениваемый сайт
C(Ti) - общее количество исходящих ссылок в сайте Ti
d - коэффициент затухания, с помощью которого задается вероятность того, что страница скучная, и пользователь покинет ее при первой возможности. Авторы алгоритма предлагают для начала брать d=0.85
Рассмотрим реализацию этого подхода для расчета рейтинга узлов сети доверия Байеса облака образовательных ресурсов. В соответствии с KFS моделью представления знаний [3] на множестве образовательных ресурсов -кластеров существуют два базовых отношения строгого частичного порядка:
part (x,y) -объект x входит в состав объекта y
source (x, y) - знания из объекта x нужны при изучении объекта у.
По большому счету эти отношения можно рассматривать как разновидности ссылок из ресурса y на ресурс х. Поэтому для расчета рейтинга ресурса по отношению part (x, у) будем использовать формулу, аналогичную формуле (1).
m
RRpart (x) = dpart + (1 - dpart) * £ RR(yt) / Cpart (y ) (2)
i=1
где x - оцениваемый ресурс
RRpart(x) -ResorceRank(x) - вычисляемый рейтинг этого ресурса по отношению
part(x,y)
yi - ресурсы, в состав которых входит ресурс Cpart (yi) - общее количество компонент в ресурсе y
dpart - степень уверенности в «самоценности» ресурса, задается априори 0.5
Соответственно, для расчета рейтинга ресурса по отношению source (x, y) будем использовать формулу
m
RR (x) = d + (1 - d ) * £ RR(y ) / С (y.) (3)
source V / source \ source / / > V^ i /' ^ source V i / V /
i=1
где x - оцениваемый ресурс
RRsource(x) -ResorceRank(x) - вычисляемый рейтинг этого ресурса по отношению source(x, y)
yi - ресурсы, при изучении которых нужны знания из ресурса x
Csource (yi) - общее количество ресурсов, знания из которых необходимы при изучении
yi
dsource - степень уверенности в «самоценности» ресурса, задается априори 0.5
Понятно, что в нашем случае для оценки ресурса в целом необходимо учитывать вклад каждого отношения. Проще всего это сделать через взвешенное суммирование соответствующих значений:
RR(x)= p* RRpart(x)+(1-p)* RRsource(x) (3)
где p- весовой коэффициент рейтинга, полученного за «работу» ресурса в составе других
ресурсов.
Такой подход позволяет избавиться от итерационной процедуры пересчета коэффициентов доверия, свойственной классическим сетям доверия Байеса. Теперь рейтинги пересчитываются только при появлении нового интеллектуального ресурса y, и только для тех ресурсов x, которые либо входят в его состав, т.е с которым он связан отношением part (x^), либо знания которых необходимы для его изучения, т.е. с которыми он связан отношением source(x,y) [3].
Авторы считают, что в данной работе новыми являются следующие положения и результаты:
• предлагаемый подход существенно снижает алгоритмическую и вычислительную сложность расчета динамики сетей доверия Байеса облака интеллектуальных ресурсов информационной образовательной среды.
• подход реализован в прототипе платформы Интернет- обучения ГЕКАДЕМ. Хотя масштаб прототипа весьма далек от реальных облачных вычислений, но уже заметно, что нам удалось преодолеть вычислительную сложность динамического пересчета коэффициентов интеллектуальных ресурсов Байесовской сети доверия.
Это позволило перейти к одной из ключевых проблем самоорганизации мультиагентной системы: разрешению конфликта интересов собственников и пользователей ресурсов.
Список литературы
1. Городецкий В.И. Самоорганизация и многоагентные системы. Модели многоагентной самоорганизации // Известия РАН. Теория и системы управления. 2012. № 2. С. 92-120.
2. Индексы научного цитирования / Научная библиотека Воронежского государственного аграрного университета имени императора Петра I [Электронный ресурс] - URL: http://library.vsau.ru/?page_id =1385 (15.01.2018)
3. Курганская Г.С. Облачные технологии Интернет-образования на основе KFS модели представления знаний // Вестник Бурятского государственного университета. Серия: Математика и информатика. № 9. - Улан-Удэ, 2013. С. б9-7б.
4. Курганская Г.С. Мультиагентный подход в Интернет-образовании на основе облачных технологий: Труды Международной суперкомпьютерной конференции «Научный сервис в сети Интернет: все грани параллелизма:». М.: Изд-во МГУ, 2013. С. 512-515
5. Курганская Г.С. Взаимодействие агентов в облаке Интернет-образования // Информационные и математические технологии в науке и управлении: Труды XX Байкальской Всероссийской конференции. Ч. 3. ИСЭМ СО РАН, Иркутск, 2015. С. 23б-241.
6. Тулупьев А.Л. Байесовские сети: логико-вероятностный подход / А.Л. Тулупьев, С.И. Николенко, А.В. Сироткин / Общ. ред. Р.М. Юсупов; Рос. акад. наук, Санкт-Петербургское отд-ние, Ин-т информатики и автоматизации. - СПб.: Наука, 200б. б07 с.
7. S. Brin and L. Page The Anatomy of a Large-Scale Hypertextual Web Search Engine // Proceedings of the Seventh International World Wide Web Conference, 1998. Р. 107-117.
Сведения об авторе
Курганская Галина Сергеевна
Д-р физ.-мат. наук, доц., проф. Иркутский государственный университет Россия, 664056, Иркутск, ул. Безбокова 34-51 Эл. почта: [email protected]
Information about author
Galina S. Kurganskaya
PhD, Professor
Irkutsk State University
Russia 664056 Irkutsk Bezbokova str. 34-51
E-mail: [email protected]