Регулирование энтропийных Технические науки
показателей контента в многоуровневых порталах учебного назначения
Тюрин А.Г
Информационное портальное обустройство учебного процесса стало неотъемлемой частью комплексной информатизации системы непрерывного образования. Методологии этого обустройства — вопросам моделирования, проектирования и сопровождения образовательных порталов - в последнее десятилетие посвящено множество научных публикаций и диссертаций [1-4].
Комплексное моделирование, проектирование и сопровождение всей обозначенной выше совокупности образовательных информационных систем опирается на использование синергетических возможностей и механизмов оценки и регулирования информационных морфизмов (взаимодействий) в дуплексах «портальное обустройство — конечный пользователь». Применительно к отдельно взятому порталу, как правило, применяется семантико-энтропийная оценка в виде обобщённой энтропии, описываемой скалярной величиной — обобщённой энтропией системы, показывающей количественно измеряемую меру успешности функционирования портала в части обеспечения выполняемых им функций. В постановке настоящей статьи реализуются функции откликов портала или консорциума порталов на запрос, причём число возможных состояний функции определяется выбором числа и комбинаторикой предъявляемых к реализации функций требований: достижение заданной пертинентности (коэффициент точности), когнитивно-сти и релевантности.
С этих позиций энтропией системы H (X) , отражающей меру её априорной неопределенности в части реализации упомянутых выше функций является сумма произведений вероятностей (P ) различных состояний (Х{) системы на логарифмы этих вероятностей, взятых с обратным знаком: [5]
H (X) = -EPi l0gaPi (1)
i=1
где i — порядковый номер от 1 до n реализуемой функции (транзакций, опций и т.д.)
a - основание логарифма, равное числу букв алфавита кода, описывающего всё разнообразие возможных состояний или исходов, последующих за реализацией функции для множества вида:
(W^ )••;-jf) (X)
p(X 1) P(X 2 ) P(X 3)..... P(Xn ) - для °ценки
H 1(X) по вероятностям событий, таких, как достижение (исход выполнения функции) релевантности, пертинентности, когнитивности и т.д. - в зависимости от постановки вопроса о выборе тех или иных критериев оценки качества функционирования портала и управления им. Профилируя применение формулы (1) к использованию её для цели семантико-энтропийных оценок эффективности информационного поиска в многоуровневых информационных консорциумах будем рассматривать основание логарифма а в формуле (1) как отражающее число возможных состояний в ин-
формационных откликах портальной системы на поисковые запросы. Например, рассматриваются комбинации: «релевантно и пертинентно», достигнуто только одно из этих двух качеств, оба качества не обеспечены — то есть возможны 4 состояния информационного морфизма на каждый единичный запрос из их числа Х; тогда а = 4 и т.п.
Проведение такого рода оценок и вытекающие отсюда возможности регулирования качества функционирования информационной системы путём воздействия на её контент средствами гармонизации и нормирования контента, а также путём улучшения архитектуры и инфологии системного строительства предоставляют проектировщику образовательных порталов высокоэффективный инструментарий. Тезис этот непосредственно вытекает из определения Е.С. Вентцель, согласно которому «...понятие об энтропии является в теории информации основным». [6]
Эту же точку зрения разделяют многие исследователи, а потому по мнению авторов настоящей статьи определение обобщённой энтропии (см. выше формулу (1)) следует вводить в моделирование и проектирование информационных образовательных порталов и их консорциумов как важную и очень перспективную аналитическую часть. В развитие этого тезиса в публикациях академика Э. Лийва [7] и в некоторых других источниках показано, что наряду с обобщённой энтропийной оценкой меры хаотичности функционирования информационных систем продуктивна так называемая негоэнтропийная оценка. Если под энтропией понимать количественно измеряемую меру неопределенности информации или системных состояний (откликов, транзакций и т.п.), то в контексте авторской парадигмы настоящей работы под негоэнтро-пией можно подразумевать приращение продуктивной информации или прирост требуемых «чистых» состояний — и в первой и во второй оценках снижение меры неопределенности функционирования информационных систем и подсистем информационного образовательного консорциума. И наоборот, соотнесение обобщённой энтропийной оценки нижестоящего в инфологии звена (например, на уровне подсистемы) к оценке в вышестоящем звене приводит к понятию относительной (иногда, условной) энтропии, демонстрирующей поглощение части хаоса зависимой подсисиемы начальствующей, что в общем то может приводить к снижению результирующей обобщённой энтропии интегрированной конструкции или, что тоже самое, к возникновению прироста обобщенной негоэнтропии.
Интерес автора настоящей статьи к энтропийной/не-гоэнтропийной оценке в процедурах семантико-энтро-пийного регулирования информационного морфизма образовательных порталов предопределён ещё и тем, что само семантико-энтропийное регулирование в последние год — два переходит на новый качественный уровень и заметно осложняется. Это связано с тем, что портальное информационное строительство в образовательной индустрии повсеместно переходит из фазы создания от-
Рисунок 1. Инфология многоуровневого расслоенного информационного консорциума
дельных разрозненных образовательных порталов к фазе многоуровневого интеграционного портального строительства. При этом не только реализуются многоэтажные вертикальные построения портального обустройства по принципу «от объединяющего горизонтального портала к вертикальным профильным порталам, опускаясь шаг за шагом до конечного пользователя с его порталом - репликатором», но имеет место слияние на единой онтологической и управленческой основе множества параллельных разноуровневых портальных устройств в единый образовательный информационный консорциум. В самом общем случае возникают распределённые многоуровневые расслоенные информационные консорциумы, инфоло-гия которых схематично представлена на рисунке 1.
Ниже на рисунке 2 эта инфология иллюстрируется частным случаем физической компьютерно-сетевой реализации второго уровня для информационного консорциума, созданного при непосредственном участии авторов в обеспечение образовательного процесса МИРЭА по направлению профессиональной подготовки 230200 «Информационные системы».
В принципе, число учебных дисциплин может быть иным, чем в приведённом на рисунке 2 примере. Здесь же показан частный случай, отражающий конфигурацию порталов второго уровня в поддержку дисциплин, изучаемых на первом курсе вуза: «Высшая математика», «Физика», «Технологиии программирования», «Введение в специальность» и «Информатика». При этом последний в списке микропортал по дисциплине «Информатика», переросший в консорциум из нескольких микропорталов, создан и сопровождается творческой группой[8]. Рассло-
ение информационного ресурса в рамках этого консорциума наглядно иллюстрируется Рис. 3.
Из всех этих описаний и графических иллюстраций инфологий многоуровневого расслоенного построения информационных портальных консорциумов в образовании следует, что приведённая в начале статьи классическая формула (1) семантико-энтропийной оценки информационного морфизма портального обустройства требует модифицирующего развития, связанного с тем, что от её толкования в отношении единичного объекта (портала) необходимо перейти к комплексной семанико-энтропийной оценке многоуровневого расслоенного портального пространства.
Рисунок 2. Пример физической реализации инфологии многоуровневой расслоенной информационной портальной системы на её втором уровне (содержащем портальную поддержку отдельно взятых пяти учебных дисциплин).
Информационное поле трехуровневой информационной поддержки дисциплины «Информатика»
Школьный базовый стандарт
Базовый стандарт высшей школы РФ (ФГОС)
Для детей, имеющих углубленный физикоматематический профиль
Углубленный профиль для детей сп ециализирующихс я по направлению «Информационные технологии и информатика»
Z
Для детей гуманитарного профиля (не упрощена, а уведена в сторону гуманизма)
По направлениям бакалавриата включая прикладной бакалавриат (на примере направления «информационные системы»)
3
По специальностям Высшей Школы РФ в соответствии со стандартами (на примере специальности «Информационные системы и технологии»)
Углубленное
элитное
образование
/*
/ :
/ \
Развивающее
дополнительное
образование
Поствузовское образование, в том числе профессиональное (аспирантура, ФПК) *
Дополнительное многоуровневое образование. В составе которого:
•аддитивная информатика; •семантическая информатика; •синергетическая информатика;
• математическая информатика;
• инфодинамика, информациология;
• прикладная информатика; •аккаунская информатика; •социальная информатика
Рисунок 3. Многоуровневое расслоенное микропортальное обустройство предметной области «Информатика» (пример реализации)
Исходя из стремления максимально облегчить функционирование многочисленным конечным пользователям, использующим в своей массе мобильную, простую, недорогую технику (например, нетбуки, мидлбуки), в парадигму построения описываемых здесь информационных консорциумов авторы вписывают ориентацию исключительно на простые информационные системы. Речь идет о системах, функции, состояния и свойства которых всегда проявляются эргодично, аддитивно, конфлюэнтно и интроектив-но. Такой набор проявлений весьма характерен в реализации проектных решений, относящихся к созданию консорциумов образовательных микропорталов, то есть порталов, которые с позиций управления ими успешно и сразу начинают полноценно функционировать при погружении в любую ^ШеИ среду без введения дополнительных программных средств и транзакций. Это позволяет использовать в системном анализе в качестве стартовой позиции формулу (1), где логарифмическая форма записи энтропии оказывается весьма кстати при исследовании интегративных процессов в отношении систем и подсистем, объединяемых на аддитивной и эргодической основе (имеется в виду удобная возможность сложения логарифмов в основной формуле обобщённой энтропии).Таким образом, становится ясно, что обобщённая энтропия после соответствующих преобразований подходит как для оценки простых однослойных систем, так и в случае применения многоуровневой расслоенной архитектуры и инфологии, что и использовано в комплексном проекте авторов по информационному мультипор-
тальному обустройству образовательной деятельности в МИРЭА и в МГДД(Ю)Т.
В многоуровневом, расслоенном представлении информационного образовательного консорциума семантико-энтропийное регулирование опирается на объединение энтропийных обобщающих оценок в некую их совокупность по числу внутрисистемных морфизмов в консорциуме (в который также входят пользовательские станции ищущих информацию).
Тогда всё та же основополагающая формула (1) для информационного консорциума, инфология которого опирается на взаимное независимое для аддитивных и эргодичных систем функционирование всех д входящих в консорциум модулей записывается в следующем развёрнутом виде:
H (X) = -Z Pi l0§аРг (1)
i=1
H (X) = -^LPi l0§аРг (1)
i=1
H (X) = -Z Pi l0g аРг (!)
i=1
Здесь совокупная энтропия, называемая в ряде публикаций [9,10] энтропией объединения, оказывается величиной не большей, чем Самопроизвольная эволюция системы (например, в случае критической ситуации) сводится к конечному выравниванию плотно-
сти информации по всем ячейкам X, ) = Xj = const. Энтропия Н2, понимаемая как обобщённая, увеличивается до максимального значения:
M
Нш,, =-Е P(X,) log а P( X j ) (2)
j=1
где M — число пространственных ячеек,
Предлагается к рассмотрению отдельный микропортал в составе консорциума, в котором Х. представляют плотности информации в пространственных ячейках г. . Самопроизвольная эволюция системы (например, в случае критической ситуации) сводится к конечному выравниванию плотности информации по всем ячейкам X, ) = Xj = const. Энтропия Н2, понимаемая как обо бщённая, увеличивается до максимального значения:
M
Н шш =-Z P( X, )l0g а P( Xj ) (2)
j=1
где M — число пространственных ячеек, P(X ■) определяются здесь как
X j X j
P( x, ) = = -j (3)
Z Xj
U
j=1
В тоже время, воспользовавшись определением вероятности через частость заполнения mi 1-го информационного уровня
P( X) =
(4)
p = ZdAк(7)
где оператор дифференцирования, Л _ оператор обращения (функции X(г) в г (X) , к — символ интервала монотонности, I — общее число таких интервалов.
Оператор (7) может быть применен многократно. Для каждого нового распределения может быть определена энтропия.
Обобщение легко достигается в терминах теории расслоенных пространств. Полное пространство в нашем случае — это множество вариаций, база — множество распределений. Характеристикой расслоенности является число К (7)
М!
K =
п
да.
Первым слоем является наблюдаемый вариационный ряд, вторым — распределение вероятностей его уровней и т.д. Число заполнения отождествляется с функцией
Х = х(п)
т(и) .
Тогда между объемами М и интервалами изменчивости N справедливо соотношение
N(и) = М(и+1),
где п - номер слоя. Сумма и («полная энергия») может быть определена двояко:
получим стремление энтропии к минимальному значению
Н =-£р(Х, )\о%„Р(Х1) ^ 0 (5)
1=1
Тогда негоэнтропия (по Бриллюену) определяется как AN = -АНМШ . Тк. AN < 0 , то АН < 0, то AN + АН < 0 или Д(-Н..... + Н ) < 0 (6)
Соотношение (6) названо Л. Бриллюэном [13] принципом деградации, причем если Д НШйй понимается им как изменение обобщенной энтропии, то АН — как некоторая не ясно определенная им свободная информация. При этом можно видеть, что (6) соответствует большей «чувствительности» Ншм к изменениям X(г}-) по сравнению с Н .
Показанное здесь отличие энтропий НШйй и Н обязывает сделать некоторое обобщение. Все различие между НШйй и Н связано с различием пространств, в которых действует оператор вероятности Р. Оператор плотности вероятности р определим, исходя из процедуры ее нахождения по функции X(г) [11]:
M(n)
u;n) = Z X'f), и2n*,) = Z"цX,
j=1
T(n) _ TT(n+1)
N(n)
(n+1) ^( n+1) y^(«+1)
2
i=1
U1n) = u2
С другой стороны:
M
( n)
N
(n)
M ( n) = Z X(”+1) = r.(n+2) X(n+2)
j=1 i=1
Л. n+ 2)
r(n)
( n+3)
N (”) = ^ X(и+2) = ^ г (”+3) X 1=1 1=1
где г (п) — аргумент (координата в п-ом слое). Следовательно,
И1(п) = М(п-!) = N(n-2) , (9)
И2(п) = М(п-2) = N(n-3) . (10)
Таким образом, разница между М, N, И относи -тельна и определяется слоем, к которому они относятся. Вместо (7), использующего параметры первого и второго слоев, можно написать общее выражение:
K(n) =
M
(n-1)
N
(n-2)
(11)
П X(n) ! п X(n) !
j=1 ,=1
Условная (относительная) энтропия определенная по n-ому слою в общем виде:
H,n) = log аКЫ log аКЫ
Г (n-1)
М1и-1) N(п-2) (12)
Числитель (11) и знаменатель (12) могут быть заменены также на и([ п)и 2 ”+1) в соответствии с (9) и (10).
Аналогично представим обобщения чисел возможных сообщений и 1(п)и2П+1) , Ь1 (Ь1 = NM ) и
l (¿2=f M +. и-1V(M,+U -1),
U
(M -1) U!
где
N
M
u = Z т,х, =z X, ,
i-1 j=1
причем все X.>0) для произвольного слоя:
¿n) = |m (n+1) f(n 5 = [n (n) ]N (^
, (13)
L( n) =
М(п) + М(п-1) -1] = N(п-1) + N(п-2) -1] М(п) - 1]м(п-1)! = [N(п-1) - (]N(п-2)!
(14)
Наконец, определение вероятности состояния ^ которое определяется как отношение числа микросостояний К, благоприятных данному макросостоянию, к полному числу возможных микросостояний Ь ^ = К/Ь):
W(n) =
K
(n)
(n-1)
(15)
отражает тот факт, что К(п) есть подмножество
7-(п-1)
множеств V предыдущего слоя.
В терминологии расслоенных пространств энтропиям Ншл и Н соответствуют Н(1) и Н(2). Выше отмечалось снижение «чувствительности» к изменениям в вариационном ряду в энтропии второго слоя. Видно, что при многократном применении оператора вероятности распределение стремится к вырождению и, соответственно, энтропия должна уменьшаться.
В сущности, показанное здесь асимптотическое вырождение обосновывает тенденцию к уменьшению обобщённой энтропии многоуровневой системы по сравнению с суммой энтропий полного набора независимых систем до их объединения в информационный консорциум.
Опыт показал, что семантико-энтропийные оценки и регуляторы являются эффективным инструментом определения и улучшения точности функционирования образовательных портальных устройств и их многоуровневых объединений. В результате многоуровневых объединений таких простых порталов на принципах обеспечения аддитивности и эргодичности происходящих информационных процессов и явлений возникают многоуровневые распределённые и расслоенные архитектуры и инфологии.
В развитие приведённых выше материалов автором показано также, что Обобщенная энтропия объединения простых информационных образовательных микропорталов в многоуровневой расслоенный консорциум может быть представлена как сумма проекций средних условных энтропий относительно исполнения единого для всех подсистем целевого критерия, которым может служить коэффициент точности извлекаемой информации (пер-тинентности, когнитивности,релевантности). При этом сами объединительные процессы создают теоретические предпосылки к снижению обобщённой энтропии многоуровневой системы.
Список используемых источников:
1. Интернет-порталы: содержание и технологии. Сб. научн. ст. / Редкол.: А.Н. Тихонов (пред.), В.Н. Васильев, Е.Г. Гридина, А.Д. Иванников, А.М. Кондаков, Г.А. Краснова, В.В. Радаев. ГНИИ ИТТ «Информика». - М.: Издательство «Просвещение», 2003.
2. А.Д. Иванников, В.П. Кулагин, А.А. Миронов, В.А.
Мордвинов, А.С. Сигов, А.Н. Тихонов, В.Я. Цветков Синергетическая теория информационных процессов и систем // МИРЭА - 2010. - 417, электронное издание, номер государственной регистрации 0321000884 от 02 июня 2010 года.
3. А.Д. Иванников, В.П. Кулагин, В.А. Мордвинов, Л.В. Най-ханова, Б.Б. Овезов, А.Н. Тихонов, В.Я. Цветков Получение знаний для формирования информационных образовательных ресурсов // ФГУ ГНИИ ИтТ «Информика» - 2008.
4. А.Н. Тихонов, А.Д. Иванников, И.В. Соловьёв, В.Я. Цветков Основы управления сложной организационно-технической системой. Информационный аспект // - М.: МАКС Пресс -2010.
5. Шеннон К. Работы по теории информации и кибернетике. — М.: Изд. иностр. лит., 1963.
6. Вентцель Е.С. Теория вероятностей. М.: Гос.изд-во физ.-мат. литературы, 1962.
7. Э.Х. Лийв Инфодинамика. Обобщённая энтропия и не-гэнтропия // Таллинн - 1998.
8. А.Г. Тюрин Микро-портал-википедия «Учащиеся. Информатика. Интернет» / М.: МГДД(Ю)Т, 2007.
9. Д.А. Савельев Многомерная векторная энтропия в оценке информационного морфизма горизонтальных образовательных порталов // Среднее профессиональное образование - 2007. - № 12.
10. Д.А. Савельев Информационный морфизм горизонтальных образовательных порталов // Наукоемкие технологии -2008. - Т. 9. - № 7.
11. Л. Брюллюэн Наука и теория информатизации // М:.
Физмат - 1960.
Информация об авторе
• Тюрин А.Г, старший преподаватель, аспирант кафедры технических и информационных средств систем управления МГТУ МИРЭА