Литература
1. Нариньяни А. С. Недоопределенность в системах представления и обработки знаний // Изв. АН СССР. Техн. кибернетика. - 1986. - № 5. - С. 3-28.
2. Narin'yani, A. S. Intelligent software technology for the new decade. Communications of the ACM. V. 34. -№ 6. - P. 60-67, 1991.
3. Narin'yani A.S., Napreenko V.G. Project Economika // Proc. Of the 2000 ERCIM / Compulog Net Workshops on Constraints, Padova, Italy, June 19-21, 2000.
4. Нариньяни А. С. Введение в недоопределенность: Прил. в ж. Информационные технологии. -2007. - № 4. - 32 с.
5. Напреенко В.Г. Применение технологии Н-моделей к задачам экономики и финансов. Прил. в ж. Информационные технологии. - 2008. - № 6. - 34 с.
РАЗРАБОТКА ДИСТАНЦИОННОЙ ОБРАЗОВАТЕЛЬНОЙ ТЕХНОЛОГИИ НА ОСНОВЕ ИСКУССТВЕННЫХ ИММУННЫХ СИСТЕМ
Г.А.Самигулина, к. т. н., доц., с.н.с., лаборатория Интеллектуальных систем
управления и сетей Тел.: 7(7272)254-73-73; E-mail: [email protected] Институт проблем информатики и управления Министерства образования и науки Республики Казахстан
http://www.ipic.kz
The intellectual remote educational technology is designed on the basis of processing of the multidimensional data by artificial immune networks in real time.
1. Введение
Современное информационное общество определяет ключевую роль информации, разработки новейших информационных технологий обработки информации в дальней-
Вшем развитии научно -техниче ского прогресса в процессе обучения. Огромные потоки информации ведут к стремительному росту сложных информационных систем.
Особенность современного образования заключается в необходимости активного внедрения инновационных технологий. Наиболее перспективными и распространенными на сегодняшний день являются дистанционные образовательные технологии, которые требуют разработки новых методов качественного индивидуального обучения и направлены на интенсификацию,
развитие логического мышления студентов и навыков творческой работы.
Особую значимость представляет проблема разработки новых интеллектуальных информационных технологий с использованием различных нетрадиционных методов. В связи с данными требованиями актуально развитие методов, основанных на моделировании естественных феноменов.
Одним из главных требований к данным системам является способность обрабатывать огромные массивы данных в режиме реального масштаба времени для эффективного управления процессом обучения. Необходимы механизмы быстрого анализа текущей ситуации в процессе получения знаний каждым студентом.
Поэтому актуально применение биологического подхода Искусственных иммунных систем (ИИС), построенного на принципах обработки информации молекулами белков [1].
Процессы, происходящие при обработке информации естественными системами, и принципы их функционирования поражают своей эффективностью, экономичностью и
быстродействием. Прежде всего, вызывает интерес способность данных систем решать многомерные задачи огромной вычислительной сложности в реальном времени. Принципы действия механизмов репарации, то есть исправления ошибок в процессе функционирования иммунной системы, позволяют строить принципиально новые алгоритмы распознавания образов на основе искусственных иммунных сетей.
Иммунные сети (ИС) - это адаптивные системы для обработки и анализа данных, которые представляют собой математическую структуру, имитирующую некоторые функции иммунной системы человека и обладающие такими свойствами, как способность к обучению, к прогнозированию на основе уже имеющихся временных рядов и принятию решения в незнакомой ситуации. ИС в принципе не нуждаются в заранее известной модели, а строят ее сами на основе полученной информации в виде временных рядов. Искусственные иммунные системы применяются при решении плохо алгоритмизируемых задач, таких как прогнозирование, классификация, управление.
Разработанная дистанционная образовательная технология, которая включает в себя обработку, анализ и прогнозирование многомерных данных на основе искусственных иммунных сетей, состоит из двух ключевых моментов:
- предварительной обработки данных на основе методов факторного анализа, позволяющей создать эффективные алгоритмы обучения ИИС и существенно сократить время необходимое для обучения;
- устранения погрешностей энергетических оценок ИИС при решении задачи распознавания образов на основе свойств гомологичных белков. Погрешности ИИС возникают за счет неполноты данных, корреляции данных и ошибок измерения. Особенно эта проблема актуальна для схожих по структуре пептидов, которые имеют примерно одинаковые параметры и находятся на границах классов. Из-за энергетических погрешностей они могут быть отнесены по ошибке не в свой класс, что существенно влияет на достоверность прогноза на основе ИИС и оперативное управление текущей ситуацией.
На основе предложенной технологии обработки информации искусственными иммунными сетями разработана интеллектуальная экспертная система, достоинством которой является способность обрабатывать многомерные данные в реальном масштабе
времени, что позволяет адаптировать учебный процесс на конкретного обучаемого и существенно повысить качество получаемого образования.
Достаточно большой набор индивидуальных характеристик дает возможность более точно отразить интеллектуальный потенциал каждого студента. С учетом этого потенциала строить модель программы обучения, адаптированную на конкретного пользователя обучающей системы.
2. Постановка задачи исследования
Постановка задачи исследования формулируется следующим образом: необходимо разработать дистанционную образовательную технологию, экспертную систему комплексной оценки знаний студентов на основе биологического подхода ИИС в целях оперативного управления процессом обучения в реальном масштабе времени и получения качественного индивидуального образования в среде Интернет или других локальных компьютерных сетях. Таким образом, решается задача автоматической адаптации модели обучаемого к соответствующей ей модели процесса обучения.
Математическая основа подхода ИИС заключается в ведении понятия формального пептида [2], как математической абстракции свободной энергии белковой молекулы от ее пространственной формы, описанной в алгебре кватернионов. Решается задача распознавания образов, где используется идея взаимодействия между белками иммунной системы человека и чужеродными антигенами, то есть в возможности молекулярного узнавания посредством определения минимальной энергии связи между формальными пептидами (белками), которая соответствует нативной (функциональной) структуре белка.
Информативные признаки заносятся в сформированные базы данных в виде временных рядов. Затем для каждого класса, выделенного экспертами, формируются матрицы эталонов: Ау, А2, А3,... п, где п -
количество классов. Для улучшения специфичности узнавания каждый временной ряд сворачивается в квадратную матрицу. После сингулярного разложения данных матриц получаем правые и левые сингулярные вектора {ху, уу}, {х2, у2} и т.д. эталонных матриц.
Затем формируется множество матриц, рассматриваемых как образы: Ву, В2, В3,
Ж = - х12 ВУ1, Ж2
Жз = - хз2 ВУз, Ж4
Жп = - Х2 Вуп,
В4,....,т, где т - количество образов.
После этого определяются энергии связи.
Согласно подходу ИИС энергия связи между формальными пептидами может быть представлена в виде:
Ж2 =- х 2 Ву 2, Ж4 = - х2 Ву4, , (1)
где 2 - символ транспонирования, п -количество классов.
Известно, что нативная (функциональная) укладка белковой цепи соответствует минимуму энергии связи, поэтому минимальное значение энергии связи определяет класс п , к которому принадлежит данный образ:
п : Жп = тт{Ж1,Жг,Жз,Ж4,...,Жп} (2)
3. Разработка теоретических основ и алгоритма построения ИИС
Известно, что эффективность обучения на основе дистанционных образовательных технологий зависит от многих факторов, таких как возраст обучающегося, память, наличие личной заинтересованности, базового образования, психологического портрета, различной способности к восприятию информации тем или иным путем и т.д. В связи с этим огромное значение имеет возможность оперативного динамического изменения учебной программы, методики и способов подачи учебного материала в зависимости от степени усвоения пройденного.
Входными характеристиками ИИС являются временные ряды, составленные из индивидуальных признаков каждого обучающегося, которые определяются тестированием по изучаемой дисциплине психологов и т.д. Вся необходимая информация содержится в базах данных (БД) и базах знаний (БЗ). Для построения иммунной сети в качестве признаков берутся поля таблиц
БД.
Задача выделения информативных признаков для построения оптимальной структуры иммунной сети решается на основе методов факторного анализа [3].
В зависимости от принадлежности обучаемого к определенному классу можно оценить его интеллектуальный потенциал и в соответствии с ним оперативно предоставить ИИС индивидуальную программу обучения. На выходе ИИС имеем комплексную оценку знаний, группировку виртуальных студентов по классам и прогноз качества по-
лученного образования. Классы определяются экспертами и соответствуют определенным знаниям, практическим навыкам, творческим способностям, логическому мышлению и т.д. В результате оперативного анализа знаний огромного числа обучающихся можно быстро корректировать процесс обучения.
Число входных и выходных элементов ИС определяется условиями рассматриваемой задачи, зависит от численности входных признаков и классов.
Несомненные достоинства подхода ИИС при решении задачи оценки знаний заключаются в возможности комплексного подхода к решению данной проблемы. Количество признаков, характеризующих каждого пользователя, может быть достаточно большим. Это позволяет осуществить индивидуальный подход к каждому конкретному обучаемому в целях лучшего усвоения пройденного материала, развития творческих способностей.
Интеллектуальная экспертная система на основе ИИС состоит из информационного, обучающего и контролирующего модулей [4].
«Информационный модуль» осуществляет разработку методов и средств хранения информации, разработку баз данных, баз знаний. Включает поисковые системы, электронные учебники по различным дисциплинам, электронные библиотеки, справочники, каталоги и т. д.
«Обучающий модуль» осуществляет разработку методов, средств и форм подачи обучающей информации, адаптированной на конкретного пользователя с учетом его индивидуальных характеристик. Составляется график выполнения объема требуемых работ и сроки его реализации.
«Контролирующий модуль» предназначен для комплексной оценки знаний обучающегося на основе ИИС в целях оперативной корректировки программы и процесса обучения.
Ниже приведен алгоритм дистанционного обучения на основе ИИС, который состоит из 14 шагов.
Алгоритм:
Шаг 1. Тестирование студентов по изучаемым дисциплинам, по различным методикам у психологов, специалистов и т.д. в целях получения индивидуальных признаков, характеризующих каждого пользователя.
Шаг 2. Создание баз данных на основе
индивидуальных характеристик обучающихся.
Шаг 3 . Создание с помощью экспертов баз знаний.
Шаг 4. Нормировка индивидуальных входных характеристик обучающихся таким образом, чтобы математическое ожидание было равно нулю, а дисперсия единице.
Шаг 5. Отбор информативных признаков, характеризующих студентов, с помощью методов факторного анализа на основе вращения собственного вектора.
Шаг 6. Построение оптимальной структуры иммунной сети по весовым коэффициентам информативных признаков.
Шаг 7. Классификация студентов по уровням знаний, практическим навыкам, творческим способностям, логическому мышлению на основе мнений экспертов.
Шаг 8. По информативным признакам студентов формирование матриц эталонов для каждого класса, сворачивание их в квадратные матрицы для улучшения специфичности узнавания, сингулярное разложение данных матриц и определение правых и левых сингулярных векторов. Матрицы эталоны рассматриваются как антигены.
Шаг 9. Обучение ИИС по эталонам с учителем.
Шаг 10. По информативным признакам студентов формирование матриц образов, сворачивание их в квадратные матрицы для улучшения специфичности узнавания. Матрицы образов рассматриваются как антитела.
Шаг 11. Определение минимальной энергии связи (энергии нативной структуры) между формальными пептидами - антигенами и антителами и решение задачи распознавания образов.
Шаг 12. Оценка энергетической погрешности ИИС на основе свойств гомологичных белков и расчет Ъ-факторов [5].
Шаг 13. Расчет коэффициентов прогнозирования.
Шаг 14. Комплексная оценка знаний, группировка студентов по классам, прогноз качества получаемого образования каждым студентом и оперативное управление процессом обучения студентов.
Достоинством данного алгоритма является оценка энергетических погрешностей на основе свойств гомологичных белков при решении задачи распознавания образов, позволяющая исключить ошибочное попадание пептидов не в свой класс в случае, если они имеют схожие характеристики. Данная
процедура существенно повышает достоверность прогноза на основе ИИС. Рассмотрим следующий пример. Пусть вычисленная энергия нативной
структуры Еы представляется в следующем
виде:
Ем = Ем + АЕМ , (3)
где Ем - истинное значение энергии натив-ной структуры; АЕЫ - погрешность энергетической оценки.
Пусть пептиды 01, а2, а3, а4, а5,
которые после решения задачи распознавания образов относятся к одному классу решений, являются гомологичными и имеют схожую пространственную структуру. Энергии связи гомологов для выбранного класса представлены следующим образом: Е* = 319,456; Е2 = 313,721;
Е* = 377,379:
Е* = 326,003;
Е* = 304,987.
На первом шаге находим среднее значение по гомологам для определенного класса. Так как число гомологичных белков равно пяти, то имеем следующее выражение:
<Е > = 319,456+ 313,721+377,379+ 326,003+304,987
5
= 328,309.
На втором шаге будем считать, что значение энергии нативной структуры приблизительно равно среднему значению потенциалов гомологичных белков: < Е5* >0 - Ем - 328,309 .
Затем на третьем шаге находим значения Ъ - факторов для различных гомологов. Значение Ъ - фактора определяется средним числом стандартных отклонений между энергией нативной структуры и энергией случайно выбранной укладки цепи:
7 =•
Еы -< Е >
< (Е-< Е >)2 >2
где Ем - < Е5 > а, < Е > - среднее число
стандартных отклонений по гомологам; Е -энергия случайно выбранной укладки цепи.
Для этого рассчитаем среднее число стандартных отклонений по гомологам < Е > . Отклонения энергий гомологов от энергии нативной структуры равны:
АЕ1 = 8,853, АЕ2 = 14,588, АЕ3 = -49.07, АЕ4 = 2,306, АЕ5 =23,322.
Получим следующее выражение для среднего числа отклонений по гомологам:
8,853 +14,588 - 49,07 + 2,306 + 23,322
< Е >=-
5
= - 0,0002.
Рассчитаем значения Ъ - факторов для рассматриваемых белков: 7 = 1,028; 72 = 1,046; 73 = 0,869; 7 4 =
1,007; 75 = 1,076.
Пептиды, для которых значения 7 -факторов ближе к единице, содержат в себе меньше ошибок энергетических оценок, и их энергии более соответствуют нативной структуре.
Рассчитываются коэффициенты риска Кк а ), г = 1,5 для всех гомологов по формуле:
Кк (а,.) = |1 - 7г|,г = ЦП.
Чем больше данный коэффициент, тем больше вероятность ошибочного зачисления данного пептида к выбранному классу решений. В нашем примере наибольший коэффициент риска Кк (а3) =0,131, поэтому,
скорее всего, пептид а3 не является гомологом и может быть исключен из данного класса решений. Полученные данные сводятся в табл. 1.
Таблица 1
Оценка энергетических погрешностей на основе гомологов
Гомологичные пептиды Энергии связи Е' i = L5 Отклонение энергии от натиЕной AEi, i = Г5 Zj - фавторы, i = ü Коэффициент риска.
Gi 319, 456 8, 853 1,028 0,028
g2 313,721 14,588 1,046 0,046
377,379 -49,07 0,869 0,131
326,003 2,306 1,007 0,007
304,987 23,322 1,076 0,076
Таким образом, использование биологического подхода ИИС при построении интеллектуальных экспертных систем позволяет оперативно оценить достоверность прогноза на основе гомологичных белков. На-тивная структура белковой цепи, соответствующая минимуму энергии связи, является для каждого класса определенной и позволяет установить принадлежность гомологов к какому-либо классу решений. Особенно это свойство ценно для образов, которые находятся на границах классов. Данная способность ИИС существенно уменьшает погрешности энергетических оценок, повышает достоверность прогноза поведения интеллектуальной системы.
Разработан пакет прикладных программ (ППП) «PEPTID», который предназначен для обработки, анализа и прогноза многомерных данных искусственными иммунными системами [6, 7] в реальном масштабе времени. Данный пакет программ реализо-
ван на языке программирования DELPHI 7.0.
В состав предложенного программного продукта входят девять взаимосвязанных подпрограмм, реализующих определенные задачи. Структурная схема пакета прикладных программ «PEPTID» обработки информации искусственной иммунной системой приведена на рис. 1.
В подпрограмме NORM после считывания исходной информации их баз данных и баз знаний осуществляется нормировка входных параметров. Разработанный удобный интерфейс позволяет графически наглядно отразить результаты нормирования. Подпрограмма INF_PRIZ предназначена для выделения входных информативных признаков на основе факторного анализа и метода главных компонент.
Подпрограмма OPT_NET осуществляет построение оптимальной структуры иммунной сети по весовым коэффициентам ин-
формативных признаков и редукцию малоинформативных признаков.
Подпрограмма CLAS_EXP предназначена для реализации алгоритмов классификации решений.
Подпрограмма LEARN осуществляет обучение иммунной сети с учителем по выбранным сформированным экспертом эта-
лонам для соответствующих классов.
Подпрограмма МГ^ЕКЕЯО предназначена для решения задачи распознавания образов на основе определения минимальной энергии связи между соответствующими пептидами, реализующая процесс молекулярного узнавания между антигеном и антителом.
СЧШЫЕАЖЕ ИНФОРМАЦИИ
-I-
Нормировка вход, параметров
Подпрограмма й OEM
Выделение икформат. признаков
Подпрограмма LNE_FRIZ
Оптимальная структура сети Подпрограмма ОРТ NET
Классификация решении
Подпрограмма CLASJEX?
Обучение иммунной сети
Подпрограмма LEARN
Распознавание образов * -
Подпрограмма МШ_ЕШЖО
Оценка энергетических ошибок
Расчет коэффициентов риска прогнозирования
Подпрограмма ENERG ERRORS
Подпрограмма KPREDIC
Анализ и прогноз данных, визуальное представление
Подпрограмма GRAFIC
Рис. 1. Структурная схема пакета прикладных программ «PEPTID»
Подпрограмма ЕКЕЯО_ЕКЯОЯ5 служит для оценки энергетических ошибок при решении задачи распознавания образов и обработки многомерной информации на основе анализа свойств гомологичных пептидов.
В подпрограмме К_РЯЕБ1С осуществ-
ляется расчет коэффициентов риска прогнозирования на основе Ъ - факторов.
Заключительная подпрограмма
ОЯЛИС позволяет сгруппировать данные для визуального представления и наглядно выделить зоны неоднозначного решения для проведения дополнительных процедур.
Литература
1. Finkelstein A.V., Gutin A.M., Badretdinov A.Y. //Proteins. - 1995. -V.23. - P.151-162.
2. Tarakanov A.O. Formal peptide as a basic of agent of immune networks: from natural prototype to mathematical theory and applications. Proceeding of the I Int. workshop of central and Eastern Europe on Multi - Agent Systems, 1999.
Отечественный и зарубежный опыт
3. Самигулина Г. А. Разработка интеллектуальных экспертных систем управления на основе технологии искусственных иммунных систем: Монография. - Алматы: ИПИУ МОН РК, 2008. - 137с.
4. Самигулина Г. А. Интеллектуальная экспертная система дистанционного обучения на основе искусственных иммунных систем // Информационные технологии моделирования и управления. -Воронеж, 2007. - Вып. 9(43). - С. 1019-1024.
5. Samigulina G.A., Chebeiko S.V. Technology of elimination errors the energy estimations of Artificial Immune Systems of the forecasting plague. Proceeding on the sixth international conference on Computational Intelligence and Natural Computation (CINC 2003). - Cary, North Carolina, USA, 2003. - P.1693-1696.
6. Самигулина Г.А., Самигулина З.И. Разработка пакета прикладных программ для обработки, анализа и прогноза данных искусственными иммунными сетями // Вестник Национальной инженерной академии Республики Казахстан. - Алматы, 2008. - №1(27). - С. 39-44.
7. Самигулина Г.А., Самигулина З.И. Разработка программного обеспечения для интеллектуальной системы прогнозирования на основе искусственных иммунных систем // Тр. V Всесибирского Конгресса женщин-математиков. Красноярск, 2008, http://www.sfukras.ru/science/congress/.
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ОБУЧЕНИЯ ДИЗАЙНЕРОВ В СТЭНФОРДСКОМ УНИВЕРСИТЕТЕ
С.В. Буцык, к.пед.н, доц., нач. Информационно-вычислительного центра Тел.: (351) 727-76-10; E-mail: [email protected] ФГОУВПО «Челябинская государственная академия культуры и искусств»
http://www.chgaki.ru
The article is devoted to the information technologies and innovations, developed and used in Design Education in Stanford University. The analysis is based on the research of the articles of University faculty, personnel attendance and meeting with the specialists of Stanford Center for Innovations in Learning in April 2008.
Российское высшее образование в сфере искусств достаточно разнообразно, поскольку включает в себя ряд крупных составных направлений, таких как: музыкальное, хореографическое, театральное, дизайнерское искусство и др. Обучение дизайнерскому искусству осуществляется в нашей стране вузами культуры и искусств и соответствующими факультетами крупных университетов по специальностям: «Дизайн», «Декоративно-прикладное искусство», «Изобразительное искусство», «Живопись», «Графика» и т.п.
Целью работы является изучение возможного спектра технико-технологической поддержки образовательных программ по данным специальностям.
В отечественных вузах этот процесс обусловлен использованием, в основном, стандартных технических средств. Преподаватели активно работают с такими устройствами, как графические планшеты, проекторы, интерактивные доски, плоттеры и т.п., а наиболее популярными программными
средствами являются стандартные графические редакторы Corel Draw, Adobe PhotoShop, 3D Studio Max, Auto Cad и т.п. В то же время собственным техническим и технологическим разработкам (за исключением сайтов), в большинстве случаев, уделяется минимальное внимание. Изучение проблем информатизации в сфере искусств и опыт работы в одном из крупнейших вузов этой сферы только подтверждают подобные рассуждения, что говорит об ограниченности в выборе технических средств обучения дизайнерскому искусству в России.
Причины сложившейся ситуации в каждом вузе могут быть различными: недостаточная теоретико-методологическая, техно-