Научная статья на тему 'О применении аппарата теории нечетких множеств в задачах обработки информации образовательного процесса'

О применении аппарата теории нечетких множеств в задачах обработки информации образовательного процесса Текст научной статьи по специальности «Математика»

CC BY
600
64
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Полещук О. М.

В статье обсуждаются методы обработки информации образовательного процесса на основе аппарата теории нечетких множеств. Предлагается методика формализации информации на базе полных ортогональных семантических пространств, позволяющая применять к формализованной информации методы нечеткого кластер-анализа и нечеткого регрессионного анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О применении аппарата теории нечетких множеств в задачах обработки информации образовательного процесса»

Условие К] = 0 эквивалентно условию

аЛ+~ + аЧ,]\;

где а, = ■

1, если сг, = 1,

-1, если а =0;

7 II 7

_ Г = 1,2,ги);

п.]- число переменных, входящих в конъюнкцию к) с отрицанием.

Таким образом, задав многогранник М(А,Ь), удовлетворяющий условиям целочисленное™, мы можем построить систему булевых уравнений, для которой М(А,Ь) является многогранником погружения. Для построения целочисленного многогранника можно воспользоваться как общей теоремой Гофмана и Краскала, выбрав А как целочисленную абсолютно унимодулярную матрицу и Ь как произвольный целочисленный вектор, так и достаточные условия целочисленности многогранника М(А,Ь) с матрицей условий, у которой элементы а и 6 {-1,0,1}, сформулированные Хеллером и Томпкинсом (см. напр. [4]).

Литература

1. Никонов В.Г., Рыбников К.К. Применение полиэдральных методов в прикладных математических задачах, сводящихся к анализу и решению систем линейных неравенств // Вестник МГУ Леса. Лесной вестник. - 2003. - № 1(26). - С. 81 - 85.

2. Рыбников К.К. Схемы функционирования формальных нейронов в нейрокомпьютерных сетях как модели анализа множества решений системы булевых уравнений // Вестник МГУЛеса. Лесной вестник. - 2003. - № 1(26). - С. 85 - 93.

3. Рыбников К.К. Оценки сложности некоторых схем метода разделяющих плоскостей при решении систем булевых уравнений // Обозрение прикладной и промышленной математики. Т.9, Вып.

2.-2002.-С. 442-443.

4. Ковалев М.М. Дискретная оптимизация. -Минск: БГУ, 1977, -192 с.

5. Рыбников К.К., Хохлушин А.С. О взаимосвязях различных алгоритмических схем методов погружения множества решений системы булевых уравнений в действительную область // Вестник МГУЛеса. Лесной вестник. - 2002, - № 5(25). -С. 189-194.

О ПРИМЕНЕНИИ АППАРАТА ТЕОРИИ НЕЧЕТКИХ МНОЖЕСТВ В ЗАДАЧАХ ОБРАБОТКИ ИНФОРМАЦИИ ОБРАЗОВАТЕЛЬНОГО ПРОЦЕССА

О.М. ПОЛЕЩУК, к. ф.-м. н., доцент каф. высшей математики

Главным направлением деятельности любого вуза является система управления процессом обучения. Этот процесс настолько многомерен и информационно емок, что некоторые его параметры не только трудноизмеримы, но и трудноформализуемы. Сложность количественного оценивания процессов обучения и управления связана с особенностью измерения в образовательной сфере. Эта особенность состоит в учете свойств или суждений лиц, измеряющих качественные показатели и принимающих на основе этого субъективного измерения решения. При оценивании качественных признаков эксперты достаточно часто используют слова естественного языка. Например, отличные знания,

высокая работоспособность, хорошие взаимоотношения в коллективе и т. д. Эти слова являются источником нечеткости в информации, полученной от эксперта. Информация, в которой заложена неопределенность в виде нечеткости, получила название нечеткой экспертной информации.

Использование слов естественного языка, в которых заложен опыт эксперта, его индивидуальное восприятие объекта или ситуации, является причиной трудноформали-зуемости этой информации в рамках традиционных математических формализмов. Следствием этого является проблематичность применения традиционных методов, основанных на классической теории множеств, теории из-

мерений, теории вероятностей и математической статистики, для обработки и анализа нечеткой информации ряда областей деятельности человека и, в частности, нечеткой информации образовательного процесса. В связи с этим необходимо использовать современный математический аппарат, позволяющий учитывать вышеизложенные особенности и основанный на комплексном и последовательном подходе к решению задач каждого уровня процесса обучения.

При решении задач образовательного процесса широко использовались и используются до сих пор методы теории вероятностей и математической статистики. Объясняется это, по- видимому, тем, что методы математической статистики хорошо разработаны и общедоступны в виде программных коммерческих продуктов. Применение этих методов предполагает вероятностную интерпретацию обрабатываемых данных и полученных статистических выводов.

Подобная интерпретация сталкивается с рядом проблем в силу того, что природа статистической информации, полученной в рамках образовательных систем - оценок образовательной деятельности, психофизических и характерологических особенностей человека и т. д., - не является случайной.

Это было понятно давно, но до развития теории нечетких множеств [10] другого подхода просто не было. Одно дело применять методы теории вероятностей и математической статистики в физике, химии и биологии и совсем другое дело пытаться применять эти методы в областях деятельности человека, в частности в образовательной сфере.

Поэтому в задачах обработки информации образовательного процесса возникает необходимость использования нечетких множеств, нечетких отношений, нечеткой логики, которые в совокупности позволяют моделировать плавное изменение исследуемых признаков, учитывать неопределенность не только случайного характера и исследовать неизвестные функциональные зависимости, выраженные в виде качественных связей.

В основании любой теории областей естествознания лежит понятие элементарно-

го объекта, которое является очень важным и основополагающим для построения этих теорий. Для теории нечетких множеств таким понятием является понятие нечеткого множества, которое по Л.А. Заде определяется своей функцией принадлежности. Фиксирование конкретных значений функции принадлежности носит субъективный характер. Дадим определение нечеткого множества согласно [10].

Пусть X- некоторое множество элементов X, и цА: X -» [0,1].

Нечетким подмножеством А В X называется график отображения /гл, то есть множество вида {(я, (*)):*£ х}. При этом

значение цл(х) называется степенью принадлежности х к А.

Из определения следует, что задание нечеткого подмножества А в х эквивалентно заданию его функции принадлежности цл (х). Следуя сложившейся традиции, будем употреблять термин нечеткое множество вместо более корректного термина нечеткое подмножество.

Значение функции принадлежности цл(х) элемента х к нечеткому множеству А можно интерпретировать как определенную экспертом (группой экспертов) степень соответствия элемента х понятию, формализуемому нечетким множеством А .

Нечеткой переменной называется

тройка

{*,£/,а},

где X - название переменной;

и - область ее определения - универсальное множество;

А - нечеткое множество универсального множества, описывающее возможные значения нечеткой переменной.

С точки зрения аппарата теории нечетких множеств, моделью множества значений некоторого описываемого (оцениваемого) экспертом признака может служить лингвистическая переменная, имеющая широкий спектр практических применений [2, 3,4]. Лингвистической переменной называется пятерка

{Х,Т(Х\и,У,8},

где X - название переменной; т(х)- терм-множества переменной X, то есть множества названий значений лингвистической переменной X. Каждое из этих значений - нечеткая переменная со значением из универсального множества I/;

V- синтаксическое правило, порождающее названия значений лингвистической переменной X;

5 - семантическое правило, которое ставит в соответствие каждой нечеткой переменной из т(х) нечеткое подмножество множества и.

Терм-множества х„ / = 1,т называют понятиями, которые образуют лингвистическую переменную. Функцию принадлежности нечеткого множества, описывающего возможные значения нечеткой переменной с названием Хп I = 1 ,ш, традиционно называют функцией принадлежности понятия х, г = 1 ,ш, или функцией принадлежности терм-множества Х„ / = 1 ,т.

Если моделью множества значений описываемого (оцениваемого) признака является лингвистическая переменная, то моделью описания (оценивания) экспертом реальных объектов является процедура выбора элементов этой переменной. Понятие лингвистической переменной является одним из основных понятий теории нечетких множеств и используется при решении многочисленных практических задач принятия решений в условиях нечеткости, определяемой как нечеткой постановкой самой задачи, так и использованием интуитивных представлений экспертов о путях ее решения и нечетком описании параметров.

Лингвистическая переменная с фиксированным терм-множеством {X, Т, (X), и, V, 5} называется семантическим пространством.

Однако, как показывает практика, работа с широким классом лингвистических переменных - семантических пространств -не всегда является удобной для эксперта в силу ряда причин [3]. Эти причины кроются в свойствах функций принадлежности зна-

чений - терм-множеств - лингвистических переменных.

Первой причиной является наличие свойства функций принадлежности, состоящего в том, что некоторые значения признака имеют отличные от нуля степени принадлежности к несоседним (и зачастую несовместным по своей сути) значениям этой переменной.

Например, когда числовое значение вероятности отказа работы системы за определенный промежуток времени имеет ненулевые степени принадлежности одновременно к значениям низкая вероятность, средняя вероятность, высокая вероятность, то при описании работы системы эксперт испытывает неудобства в связи с неоднозначностью выбора элементов переменной.

Второй причиной является наличие свойства функций принадлежности переменной, состоящего в том, что степени принадлежности некоторых значений признака, ко всем без исключения значениям этой переменной, равны нулю. В этом случае эксперт вообще не может идентифицировать объект с таким значением признаком ни с одним из значений переменной.

Третьей причиной является наличие свойства функций принадлежности лингвистической переменной, состоящего в том, что некоторые значения переменной не имеют типичных значений признака. В этом случае эксперт не имеет эталонов, опираясь на которые он упрощает себе процедуру оценивания (описания) объектов.

Следствием всех вышеперечисленных свойств является то, что эксперт испытывает значительные трудности с идентификацией объектов, и соответственно сама процедура оценивания перестает быть понятной и достаточно простой. В результате такой процедуры оценивания следует ожидать значительного увеличения нечеткости полученной информации.

Поэтому в последние годы, в качестве моделей множества значений описываемых (оцениваемых) экспертом признаков, стали использоваться наборы нечетких переменных, описывающих некоторые понятия и имеющих функции принадлежности,

которые позволяют значительно облегчить экспертам процедуры оценочных и управляющих действий. Свойства этих функций принадлежности позволяют находить и контролировать количественную меру трудностей, которую испытывает эксперт при оценивании реальных объектов и ситуаций, снижать нечеткость оценочных процедур и соответственно нечеткость формализованных экспертных оценочных результатов.

Эти наборы нечетких переменных получили названия полных ортогональных семантических пространств (ПОСП). Многие свойства ПОСП находятся в стадии изучения, тем не менее, уже имеются работы, в которых предлагаются методы их построения [4, 6, 7], определяются показатели нечеткости и их устойчивость [3], определяются показатели различия и сходства и отношения подобия на множествах ПОСП [5,9].

Определим свойства функций принадлежности = 1'ш ПОСП.

1) Для каждого = существует, по крайней мере, один хеи :ц,(х) = 1.

Условие 1) означает, что для каждого понятия - терм-множества - существует, по крайней мере, один типичный для этого понятия объект.

2) Пусть и, ={сеи: ц,(х) = 1}, тогда

цХх\1 = \,т не убывает слева от и, и не возрастает справа от и,.

Условие 2) означает требование плавности границ понятий, отсутствие скачкообразных переходов от одного соседнего понятия к другому.

,т имеют не более двух точек разрыва первого рода.

Условие 3) обеспечивает возможность использования наряду с функциями принадлежности характеристических функций. Другими словами, некоторые терм-множества могут быть четкими.

4) Для каждого хе и существует /,/ = 1,т: ц,(х)фО .

Условие 4) обеспечивает для каждого объекта существование хотя бы одного

терм-множества, которое описывает этот объект с ненулевой степенью.

т

5) Для каждого хв и ^/!,(*) = 1.

Ы\

Условие 5) обеспечивает разделимость понятий, образующих ПОСП, отсутствие в построении синонимии или семантически близких терминов.

Опишем методику формализации информации образовательного процесса, представленной оценками успеваемости учащихся в рамках некоторого предмета У.

Пусть X - «знания учащихся по предмету У, Т(Х) = {2,3,4,5}; и = [о,1]; хеи -степень интенсивности проявления знаний по рассматриваемому предмету; * = 0 соответствует полному отсутствию проявления знаний и является типичной точкой - степень принадлежности равна 1) - нечеткого множества, поставленному в соответствие оценке «2»; х = 1 соответствует полному присутствию проявления знаний и является типичной точкой нечеткого множества, поставленному в соответствие оценке «5». Относительное содержание учащихся с оценкой «2» в данных успеваемости обозначим с1; относительные содержания учащихся с оценками «3», «4», «5» соответственно с, Ь, а; а+Ь+с+<1 = 1. Поставим в соответствие оценкам «2», «3», «4», «5» четыре терм-множества ПОСП 2, 3,4,5 с трапецеидальными функциями принадлежности, однозначно определяемыми четырьмя параметрами - абсциссами точек излома графиков.

Обозначим ^2{х),^(х),^(х\^{х) ~

функции принадлежности терм-множеств 2,3, 4,5.

I а) а<Ь, = ;

6) а>Ь, Ц;(х) = ^1-а—^;1—а+~;1;1 .

II а) Ь> тах(а,с),

б) а < Ь<с,

МЛх) =

3Ь Ъ За а .

1_а_ ;1_а_

2 2 2 2

в) с <Ь <а ,

М4 =

, с , Зс , Ь . Ъ й +—+—;1-а—;1-а + — 2 2 2 2

г) Ь<тт(а,с), 36

М4(*) =

* , * 1

1-а---;1-а—- а—;1-а+ —

2 2 2 2

III а) с > тах(Ь,£?), 3<*

=

1 зь.1 1-а--------1-а —

2 2 2 2

б) Ь<с<й,

&{х) =

, с * с - ЗЬ . Ь .

+—;1-а—— ;1 — а—— ; 2 2 2 2

л, , ((I М , с , Ъс

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

в) й <с<Ь, и = —;—;*/ +—;Л +—

3 (_2 2 2 2

г) с < тт(Ь,«/),

МД*) =

IV а) ^ <с ,ц2(х) =

2 2 2 2

б) (I >с ,ц2(х) =

2 2

0;0;с/-—;й? +— 2 2

делить такой количественный показатель качественного признака знания, как интенсивность проявления знаний в рамках некоторой учебной дисциплины. Задача определения количественных показателей проявлений качественных признаков является одной из основных задач экспертного оценивания.

Существуют различные методы четкого представления нечеткого множества или методы дефаззифиции нечеткого множества. Достаточно часто используется широко известный метод центра тяжести, согласно которому число

Е=-

I

jxцl(x)dx

л____________

I

1}11(х)<1х

Нетрудно проверить, что функции принадлежности /!,(*), 1 = 2,5 терм-множеств 2,3, 4, 5 удовлетворяют условиям 1) - 5), поэтому построенное семантическое пространство действительно является полным и ортогональным.

Пример. Имеются данные успеваемости студентов по высшей математике. Воспользуемся предложенным методом и построим ПОСП X- знания студентов по высшей математике, г(х)={2, 3,4, 5}, с1 = од, с = 0,4, Ь = 0,3, а = 0,2. Тогда функции принадлежности терм-множеств т(х) соответственно ц,(х\ /*,(*), К,(4 иАх) будут однозначно определяться своими параметрами: 1Л2(х) = (0;0;0.05;0.15); ц,(х) = (0.05:0.15;0.35;0.65)

1Л,(х) = (0.35;0.65;0.7;0.9);

М5(л-) = (0.7;0.9;1;1).

Подобное представление информации образовательного процесса позволяет опре-

применительно к образовательному процессу можно трактовать как количественную оценку интенсивности проявления знаний в рамках оценок / = 2,5.

Изложенная методика формализации качественной информации является универсальной и может применяться к результатам оценивания любого качественного признака. В свою очередь, этап формализации качественной информации позволяет применять к формализованной информации аппарат теории нечетких множеств для ее обработки и анализа. Среди методов обработки нечеткой информации можно выделить методы нечеткого кластер-анализа [5, 8, 9] и методы нечеткого регрессионного анализа [10]. Эти методы позволяют сравнивать подходы преподавателей к оценке знаний, формировать предметные комиссии для приема экзаменов, сравнивать профессиональную подготовку выпускников вуза разных лет, прогнозировать успеваемость учащихся, прогнозировать изменение характерологических и интеллектуальных показателей учащихся за период обучения и т. д.

Выводы

Сложность количественного оценивания процессов обучения и управления этими процессами является причиной наличия многообразной трудноформализуемой в

рамках традиционных математических формализмов информации. Появление и развитие теории нечетких множеств обеспечило возможность формализации такой информации в рамках основных понятий этой теории с последующим применением ее аппарата для обработки и анализа.

Методы теории нечетких множеств нашли многочисленные применения в ряде областей деятельности человека и должны занять свое достойное место среди методов обработки информации образовательного процесса.

Литература

1. Рыжов А.П. Элементы теории нечетких множеств и измерения нечеткости. - М.: Диалог-МГУ, 1998.-116 с.

2. Нечеткие множества в моделях управления и искусственного интеллекта / А.Н. Аверкин, И.З. Батыршин, А.Ф. Блишун, и др. - М.: Наука, Гл. ред. физ-мат. лит., 1986. - 312 с.

3. Полещук О.М. О применении нечетких множеств в задачах построения уровневых градаций // Лесной вестник. - 2000. - № 4(13). - С.142 - 146.

4. Полещук О.М., Полещук И.А. Нечеткая кластеризация элементов множества полных ортогональ-

ных семантических пространств // Вестник Московского государственного университета леса -Лесной вестник. - 2003. - № 1 (26). - С. 117 - 127.

5. Полещук О.М. О развитии систем обработки нечеткой информации на базе полных ортогональных семантических пространств // Вестник Московского государственного университета леса -Лесной вестник. - 2003. - № 1(26). - С. 112 - 117.

6. Полещук О.М. Некоторые подходы к моделированию системы управления образовательным процессом // Телекоммуникации и информатизация образования. - 2002. - № 3(10). - С. 54 - 72.

7. Домрачев В.Г., Полещук О.М. Повышение качества образовательных услуг на основе системы индивидуального подхода к подготовке специалиста / Материалы научной конференции «Качество и ИПИ-технологии». - М.: Фонд «Качество», 2002.-С. 68-70.

8. Домрачев В.Г., Полещук О.М. О нечетком кластер-анализе на основе полных ортогональных семантических пространств // Вестник Самарского государственного аэрокосмического университета им. С.П.Королева. - 2002. - Вып. 6. - С. 52 - 53.

9. Полещук О.М. Нечеткая регрессионная модель прогноза успеваемости обучающихся // Обозрение прикладной и промышленной математики. -2002. - Т.9, Вып. 2. - С. 435 - 436.

10. Zadeh L. A. Fuzzy sets // Inform. And Control. 1965. №8. P. 338-352.

О ПОСТРОЕНИИ РЕЙТИНГОВЫХ ОЦЕНОК НА ОСНОВЕ ЛИНГВИСТИЧЕСКИХ ПЕРЕМЕННЫХ

О.М. ПОЛЕЩУК, к. ф.-м. н., доцент каф. высшей математики

Задачи нахождения рейтинговых оценок в рамках одного или нескольких качественных признаков возникают в различных областях деятельности человека. Решения этих задач позволяют получать доступную и своевременную информацию в виде некого интегрального показателя, который используется для принятия ряда управленческих решений. Сложность нахождения рейтинговых оценок в рамках качественных признаков вытекает из общей сложности количественного оценивания этих признаков. Связана она с особенностью их измерения, состоящей в необходимости учета свойств или суждений лиц, измеряющих качественные признаки и принимающих на основе этого субъективного измерения решения.

Качественные признаки, как правило, измеряются в порядковой шкале и до развития теории нечетких множеств [13] значения этих признаков считались значениями неких случайных величин. Однако следует отметить, что взаимоотношение явления и его вероятностной модели обнаруживается при повторных наблюдениях за явлением. Частоты исходов в длинном ряду испытаний стабилизируются, их колебания с ростом числа испытаний уменьшаются. Выходя за пределы реального опыта, полагают, что при его неограниченном повторении частоты стремятся к пределам, которые и принимают за вероятности соответствующих исходов или событий. Поэтому теория вероятностей базируется на ряде требований, выполнение которых необ-

i Надоели баннеры? Вы всегда можете отключить рекламу.