Известия ТРТУ
Специальный выпуск
тота использования терма во всей коллекции; 3) длина документа. Пусть 0={^1 -множество информационных ресурсов, которое требуется разбить на подмножества по тематике. Множество тематических каталогов, определяемых своими тематическими профилями, обозначим через К={К}Ь. Каждый тематический профиль определяется своими собственными дескрипторами, ключевыми словами или другими лексическими единицами, которые назовем терминами. Множество терминов, определяющих тематические направления тематического профиля Кь обозначим через ТК Информационный поиск можно представить в виде пятерки ГО={К,Б,Т,РД}, где 1Я - результат информационного поиска, выдаваемым пользователю в виде списка названий, адресов и других реквизитов источников информации, р - запросы пользователей. Я={ Яс, ЯК, Я3, Я°} - множество отношений, которое определяет отношения типа “информационный ресурс - термин” (Яс), “тематический каталог - термин” (ЯК), “термин - синоним” (Я3) и “запрос - термин” (Яр). Все отношения, определяемые здесь, являются нечеткими. Информационный поиск возможно представить в виде ориентированного графа, вершинами которого являются множества, а дугами представляются отношения между ними.
УДК 62-52:658.562.3
А.В. Боженюк, А.В. Чкан
ИСПОЛЬЗОВАНИЕ СИНТАКСИЧЕСКИ-НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ В ЗАДАЧАХ КЛАССИФИКАЦИИ
Традиционно задача классификации с обучением заключается в разбиении пространства признаков Х1хХ2х... хХп объектов на к не пер есекающихся подмножеств на основе обучающих алгоритмов, которые используют выборку объектов с уже известной классификацией. При определении степени (меры) близости между сравниваемыми параметрами объектов используемые нормы в обучающих алгоритмах действуют одинаково на всем диапазоне параметров. В этом смысле они являются «объективными» и не учитывают субъективизм человека при проведении классификации. Предлагается подход к нечеткой классификации, позволяющий учитывать субъективный опыт человека путем использования нечетких лингвисти-,
признаков классифицируемых объектов.
Пусть информация об уже классифицируемых объектах задана в виде системы четких высказываний: Ь (<если А,■ то В>}, 1е{1,2,...,т}, где А/ - высказывание, отражающее характеристики /'-го наблюдаемого объекта; В- высказывание, отражающее классификацию /'-го объекта в виде, -е{1,2,...,к}, к- число возможных классов. На каждом множестве Хъ 1е{1,2,...,п} параметров признаков экспертом заданы лингвистические переменные в По наблюдаемым параметрам х=(х’1, х’2,..., х’п), х’1еХ1, ..., х’пеХп генерируются значения {о}синтаксически-
независимых лингвистических переменных в с соответствующими функциями
. А , -
зификацией четких параметров. По полученному высказыванию формируется система нечетких высказываний Ь = {Ь- : < если А то В - >}, - = 1, к. Определяются степени близости {Т}е[0,1] относительно четкой системы высказываний Ь, которые и отражают «близость» объекта к классу t, т.е. задают нечеткую клас.