Алгоритмическое обеспечение инструментального комплекса для формирования знаний о технологических процессах

Пименов В.И.

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ

УДК 681.3.06

В. И. Пименов

АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИНСТРУМЕНТАЛЬНОГО КОМПЛЕКСА ДЛЯ ФОРМИРОВАНИЯ ЗНАНИЙ О ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССАХ

Рассматриваются особенности представления в компьютерных обучающих системах базы знаний, описывающей технологические процессы. Автоматизация проектирования динамической модели знаний интеллектуальных обучающих систем выполняется в рамках специального инструментального комплекса. Решающие правила, построенные в процессе обучения распознаванию образов, используются для представления динамических знаний.

Ключевые слова: технологический процесс, компьютерная обучающая система, распознавание образов, решающее правило, база знаний.

Введение. В специальной литературе технологический процесс (ТП) представляется как текстовое описание (вербальная модель), снабженное иллюстрациями, формулами, таблицами. Не исследованные до конца технологии и процессы, описывающие создание новых материалов, сопровождаются также наличием большого количества экспериментальных данных.

Этапность выполнения технологических операций, выделение классов готовой продукции, наличие диапазонов значений технологических параметров, обеспечивающих получение готового продукта требуемого качества, приводят к построению дискретных моделей знаний о технологических процессах. Многие исходные компоненты являются результатами выполнения других технологических процессов. Поэтому для описания понятий и их свойств вопросы формализации исходных компонентов и готового продукта должны решаться одинаково.

При реализации обучающей системы в гипермедиа-технологиях в основе ее логической схемы, в первую очередь, лежит модель предметной области, которая чаще всего строится в виде графа логических связей учебных элементов, представляющих подраздел дисциплины на минимальном уровне [1, 2]. Основная проблема при преобразовании первичного материала в систему гипермедиа-компонентов — выделение информационных блоков и установление логических связей-гиперссылок между сотнями, а иногда тысячами учебных элементов.

Модель знаний о ТП представляется как совокупность статической и динамической составляющих. Статическая модель отражает множество классов О: возможные наименования продукции, сортность, уровни потребительских и эксплуатационных показателей качества. Описание технологического процесса массивом „объект — атрибуты — значения" позволяет представить задачу проектирования динамической модели знаний как обучение распознаванию образов (ОРО) [3], когда из баз данных извлекается система решающих правил (РП), описывающих порядок изготовления продукции заданных классов. Система РП графически представляется моделью поля знаний, на котором распределяются информационные блоки и устанавливаются связи-гиперссылки. Значения образующих априорный словарь Хд свойств,

характеризующих сырье, материалы, детали, изделия, и достаточное число прецедентов позволяют выделить информативное подмножество признаков ХР для разделения ТП по выпуску продукции различных классов. Признаки-свойства, не вошедшие в рабочий словарь ХР, определяют в исходных текстах базовые понятия, общие места или дополнительную информацию.

Состав инструментального комплекса. Инструментальный комплекс для автоматизации проектирования динамической модели знаний интеллектуальных обучающих систем технологической направленности основан на различных методах и алгоритмах. Исходными данными для формирования РП являются описания Хд производимых объектов с указанием их принадлежности соответствующему классу. Список признаков, входящих в априорный словарь, специалист формирует исходя из заданного алфавита классов объектов, в частном случае — при составлении онтологии знаний об описываемых ТП.

Получение априорной информации для обучения реализуется одним из следующих способов:

— выборкой из базы данных результатов наблюдения за выпуском готовой продукции;

— заданием значений признаков (или диапазонов значений признаков) объектов обучающей выборки (ОВ);

— заданием функций принадлежности нечетких классов.

Если отношение размерности исходного пространства признаков (УА) к объему (п) обучающей выборки невелико и априорный словарь является недостаточным для разделения объектов различных классов, то возникает необходимость применения последовательного критерия отношения вероятностей (ПКОВ), позволяющего накапливать информацию о значениях признаков объекта на этапе логического вывода. В режиме выделения класса с новыми потребительскими свойствами на основе базы знаний (БЗ) решается задача альтернативного распознавания объектов определенного класса, представляющего интерес, и остальных объектов, относящихся к фоновому классу [4].

При ограниченном обучающем материале основное внимание при создании комплекса уделяется алгоритмам ОРО, обеспечивающим высокую экстраполирующую силу найденных правил. Критерием выбора класса решающего правила, осуществляемого совместно с поиском рабочего словаря ХР, является гарантированная оценка риска [5]

Рош = Хр ) + в(п, п, М, И),

где V — эмпирический риск (частота ошибок распознавания на обучающей выборке); в — гарантированное отклонение степени среднего риска от эмпирического; емкость И = И(К, ХР) является мерой разнообразия класса РП К для фиксированной размерности признакового пространства. Характер зависимости величины Рош от объема выборки п, доверительной вероятности п, количества классов продукции М и емкости И позволяет при недостаточности

ОВ осуществить выбор класса РП К и рабочего словаря ХР. Выбранный по критерию мини*

мума Рош класс К является предпочтительным с точки зрения обеспечения экстраполирующей силы системы РП.

Среди простейших классов, обладающих минимальной емкостью, рассматриваются логические, линейно-логические, линейные и кусочно-линейные РП. Решающие правила, образующие в пространстве признаков нелинейные разделяющие гиперповерхности, при оценке их емкости могут использовать кусочно-линейную аппроксимацию.

Нарушение гипотезы компактности, когда объекты различных классов „перемешаны" в признаковом пространстве, приводит к тому, что дискриминантные правила не дают возможности выполнить распознавание или, в лучшем случае, выявляют только фрагменты логических закономерностей в данных [6]. Во избежание подобной ситуации следует перед обучением соответствующие „трудные" классы разбить на подклассы, используя методы таксономического анализа.

Поиск рабочего словаря и интервальное кодирование признаков (для логических РП) осуществляются на основе вычисления критерия информативности, выбор которого зависит от класса используемых РП. Для логических РП и для РП, построенных в пространстве непрерывных признаков, применяются свои группы критериев [7].

В целях уменьшения избыточности кода и объема пространства признаков

мР

V = Пtj , j =!,Np, j=1

можно осуществить устранение „дублирующих" порогов после дискретизации отдельных признаков на определенное число градаций j что позволяет обеспечить более глубокий минимум Рош.

Таким образом, при формировании алгоритмического обеспечения распознающей БЗ в случае ограниченности исходных данных прежде всего решается комбинаторная задача выбора класса РП и системы описания объектов, а затем с учетом типа входящих в описание признаков непосредственно выполняется построение решающего правила. Тем самым осуществляется разбиение единого процесса обучения и учитывается структура взаимосвязи его основных этапов.

Используемые в инструментальном комплексе программы кодирования признаков реализуют алгоритм позиционного порогового кодирования [8] и алгоритм минимального числа порогов МЧП [9].

Программы формирования рабочего словаря выбирают минимальное или квазиминимальное число признаков Np из исходного априорного словаря Хд при информативности /Р не ниже исходной /д. После МЧП-дискретизации задачу выбора рабочего словаря можно свести к схеме аддитивного алгоритма ветвей и границ [9]. Рабочий словарь, близкий к оптимальному, может быть найден, если параметр алгоритма 0<s1<1.

Алгоритмы обучения и распознавания используют, в частности, следующие методы.

Метод ближайшего соседа — кусочно-линейное РП формируется для небольшого числа классов (M < 10).

Метод дискретных линейных решающих функций (ЛРФ) [8] — при обучении настраиваются коэффициенты дискретных функций и пороги позиционного кодирования признаков.

Метод t-арного решающего дерева — лучшим на данном уровне дерева признаком считается тот, который обеспечивает минимум суммы числа неразделимых этим признаком пар классов по всем подмножествам рассматриваемого уровня.

Метод бинарной решающей матрицы (БРМ) — реализует покрытие каждого класса объектов ОВ гиперпараллелепипедами с гранями, ортогональными координатным осям [10].

Параметрическая адаптация решающих правил заключается в настройке коэффициентов алгоритма распознавания на конкретную обучающую выборку: по окончании процесса обучения формируются массивы значений порогов для логических РП или коэффициенты линейных функций для линейных и кусочно-линейных РП.

Выбор алгоритма обучения для множества альтернативных РП в условиях недостаточной ОВ осуществляется на основе рассмотрения сформированных систем описания (рис. 1). Наилучшим является алгоритм, для которого объем V пространств признаков и соответственно значение Рош минимальны при vmin ~ 0 и n = const. Например, при распознавании 11 классов деталей сложной формы на основе 15 геометрических признаков с числом объектов ОВ в каждом классе, равном 10, вероятность ошибки распознавания по методу дискретных ЛРФ составила 5 %, по методу решающего дерева — 4 %, с помощью БРМ — 3,4 %.

С одной стороны, наибольшая надежность метода БРМ объясняется применением при обучении алгоритма ветвей и границ, позволившего выбрать оптимальную группу признаков, с другой стороны, преимущество методов БРМ и решающего дерева перед дискретными ЛРФ связано с более глубокими причинами — используемым способом кодирования признаков и видом их критерия информативности.

С Начало )

г2-

Выборка исходных данных: О={Оь О2, ..., Ом}, | О. |=п, ХА={ХЬ X, ...

Задание отличительного пр>изнакаХХ^-для обнаружения объектов искомого класса О и верояоносое й ошибок

02 14

02 20

02 23

02 32

Рис. 1

.14

01

Кодирование признаков априорного словаря

15__

Минимизация объема пространства признаков: К^шш при

/р(^1)=/А(^1)

16 ____ Устранение дублирующих порогов

ногоЛ 'градаци-17 онные , признаки

.18

Определение

vmm(Kb XP)

г19 -

Вычисление

Рош №) = =Vmm(Kb Хр)+

+е(и, V, п)

Формирование рабочего словаря из условия

Vшm(K2) = = Vmm(Kз)

01

_23_

Минимизация рабочего словаря:

при /р(КЗ)=/А(КЗ)

01

_32 _

Минимизация рабочего словаря: ХР^тш при /р(КЗ)=/А(КЭ)

епре-рывные 24 признаки

.22 _

Вычисление

Рош (KOT =Vmin(K2, Хр)+ +s(n, А, п, М

-25

Формирование РП из условия v(K3, XP)^min

.33 _

Формирование РП из условия v(K4, XP)^min

,.26 I

Вычисление

Рош (Кз)= =Vmin(K3, Хр)+ +s(n, NP, п, М)

.34 _

Вычисление

Рош (K4)= =vmin(K4, XP)+

+s(n, NP, п, k, М

Выбор класса РП: K* =arg min Рош (K)

KCK

I

,-29 -

Выбор реализации РП

из класса К* и алгоритма ОРО

30

Параметрическое

обучение. Определение РП k*:

k* =arg min v(k, XP)

kcK*

01 13

35 I Построение функций принадлежности

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и// х/ е Х],

/=1, Ха, /=1, М

_36_

Определение

степеней разделимости пар классов

А>

/=1, М(М-1)/2, ./=1, Ха

.37 _

Кодирование признаков априорного словаря

.38 _

Выбор рабочего словаря признаков

_39 ___

Формирование размытого логического РП в виде многоградаци

онной решающей матрицы

31

( Конец )

Рис. 1

При обучении по методу дискретных ЛРФ применялся способ позиционного порогового кодирования, а информативность группы признаков по критерию разделяющей силы определялась по матрице разделимости классов, что привело к избыточному описанию объектов (рис. 2, а). Для повышения экстраполирующей силы системы РП избыточные пороги целесообразно исключить (пороги d11, ^41, й?12) или заменить одним, установленным посередине (пороги d21, Уменьшить избыточность кода позволяет способ кодирования методом минимального числа порогов (рис. 2, б), при этом РП формируется в виде БРМ.

а)

б)

X,

г к г2 J

Q1 г h у у

X,

С Г ^

© «

d

22

12

d

12

0 dll d2l dзl d4l Х1

Рис. 2

Алгоритм позиционного порогового кодирования, применяемый при формировании дискретных ЛРФ, основан на использовании при обучении интервального критерия информативности, который для одиночного признака Xj, ] = 1, N а , определяется выражением

^инт j tj

> ¿M

/ i=1

i = 1, t;

где

и

jt

мощность характеристического множества классов на t-м интервале квантования

значений признака XI.

Значение критерия информативности группы признаков {Х1, Х2}, определенное по их разделяющей силе (рис. 2, в), меньше единицы (априорный словарь недостаточен). Выберем интервальный критерий вида

/V'

/них (Хр ) = V'/¿Ы , I = 1, V' ,

I=1

где |и/| — мощность характеристического множества классов объектов ОВ, для которых на

данном 1-м элементе (ячейке) пространства признаков ХР частота появления объектов ОВ не равна нулю; V— число элементов объема пространства признаков, содержащих объекты ОВ.

Использование критерия /инт позволяет сделать вывод о достаточности рабочего словаря {Х1, Х2} для разделения объектов ОВ на три класса. При этом построенное дискретное линейное РП обеспечивает нулевое значение степени эмпирического риска.

Таким образом, способ кодирования признаков должен соответствовать введенному критерию информативности, который, в свою очередь, должен быть согласован со сложностью РП: дискретные ЛРФ аппроксимируют линейные непрерывные решающие функции с малым шагом дискретизации и по своей сложности занимают промежуточное положение между известными логическими и линейно-логическими РП.

Заключение. Учет взаимосвязи основных этапов обучения на основе комплексного применения дискриминантных алгоритмов в условиях ограниченной априорной информации позволяет проектировать динамическую модель знаний с обеспечением высокой точности при принятии решения по новым данным.

Решающие правила, построенные как простой набор дискриминантных функций линейного и более сложного вида, даже в случае полного разделения классов не содержат знаний о диапазонах изменения значений параметров ТП и их взаимодействий для получения готового изделия заданного класса. Анализ РП позволяет указать лишь наиболее важные технологические параметры и их весовые коэффициенты для попарной различимости технологических процессов. Разработанные для инструментального комплекса логические правила в форме бинарной решающей матрицы и нечеткой решающей матрицы легко поддаются семантической интерпретации и соответствующей реализации в базе знаний [9].

1. Соловов А. В. Проектирование компьютерных систем учебного назначения: Учеб. пособие. Самара: СГАУ,

2. Тархова Л. М. Проектирование и компиляция электронных информационно-справочных материалов по инженерной графике // Информационные технологии моделирования и управления. 2005. № 7(25). С. 950—955.

3. Романов В. Е., Климов В. А., Саакян Р. Р. К развитию информационных технологий в области технологии химических волокон // Вестн. Санкт-Петербург. гос. ун-та технологии и дизайна. 2001. Вып. 5. С. 95—109.

4. Пименов В. И. Применение методов обучения распознаванию образов для проектирования динамической модели знаний о технологических процессах // Системы управления и информационные технологии. 2006. № 2 (24). С. 98—103.

5. Вапник В. Н., Червоненкис А. Я. Теория распознавания образов (статистические проблемы обучения). М.: Наука, 1974.

6. Дюк В. А. Осколки знаний // Экспресс-электроника. 2002. № 6. С. 60—65.

7. Мандель И. Д. О выборе информативных признаков при классификации объектов // Автоматика и телемеханика. 1986. № 2. С. 164—167.

8. Носов А. Л. Описание объектов распознавания в системах технического зрения роботов / Киров. политехн. ин-т. Киров, 1986. Деп. в ЦНИИТЭИприборостроения 01.04.86, № 3202—пр.

9. Пименов В. И. Разработка обучающих систем в области технологии и дизайна на основе методов интеллектуального анализа данных. СПб.: ИПЦ СПбГУТД, 2006.

10. Пименов В. И. Построение обучающей системы на базе модели онтологии // Качество. Инновации. Образование. 2006. № 4. С.42—48.

СПИСОК ЛИТЕРАТУРЫ

1995.

Виктор Игоревич Пименов

Сведения об авторе канд. техн. наук, доцент; Санкт-Петербургский государственный университет технологии и дизайна, кафедра прикладной информатики; профессор; E-mail: [email protected]

Рекомендована кафедрой прикладной информатики

Поступила в редакцию 29.06.07 г.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пименов В. И.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пименов В. И.

TOOL COMPLEX ALGORITHMS FOR KNOWLEDGES DESIGNING ABOUT TECHNOLOGICAL PROCESSES

Текст научной работы на тему «Алгоритмическое обеспечение инструментального комплекса для формирования знаний о технологических процессах»