ОБРАЗОВАНИЕ
РАСПОЗНАВАНИЕ СВОЙСТВ СМЕСЕЙ ВЕЩЕСТВ И ТЕХНОЛОГИЙ ПО СВОЙСТВАМ КОМПОНЕНТОВ СМЕСИ
Мазуров Вл.Д.
Рассматриваются задачи прогнозирования и диагностики свойств смесей материалов и технологий на основе методов линейного программирования и распознавания образов. Прогнозирование смеси осуществляется по свойствам компонентов смеси. Проблема состоит в нелинейной и часто неформализованной зависимости свойств смеси от свойств компонентов. Поэтому основная модель дополняется процедурами статистического обучения методов классификации и распознавания. Приводятся конкретные примеры задач такого рода.
Ключевые слова: прогнозирование, диагностика, смеси, дискриминантный анализ
THE RECOGNITION PROPERTIES OF SUBSTANCES AND TECHNOLOGIES ON THE PROPERTIES OF THE MIXTURE COMPONENTS
Mazurov Vl.D.
The prognosis and diagnosis processes for properties of mixtures are investigated on the base of optimization and pattern recognition theory. The problem is some non - formal dependence of mixture properties from components dependences. Some examples of such problems are given.
Keywords: forecasting, diagnostics, mixes, discriminant analysis
Методы распознавания образов (обучения методов диагностики на основе статистик) и оптимизации (математического программирования) применяются к задачам структуризации сложных систем, их диагностики и управления ими. В данной статье рассматривается задача определения свойств смесей некоторых компонентов (например, составляющих металлургических шихт) по свойствам компонентов и свойств комбинированных технологий из некоторых составляющих элементарных или базисных технологий с учетом дополнительных факторов. Методы решения этой задачи используют построение допустимого множества линейных комбинаций векторов и дискриминант-ный анализ - построение поверхности, разделяющей конечные множества элементов линейного векторного пространства. Проблема состоит в том, что свойства смеси зависят от свойств компонентов нелинейным
образом, и часто эта зависимость неформа-лизована. Этим и определяется обращение к методам распознавания образов.
В работах, выполнявшихся нами совместно с геологами и геофизиками [1], методы распознавания применялись для моделирования некоторых пространственных неодно-родностей. В геофизике и геологии применяются эмпирическое моделирование и диагностика природных систем. Так, в задачах разбиения на однородные классы, в задачах районирования (выделения таксонов) природных областей приходится строить поверхности, разделяющие множества векторов.
Динамика таксонов вызывается миграцией химических элементов, которая обусловлена рядом факторов: физико-химических, биогеофизических, техногенных. В анализе данных надо разделять множества сигналов, характерных для различных классов смесей векторов.
Задачи оптимизации - это класс экстремальных задач, составленных целевыми функциями многих переменных и системами алгебраических уравнений и неравенств. Отыскивается экстремальное значение целевой функции при этих ограничениях. В основе методов решения таких задач лежат методы для задач линейного программирования, в которых целевая (критериальная) функция аффинна, а система ограничений составлена из линейных неравенств.
В задачах прогнозирования свойств комбинированного сырья для металлургии [ 1] по свойствам компонентов надо прогнозировать свойства шихт. В частности, в черной металлургии важно прогнозировать прочность шихт. Действительно, металлургические предприятия имеют коксохимические цехи и агломерационные фабрики. Для доменного процесса важен химический состав кокса.
Многие задачи в этой области связаны с разделением и дифференциацией смесей, моделируемых элементами многогранных множеств, с определением расстояний между множествами. Смесь векторов х(Г), i = 1,.. ,,т, есть вектор
х(а) = а1 х(1) + ...+ ат х(т), а = [а1,...,ат], (а,у) = 1, х(0 >0, у = [1,...,1].
Свойства смеси, как некоторые такие же комбинации свойств составляющих, как правило, не имеют места. При таком представлении множество всех теоретически возможных смесей есть выпуклая оболочка векторов а(Г). Двойственное представление множества осуществляется через систему линейных неравенств. В этом случае мы используем опоры множеств. Геометрически прозрачное понятие опоры множества используется в дискриминантном анализе. Перейдем к деталям.
Пусть М - множество в линейном пространстве L. Если А содержит М, то А -опора множества М. Для f е F (Е -некоторый класс отображений L^R) f - опорой
ов Вл.Д.
множества М назовем множество {х: Д(х) < 0} з М.
Опоры множеств используются как опоры прецедентных множеств в дискриминан-тном анализе.
Задача опорных множеств сводится к решению сопряженных неравенств (то есть мы ищем определенную функцию Д(х) > 0 (хе М), Д(х) < 0 (х е К).
Для случая, когда F - множество аффинных функций, методы опорных множеств исследованы С.Н. Черниковым. Для задач дискриминантного анализа этот аппарат исследован Вл.Д. Мазуровым и М.Ю. Ха-чаем.
Пусть L - линейное пространство, L* -сопряженное пространство, А, В содержатся как подмножества в допустимом множестве D - подмножестве пространства L. Рассмотрим задачу дискриминантного анализа DA(A,B,F), F - подмножество пространства L*. Эта задача состоит в нахождении функции Д из F, разделяющей множества А и В. Например, F - конус в L. В частном случае L = Ял, L* = Яп. F = Яп+. Далее проводим сведение этой задачи к системе линейных неравенств и, в частности, к конечномерной системе. Затем можно рассмотреть комитетные решения этой задачи. Заметим, что из этой формулировки вытекает, что дискриминантный анализ можно представить как обобщение задачи математического программирования. Потому обобщение, что вместо критериальной функции от Д мы записали более общее условие, что Д принадлежит множеству Е Если F - линейное пространство, то задача сводится к системе линейных неравенств (возможно, бесконечномерной). Линейные неравенства в бесконечномерных пространствах изучены Фань-Цзи. Бесконечные системы линейных неравенств изучены С.Н. Черниковым.
Для определения множеств смесей и их разделимости используются такие конструкции, как расстояния между множества-
ОБРАЗОВАНИЕ
ми и фейеровские процессы вычисления расстояний.
Если М - подмножество векторов пространства Ял, то слабофейеровский сдвиг из вектора х в вектор у таков, что
ё(у^) < ё(х^) (для всех z из М).
Здесь ё - символ расстояния.
Смесь векторов х(1),.. ,,х(т) есть вектор:
а(1)х(1) + .а(т)х(т), а(1) + .+ а(т) = 1, a(i) >0 (I = 1,...,т).
И мы имеем два множества смесей: А и В; А - все смеси из векторов х(1),.,х(т), В - все смеси из у(1),.. ,,у(к). Анализ этих данных опирается на дискримиантный анализ. Расстояние между множествами А и В определяется формулой
ё(А,В) = ^ {|х-у|: х е А, у еВ}.
В качестве конкретного примера рассмотрим задачу прогнозирования свойств смесей веществ. В этой сфере существует потребность в конкретных методах повышении надежности прогнозирования. Так, в распознавании свойств шихт в черной металлургии нами был применен метод комитетов распознавания образов с хорошим практическим внедрением.
Задача, близкая к рассмотренной (но со своими особенностями), - прогнозирование свойств композитных материалов. Эта проблема важна в изучении и использовании новых материалов, в атомной промышленности, в космонавтике и в других современных технологиях. Строение этих материалов может быть самым различным - это и слоистое строение, и волокнистое, и пористое. Однако их можно изучать с некоторой общей точки зрения - что они представляют собой смеси мелкозернистых компонент. Здесь, как правило, применяется метод усреднения [3]. Трудная формализуемость этой про-
цедуры вытекает из того обстоятельства, что физические параметры смеси разрывны и сильно изменяются при переходе от одной составляющей к другой. При этом информация может быть неполной. В этом случае выход может быть найден на пути использования методов распознавания образов и нейронных сетей.
Смешивание технологий используется также в следующих ситуациях. В целом ряде промышленных отраслей (металлургической, металлообрабатывающей, химической, нефтеперерабатывающей) используются методы получения линеек продуктов из одного вида сырья. Задача анализа этих ситуаций выглядит следующим образом.
Есть некоторое комплексное сырье. Из него производится ряд видов продукции в заданных пропорциях. Из т(Г) единиц продукции соответствующих видов составляется ассортиментный набор. Существуют п технологий обработки сырья. Надо найти неотрицательные числа х(Г) - доли сырья, используемые по этим технологиям. Выбор эффективной смеси связан с нахождением оптимальной по некоторым критериям комбинации компонентов. Максимизируется число ассортиментных наборов. Получается задача линейного программирования. Так как зависимость свойств смеси от свойств компонент часто неформализована, то методы линейного программирования дополняются методами дискриминантного анализа.
ЗАКЛЮЧЕНИЕ
Методы опорных множеств, используемые в дискриминантном анализе, применяются для решения задач диагностики смесей веществ и технологий. Диагностика осуществляется на основе методов дис-криминантного анализа и математического программирования. Приводятся примеры конкретных задач прогнозирования и диагностики смесей материалов и технологий.
Мазуров Вл.Д.
ЛИТЕРАТУРА
1. Мазуров Вл.Д. (ред.) Метод комитетов в распознавании образов. УНЦ АН, СССР , 1974.
2. Мазуров Вл.Д., Хачай М.Ю. Комитетные конструкции // Известия Уральского государственного университета. 1999. № 14. Серия "Математика и механика".
3. Attoush Hedy. Homogeneisation. - Sem. Bourbaki, 1987 - 88.
4. Мазуров Вл.Д. Метод комитетов в оптимизации и классификации. М.: Наука, 1990.
5. Еремин И.И. Теория линейной оптимизации. Екатеринбург: УрО РАН, 1998.
6. Ky Fan. On systems of linear inequalities. University Notre Dame, 1954.
7. Черников С.Н. Линейные неравенства. М.: Наука, 1968.