Научная статья на тему 'Многофакторная модель прогнозирования характеристик выпускаемой продукции на основе метода опорных векторов'

Многофакторная модель прогнозирования характеристик выпускаемой продукции на основе метода опорных векторов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
250
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОД ОПОРНЫХ ВЕКТОРОВ / СПЛАВЫ АЛЮМИНИЯ / SUPPORT VECTOR MACHINES / ALUMINIUM ALLOYS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Юрков Николай Сергеевич

Рассматривается задача прогнозирования свойств алюминиевых сплавов от технологических параметров их приготовления. Предлагается математический аппарат на основе метода опорных векторов, способ подготовки исходных данных. Приводятся результаты тестирования моделей прогнозирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The paper discusses forecasting of aluminium alloya properties depending on their production parameters. Mathematical apparatus on basis of support vector machines and data preparation technique are proposed. Forecasting model testing results is demonstrated.

Текст научной работы на тему «Многофакторная модель прогнозирования характеристик выпускаемой продукции на основе метода опорных векторов»

4. Гущин А. Н. Основные концепции построения лич- 6. Рассел С., Норвиг П. Искусственный интеллект: со-ностно-ориентированных информационных систем // временный подход. М. : Вильямс, 2006.

Военмех. Вестн. Балт. гос. техн. ун-та. СПб, 2008. С. 34-44. 7. Ясницкий Л. Н. Введение в искусственный интел-

5. Лорьер Ж.-Л. Системы искусственного интеллекта : лект : учеб. пособие для студентов высш. учеб. заведе-

пер. с франц. М. : Мир, 1991. ний. М. : Академия, 2005.

O. V Aripova, A. N. Guschin METHODS OF AGENT CONTROL IN MULTI-AGENT EXPERT SYSTEM

In the article we discuss on the user’s models interacting with the distributed network resource, where every user has a correlated agent, as well as on the methods of multi-agent expert system control.

Keywords: expert system, the agent, interaction, behavior, control.

© Арипова О. В., Гущин А. Н., 2010

УДК: 51-74

Н. С. Юрков

МНОГОФАКТОРНАЯ МОДЕЛЬ ПРОГНОЗИРОВАНИЯ ХАРАКТЕРИСТИК ВЫПУСКАЕМОЙ ПРОДУКЦИИ НА ОСНОВЕ МЕТОДА ОПОРНЫХ ВЕКТОРОВ

Рассматривается задача прогнозирования свойств алюминиевых сплавов от технологических параметров их приготовления. Предлагается математический аппарат на основе метода опорных векторов, способ подготовки исходных данных. Приводятся результаты тестирования моделей прогнозирования.

Ключевые слова: метод опорных векторов, сплавы алюминия.

Одним из наиболее интересных направлений исследований в настоящее время является создание материалов с заданными свойствами. Решение подобных задач позволяет до определенного уровня освободить конструктора от привязки к имеющимся в наличии материалам и открывает дополнительный способ улучшения характеристик создаваемой техники.

Выполненная нами исследовательская работа [1] показала перспективность создания численных моделей зависимости потребительских свойств материалов от технологии их изготовления, на примере механических свойств (твёрдости, удлинения при разрыве) алюминиевых деформируемых сплавов в зависимости от из химического состава.

В качестве следующего шага была рассмотрена сходная задача: в качестве объекта исследования были приняты деформируемые алюминиевые сплавы только систем А1-Мп и Al-Mg, а база данных была пополнена за счёт введения параметров, определяющих режим механического упрочнения для данных сплавов.

Объект исследования. Упрочнение алюминиевых сплавов создается не только путем добавки различных легирующих элементов, но и механическим воздействием методом холодной деформации заготовок (наклепом, вытяжкой), а также термической обработкой (закалкой, старением). По этому признаку деформируемые сплавы подразделяют на упрочняемые и не упрочняемые термической обработкой [2].

Деформируемые сплавы, не упрочняемые термической обработкой, характеризуются сравнительно невысокой прочностью (ненамного превышающей прочность алюминия), высокой пластичностью и коррозионной стойкостью. Их применяют в тех случаях, когда требуется высокая пластичность - для изделий, получаемых глубокой штамповкой.

К рассматриваемой группе сплавов относят сплавы системы А1-Мп (сплавы АМц по отечественной классификации, 3ХХХ серии по международной) и A1-Mg (АМг по отечественной классификации, 5ХХХ серии по международной).

Эти сплавы в виде листов, а также прокатанного или прессованного материала поставляются в отожжённом (мягком) состоянии, после небольшой степени наклёпа (полунагартованные) и после сильного наклёпа (нагар-тованные) [2].

Постановка задачи. Хорошо известно, что пластическая деформация металлических заготовок увеличивает предел прочности металла, а относительное удлинение при этом падает (рис. 1) [2].

Международный стандарт БМ 515-1993 [3] обобщает несколько используемых технологических режимов получения требуемых значений механических свойств для термически неупрочняемых деформируемых алюминиевых сплавов (табл. 1)

Эта маркировка дополняется также обозначением степени механического упрочнения (табл. 2).

К примеру, маркировка продукции «5052-Ю6» означает, что она изготовлена из сплава 5052 (А основа, & 0,15...0,35 %; Mg 2,2...2,8 %), прошедшего механическое упрочнение со стабилизацией, степень упрочнения 3/4.

Предлагаемая математическая модель решения поставленной задачи. Исходная база данных была составлена на основе материалов MatWeb [5], и включала 94 записи (точки данных), содержащих информацию по химическому составу (содержание элементов Сг, Си, Mg, Mn), режиму упрочнения, и механическим свойствам (твёрдости по Бриннелю и удлинению при разрыве) основных промышленных деформируемых алюминиевых сплавов 3ХХХ и 5 ХХХ серий.

На графиках распределения результирующих переменных видно, что имел место достаточно большой разброс значений, что осложняет построение модели (рис. 3).

Основываясь на успешных результатах разработки математической модели в работе [1] и учитывая близкий характер новой задачи, была рассмотрена возможность применения тех же методик подготовки и анализа данных.

В основу численного решения поставленной задачи также был положен метод опорных векторов. В данном случае важно было воспользоваться такими его преимуществами, как устойчивость решений (нет риска попада-

ния в локальный оптимум) и отсутствие проблемы «излишнего обучения», т. е. идеальной подгонки полученной модели к обучающей выборке в ущерб общей эффективности модели [6].

Несмотря на то что размер набора данных вырос примерно в 2,5 раза (с 37 до 94 точек данных), что должно было увеличить время расчета ориентировочно в 6... 7 раз, в нашем случае, однако, это осталось некритичным (сложности со слишком длительным временем расчёта могут возникнуть при размерах набора данных более 500 записей).

Что касается интерпретации результата, то в постановке задачи не была обусловлена необходимость получения формульной зависимости результирующей переменной от факторов, т. е. форма решения вида

Исв

/ ( X) = ^ (а,. - а,. *)к(, х) + Ь оказывалась вполне удов-

I=1

летворительной [6].

Математический аппарат метода опорных векторов, в том числе его интерпретация для решения задач множественной нелинейной регрессии, описан в книге [7] и в статье [1], поэтому его подробности здесь не приводятся.

В общих чертах его идея сводится к минимизации структурного (ожидаемого) риска, а не только эмпири-

Таблица 1

Технологические режимы упрочнения деформируемых алюминиевых сплавов 3ХХХ и 5ХХХ серий (по ЕК 515-1993)

Маркировка Наименование Характеристика

О Отжиг (с рекристаллизацией) Обеспечивает наименьшую прочность при наибольшей пластичности

Н1 Механическое упрочнение Обеспечивает повышение прочностных свойств при понижении пластичности

Н2 Механическое упрочнение с частичным отжигом При таком режиме заготовки подвергаются большей степени деформации, чем нужно для достижения требуемых характеристик. Затем выполняется частичный отжиг, который до определённой степени компенсирует результаты механического упрочнения (рис. 2) [4]

Н3 Механическое упрочнение с последующей стабилизацией Ряд сплавов в деформированном состоянии подвергаются старению при комнатной температуре, что приводит к уменьшению прочности. Поэтому они, как правило, подвергаются искусственному старению при невысоких температурах, благодаря чему растёт пластичность, а прочие механические свойства стабилизируются

500 д}%

400 -40

^300 -30

\200 -20

&

100 -10

а 6в

і

1

V д

5

б

2 3 4 5 5 12 3

Степень деформации, X

Рис. 1. Зависимость предела прочности и относительного удлинения от степени деформации

ческого, т. е. к построению такой регрессионной кривой (плоскости), чтобы она наилучшим образом моделировала не только обучающую выборку (что типично для большинства решающих данную задачу методов анализа данных), но и предполагаемую общую выборку - все точки данных, включая ещё не зарегистрированные.

В соответствии с ключевой идеей МОВ [8], следует одновременно минимизировать эмпирический риск ^еЕшр и сумму весовых коэффициентов векторов | | Щ | 2, которая характеризует размерность модели. Следовательно, для построения линейной регрессионной гиперплоскости /(X, Щ) = ЩТХ + Ь необходимо минимизировать

к = 2|Щ|Г + с£|у, -/(X,.,Щ)| .

2 , = 1 Е

Параметр С задаёт соотношение между двумя слагаемыми минимизируемой функции (т. е. отношение ошибки обучения к размерности модели).

В источниках [7], [1] подробно описан вывод математического выражения наилучшей регрессионной гиперплоскости для случая нелинейной регрессии:

Маркировка степени

/(X, Щ) = Щ0ТХ + Ь = £ (а, - а*) к (XX) + Ь,

I =1

где Щ0, Ь, а., а.* - оптимальные параметры модели; к (X, X) - ядровая функция; X - массив входных переменных.

Для проверки достоверности модели был выбран метод «1еауе-опе-оШ» («один против всех»), являющийся крайним случаем метода п-кратной перекрёстной проверки, где п равняется количеству точек данных в наборе данных, и при каждом повторении поочерёдно отбирается одна точка данных, заносимая в тестовую выборку, остальные - в обучающую.

Для задачи регрессии среднее значение ошибки по п тестам модели будет приниматься как критерий точности модели [9]. Таким образом, средняя ошибка модели определялась по формуле

е (X, У, /) =1 £ |/ (X*, У *, Р, Xi) - У, |, п , =1

X,. г X*, у г у*, где X, У - входной и выходной массивы набора данных; /- проверяемая модель; X*, У* - обучающая выборка на

Таблица 2

)го упрочнения (по ЕК 515-1993)

Маркировка Характеристика

Нх1 1/8 полного

Нх2 1/4 полного

Нх3 3/8 полного

Нх4 1/2 полного

Нх5 5/8 полного

Нх6 3/4 полного

Нх7 7/8 полного

Нх8 Полное (для алюминия соответствует примерно 75-процентному уменьшению площади поперечного сечения)

Нх9 Усиленное (применимо для ограниченного ряда сплавов и видов продукции)

Рис. 2. Предел прочности и относительное удлинение при деформации и отжиге

,-м шаге проверки модели (не включающая ,-ю точку данных); Р - параметры модели.

Такой метод проверки обеспечивает максимально интенсивную эксплуатацию набора данных, что повышает вероятность получения возможно более достоверной модели. Эта детерминированная процедура (в ней не применяется случайное разбиение набора данных на выборки) позволяет лучше оценить влияние параметров модели при их подборе на её качество (для небольших наборов данных).

Источник и подготовка исходных данных. В качестве наиболее полного источника однородных данных, чтобы обеспечить возможно большую выборку, имеющую минимум пропусков в данных (так как выбранная математическая модель к ним чувствительна), была выбрана база данных материалов Ма1^^еЪ [5], содержащая информацию по типовому химическому составу и механическим свойствам интересующих нас групп промышленных деформируемых алюминиевых сплавов, с учётом механического упрочения.

При подготовке рабочего набора данных на основе исходной базы данных были использованы те же приёмы, что и в работе [1]: приняты усреднённые значения (среднее между верхней и нижней границей по спецификации) содержания легирующих элементов в %; в качестве результирующих переменных приняты «твёрдость по Бриннелю» (безразмерная величина) и удлинение при разрыве (в %).

С учётом изменившейся задачи исследования, в подготовку данных были внесены изменения. Количество учитываемых легирующих элементов сокращено с 6 до 4 (Сг, Си, Mg, Мп), поскольку в исследуемых группах сплавов (3ххх и 5ххх серии) в качестве легирующих практически исключительно применяются только эти элементы.

Введены дополнительные переменные модели, указывающие на режим механического упрочнения - всего три логических (значения 0 или 1) переменных. Первая определяет наличие/отсутствие механического упрочнения, вторая принимает значение 1 только для случаев механического упрочнения с частичным отжигом, тре-

тья принимает значение 1 только для случаев механического упрочнения с последующей стабилизацией.

Данная схема позволила перевести качественный фактор «режим механического упрочнения», имеющий в наших исходных данных четыре возможных значения, в двоичные количественные, при этом не абстрагируясь от его технологического происхождения (табл. 3).

Всего в набор данных вошли 94 записи (точки данных).

Практические результаты исследования. Параметры модели подбирались в соответствии с методикой, реко -мендованной в общем виде в [7], и использованной при выполнении расчётов в [1].

В качестве ядерной функции была принята Г ауссова функция (радиальная базисная функция) вида - X - X2

К (X, X) = е 2а (14), которая удобна для построения моделей регрессионных зависимостей.

Поскольку увеличение управляющей константы С сопровождается экспоненциальным ростом размерности модели (и соответственно потребляемой вычислительной мощности), в то время как средняя ошибка при этом уменьшается, стабилизируясь на определённом уровне, то было принято значение С = 1 000, позволявшее выполнять расчёт за разумное время (25...30 с на 1 расчёт) и обеспечивавшее приемлемые показатели средней ошибки.

Для модели прогнозирования параметра «удлинение при разрыве» эксперименты показали полное отсутствие изменения достоверности модели при С < 100.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Параметр е был подобран в пределах 5...15 % от среднего значения прогнозируемой переменной (свой для каждой модели), параметр формы ядерной функции (в нашем случае ст) - выбран перебором.

Тестирование построенных моделей прогнозирования механических свойств алюминиевых сплавов (с учётом термообработки) подтвердило правильность предположения о возможности расширения описанных в [1] моделей с введением дополнительных технологических факторов, более плотно приближающих такие модели к практическому применению.

Рис. 3. Квартальные графики распределения значений результирующих переменных в рассматриваемом наборе данных

Приведем результаты тестирования полученной оптимальной модели, в том числе с разбивкой по подмножествам набора данных (рис. 4, 5).

В результате выполнения данного исследования была подтверждена эффективность численных моделей зависимости свойств материалов от технологических параметров их производства. По сравнению с предыдущими работами по данной теме, модель была существенно расширена, и учитывает сразу две группы технологических параметров при изготовлении литых заготовок: химический состав расплава и режим упрочнения заготовки.

Приведены практические результаты прогнозирования свойств промышленных алюминиевых деформируемых сплавов 3 ххх и 5 ххх серий.

Результаты проведённой работы показывают возможность создания «обратной» модели, т. е. решения задачи подбора технологических параметров для создания материалов с заданными свойствами, являющейся наиболее интересной с точки зрения практики.

Библиографические ссылки

1. Юрков Н. С. Решение задачи множественной нелинейной регрессии с применением метода опорных век-

торов (на примере механических свойств сплавов алюминия). Системы управления и информ. технологии. 2009. № 1.2 (35). С. 307-312.

2. Гуляев А. П. Металловедение : учебник для вузов. 6-е изд., перераб. и доп. М. : Металлургия, 1986. 544 с.

3. DIN EN 515-1993. Aluminium and aluminium alloys; wrought products; temper designations. DIN-Mitteilungen von 1996; Nr. 12, S. A 971 (Tabelle 4, S. 11 2. Spalte ge№dert).

4. Смирнягин А. П. Промышленные цветные металлы и сплавы. М. : Металлургиздат, 1956. 559 с.

5. MatWeb - Online material property database [Electronic Resource] // MatWeb. URL: www.matweb.com. (date ofvisit 15.01.2010).

6. Методы и модели анализа данных: OLAP и Data Mining / А. А. Барсегян, М. С. Куприянов, В. В. Степаненко , И. И. Холод. СПб. : БХВ-Петербург, 2004. 336 с.

7. Kecman W. Support Vector Machine Basics. School of engineering report 616. - Auckland: The University of Auckland, 2004. 54 с.

8. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. М. : Наука, 1979. 499 с.

9. Witten I. H., Frank E. Data Mining: Practical Machine Learning Tools and Techniques.- 2nd ed. San Francisco : Morgan Kaufmann Publishers, 2005. 525 p.

Таблица 3

Способ регистрации режимов механического упрочнения в записях набора данных

Технологический режим Переменные

Первая Вторая Третья

Отжиг 0 0 0

Механическое упрочнение 1 0 0

Механическое упрочнение с частичным отжигом 1 1 0

Механическое упрочнение со стабилизацией 1 0 1

b;=DU030<a ;гл;е:е i,:--.™ "р-,—i; tvaDJD

Рис. 4. Средняя ошибка прогнозирования с разбивкой по группам сплавов

1Э.СЧ

:| ■ I - -k "I i:iKh О lii-i-h-: П| I it -j.4 и.#- П:1 -.чш/-:

"■"к: г f-j ikirv .-.iin ■ с.‘ г.

W"- if I i.i-1 птг.тп:- ч I иг л

■гц :ч i?i к : : гтж.гги :

Рис. 5. Средняя ошибка прогнозирования с разбивкой по режимам упрочнения

N. S. Yurkov

MULTIPARAMETRIC MODEL ON BASIS OF SUPPORT VECTOR MACHINES FOR FORECASTING PRODUCT CHARACTERISTICS

The paper discusses forecasting of aluminium alloya properties depending on their production parameters. Mathematical apparatus on basis of support vector machines and data preparation technique are proposed. Forecasting model testing results is demonstrated.

Keywords: support vector machines, aluminium alloys.

© Юрков Н. С., 2010

i Надоели баннеры? Вы всегда можете отключить рекламу.