УДК 539.4.015 + 539.3
Обратное проектирование механических и трибологических свойств покрытий: результаты алгоритмов машинного обучения
Д.М. Пашков1'2, О.А. Беляк1, А.А. Гуда1'2, В.И. Колесников1
1 Ростовский государственный университет путей сообщения, Ростов-на-Дону, 344038, Россия 2 Международный исследовательский институт интеллектуальных материалов, Южный федеральный университет,
Ростов-на-Дону, 344090, Россия
Многослойные покрытия из состава TixAlj_xN улучшают механические и трибологические свойства стальной поверхности. Рациональная разработка покрытий основывается на глубоком понимании функциональных зависимостей между параметрами синтеза, морфологией и кристалличностью слоев и итоговыми свойствами. Такая задача практически неразрешима с экспериментальной точки зрения из-за необходимости получения большого количества синтезированных образцов, данных спектроскопических исследований и трибологических испытаний для охвата многомерного пространства параметров большого размера. В данной работе рассматривается возможность прогнозирования механических и трибологических свойств покрытий с помощью методов машинного обучения. Алгоритм обучается на наборе теоретических расчетов в рамках микромеханического подхода. Качество прогнозов сравнивается для нескольких методов машинного обучения: гребневая регрессия, случайный лес, радиальные базисные функции и нейронные сети. Показано, что подход машинного обучения позволяет решить проблему обратного проектирования. Использование тандемной архитектуры позволяет преодолеть проблему многозначности и обучить нейронную сеть предсказывать модуль Юнга и коэффициент Пуассона для каждого слоя в зависимости от требуемых механических параметров слоистого покрытия. Топология нейронной сети была оптимизирована и достигла относительной погрешности менее 5 %.
Ключевые слова: трибология, микромеханика, машинное обучение, нейронные сети, тандемная архитектура, обратное проектирование
DOI 10.55652/1683-805X_2022_25_2_24
Reverse engineering of mechanical and tribological properties of coatings: Results of machine learning algorithms
DM. Pashkov1,2, O.A. Belyak1, A.A. Guda1,2, and V.I. Kolesnikov1
1 Rostov State Transport University, Rostov-on-Don, 344038, Russia 2 Smart Materials Research Institute, Southern Federal University, Rostov-on-Don, 344090, Russia
Mechanical and tribological properties of the steel surface can be improved by TixAli_xN multilayer coatings. Their rational design starts from a deep understanding of the functional relation of synthesis parameters, morphology, and crystallinity to final properties of layers. This problem can be described as experimentally intractable as it requires numerous specimens, spectroscopic characteristics, and tribological tests to cover a large multidimensional parameter space. The present paper discusses the possibility of predicting mechanical and tribological properties of coatings by machine learning methods. The algorithm is trained on a set of theoretical micromechanical calculations. The quality of predictions is determined by comparing between several machine learning methods: ridge regression, random forest, radial basis functions, and neural networks. The machine learning approach is shown to be applicable to the reverse engineering problem. The tandem neural network architecture is used to overcome the ambiguity problem and to predict Young's modulus and Poisson's ratio for each layer depending on the required mechanical parameters of the multilayer coating. The neural network topology is optimized so that the relative error comprises less than 5%.
Keywords: tribology, micromechanics, machine learning, neural networks, tandem architecture, reverse engineering
© Пашков Д.М., Беляк О.А., Гуда А.А., Колесников В.И., 2022
1. Введение
Развитие новых двигателей, летательных аппаратов, скоростных поездов ставит новые задачи при разработке тяжелонагруженных узлов трения для повышения ресурса и снижения трибологиче-ских потерь в трибосопряжениях [1]. Новые типы покрытий, получившие название адаптивных, способны изменять свои свойства в зависимости от условий эксплуатации. Так, пленки ^-Al-N обладают адаптивными свойствами к сопротивлению окислению. Защитный эффект в таких покрытиях может быть усилен за счет введения хрома, что обеспечивает термическую стабильность структуры покрытий [2-4]. Улучшение свойств покрытий для триботехнических применений основывается на оптимизации толщины, значения коэффициента трения, способности сопротивления упругой и пластической деформации. Для использования на контактных поверхностях нагруженных трибосо-пряжений толщина покрытия должна быть снижена во избежание нарушения геометрии трибо-контакта и формирования напряжений в покрытии при эксплуатации. Остальные из указанных параметров металлокерамических нитридных покрытий могут быть модифицированы введением дополнительных компонентов при нанесении покрытия, а также изменением его архитектуры. Так, в работе [5] показана высокая износостойкость при трении с покрытиями CrAlSiN, а также при их послойном комбинировании с углеродными прекурсорами.
Благодаря развитию методов машинного обучения анализ больших объемов данных позволяет проводить скрининг новых материалов с целью подбора требуемого состава и морфологии для конкретных задач [6]. В настоящее время в открытой литературе существует большой объем информации о структуре и свойствах молекул и твердых материалов, которые можно использовать для тренировки алгоритмов машинного обучения [7]. Большой интерес представляет скрининг новых материалов на основе корреляций структура-свойство-активность [8]. Summers et al. продемонстрировали [9], как среда молекулярного моделирования и проектирования MoSDeF, созданная с помощью языка программирования Python, может быть использована для скрининга функционализированных монослойных пленок с акцентом на их трибологическую эффективность. Алгоритмы машинного обучения способны значительно снизить экспериментальные и вычисли-
тельные затраты [10]. Обусловлено это прежде всего тем, что они могут использоваться для восстановления неизвестных нелинейных зависимостей в данных, полученных в ходе экспериментов или наблюдений [11-13]. В последние два десятилетия, начиная с работ Jones et al. [14], области внедрения искусственного интеллекта и нейронных сетей, в частности [15], постоянно расширяются в трибологических исследованиях и охватывают такие разнообразные области применения, как износ полимерных композитов [16, 17], износ инструмента [18], характеристики тормозов [19, 20], эрозия полимеров [21], износ колес и рельсов [22]. Важно отметить, что на процессы трения влияют как микроскопические параметры материала (энергии связи атомов, энергия адгезии, дефекты и напряжения в кристаллической структуре), так и макроскопические параметры (морфология поверхности, толщина и прочность покрытия, параметры нагружения, химические реакции в ходе испытаний). Использование методов машинного обучения позволяет ускорить процесс тестирования новых материалов за счет отсутствия необходимости каждый раз повторять трудоемкие вычисления или эксперименты [23]. Особенно актуально использование такого подхода для сложных многокомпонентных систем.
Целью настоящей работы является исследование применимости алгоритмов на основе нейро-сетей для прогнозирования механических свойств многослойного покрытия. Мы рассматриваем два варианта применения алгоритма. В прямом подходе свойства покрытия прогнозируются на основе известных параметров каждого слоя и концентрации включений. В обратном подходе для искомых свойств покрытия алгоритм находит один из возможных наборов значений параметров каждого слоя и концентрацию включений.
2. Методы
2.1. Механические свойства многослойного покрытия
Основное внимание в исследовании уделяется слоистой среде TiAlN с чередующимися слоями TiN, AlN. Модель слоистого покрытия представлена на рис. 1. Это трансверсально-изотропная среда, ось транстропии х3 которой перпендикулярна плоскости слоев. Тензор упругих постоянных слоистой среды Ceff определялся на основе дифференциальной схемы метода самосогласования [24-27] для сплюснутых сфероидальных
х\
Материал 1 Материал 2
Рис. 1. Схема многослойного покрытия, состоящего из чередующихся слоев ТГК (7) и ЛШ (2) (цветной в онлайн-версии)
включений на основании следующего соотношения:
асейчФ) = _1__сд - сс1г(ф) (1)
1 - Ф е+8(Ф)(сп - сей?(ф))/се%)'
сей?(0) = ст(1),
где ф — объемная концентрация материала включений в среде; 8 — тензор Эшелби для транс-тропной среды; Е — единичный тензор; с^ сц — тензоры упругих постоянных основного материала и материала включений (изотропные материалы). Стоит отметить, что уравнение (1) позволяет рассчитать эффективные модули слоистой среды, моделируя слои как бесконечно тонкие дискообразные пластинчатые включения [26, 27]. Тонкие пластинчатые дискообразные включения имеют вид сфероидов с полуосями а1 = а2 = а, а3 = са, кроме того С « 1. В этом случае компоненты тензора Эшелби известны [28]. Численные эксперименты по расчету эффективных модулей упругости слоистой среды проводились в программном пакете МЛТЬЛБ. Для проверки данных, полученных с помощью расчетов на основе уравнения (1), программа была первоначально протестирована с использованием частных случаев для компонент тензора Эшелби в случае изотропной среды со сферическими включениями.
Надо отметить, что такой подход к моделированию механических свойств покрытий, получаемых методом ионноплазменного напыления, на основании их микроструктурного анализа реализован в работах [26, 27]. Представлены зависимости упругих модулей гомогенной среды от микроструктурных параметров слоистого покрытия. Количественное сопоставление результатов моделирования эффективных упругих свойств слоистой среды выполнено в рамках подходов микромеханики [26] и конечно-элементного моделирования [27]. Кроме этого, теоретическое значение модуля Юнга слоистой среды в плоскости, перпендикулярной направлению осаждения, было сопостав-
лено с результатами лабораторного эксперимента по наноиндентированию образца покрытия нит-ридной системы TiAlN с известным соотношением Al/Ti [29]. В работе [30] на основании схемы гомогенизации Максвелла получены эффективные свойства трех типов покрытий из сплава 625 в зависимости от микротрещин и оксидных включений.
2.2. Алгоритмы машинного обучения
Для успешного применения методов машинного обучения необходимо наличие достаточного набора данных для обучения, которые покрывали бы равномерно пространство значений и область определения многомерной целевой функции. Для решения задачи прогнозирования механических и трибологических свойств покрытий мы построили выборку с помощью численного решения уравнения (1). Для того чтобы сбалансировать обучающую выборку, использовалась генерация точек в пространстве параметров методом улучшенного латинского гиперкуба (improved Latin hypercube sampling (IHS)). На рис. 2 в качестве примера представлены распределения точек обучающей выборки, состоящей из 16 объектов, и их проекций в двумерном случае.
Были использованы несколько методов машинного обучения: гребневая регрессия, случайный лес, нейросеть. Гребневая регрессия является линейной регрессией, использующей регуляризацию для поиска оптимальных параметров. Рассмотрим функцию линейной регрессии, которая для каждого входного вектора x = (x1, x1, ..., xp)
предсказывает выход y по формуле
p
y = ®o + X xj © j. (2)
j=1
Задача обучения для такой модели заключается в поиске оптимальных параметров (© )pi=1 по объектам обучающей выборки (xi, yi )i=г Поиск оптимального решения осуществляется методом наименьших квадратов:
N T 2 RSS(©) = X(У - xT©)2 ^ min. (3)
i=1
В процессе обучения коэффициенты регрессии могут значительно расти, что серьезно уменьшает обобщающую способность метода. Для того чтобы ограничить рост данных коэффициентов, была добавлена регуляризация Тихонова:
N p
RSS(©) = X(У - xT©)2 + ©2 ^ min. (4)
i=1 k=1
Рис. 2. Сравнение обучающей выборки, сгенерированной различными методами: на сетке (а), случайно (б), с помощью улучшенного латинского гиперкуба (б) (цветной в онлайн-версии)
Алгоритмы «случайный лес» (random forest) [31], так же как и его модификация «экстремально рандомизированные деревья» (extra trees) [32], являются ансамблевыми алгоритмами, т.е. представляют собой множество моделей машинного обучения (решающих деревьев). В задачах регрессии предсказание ансамблевого алгоритма получается в результате усреднения предсказаний всех моделей, входящих в ансамбль. Для повышения устойчивости предсказаний ансамбля каждая из моделей, входящая в ансамбль, обучается не на всем пространстве признаков, а на его случайно сгенерированном подмножестве. Такие подвы-борки для каждой модели ансамбля генерируются с повторениями.
Радиальные базисные функции (radial basis functions (RBF)) являются по сути методом жесткой интерполяции. Это вещественные функции ф(х) = ф(ух - cv), зависящие лишь от расстояния до некоторого центра с. С помощью линейной комбинации таких функций можно аппроксимировать неизвестную зависимость в данных обучающей выборки:
N
(5)
у( х) = 2®/ф(ух - X V).
/=1
В качестве нормы для поиска радиуса используется евклидова норма, а в качестве радиальной функции — полином второго порядка.
Искусственные нейронные сети являются математической моделью биологических нейронных сетей. В общем виде отклик искусственного нейрона можно выразить формулой
а( х) = f
ю
N
0 +
i=1
(6)
У
где /(х) — функция активации нейрона. В работе были использованы следующие функции активации: сигмоида, гиперболический тангенс и усе-
ченное линейное преобразование (rectified linear unit (ReLU)). На рис. 3 представлена модель пер-цептрона, используемая в работе. Входной слой является вектором входных значений длины п. Скрытый слой состоит из m нейронов, каждый из которых получает на вход один и тот же входной сигнал. Скрытый слой может состоять из нескольких слоев. Оптимальной архитектурой для решаемых в данной работе задач оказался многослойный перцептрон, состоящий из четырех скрытых слоев, которые имели 100, 200, 200, 100 нейронов соответственно. Выходной слой состоит из нейронов, возвращающих ответ решаемой задачи. В случае задачи классификации на к классов, каждый из к выходных нейронов будет предсказывать вероятность принадлежности классу. Для задачи регрессии используется один нейрон, возвращающий число.
В момент создания искусственных нейронных сетей весовые коэффициенты ю инициализируются произвольным образом. В процессе обуче-
Рис. 3. Схема используемой нейронной сети — пер-цептрона (цветной в онлайн-версии)
ния производится оптимизация весов в каждом слое с помощью итеративного алгоритма обратного распространения ошибки [33]. На первом этапе происходит прямое распространение сигнала в искусственные нейронные сети, т.е. вычисляется предсказание нейронной сети для некоторого входа. Затем начинается обратный проход. Для вычисления частных производных в процессе оптимизации необходимо условие дифференцируе-мости используемой функции активации. В настоящей работе был использован метод оптимизации весов Adam [34].
Как правило, однократного использования всей обучающей выборки для оптимизации весовых коэффициентов недостаточно для получения наилучшей модели. В связи с этим обучающая выборка перемешивается и подается на вход искусственных нейронных сетей несколько раз до тех пор, пока не будет достигнуто наилучшее качество работы алгоритма. Каждый проход всей обучающей выборки через искусственные нейронные сети обычно называют эпохой обучения.
Качество работы алгоритма машинного обучения оценивалось следующим образом. Пусть дана обучающая выборка с объектами X = (x1, x2, ..., xN) и ответами Y = (y1,y2, ...,yN), множество Y = (y1, y2,...,yN) — предсказания искусственной ней-
ронной сети. В качестве функции потерь при обучении искусственных нейронных сетей использовалась функция среднеквадратичного отклонения
М8В(Х) = (У, - У,)2. (7)
Я 1=1
Для оценки качества предсказаний модели машинного обучения для решаемой задачи регрессии использовался коэффициент детерминации
N
X (У - Уг )2
2 1 i=1
R2 = 1 -
ТТЛ 2
N
X (Уг - У ) i=1
где
_ 1 N
У=nXi уг
(8)
(9)
3. Результаты
Общая схема работы алгоритмов представлена на рис. 4, а. В настоящей работе решались две взаимно обратных задачи.
1. Прогнозирование эффективных механических свойств слоистой среды, например модулей Юнга Е11, Е33 и модуля сдвига 013 в плоскости, перпендикулярной плоскости изотропии х1х2 на основе формулы (1). Входной информацией при
Рис. 4. Схема применения методов машинного обучения для предсказания механических свойств покрытия (а) и оценки качества предсказаний моделей машинного обучения (б) (цветной в онлайн-версии)
этом считались Еи V, изотропных материалов 1, 2, составляющих слоистое покрытие, и объемная концентрация материала включений ф в слоистой композиции.
2. Прогнозирование механических свойств изотропных материалов 1, 2 Е, V, и объемной концентрации ф на основе заданных технических констант слоистой среды.
Для тренировки алгоритмов машинного обучения была сгенерирована обучающая выборка значений механических свойств покрытия методом 1Н8 в пространстве параметров (Еь VI, Е2, V2, ф) в размере 10000 точек. Значения параметров варьировались в следующих диапазонах: Е12 = 180— 400 ГПа, V1,2 = 0.2-0.4, ф = 0-89. Поскольку параметры имеют различные единицы измерения, то их значения сильно отличаются друг от друга. Такой дисбаланс между значениями признаков, используемых для обучения моделей машинного обучения, может привести к неустойчивой работе моделей, особенно при применении методов, чувствительных к абсолютным значениям признаков. В этой связи значения всех входных параметров были нормированы таким образом, чтобы их значения находились в диапазоне от 0 до 1.
Для всех точек в пространстве (Еь VI, Е2, V2, ф) были рассчитаны механические свойства слоистой среды: модули Юнга Ец, Е33 и модуль сдвига Glз в плоскости, перпендикулярной плоскости изотропии Х\Х2. Полученные наборы точек и соответствующие им механические свойства покрытия использовались для обучения и тестирования методов машинного обучения. Вся обучающая выборка была поделена на три части в соотношении 80 %:10%:10%. Первая часть использовалась непосредственно для обучения алгоритма, вторая — для промежуточного контроля качества предсказаний, а последняя являлась тестовым множеством, на котором проверялось качество предсказаний обученной модели.
3.1. Сравнение методов машинного обучения для решения прямой и обратной задачи
На первом шаге решалась прямая задача — предсказание модулей Юнга Е11, Е33 и модуля сдвига G13 по значениям модулей упругости, коэффициентов Пуассона и объемной концентрации фаз 1 и 2, составляющих слоистое покрытие. Для оценки качества предсказаний использовался коэффициент детерминации Я2. В табл. 1 приведены значения качества предсказаний методов машинного обучения для обучающих выборок различного размера. Из представленных результатов видно, что наименее точным является метод квадратичной гребневой регрессии. Качество предсказаний зависит от размера обучающей выборки и насыщение происходит при количестве точек в пятимерном пространстве порядка 1000.
Поскольку разные наборы параметров слоев могут давать одинаковые механические свойства покрытия, обратная задача имеет неединственное решение. В такой ситуации методы машинного обучения способны предоставить лишь одно из возможных решений и оценка качества предсказаний проводилась следующим образом:
- обучение модели машинного обучения М для решения прямой задачи, т.е. для предсказания (Ец, Е33, Gl3) по значениям параметров (Еь VI, Е2, V2, ф);
- обучение модели машинного обучения М1 для решения обратной задачи, т.е. для предсказания параметров (Еь VI, Е2, V2, ф) по заданным значениям (Ец, Е33, С^);
- оценка точности предсказаний модели, решающей обратную задачу, с помощью коэффициента детерминации Я2, рассчитанного для заданных значений (Ец, Е33, С^) и значений, полученных в результате предсказания прямой модели М по параметрам, определенным в результате предсказания обратной модели М¡. Схематическое описание данного подхода представлено на рис. 4, б.
Таблица 1. Результаты сравнения методов машинного обучения для решения прямой задачи
Размер обучающей выборки Гребневая регрессия Радиальные базисные функции Экстремально рандомизированные деревья Многослойный перцептрон
50 0.890 0.991 0.966 0.981
100 0.926 0.996 0.962 0.981
1000 0.979 0.999 0.992 0.999
10000 0.976 0.999 0.998 0.999
Таблица 2. Результаты сравнения методов машинного обучения для решения обратной задачи
Размер обучающей выборки Гребневая регрессия Радиальные базисные функции Экстремально рандомизированные деревья Многослойный перцептрон
50 0.925 -144.548 0.981 0.906
100 0.963 -344.413 0.985 0.910
1000 0.997 -6854.715 0.993 0.957
10 000 0.997 -17011.606 0.997 0.999
В качестве основы данного подхода к оценке качества предсказания была взята процедура обучения тандемных нейронных сетей [35], которые применялись в данной работе. В табл. 2 представлены значения метрики Я2 для различных методов машинного обучения, решающих обратную задачу. Все методы, кроме КЭБ, с высокой точностью находят решение. Радиальные базисные функции, будучи методом жесткой интерполяции, не способны решить обратную задачу по причине неоднозначности решений в поставленной задаче, вследствие чего предсказания такой модели являются случайными.
3.2. Оптимизация тандемной архитектуры нейросети
Наличие многозначности в функциональных зависимостях между данными препятствует быстрой и гарантированной сходимости к оптимальному решению. Для решения данной проблемы была использована архитектура тандемных нейронных сетей, которая схематически представлена на рис. 5.
Тандемная нейронная сеть состоит из двух частей — обратной сети и прямой, каждая из ко-
Рис. 5. Схема работы и обучения тандемной нейронной сети (цветной в онлайн-версии)
торых обучается в отдельности. Предварительно была обучена прямая сеть, которая по набору параметров (Еь Vi, E2, v2, ф) возвращает эффективные механические свойства слоистой среды (E11, E33, G13). Далее происходило обучение обратной сети, которая, наоборот, по заданным механическим свойствам слоистой среды возвращала механические свойства изотропных материалов и их объемную концентрацию (Е1, v1, E2, v2, ф). Выход обратной сети соединялся с входом прямой сети, и в качестве функции потерь использовалась среднеквадратичная ошибка между входными значениями и значениями, полученными прямой сетью на выходе. Таким образом, промежуточный слой, соединяющий две части тандемной сети, возвращает набор параметров, соответствующий заданным свойствам слоистой среды. В силу неоднозначности параметров, соответствующих желаемым механическим свойствам, результат, получаемый с помощью тандемной сети, является одним из возможных решений.
В качестве как прямой, так и обратной нейронной сети использовался многослойный перцеп-трон. Наилучший результат был получен для сетей, имеющих 4 скрытых слоя, которые состояли из 100, 200, 200, 100 нейронов соответственно. Согласно входным и целевым параметрам прямой и обратной задачи у прямой сети размер входного слоя был равен 5, а выходного 3. У обратной сети наоборот — входной слой состоит из 3 нейронов, а выходной из 5. В качестве функции активации в прямой сети использовалась ReLU, а в обратной сети — сигмоидная функция. Обучение нейронных сетей проводилось на протяжении 500 эпох. В качестве оптимизатора весов сети использовался оптимизатор Adam с параметром скорости обучения равным 0.0001. На рис. 6 представлены графики изменения величины ошибки нейронной сети в ходе обучения.
Оценка достоверности решения, полученного с помощью тандемной нейронной сети, проводилась следующим образом. Для заданных модулей
Рис. 6. Изменение ошибки нейронной сети на обучающей и проверочной выборке в ходе обучения (цветной в онлайн-версии)
Юнга и модуля сдвига Е1Ь Е33, 013 слоистого покрытия (рис. 1) тандемной нейронной сетью предсказывались значения модулей Юнга и коэффициентов Пуассона изотропных материалов 1 и 2 и объемная концентрация (Е1, у1, Е2, у2, ф). Затем для полученных параметров (Е1, у1, Е2, у2, ф) фаз 1 и 2 покрытия рассчитывались значения параметров слоистой среды (Е11, Е33, 013) с помощью численного решения уравнения (1). Относительная погрешность значений оценивалась в ходе сравнения предсказанных значений и значений, полученных численным решением уравнения (1). В табл. 2 представлены результаты данной оценки для пяти наборов значений механических свойств слоистой среды. Средняя относительная погрешность для предсказания параметров покрытия не превышает 3 %, что свидетельствует о достаточно высокой точности предсказаний.
4. Обсуждение
Надо отметить, что для более высоких значений модулей Юнга и модуля сдвига слоистой среды Т^Л^^К тандемная нейронная сеть пред-
сказывает также более высокие параметры Еь vb Е2, v2, ф. Слоистому покрытию системы TixAl1-xN, обладающему механическими характеристиками, представленными во второй строке табл. 3, соответствуют параметры, предсказанные тандемной нейросетью для TiN: Е1 = 236.41, v1 = 0.29, для AlN: Е2 = 397.95, v2 = 0.24, при этом соотношение Al/Ti в мас. % равно 0.64. Слоистые покрытия с таким соотношением Al/Ti в мас. % были исследованы в работе [30]. Проведено сравнение с результатами работы [30], где в табл. 1 даны значения приведенного модуля Юнга, полученного методом наноиндентирования. Были рассмотрены результаты, полученные для максимальной силы вдавливания индентора (10 мН), чтобы исключить влияние на результаты наноиндентирования механических характеристик подложки. Пересчет приведенного модуля Юнга, полученного методом наноиндентирования [30], осуществлен в рамках модели Оливера-Фарра [36]. Относительная погрешность между модулем Юнга E33 = 255 ГПа в настоящем исследовании и модулем Юнга, полученным в результате наноиндентирования покрытия с таким же соотношением Al/Ti, представленным в табл. 1 работы [30], не превосходила 5 и 10 % для слоистых покрытий с толстыми и тонкими слоями соответственно.
Имея программную реализацию численного решения уравнения (1), решать обратную задачу невозможно, т.к. в этом случае не представляется возможным вычисление градиентов для использования оптимизационных методов, основанных на методе градиентного спуска. Такую возможность представляют методы машинного обучения, в особенности искусственные нейронные сети. В литературе имеется несколько примеров успешного применения методов машинного обу-
Таблица 3. Величины относительной погрешности для решения обратной задачи методом тандемной нейронной сети. Сравниваются значения, задаваемые пользователем и рассчитанные численно (1) механические свойства покрытия (Е11, Е33, G13) на основе предсказанных нейросетью параметров слоев (Е1, у1, Е2, у2, ф)
Требуемые значения параметров покрытия (E1b E33-, G13) Предсказанные тандемной нейронной сетью параметры слоев (Еь vb Е2, v2, ф) Параметры покрытия (Е11, Е33, G13), рассчитанные численно согласно (1) для предсказанных тандемной нейронной сетью параметров слоев (Е1, у1, Е2, у2, ф) Относительная погрешность, %
(200, 195, 75) (192.50, 0.259, 349.21, 0.206, 29) (198.77, 196.72, 78.35) (0.61, 0.88, 4.46)
(248, 255, 90) (236.41, 0.292, 397.95, 0.239, 39) (248.02, 245.07, 95.13) (0, 3.89, 5.70)
(308, 300, 117) (292.31, 0.248, 399.90, 0.245, 51) (305.20, 302.58, 121.6) (0.91, 0.86, 3.93)
(355, 347, 135) (340.60, 0.246, 400.00, 0.260, 62) (350.86, 349.64, 140.2) (1.16, 0.76, 3.85)
(387, 394, 144) (378.74, 0.266, 400.00, 0.312, 75) (384.07, 383.87, 150.2) (0.75, 2.57, 4.30)
чения к задачам трибологии. Так, используя модели регрессии для результатов трибологических испытаний, была предсказана степень износа для поверхности меди, модифицированной частицами нитрида алюминия и нитрида бора [37]. Используя метод радиальных базисных функций [38], Бо1-& й а1. смогли натренировать алгоритм предсказывать коэффициент трения для текстурирован-ных и пористых поверхностей. При этом были выбраны подходящие дескрипторы для описания морфологии поверхности. Качество работы алгоритма зависит от полноты базы данных, используемых при обучении. Wu Й а1. [39] вводят прогностический метод на основе рандомизированных деревьев (КБ) для прогнозирования износа инструмента, а также сравнивают производительность КБ с искусственными нейронными сетями с обратной связью (РББР) и регрессией опорных векторов (8УЯ).
Классические методы машинного обучения не способны найти все множество решений в задачах, имеющих неединственное решение. В настоящей работе показан подход, способный находить одно из возможных решений с высокой точностью. Для решения подобных задач эффективна архитектура тандемных нейронных сетей. Проблема неоднозначности данных обучающей выборки является довольно распространенной, в связи с чем существуют несколько подходов к разрешению данной проблемы. Вводя новый класс для объектов обучающей выборки, вызывающих неоднозначность интерпретации данных, можно добиться снижения количества ошибок при классификации на тестовой выборке [40]. Другим решением является отделение неоднозначных объектов от обучающей выборки [41]. Для некоторых задач распознавания образов невозможно присвоить одну единственную метку класса, представление метки каждого объекта с помощью распределения классов помогает обучать сверточные нейронные сети для данных задач эффективнее [42].
5. Заключение
В работе исследована задача оптимизации механических свойств многослойного покрытия за счет подбора свойств отдельных слоев (модуль Юнга, коэффициент Пуассона) и объемной концентрации материала включений в слоистой композиции. Была разработана методика решения обратной задачи конструирования покрытия с заданными механическими свойствами на основе
тандемной нейронной сети. Архитектура с наилучшим качеством предсказаний была составлена из двух одинаковых многослойных перцептронов с четырьмя скрытыми слоями с размерами 100, 200, 200, 100. Показана возможность нахождения решения в условиях наличия множества неоднозначных решений, в том числе непрерывной неоднозначности. Качество предсказаний, оцениваемое коэффициентом детерминации R2, превышает 0.99 как для прямой, так и для обратной задачи, при условии количества элементов в обучающей выборке более 1000. Полученные результаты лягут в основу разработки цифровой технологии синтеза новых трибологических материалов с использованием машинного обучения для управления непосредственно самим процессом синтеза материалов, что позволит создавать функциональные материалы с заданными триботехничес-кими и механическими характеристиками для конкретных условий эксплуатации.
Работа выполнена при поддержке РНФ (проект № 21-79-30007).
Литература
1. Meng Y.G., Xu J., Jin Z.M., Prakash B., Hu Y.Z. A review of recent advances in tribology // Friction. -2020. - V. 8. - P. 221-300. - https://doi.org/10.1007/ s40544-020-0367-2
2. Pfluger E., Schroer A., Voumard P., Donohue L., Munz W.D. Influence of incorporation of Cr and Y on the wear performance of TiAlN coatings at elevated temperatures // Surf. Coat. Technol. - 1999. -V. 115. - P. 17-23. - https://doi.org/10.1016/s0257-8972(99)00059-6
3. Savan A., Pfluger E., Goller R., Gissler W. Use of na-noscaled multilayer and compound films to realize a soft lubrication phase within a hard, wear-resistant matrix // Surf. Coat. Technol. - 2000. - V. 126. - P. 159165. - https://doi.org/10.1016/s0257-8972(00)00542-9
4. Sousa V.F.C., Da Silva F.J.G., Pinto G.F., Baptis-ta A., Alexandre R. Characteristics and wear mechanisms of TiAlN-based coatings for machining applications: A comprehensive review // Metals. - 2021. -V. 11. - https://doi.org/10.3390/met11020260
5. Kolesnikov V.I., Vereskun V.D., Kudryakov O.V., Manturov D.S., Popov O.N., Novikov E.S. Technologies for improving the wear resistance of heavily loaded tribosystems and their monitoring // J. Frict. Wear. -2020. - V. 41. - P. 169-173. - https://doi.org/10. 3103/s1068366620020051
6. Sun S.J., Hartono N.T.P., Ren Z.K.D., Oviedo F., Bus-cemi A.M., Layurova M., Chen D.X., Ogunfunmi T., Thapa J., Ramasamy S., Settens C., DeCost B.L., Ku-sne A.G., Liu Z., Tian S., Peters I.M., Correa-Bae-
na J.P., Buonassisi T. Accelerated development of pe-rovskite-inspired materials via high-throughput synthesis and machine-diagnosis // Joule. - 2019. - V. 3. -P. 1437-1451. - https://doi.org/10.1016/jjoule.2019. 05.014
7. Zhou T., Song Z., Sundmacher K. Big data creates new opportunities for materials research: A review on methods and applications of machine learning for materials design // Engineering. - 2019. - V. 5. - P. 10171026. - https://doi.org/10.1016Zj.eng.2019.02.011
8. Masood H, Toe C.Y., Teoh W.Y., Sethu V., Amal R. Machine learning for accelerated discovery of solar photocatalysts // Acs Catalysis. - 2019. - V. 9. -P. 11774-11787. - https://doi.org/10.1021/acscatal.9b 02531
9. Summers A.Z., Gilmer J.B., lacovella C.R., Cum-mings P.T., McCabe C. MoSDeF, a python framework enabling large-scale computational screening of soft matter: Application to chemistry-property relationships in lubricating monolayer films // J. Chem. Theory Comput. - 2020. - V. 16. - P. 1779-1793. -https://doi.org/10.1021/acs.jctc.9b01183
10. Saxena S., Khan T.S., Jalid F., Ramteke M., Haider M.A. In silico high throughput screening of bimetallic and single atom alloys using machine learning and ab initio microkinetic modelling // J. Mater. Chem. A. - 2020. - V. 8. - P. 107-123. - https://doi. org/10.1039/c9ta07651d
11. Bucholz E.W., Kong C.S., Marchman K.R., Sawyer W.G., Phillpot S.R., Sinnott S.B., Rajan K. Data-driven model for estimation of friction coefficient via informatics methods // Tribol. Lett. - 2012. - V. 47. - P. 211221. - https://doi.org/10.1007/s11249-012-9975-y
12. Ali Y., Rahman R., Raja R. Acoustic emission signal analysis and artificial intelligence techniques in machine condition monitoring and fault diagnosis: A review // J. Teknol. - 2014. - V. 69. - https://doi.org/ 10.11113/jt.v69.3121
13. Liao S.H., Chu P.H., Hsiao P.Y. Data mining techniques and applications—A decade review from 2000 to 2011 // Expert Syst. Appl. - 2012. - V. 39. - P. 1130311311. - https://doi.org/10.1016/j.eswa.2012.02.063
14. Jones S.P., Jansen R., Fusaro R.L. Preliminary investigation of neural network techniques to predict tribo-logical properties // Tribol. Trans. - 1997. - V. 40. -P. 312-320. - https://doi.org/10.1080/1040200970898 3660
15. Gandomi A.H., Roke D.A. Assessment of artificial neural network and genetic programming as predictive tools // Adv. Eng. Software. - 2015. - V. 88. - P. 6372. - https://doi.org/10.1016/j.advengsoft.2015.05.007
16. El Kadi H. Modeling the mechanical behavior of fiber-reinforced polymeric composite materials using artificial neural networks—A review // Comp. Struct. - 2006. - V. 73. - P. 1-23. - https://doi.org/ 10.1016/j.compstruct.2005.01.020
17. Jiang Z.Y., Zhang Z., Friedrich K. Prediction on wear properties of polymer composites with artificial neural networks // Comp. Sci. Tech. - 2007. V. 67. - P. 168176. - https://doi.org/10.1016/j.compscitech.2006.07. 026
18. Quiza R., Figueira L., Davim J.P. Comparing statistical models and artificial neural networks on predicting the tool wear in hard machining D2 AISI steel // Int. J. Adv. Manuf. Tech. - 2008. - V. 37. - P. 641648. - https://doi.org/10.1007/s00170-007-0999-7
19. Aleksendric D., Barton D.C. Neural network prediction of disc brake performance // Tribol. Int. - 2009. -V. 42. - P. 1074-1080. - https://doi.org/10.1016/j.tri-boint.2009.03.005
20. Bao J.S., TongM.M., Zhu Z.C., Yin Y. Intelligent Tri-bological Forecasting Model and System for Disc Brake // Proc. 24th Chinese Control and Decision Conference, 2012. - P. 3870-3874. - https://doi.org/ 10.1109/CCDC.2012.6243100
21. Zhang Z., Barkoula N.M., Karger-Kocsis J., Friedrich K. Artificial neural network predictions on erosive wear of polymers // Wear. - 2003. - V. 255. -P. 708-713. - https://doi.org/10.1016/s0043-1648C03) 00149-2
22. Shebani A., Iwnicki S. Prediction of wheel and rail wear under different contact conditions using artificial neural networks // Wear. - 2018. - V. 406. - P. 173184. - https://doi.org/10.1016/j.wear.2018.01.007
23. Tran A., Furlan J.M., Pagalthivarthi K.V., Visintai-ner R.J., Wildey T., Wang Y. A computationally efficient machine learning framework for local erosive wear predictions via nodal Gaussian processes // Wear. -2019. - V. 422. - P. 9-26. - https://doi.org/10.1016/j. wear.2018.12.081
24. Giordano S. Differential schemes for the elastic characterization of dispersions of randomly oriented ellipsoids // Eur. J. Mech. A. Solids. - 2003. - V. 22. -P. 885-902. - https://doi.org/10.1016/S0997-7538C03) 00091-3
25. Belyak O.A., Suvorova T.V. Modeling stress deformed state upon contact with the bodies of two-phase microstructure // Solid State Phenomena. - 2020. -V. 299. - P. 124-129. - https://doi.org/10.4028/www. scientific.net/SSP.299.124
26. Kolesnikov V.I., Suvorova T.V., Belyak O.A. Modeling mechanical properties of multilayer coatings TiAlN // Defect Diffus. Forum. - 2021. - V. 410. - P. 578584. - https://doi.org/10.4028/www.scientific.net/DDF. 410.578
27. Kolesnikov V.I., Suvorova T.V., Belyak O.A. Mechanical properties of multilayer coatings TiAlN // J. Phys. Conf. Ser. - 2021. - V. 1954. - P. 012019. - https:// doi.org/10.1088/1742-6596/1954/1/012019
28. Sevostianov I., Yilmaz N., Kushch V., Levin V. Effective elastic properties of matrix composites with trans-versely-isotropic phases // Int. J. Solids Struct. -
2005. - V. 42. - P. 455-476. - https://doi.org/10. 1016/j.ij solstr.2004.06.047
29. Kolesnikov V.I., Kudryakov O.V., Zabiyaka I.Y., No-vikov E.S., Manturov D.S. Structural aspects of wear resistance of coatings deposited by physical vapor deposition // Phys. Mesomech. - 2020. - V. 23. -No. 6. - P. 570-583. - https://doi.org/10.1134/s1029 959920060132
30. Azarmi F., Sevostianov I. Comparative micromechani-cal analysis of alloy 625 coatings deposited by air plasma spraying, wire arc spraying, and cold spraying technologies // Mech. Mater. - 2020. - V. 144. -P. 103345. - https://doi.org/10.1016/j.mechmat.2020. 103345
31. Breiman L. Random forests // Machine Learning. -2001. - V. 45. - P. 5-32. - https://doi.org/10.1023/a: 1010933404324
32. Geurts P., Ernst D., Wehenkel L. Extremely randomized trees // Machine Learning. - 2006. - V. 63. -P. 3-42. - https://doi.org/10.1007/s10994-006-6226-1
33. David E.R., James L.M. Learning Internal Representations by Error Propagation // Parallel Distributed Processing: Explorations in the Microstructure of Cognition: Foundations. - MIT Press, 1987. - P. 318-362. -https://doi.org/10.7551/mitpress/5236.001.0001
34. Kingma D.P., Ba J. Adam: A method for stochastic optimization. - CoRR, abs/1412.6980, 2015. - arXiv: 1412.6980v9
35. Liu D.J., Tan Y.X., Khoram E., Yu Z.F. Training deep neural networks for the inverse design of nanophoto-nic structures // Acs. Photonics. - 2018. - V. 5. -P. 1365-1369. - https://doi.org/10.1021/acsphotonics. 7b01377
36. Oliver W.C., Pharr G.M. An improved technique for determining hardness and elastic modulus using load
and displacement sensing indentation experiments // J. Mater. Res. - 1992. - V. 7. - P. 1564-1583. -https://doi.org/10.1557/jmr.1992.1564
37. Thankachan T., Prakash K.S., Kamarthin M. Optimizing the tribological behavior of hybrid copper surface composites using statistical and machine learning techniques // J. Tribol. Trans. ASME. - 2018. -V. 140. - https://doi.org/10.1115/L4038688
38. Boidi G., da Silva M.R., Profito F.J., Machado I.F. Using machine learning radial basis function (RBF) method for predicting lubricated friction on textured and porous surfaces // Surface Topogr. Metrol. Prop. - 2020. -V. 8. - https://doi.org/10.1088/2051-672X/abae13
39. Wu D.Z., Jennings C., Terpenny J., Gao RX., Kumara S. A comparative study on machine learning algorithms for smart manufacturing: Tool wear prediction using random forests // J. Manuf. Sci. Eng. Trans. ASME. -2017. - V. 139. - https://doi.org/10.1115/L4036350
40. Trappenberg T.P., Back A.D. A Classification Scheme for Applications with Ambiguous Data // Proc. IEEE-INNS-ENNS Int. Joint Conf. Neural Networks: IJCNN 2000 / Ed. by S.I. Amari, C.L. Giles, M. Gori, V. Piuri. - 2000. - V. VI. - P. 296-301. - https://doi. org/10.1109/ijcnn.2000.859412
41. Nalepa J., Kawulok M. Selecting training sets for support vector machines: A review // Artific. Int. Rev. -2019. - V. 52. - P. 857-900. - https://doi.org/10. 1007/s10462-017-9611-1
42. Gao B.B., Xing C., Xie C.W., Wu J.X., Geng X. Deep label distribution learning with label ambiguity // IEEE Trans. Image Proc. - 2017. - V. 26. - P. 2825-2838. -https://doi.org/10.1109/tip.2017.2689998
Поступила в редакцию 10.09.2021 г., после доработки 10.11.2021 г., принята к публикации 18.11.2021 г.
Сведения об авторах
Пашков Данил Максимович, мнс РГУПС, инж.-иссл. МИИИМ ЮФУ, pashkov@sfedu.ru Беляк Ольга Александровна, к.ф.-м.н., доц., доц. РГУПС, o_be1s@mai1.ru Гуда Александр Александрович, к.ф.-м.н., снс РГУПС, зам. дир. МИИИМ ЮФУ, guda@sfedu.ru Колесников Владимир Иванович, д.т.н., ак. РАН, проф., президент РГУПС, kvi@rgups.ru