Научная статья на тему 'Формирование электронной компонентной базы с особыми требованиями качества с применением ансамблей алгоритмов кластеризации'

Формирование электронной компонентной базы с особыми требованиями качества с применением ансамблей алгоритмов кластеризации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
54
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЛГОРИТМЫ КЛАСТЕРИЗАЦИИ / АНСАМБЛИ АЛГОРИТМОВ / ГЕНЕТИЧЕСКИЙ АЛГОРИТМ / CLUSTERING ALGORITHMS / ENSEMBLES OF ALGORITHMS / GENETIC ALGORITHM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рожнов И.П., Орлов В.И., Казаковцев Л.А.

Рассмотрен алгоритм составления оптимального (по точности результата на заданном наборе задач) ансамбля алгоритмов кластеризации для обеспечения качества электронно-компонентной базы (ЭКБ), устанавливаемой в лётные образцы космических аппаратов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Рожнов И.П., Орлов В.И., Казаковцев Л.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORMATION OF ELECTRONIC COMPONENT BASE WITH SPECIAL QUALITY REQUIREMENTS WITH THE USE OF CLUSTERING ALGORITHMS

We consider an algorithm for compiling an ensemble of clustering algorithms to ensure the quality of the electronic component base (ECB), which is installed in spacecraftss (in terms of the accuracy of the result on a given set of problemss).

Текст научной работы на тему «Формирование электронной компонентной базы с особыми требованиями качества с применением ансамблей алгоритмов кластеризации»

УДК 519.6

ФОРМИРОВАНИЕ ЭЛЕКТРОННОЙ КОМПОНЕНТНОЙ БАЗЫ С ОСОБЫМИ ТРЕБОВАНИЯМИ КАЧЕСТВА С ПРИМЕНЕНИЕМ АНСАМБЛЕЙ АЛГОРИТМОВ КЛАСТЕРИЗАЦИИ

И. П. Рожнов, В. И. Орлов, Л. А. Казаковцев

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: levk@bk.ru

Рассмотрен алгоритм составления оптимального (по точности результата на заданном наборе задач) ансамбля алгоритмов кластеризации для обеспечения качества электронно-компонентной базы (ЭКБ), устанавливаемой в лётные образцы космических аппаратов.

Ключевые слова: алгоритмы кластеризации, ансамбли алгоритмов, генетический алгоритм.

FORMATION OF ELECTRONIC COMPONENT BASE WITH SPECIAL QUALITY REQUIREMENTS

WITH THE USE OF CLUSTERING ALGORITHMS

I. P. Rozhnov, V. I. Orlov, L. A. Kazakovtsev

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation

E-mail: levk@bk.ru

We consider an algorithm for compiling an ensemble of clustering algorithms to ensure the quality of the electronic component base (ECB), which is installed in spacecraftss (in terms of the accuracy of the result on a given set ofprob-lemss).

Keywords: clustering algorithms, ensembles of algorithms, genetic algorithm.

Комплектация бортовой аппаратуры космического аппарата высоконадёжными электронными компонентами является одной из основных задач современной космической отрасли. В рамках решения этой задачи необходимо обеспечить закупку ЭКБ у проверенных поставщиков, а также проведение входного контроля, дополнительных отбраковочных испытаний и разрушающего физического анализа ЭКБ [1].

Для интеллектуального анализа данных, включая задачи автоматической группировки, предложено множество статистических и иных методов, но по-прежнему важной задачей остаётся разработка технологии (метода), подходящей для решения максимально широкого круга задач кластеризации. Например, после проведённых многократных исследований, применение ансамблей алгоритмов кластеризации позволяет сделать вывод об их сравнительной эффективности для решения широкого круга задач. Но тогда возникает вопрос о методе формирования ансамбля. Как показывает практика, формирование эффективных ансамблей сопряжено с трудностями, так как выбор для формирования ансамбля алгоритмов, демонстрирующих лучшие результаты, не всегда приводит к формированию ансамбля дающего наилучшую точность [2-3].

В ансамблевом подходе для каждого полученного отдельными алгоритмами разбиения объектов на группы составляется предварительная бинарная матрица различий размера п х п (где п - количество объектов):

H = <h(i, j)>,

где hi(i, j) равен нулю, если элемент i и элемент j попали в один кластер, и 1, если нет.

Следующим шагом в составлении ансамбля алгоритмов кластеризации является составление согласованной матрицы бинарных разбиений.

H =( h (i, j)) , h (i, j) = X wh (i, j),

где wi - вес алгоритма. Мы принимаем вес, равный усредненной точности алгоритма, примененного на тестовых задачах.

Генетическое программирование показало высокую эффективность при построении ансамблей нейронных сетей применяемых, в том числе, для решения задач кластеризации. Мы применили генетический алгоритм метода жадных эвристик для формирования ансамбля произвольных алгоритмов.

Точность отдельных алгоритмов кластеризации и их ансамблей можно оценить по имеющейся размеченной выборке - то есть требуется выборка, в которой принадлежность объектов к фактическим группам известна заранее.

Точность алгоритмов и их ансамблей будем оценивать следующим образом:

Fit1 = A/N^ max,

где A - количество правильно кластеризованных объектов; N - общее количество объектов.

Алгоритм формирования ансамбля алгоритмов кластеризации изложен авторами в [2-3].

Электронная компонентная база щ>смических,систем

Решение 1

Решение 2 (такая же или другая метрическая или кластерная модель)

I \ I > I I

и

U

Совместное решение

Л

Solution ' = Solution 1 u subset (Solution 2) result = greedy(Solution ' )

Принцип объединения множеств родительских решений

По результатам наших вычислительных экспериментов видно, что любые алгоритмы кластеризации для задачи разделения сборной партии электрорадио-изделий на две однородные партии показывают довольно высокую точность. При увеличении числа однородных производственных партий в сборной партии точность падает. При этом для разных наборов данных наилучшие результаты демонстрируются разными алгоритмами.

В любом случае, применение нескольких моделей кластеризации полезно: если одна из моделей относит два элемента к одной и той же группе, а другая относит их к различным группам, то в условиях космического производства дешевле отнести их к спорным элементам и на всякий случай исключить из производственного цикла, чем испытывать последствия сбоев на орбите.

Дальнейшим развитием идеи применения ансамблевого подхода является решение нескольких проблем, основанных на разных моделях кластеризации, в одной популяции генетического алгоритма с жадной агломеративной эвристикой [4-5].

Идея наших генетических алгоритмов состоит в объединении пар решений, каждый из которых представляет собой набор центров или центроидов кластеров. В результате мы получаем промежуточное неосуществимое решение с избыточным числом центров.

Дополнительные центры затем последовательно исключаются с помощью жадной агломерационной процедуры (см. рисунок).

В наших работах показано, что можно эффективно комбинировать решения, содержащие различное количество центроидов, то есть решения различных задач кластеризации, которые различаются по количеству кластеров.

Еще одна идея заключалась в объединении наборов центров или центроидов с различными измере-

ниями расстояния. Полученный результат рассматривается как набор центров или центроидов с одной из дистанционных мер, участвующих в объединении, и мы используем жадную процедуру агломерации, последовательно уменьшая число центров.

Таким образом, в одной популяции генетического алгоритма мы можем одновременно получать решения на основе разных моделей кластеризации, а затем либо составлять лучшие из ансамблевых решений, либо отбрасывать противоречивые элементы.

По данной идее сейчас идут вычислительные эксперименты, получены лишь самые первые результаты, но результаты являются многообещающими.

Библиографические ссылки

1. Лукьяненко М. В., Чурляева Н. П., Федосов В. В. Надежность изделий электронной техники в аппаратуре космических аппаратов : учеб. пособие / Сиб. гос. аэрокосмич. ун-т. Красноярск, 2016. 188 с.

2. Составление оптимальных ансамблей алгоритмов кластеризации / И. П. Рожнов и др. // Системы управления и информационные технологии. 2018. № 2 (72). С. 31-35.

3. Rozhnov I., Kazakovtsev L., Orlov V. Ensembles of clustering algorithms for problem of détection of homogeneous production batches of semiconductor devices // CEUR-WS. 2018. Vol. 2098. P. 338-348.

4. Hansen P., Mladenovic N. Variable Neighborhood Search // Search Methodology / E. K. Bruke, G. Kendall [eds.]. Springer US. 2005. P. 211-238. Doi: 10.1007/0-387-28356-0_8.

5. Казаковцев Л. А., Ступина А. А., Орлов В. И. Модификация генетического алгоритма с жадной эвристикой для непрерывных задач размещения и классификации // Системы управления и информационные технологии. 2014. Вып. 2 (56). C. 35-39.

References

1. Lukyanenko M. V., Churlyaeva N. P., Fedosov V. V. Reliability of electronic products in spacecraft equipment : training allowance / Sib. state. aerospace. un-t. Krasnoyarsk, 2016. 188 p.

2. Composing the optimal ensembles of clustering algorithms / I. P. Rozhnov [et al.] // Control Systems and Information Technology. 2018. Vol. 2 (72). P. 31-35. (In Russ.)

3. Rozhnov I., Kazakovtsev L., Orlov V. Ensembles of clustering algorithms for problem of detection of homo-

geneous production batches of semiconductor devices // CEUR-WS. 2018. Vol. 2098. P. 338-348.

4. Hansen P., Mladenovic N. Variable Neighborhood Search // Search Methodology / E. K. Bruke, G. Kendall [eds.]. Springer US. 2005. P. 211-238, Doi: 10.1007/0-387-28356-0_8.

5. Kazakovtsev L. А., Stupina A. A., Orlov V. I. Modification of the genetic algorithm with greedy heuristics for continuous problems of allocation and classification // Control Systems and Information Technology. 2014. Iss. 2 (56). P. 35-39. (In Russ.)

© Рожнов И. П., Орлов В. И., Казаковцев Л. А., 2018

i Надоели баннеры? Вы всегда можете отключить рекламу.