Научная статья на тему 'Алгоритм поиска в чередующихся окрестностях для задачи выделения однородных производственных партий электрорадиоизделий'

Алгоритм поиска в чередующихся окрестностях для задачи выделения однородных производственных партий электрорадиоизделий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
91
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАСТЕРНЫЙ АНАЛИЗ / K-СРЕДНИХ / VNS / ЖАДНЫЕ АГЛОМЕРАТИВНЫЕ ПРОЦЕДУРЫ / CLUSTER ANALYSIS / K-MEANS / GREEDY AGGLOMERATIVE PROCEDURES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Орлов В.И., Рожнов И.П., Казаковцев Л.А., Гудыма М.Н.

Предложен новый алгоритм для задачи выделения однородных производственных партий электрорадиоизделий космического применения по данным тестирования, позволяющий получать более точный результат в сравнении с известными алгоритмами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

VARIABLE NEIGHBORHOOD SEARCH ALGORITHM FOR THE PROBLEM OF DETECTION OF HOMOGENIOUS PRODUCTION BATCHES OF SEMICONDUCTOR devices

We propose new algorithms for solving the problem of detection of homogeneous production batches of semiconductor devices shipped for the space industry based on data of rejection tests which provide more accurate results in comparison with known algorithms.

Текст научной работы на тему «Алгоритм поиска в чередующихся окрестностях для задачи выделения однородных производственных партий электрорадиоизделий»

Электронная компонентная база щ>смических,систем

УДК 519.6

АЛГОРИТМ ПОИСКА В ЧЕРЕДУЮЩИХСЯ ОКРЕСТНОСТЯХ ДЛЯ ЗАДАЧИ ВЫДЕЛЕНИЯ ОДНОРОДНЫХ ПРОИЗВОДСТВЕННЫХ ПАРТИЙ ЭЛЕКТРОРАДИОИЗДЕЛИЙ

В. И. Орлов, И. П. Рожнов, Л. А. Казаковцев, М. Н. Гудыма

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: levk@bk.ru

Предложен новый алгоритм для задачи выделения однородных производственных партий электрорадиоиз-делий космического применения по данным тестирования, позволяющий получать более точный результат в сравнении с известными алгоритмами.

Ключевые слова: кластерный анализ, k-средних, VNS, жадные агломеративные процедуры.

VARIABLE NEIGHBORHOOD SEARCH ALGORITHM FOR THE PROBLEM OF DETECTION OF HOMOGENIOUS PRODUCTION BATCHES OF SEMICONDUCTOR DEVICES

V. I. Orlov, I. P. Rozhnov, L. A. Kazakovtsev, M. N. Gudyma

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation

E-mail: levk@bk.ru

We propose new algorithms for solving the problem of detection of homogeneous production batches of semiconductor devices shipped for the space industry based on data of rejection tests which provide more accurate results in comparison with known algorithms.

Keywords: cluster analysis, k-means, VNS, greedy agglomerative procedures.

Выделение однородных партий электрорадиоизде-лий по данным неразрушающего тестирования с применением методов кластерного анализа связано с обеспечением надежности электронной аппаратуры. Ионизирующие излучения как физический фактор космической среды во многом определяют срок активного существования космических аппаратов. Можно отметить общность задач кластеризации на основе модели k-средних и аналогичных (параметрами являются координаты центров кластеров) с задачами на основе модели разделения смеси распределений, в которых параметрами являются параметры распределений (в том числе математические ожидания - фактически центры кластеров), дополненные априорными вероятностями распределений.

Наиболее популярным методом решения задачи k-средних является одноименный алгоритм k-средних (k-means) [1], называемый также ALA-процедурой (Alternating Location-Allocation - чередующееся размещение-распределение). Алгоритм включает всего два чередующихся шага: разбиение на группы (кластеры) вокруг известных центров (объект относится к той группе, центр которой является к нему ближайшим) и переопределение центров групп. Алгоритм последовательно улучшает известное решение, позволяя найти локальный минимум. Это простой и быстрый алгоритм, применимый к широчайшему классу задач [2-3].

Общую схему алгоритма поиска в чередующихся окрестностях для решения задачи k-средних можно описать следующим образом [4-5].

Алгоритм (Х-УШ).

1. Запустить алгоритм Х-средних из случайного начального решения, получить решение 5".

2. Установить 5 = 5^ (номер окрестности поиска).

3. Установить / = 0, ] = 0; (количество безрезультатных итераций в конкретной окрестности и в целом по алгоритму).

4. Запустить алгоритм Х-средних из случайного начального решения, получить решение 51.

5. Запустить алгоритм жадной процедуры с частичным или полным объединением [5] с начальными решениями 5 и 5". Таким образом, окрестность определяется способом включения центров кластеров из второго известного решения и параметром окрестности - собственно вторым известным решением.

6. Если результат по значению целевой функции лучше, чем 5, то заменить 5 этим новым результатом, присвоить I = 0, ] = 0, перейти к шагу 5.

7. Присвоить I = I + 1.

8. Если I < /тах, то перейти к шагу 4.

9. Присвоить I = 0, ] = ] + 1. Осуществить переход к новой окрестности: 5 = 5 + 1; если 5 > 3, то присвоить 5 = 1.

10. Если у > ¿тах, или выполняются другие условия останова (максимальное время работы), то ОСТАНОВ. Иначе перейти к шагу 5.

Важными являются значения двух параметров: /тах - число безрезультатных поисков в окрестности и ¿пах - число безрезультатных переключений окрестностей. Мы использовали значение /тах = 2к, ¿тах = 2.

Решетневскуе чтения. 2018

Сравнительные результаты вычислительных экспериментов

Алгоритм Достигнутое значение целевой функции

Среднее | СКО

Тестовые испытания партии электрорадиоизделий Н5503ЧМ1-289 (10 кластеров, 30 секунд на попытку, 30 попыток )

'-Means 43 701,45 12,22

Л-средних 43 722,19 9,87

Л-VNS 43 689,39 4,89

Mopsi-Joensuu (20 кластеров, 2 400 секунд на попытку, 30 попыток)

'-Means 36,730 0,253

Л-средних 50,387 1,359

Л-VNS 36,565 0,000

chess (30 кластеров, 3 600 секунд на попытку, 30 попыток)

'-Means 8 014,72 10,71

Л-средних 7 990,12 9,31

Л-VNS 7 960,22 2,71

Также важным может быть параметр sstart, задающий номер окрестности, с которой начинается поиск. Данный параметр особенно важен. Мы провели вычислительные эксперименты со всеми возможными его значениями. В зависимости от этого значения алгоритмы обозначены k-VNS1, k-VNS2, k-VNS3. Старт алгоритма поиска может начинаться с разных окрестностей.

Результаты вычислительных экспериментов.

Для тестирования нашего нового алгоритма (k-VNS) в трёх различных его модификациях мы использовали данные тестовых испытания электрорадиоизделий и классические наборы данных из репозитория UCI. Для всех наборов данных было выполнено по 30 попыток запуска каждого алгоритма (/'-Means, /^средних, новый алгоритм k-VNS). Фиксировались только лучшие результаты (значения целевой функции), достигнутые в каждой попытке, затем из этих результатов по каждому алгоритму были рассчитаны среднее значение и среднеквадратичное отклонение (СКО). Алгоритмы /-Means и /-средних были запущены в режиме мультистарта (см. таблицу).

Результаты наших вычислительных экспериментов показали, что новый алгоритм поиска в чередующихся окрестностях (k-VNS), примененный как для задачи автоматической группировки электрорадилиз-делий по однородным производственным партиям, так и для задач кластеризации классических наборов данных дает более стабильные результаты (с меньшим среднеквадратичным отклонением значения целевой функции), и лучшие (по достигнутому значению целевой функции) в сравнении с классическими алгоритмами /-Means и /-средних. При этом сложно отдать однозначное предпочтение одной из версий нового алгоритма k-VNS. С ростом числа кластеров и объёма данных сравнительная эффективность новых алгоритмов не снижается.

Таким образом, арсенал высокоточных методов решения рассматриваемой задачи пополнен новыми алгоритмами.

Библиографические ссылки

1. Facility location: Concepts, models, algorithms and case studies / R. Z. Farahani and M. Hekmatfar (eds.). Berlin Heidelberg : Springer-Verlag. 2009. 549 p.

2. Steinhaus H. Sur la division des corps materiels en parties // Bull. Acad. Polon. Sci. 1956. Cl. III, Vol IV. P. 801-804.

3. Lloyd S. P. Least Squares Quantization in PCM // IEEE Transactions on Information Theory. 1982. Vol. 28. P. 129-137.

4. Алгоритм для серии задач разделения смеси распределений / Д. В. Сташков [и др.] // Решетневские чтения : материалы Междунар. науч. конф. (08-11 нояб. 2017) / под общ. ред. Ю. Ю. Логинова ; Сиб. гос. аэро-космич. ун-т. Красноярск, 2017. Т. 1, № 21. С. 327-328.

5. Дальнейшее развитие метода жадных эвристик для задач автоматической группировки объектов / Л. А. Казаковцев [и др.] // Системы управления и информационные технологии. 2017. № 4 (70). С. 34-40.

References

1. Facility location: Concepts, models, algorithms and case studies / R. Z. Farahani and M. Hekmatfar (eds.). Berlin Heidelberg : Springer-Verlag. 2009. 549 р.

2. Steinhaus H. Sur la division des corps materiels en parties // Bull. Acad. Polon. Sci. 1956. Cl. III, Vol IV. P. 801-804.

3. Lloyd S. P. Least Squares Quantization in PCM // IEEE Transactions on Information Theory. 1982. Vol. 28. P. 129-137.

4. Algorithm for Series of Mixture Distribution Separation Problems / D. V. Stashkov [et al.] // Materialy Mezhdunar. nauch. konf. "Reshetnevskie chteniya" (2017, November 08-11, Krasnoyarsk). 2017. Vol. 1 (21). P. 327-328. (In Russ.)

5. Further Development of the Greedy Heuristic Method for Clustering Problems / L. A. Kazakovtsev, [et al.] // Control Systems and Information Technology. 2017. Vol. 4 (70). P. 34-40. (In Russ.)

© Орлов В. И., Рожнов И. П., Казаковцев Л. А., Гудыма М. Н., 2018

i Надоели баннеры? Вы всегда можете отключить рекламу.