Научная статья на тему 'Применение EM-алгоритма к задаче автоматической группировки электрорадиоизделий'

Применение EM-алгоритма к задаче автоматической группировки электрорадиоизделий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
124
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАСТЕРИЗАЦИЯ / ЭЛЕКТРОРАДИОИЗДЕЛИЯ / АВТОМАТИЧЕСКАЯ ГРУППИРОВКА / CLUSTERING / ELECTRONIC COMPONENTS / AUTOMATIC GROUPING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Орлов В.И., Сташков Д.В., Гудыма М.Н., Казаковцев Л.А.

Рассмотрено применение EM-алгоритма к задаче автоматической группировки электрорадиоизделий космического применения. Работа алгоритма проверена на реальных данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Орлов В.И., Сташков Д.В., Гудыма М.Н., Казаковцев Л.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EM-ALGORITHM FOR PROBLEM OF AUTOMATIC GROUPING OF ELECTRONIC COMPONENTS

In this paper we consider applying of EM-algorithm for a problem of automatic grouping of electronic components for spacecraft manufacturing. We also examine algorithm on real data.

Текст научной работы на тему «Применение EM-алгоритма к задаче автоматической группировки электрорадиоизделий»

<Тешетневс^ие чтения. 2016

УДК 519.6

ПРИМЕНЕНИЕ ЕМ-АЛГОРИТМА К ЗАДАЧЕ АВТОМАТИЧЕСКОЙ ГРУППИРОВКИ

ЭЛЕКТРОРАДИОИЗДЕЛИЙ

В. И. Орлов, Д. В. Сташков*, М. Н. Гудыма, Л. А. Казаковцев

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: stashkov@sinetic.ru

Рассмотрено применение EM-алгоритма к задаче автоматической группировки электрорадиоизделий космического применения. Работа алгоритма проверена на реальных данных.

Ключевые слова: кластеризация, электрорадиоизделия, автоматическая группировка.

EM-ALGORITHM FOR PROBLEM OF AUTOMATIC GROUPING OF ELECTRONIC COMPONENTS

V. I. Orlov, D. V. Stashkov*, M. N. Gudyma, L. A. Kazakovtsev

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: stashkov@sinetic.ru

In this paper we consider applying of EM-algorithm for a problem of automatic grouping of electronic components for spacecraft manufacturing. We also examine algorithm on real data.

Keywords: clustering, electronic components, automatic grouping.

Важной задачей космической отрасли является получение надежных способов автоматической группировки электрорадиоизделий (ЭРИ) по данным тестовых испытаний с целью выделения групп ЭРИ, однородных по производственным партиям исходного сырья. Обеспечение однородности является условием выполнения дальнейших мероприятий, проводимых в рамках многоступенчатых испытаний ЭРИ [1].

Обзор наиболее часто используемых на практике методов приведен в [2]. ЕМ-алгоритм (максимизация мат.ожидания), успешно применяется для статистических задач, связанных с анализом неполных данных, когда некоторые статистические данные отсутствуют, либо для случаев, когда функция правдоподобия имеет вид, не допускающий удобных методов исследования, но допускающий серьезные упрощения при введении дополнительных «ненаблюдаемых» («скрытых») величин [3]. Именно такая постановка задачи (кластеризация многомерных данных нормального распределения со скрытыми данными) используется нами для решения задач разделения ЭРИ по производственным партиям исходного сырья.

Пусть плотность распределения на множестве X имеет вид смеси к распределений (предполагаем, что распределения гауссовы):

Р(х) = Xк=1 ЮР](х) , X к=1 Ю] = ^ ^ 0,

где ру(х) - функция правдоподобия ]-й компоненты смеси; ау - ее априорная вероятность, а функции правдоподобия принадлежат параметрическому семейству распределений ф(х; 9) и отличаются только

значениями параметра ру(х) = ф(х; 9). Задача разделения смеси (нечеткой кластеризации) заключается в том, чтобы, имея выборку X случайных и независимых наблюдений из смеси р(х), зная число к и фун-цию ф, оценить вектор параметров распределения © = (Ш1, ..., Шк, 91, ... 9к).

Искусственно вводится вспомогательный вектор скрытых переменных О, который может быть вычислен, если известны значения вектора параметров ©.

ЕМ-алгоритм состоит из итерационного повторения двух шагов. На Е-шаге вычисляется ожидаемое значение вектора скрытых переменных О по текущему приближению вектора параметров ©. Обозначим через р(х, 9у) = р(х)Р(9у|х) = аур/х) плотность вероятности того, что объект х получен из ]-й компоненты смеси. Обозначим

gij = Рфу | х-) = Ю]Ру(х-) / Xк=1 ЧР.(х)

апостериорную вероятность того, что обучающий объект х- получен из]-й компоненты смеси.

На М-шаге решается задача максимизации логарифма правдоподобия

=1п Пт=1Р(х) = X;>Х к]=1 Ю]Р](х-) ^ тах0

и находится следующее приближение вектора © по текущим значениям векторов О и ©. М-шаг сводится к вычислению весов компонент ау и оцениванию параметров 9у путем решения к независимых оптимизационных задач.

Данный алгоритм не позволяет определять количество к компонентов смеси (количество кластеров),

Математические методы моделирования, управления и анализа данных.

поэтому должна решаться серия задач с различным предполагаемым числом кластеров. Кроме того, ЕМ-алгоритм обладает сильной неустойчивостью по начальным данным [3]. Тем не менее, к его преимуществам можно отнести [2] то, что его можно комбинировать с другими алгоритмами обработки данных, также не требуется выделение метрик. При примере-нии более распространенной модели ¿-средних к задаче выделения однородных производственных партий электрорадиоизделий проблема выбора метрики или меры расстояния [4] не имеет однозначного решения. На практике приходится использовать сложные специальные способы нормировки данных [5].

ЕМ-алгоритм успешно работает с малыми объемами данных. Некоторые дорогие виды электрора-диоизделий, несущие в космических аппаратах наибольшую функциональную нагрузку, поступают партиями от нескольких штук, что делает применение ЕМ-алгоритма и алгоритмов на его основе весьма перспективным применительно к нашей задаче.

Мы использовали реализацию ЕМ-алгоритма в среде моделирования Я для автоматической группировки партий ЭРИ от 50 до 620 штук (см. рисунок). Кроме определения принадлежности каждого ЭРИ (точки на диаграмме) к кластеру, алгоритм дает таблицу с вероятностными характеристиками принадлежности к кластеру и показывает форму кластера, визуализируя возможные корреляции параметров ЭРИ.

СП - а о

(Ч - о о О

- - л Л ¿1 А

о - 0 :f_4—¡ о : ; в 1 i с.; о ; Т" Г Ш© Д ¿S /ТЧ д ¡ЖЛ

о дЛ A ¡ 1 ' л

Р о д д д

-105 10 0 -9 5 90 8 5 -0 0

X

Срез (показаны 2 параметра из 32) результата автоматической группировки усилителей 140УД25АС1ВК

Создание модификаций EM-алгоритма с повышенной устойчивостью результата откроет новые перспективы в решении задачи автоматической группировки ЭРИ по производственным партиям, в частности, при небольшом объеме входных данных.

Библиографические ссылки

1. Коплярова Н. В., Орлов В. И. Об исследовании компьютерной системы диагностики электрорадио-изделий на основе данных испытаний // Вестник СибГАУ. 2014. Вып. 1(53), С. 24-30.

2. Черезов Д. С., Тюкачев Н. А. Обзор основных методов классификации и кластеризации данных // Вестник Воронеж. гос. ун-та. Сер. «Системный анализ и информационные технологии». 2009. Вып. 2.

3. Королев В. Ю. ЕМ-алгоритм, его модификации и их применение к задаче разделения смесей вероятностных распределений. Теоретический обзор // ИПИ РАН. М., 2007. С. 94.

4. Казаковцев Л. А., Орлов В. И., Ступина А. А. Выбор метрики для системы автоматической классификации электрорадиоизделий по производственным партиям // Программные продукты и системы. 2015. № 2. С. 124-129. Doi: 10.15827/0236-235X.110.124-129.

5. Федосов В. В., Казаковцев Л. А., Гудыма М. Н. Задача нормировки исходных данных испытаний электрорадиоизделий космического применения для алгоритма автоматической группировки // Информационные технологии моделирования и управления. 2016. № 4. С. 263-268.

References

1. Koplyarova N. V., Orlov V. I. [About research of radio-electronic equipment diagnostics computer system on the basis of experimental data]. VestnikSibGAU. 2014. Vyp. 1(53), P. 24-30. (In Russ.)

2. Cherezov D. S., Tukachev N. А. [Overview of the main methods of classification and clustering of data.] Voronezh, Vestnik VGU. Systems Analysis and Information Technologies, 2009. Vyp. 2.

3. Korolev V. Yu. EM-algoritm, ego modifikatsii i ikh primenenie k zadache razdeleniya smesey veroyatnostnykh raspredeleniy. Teoreticheskiy obzor. [EM algorithm modifications and their application to the separation of mixtures of probability distributions. The theoretical overview.] IPI RAN Moscow, 2007. P. 94.

4. Kazakovtsev L. A., Orlov V. I., Stupina A. A. [On distance metric for the system of automatic classification of the EEE devices by production batches]. Programmnye produkty i sistemy, 2015. № 2. P. 124-129. Doi: 10.15827/0236-235X.110.124-129.

5. Fedosov V. V., Kazakovtsev L. A., Gudyma M. N. Problem of normalization of raw data of spaceship electronic components testings for automatic grouping algorithm. Informatsionnye tekhnologii modelirovaniya i upravleniya. 2016. No. 4. P. 263-268.

© Орлов В. И., Сташков Д. В., Гудыма М. Н., Казаковцев Л. А., 2016

i Надоели баннеры? Вы всегда можете отключить рекламу.