УДК 509.6
Вестник СибГАУ 2014. № 4(56). С. 55-61
ЗАДАЧА КЛАССИФИКАЦИИ ЭЛЕКТРОННОЙ КОМПОНЕНТНОЙ БАЗЫ
Л. А. Казаковцев1, В. И. Орлов2, А. А. Ступина1, И. С. Масич1
1 Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
2 ОАО «ИТЦ - НПО ПМ» Российская Федерация, 662970, г. Железногорск Красноярского края, ул. Молодежная, 20
E-mail: [email protected]
Комплектация бортовой аппаратуры космических аппаратов высоконадёжной электронной компонентной базой является одной из основных задач современной космической отрасли. В первую очередь следует предотвратить попадание в аппаратуру низкосортной фальсифицированной продукции, которая не удовлетворяет требованиям, предъявляемым к надёжности.
Рассматривается задача повышения качества отечественного производства электронных изделий. При изготовлении практически любой электронной схемы желательно использовать в ней электрорадиоизделия с одинаковыми характеристиками, что с наибольшей вероятностью достигается при использовании электро-радиоизделий, изготовленных в одной производственной партии. В случае если способ производства в точности не известен, едва ли не единственным доступным способом повысить качество элементной базы и, как следствие, всей системы является проведение комплексных испытаний поставляемых партий. Особенно актуальной данная проблема является при сборке узлов электронных систем космических аппаратов. Космический аппарат содержит от 100 до 200 тысяч электронных компонентов. К ним относятся микросхемы, транзисторы, диоды, конденсаторы, реле, кварцевые резонаторы, резисторы и т. д.
Бортовая аппаратура в космическом пространстве не подлежит ремонту, надежность такой аппаратуры должна быть максимально возможной. Требуемый уровень достигается за счёт многих факторов, одним из основных является применение высоконадёжной электронной компонентной базы.
Приведена постановка задачи выявления производственных партий электрорадиоизделий в поступающей от поставщика партии по результатам тестирования. Задача сводится к серии задач кластерного анализа, для решения которых применяется специальный генетический алгоритм.
Ключевые слова: электронные компоненты, классификация, производственные партии.
Vestnik SibGAU 2014, No. 4(56), P. 55-61
PROBLEM OF ELECTRONIC COMPONENTS CLASSIFYING
L. A. Kazakovtsev1, V. I. Orlov2, A. A. Stupina1, I. S. Masich 1
1 Siberian State Aerospace University named after academician M. F. Reshetnev 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation
2 TTC - NPO PM
20, Molodegnaya st., Jeleznogorsk, Krasnoyarsk region, 662970, Russian Federation
E-mail: [email protected]
Forming the on-board equipment of the space systems with fail-tolerant electronic devices is one of the most important problems of the modern space industry. The first issue is to supply the space industry companies with fake and low-quality production which does not correspond to the reliability requirements.
In this paper, authors consider the problem of improving quality of national production of electronic devices. In production of electronic units, using the electronic devices with equal values of characteristics is preferable. The equality of the characteristics is reached if a production lot of the electronic devices consists of devices produced as a single production batch. In the case when the production conditions are unknown, the only way of checking if the whole lot belongs to a single production batch and improving quality of electronic unit and the whole system is complex testing of the whole lot. This problem is the most actual and important for construction of electronic units of the space systems. The spacecraft contains approximately 100000-200000 electronic devices such as electronic chips, transistors, diodes, capacitors, relays, resistors etc.
On-board equipment in the space cannot be repaired. Thus, the reliability of such equipment must be maximal. Required reliability level can be reached via many various factors. One of the most important factors is to use the hi-reliability electronic devices.
In this article, authors propose a problem statement of learning the quantity of the production batches in a lot of the devices. This problem is solved as series of cluster analysis problems by special genetic algorithm.
Keywords: electronic components, classifying, production batches.
Введение. Качество электронной компонентной базы, применяемой при сборке различных электронных узлов, зачастую оставляет желать лучшего. Электронная компонентная база, выпускаемая производителями в США, подразделяется на классы качества (Commercial/Industry, Military, Space) [1; 2]. Проблема повышения качества отечественного производства электронных изделий высокого качества в последнее время становится наиболее актуальной [3-5]. От класса к классу (более высокому) стоимость изделий увеличивается на порядок. Независимо от класса продукции при изготовлении практически любой электронной схемы желательно использовать в ней электрора-диоизделия с близкими эксплуатационными характеристиками, что с наибольшей вероятностью достигается при использовании электрорадиоизделий, изготовленных в одной производственной партии. В идеале вся партия, например микросхем, должна быть выпущена в одних и тех же условиях из одной и той же партии сырья.
В то же время поставщики полупроводниковых и других приборов не всегда могут гарантировать однородность партии приборов. Особенно это актуально при использовании изделий импортного производства, доля которых близка к 100 % [5]. В этом случае едва ли не единственным доступным способом повысить качество элементной базы и, как следствие, всей системы является проведение комплексных испытаний поставляемых партий.
Одним из направлений повышения качества элементной базы является проверка партий отечественной продукции на однородность и выделение групп элементов с идентичными характеристиками из сборных (предположительно) партий импортного происхождения.
Метод классификации с использованием генетического алгоритма. Результатом испытаний, проводимых заводом-изготовителем или испытательным центром, является набор параметров каждого элемента. Результат каждого из видов испытаний является числовой характеристикой (чаще всего, напряжение или ток в той или иной цепи в тех или иных условиях). Сделать вывод об однородности либо разнородности партии изделий по условиям производства следует на основе анализа этих характеристик. Хотя к диапазону каждой из этих характеристик применяются жесткие требования, незначительные на первый взгляд колебания сразу нескольких характеристик позволяют сделать вывод о том, что части партии произведены в разных условиях.
Задача к-средних на сегодняшний день является наиболее распространенной моделью кластерного анализа [6]. В свою очередь, кластерный анализ -универсальный инструмент классификации и стати-
стической обработки данных [7; 8]. Задачу к-средних можно отнести к задачам непрерывной теории размещения [9]. В действительности задача сводится к нахождению к точек (центров, центроидов) в d-мерном пространстве характеристик (здесь d - число измерений характеристик) таких, чтобы сумма расстояний от каждого из векторов данных до ближайшего к нему из к центров достигала минимума. В пространстве характеристик используется, как правило, квадратичная евклидова метрика, поскольку в данном случае нахождение центра каждого из кластеров является элементарной задачей, выполняемой за один шаг, и вычислительная сложность алгоритма падает по сравнению с алгоритмом с евклидовой метрикой, при которой вычисление центра (медианы) [10] - итеративный процесс [11; 12]. Векторами данных при этом являются наборы характеристик, в нашем случае -данные результатов испытаний каждого из изделий, выраженные в виде набора числовых характеристик различной (в общем случае) размерности. Задача является задачей глобального поиска [13].
Для решения данных задач используется ALA-алгоритм (Alternating Location-Allocation - изменяющееся размещение-распределение) [13]. Данный алгоритм является процедурой локального поиска, начинается с указания некоторого начального решения -начального множества центров, в качестве которого используется подмножество из к точек-векторов данных, и состоит в поочередном нахождении множеств векторов данных для каждого из центров, для которых данный центр является ближайшим, и нахождения нового центра для каждого из этих множеств. В случае задачи к-средних в качестве нового центра выбирается медиана множества, в случае р-медианной задачи новый центр является решением задачи Вебе-ра [10], для чего используется итеративная процедура Вайсфельда [11] или более совершенные ее модификации [12]. Вследствие этого требуется гораздо больше вычислительных ресурсов.
В общем случае непрерывную задачу к-средних можно сформулировать следующим образом:
N
argmin V min L (X,, A,), (1)
X,, ..., XpeRf1= *1 к> K J '
где (Ab ..., An} - множество известных точек - векторов данных в d-мерном пространстве; Хь ..., Xp - искомые точки (центры кластеров); L( ) - некоторая функция (метрика) расстояния.
В случае евклидовой метрики L (Xj, Ai) =
= ^V d=i Xiк - а'к) мы имеем p-медианную задачу. Здесь Xi = (j ... j) V/ = 1,p, Ai = (... aa)
Vi = 1, N . В случае квадратичной евклидовой метри-
ки I (Х], А) - X Ц*м - «к)
мы имеем задачу к-средних. Алгоритм 1. ЛЬЛ-алгоритм. Дано: начальные центры Х1, .
при wj = 1Vi = 1, N
X„
1. Для каждого вектора данных
е{, ...
Ai е Ai,
An } .
АЛ/
найти ближайший центр Ci = arg min L (Aj X< ).
Сформировать k множеств (кластеров) векторов данных, для которых каждый из k центров является бли-
жайшим: NN С:'
{' 4'N}
с,.
j}.
' j = 1, k рассчитать
2. Для каждого кластера Ж" его центр X].
3. Если на шаге 2 значение хотя бы одного из центров поменялось, то перейти к шагу 1.
4. Иначе останов.
В случае задачи к-средних такой алгоритм называется стандартной процедурой к-средних (р-средних).
Для задачи к-средних нахождение нового центра кластера - весьма простая задача:
X «ИЛук=
Здесь |с]'ш'| - мощность множества.
В случае евклидовой метрики центр кластера является решением задачи Вебера [10], его приближенное значение может быть получено с использованием итеративной процедуры Вайсфелда [11; 12]. Для снижения вычислительных затрат на шаге 2 пересчиты-ваются центры лишь тех кластеров, состав которых изменился на шаге 1.
Результат описанного алгоритма зависит от выбора начальных значений центров. Известная процедура к-теаш++ [14] имеет преимущество перед хаотическим выбором начальных центров, гарантируя точность результата 0(^(р)). Тем не менее такая точность может быть неприемлема для многих практически важных задач. В этом случае используются различные техники рекомбинации множеств начальных центров.
Существует множество подходов к оптимизации работы ЛЬЛ-алгоритма, например сэмплинг [14] (решение задачи на случайным образом выбранной части данных и использование результата в качестве начального решения при решении полной задачи), различные потоковые алгоритмы для работы с большими объемами данных [15] и др.
Зависимость результатов ЛЬЛ-алгоритма, как и любой процедуры локального поиска, от заданных начальных значений является серьезной проблемой также и с точки зрения воспроизводимости результатов работы алгоритма классификации: при разных запусках алгоритма, в зависимости от выбора начальных значений центров кластеров, одни и те же векторы данных могут относиться к различным кластерам (в терминологии классификации элементной базы -относиться к различным партиям) либо к одному и тому же кластеру (к одной производственной партии).
Таким образом, требуется разработка алгоритма кластерного анализа, дающего стабильный результат. Иными словами, требуется повышение точности используемого оптимизационного алгоритма.
Превосходные результаты могут быть получены для задач кластерного анализа и классификации с использованием метода Information Bottleneck Clustering -метода «бутылочного горлышка» при кластеризации [16]. Работа данного алгоритма начинается с рассмотрения каждого из векторов данных как отдельного кластера. Затем из системы один за другим удаляются «лишние» кластеры, пока не останется требуемое количество. Каждый раз удаляется кластер, удаление которого дает наименьший прирост суммарного квадратичного расстояния от векторов данных до ближайшего из центров кластеров. Такие алгоритмы чрезвычайно медленные [16]. Некий компромисс представляют собой генетические алгоритмы с жадной эвристикой [17], изначально разработанные для решения p-медианной задачи на сети, в редакции, предложенной в работе [18], могут быть применены для решения непрерывных задач. Идею подхода можно изложить следующим образом [9].
Алгоритм 2. Генетический алгоритм с жадной эвристикой для p-медианной задачи.
Дано: Размер популяции Np.
1. Сформировать (случайным образом или с использованием процедуры k-means++) Np различных
начальных решении х1,
Xn с (1, N},
p Vi -
= 1, N- множеств индексов векторов данных мощности р, используемых в качестве исходных решений ЛЬЛ-алгоритма. Для каждого из начальных решений оценить значение целевой функции (х),
которое здесь и далее вычисляется алгоритмом 3, сохранить значения данной функции в переменных
2. Если достигнуты условия останова, то останов. Решением является начальное решение х * , которому
соответствует наименьшее значение /¡. Для нахождения окончательного решения запускается ЛЬЛ-алгоритм (алгоритм 1).
3. Выбрать случайным образом два индекса к1, к2 е{1, Ж}, к1 ф к2 .
4. Получить промежуточное решение
X c
= X k1 ^ X k2
5. Если |xc> p , то перейти к шагу 7.
6. Вычислить / = argminFfitness(xc \ {j}). Исключить
j из Xc : Xc = X,
\ {j*
1
}. Перейти к шагу 5. 7. Если 3i е (1, N }: хt = Xc, т0 перейти к шагу 2.
8. Выбрать индекс k3 е (1, N }. Выбираются слу-
чайным образом два индекса
Л, > /fc , Т0 k3 =k4, ИНаЧе k3 = k5
k4, k5
: (1, N}, если
9. Заменить хкз и соответствующее значение целевой функции: хк3 = Xс, fh = Ff,tmss (хс). Перейти к шагу 2.
Определение значения целевой функции осуществляется при помощи алгоритма 3ю
Алгоритм 3. Вычисление целевой функции F (х)
fitness '
Дано: начальное решение х . 1. Запустить алгоритм 1 с начальным множеством центров {Ai \i е /}, получить множество центров
X ..., Xp}.
2. Возвратить
= У N w min L(X., A).
¿-¡i=l Je{1,p} \ J' V
значение
F
fitness
(X ) =
Шаг 4 алгоритма 2 порождает промежуточное решение - множество мощности до 2р, из которого последовательно исключаются (шаг 6) элементы до достижения мощности р. При этом на каждой такой итерации требуется количество вычислений функции соответствующее текущей мощности множества - промежуточного решения. В настоящей работе предлагается уменьшить количество центров в промежуточном решении, порождаемом на шаге 4. Одной из идей, применяемых для улучшения результата локального поиска, достигнутого ЛЬЛ-алгоритмом, является замена части центров в решении на случайным образом выбранные векторы данных [18]. В нашем случае добавляем к начальному решению некоторое число элементов другого начального решения, а затем последовательно исключаем центры из начального решения, пока не останется р центров. Количество добавляемых центров выбирается случайным образом. Таким образом, шаг 4 алгоритма 2 приобретает следующий вид:
4.1. С помощью генератора случайных чисел выбрать целое г е {1, р}.
4.2. Из множества хк выбрать случайным обра-
*
зом подмножество хкг мощности г.
4.3. Получить промежуточное решение
*
х с _ х к1 ^ х к2 .
Результаты. В зависимости от класса электронного компонента и от конечного узла, в монтаже которого будет использован данный элемент, применяется различное количество тестов. Так, например, для микросхемы 1526ЛЕ5 были сняты показания 55 измерений, различающихся и размерностью, и измеряемой физической величиной.
Разработанные алгоритмы кластеризации были применены для классификации партий радиоэлектронных изделий по производственным партиям, различающимся условиями производства и, следовательно, характеристиками, измеряемыми при проведении неразрушающих испытаний. Кроме того, данные алгоритмы были применены и для определения количества партий в тестируемом множестве изделий.
Пространство результатов измерений нормируется [19].
Для визуализации результатов измерений и производимой с помощью разработанных алгоритмов классификации тестируемых радиоэлектронных изделий был применен метод MDS (Multi-Dimensional Scaling -многомерное масштабирование [16; 20]) и собственно средства визуализации ELKI [21] и GNUPlot. Данные программные разработки распространяются по лицензии GNU GPL с открытым исходным кодом, что делает их удобными для интеграции в сложные прикладные разработки.
Были использованы 10 сборных партий различных ЭРИ (диоды, стабилитроны, полевые транзисторы, микросхемы), каждая из которых содержала от одной до семи производственных партий, различающихся условиями изготовления. Объемы сборных партий -от 60 до 1250 единиц продукции.
Алгоритмы классификации были запущены для каждой из партий 10 раз с различными значениями параметра к (предполагаемое число кластеров-партий ЭРИ) от 1 до 10.
Результаты разбиения сборной партии микросхемы 1526ЛЕ2 на предполагаемые производственные партии для к от 1 до 4 показаны на рисунке. Результаты разбиения показаны в условном двумерном пространстве (результат процедуры MDS).
Визуально для микросхемы 1526ЛЕ5 можно различить 3 кластера, что соответствует фактически присутствовавшим в сборной партии (всего 825 единиц) экземплярам трех производственных партий.
Результатом работы алгоритмов кластеризации является собственно соответствие номеров единиц продукции в сборной партии и номеров предполагаемых производственных партий, а также суммарный разброс параметров результатов измерений в нормированном пространстве, являющийся целевой функцией алгоритмов. Зависимость данного суммарного разброса от количества предполагаемых производственных партий (т. е. от количества кластеров к) сведены в табл. 1.
Из табл. 1 видно, что для изделия 1526ЛЕ5 значение целевой функции в первой партии изделий (825 единиц изделий) резко падает с ростом к до значения к = 4 (четыре производственных партии). Для второй партии (1132 изделия) такое поведение целевой функции не характерно вследствие того, что данная партия составлена из изделий лишь одной производственной партии. Все результаты получены за время, не превышающее 5 с (данное время было задано как условие останова алгоритма). Для сравнения: обработка данных той же первой партии изделия 1526ЛЕ5 из 825 единиц методом Information Bottleneck Clustering потребовала более 15 мин времени на машине с процессором Intel Xeon с тактовой частотой 2 ГГц при сравнимых по точности результатах. В табл. 2 приведены сравнительные результаты различных методов, примененных для классификации первой партии изделий. Новый алгоритм дает стабильные результаты (минимальный разброс значений) при высокой скорости выполнения расчета.
Таблица 1
Зависимость значения целевой функции (суммарного расстояния до центров кластеров) от числа предполагаемых производственных партий к изделия 1526ЛЕ5
к Партия 1 (сборная) Партия 2 (однородная)
( X ) В % от предыдущего значения ^рпеы ( Х) В % от предыдущего значения
1 84359 - 32984 -
2 53968 63,9 % 29355 89 %
3 37985 70,4 % 27110 92,3 %
4 27329 71,9 % 25320 93,4 %
5 21098 77,2 % 23927 94,5 %
6 19865 94,2 % 22754 95,1 %
7 18952 95,4 % 21821 95,9 %
8 18091 95,5 % 21035 96,4 %
9 17357 95,9 % 20425 97,1 %
10 17021 98,1 % 20078 98,3 %
Разбиение сборной партии микросхемы 1526ЛЕ5 на 1-4 кластера, представляющих предполагаемые производственные партии
Таблица 2
Сравнение результатов различных методов для первой партии изделия 1526ЛЕ5 при к = 4
Алгоритм Число Время Среднее Точность Лучшее Наихудшее Разброс
запусков на 1 запуск, с значение F ( Х ) fitness в сравнении с наилучшим известным значением значение F ( Х ) fitness значение F ) fitness V А* ' значений, %
Information 1 972 27318,1 99,996 % 27317,1 27317,1 -
Bottleneck
k-means++ 30 5 27398,4 99,7 % 27316,9 27416,9 0,37 %
Новый алго- 30 5 27320,1 99,98 % 27316,9 27321,1 0,015 %
ритм
Заключение. Задача классификации поступающих партий электрорадиоизделий по производственным партиям с различными условиями производства на основе данных неразрушающих тестов может быть сведена к задаче кластерного анализа. Применение предложенного в настоящей работе генетического алгоритма с особой эвристикой позволяет решать подобные задачи, получая стабильный результат.
Библиографические ссылки
1. Hamiter L. The History of Space Quality EEE Parts in the United States // ESA Electronic Components Conference, ESTEC, Noordwijk, The Netherlands, 12-16 Nov 1990, ESA SP-313 (March 1991).
2. High Efficiency Digital Cooler Electronics for Aerospace Applications / C. S. Kirkconnell [et al.] // Proc. SPIE 9070, Infrared Technology and Applications XL, 90702Q (June 24, 2014). DOI: 10.1117/ 12.2053075.
3. Федосов В. В., Орлов В. И. Минимально необходимый объем испытаний изделий микроэлектроники на этапе входного контроля // Изв. вузов. Приборостроение. 2011. Т. 54 (4). С. 68-62.
4. Харченко В. С., Юрченко Ю. Б. Анализ структур отказоустойчивых бортовых комплексов при использовании компонент Industry // Технология и конструирование в электронной аппаратуре. 2003. Вып. 2. С. 3-10.
5. Субботин В., Стешенко В. Проблемы обеспечения бортовой космической аппаратуры космических аппаратов электронной компонентной базой // Компоненты и технологии. 2011. Вып. 11. С. 10-12.
6. Tan P.-N., Steinbach M., Kumar V Cluster Analysis: Basic Concepts and Algorithms, Chapter 8 / Introduction to Data Mining. Addison-Wesley, 2006. P. 487-567.
7. MacQueen J. B. Some Methods of Classification and Analysis of Multivariate Observations // Proceedings of the 5th Berkley Symposium on Mathematical Statistics and Probability. 1967. Vol. 1. P. 281-297.
8. Масич И. С., Краева Е. М. Отбор закономерностей для построения решающего правила в логических алгоритмах распознавания // Системы управления и информационные технологии. 2013. Т. 51. Вып. 1.1. С. 170-173.
9. Казаковцев Л. А., Ступина А. А., Орлов В. И. Модификация генетического алгоритма с жадной эвристикой для непрерывных задач размещения и клас-
сификации // Системы управления и информационные технологии. 2014. Вып. 2(56). С. 31-34.
10. Weber A. Uber den Standort der Industrien, Erster Teil: Reine Theorie des Standortes. Tubingen, Mohr, 1922.
11. Weiszfeld E. Sur le point sur lequel la somme des distances de n points donnes est minimum // Tohoku Mathematical Journal. 1937. Vol. 43, No. 1. P. 335-386.
12. Drezner Z. The Fortified Weiszfeld Algorithm for Solving the Weber Problem // IMA Journal of Management Mathematics. 2013. Published online. DOI: 10.1093/imaman/dpt019.
13. Cooper L. Location-allocation problem // Oper. Res. 1963. Vol. 11. P. 331-343.
14. Mishra N., Oblinger D., Pitt L. Sublinear time approximate clustering // 12th SODA. 2001. P. 439-447.
15. StreamKM: A Clustering Algorithm for Data Streams / M. R. Ackermann [et al.] // J. Exp. Algorithmics. 2012. Vol. 17. Article 2.4 (May 2012). Published online. DOI: 10.1145/2133803.2184450.
16. Sun Zh., Fox G., Gu W., Li Zh. A parallel clustering method combined information bottleneck theory and centroid-based clustering // The Journal of Supercomputing. 2014, Vol. 69. Iss. 1. P. 452-467. DOI: 10.1007/s11227-014-1174-1.
17. Alp O., Erkut E., Drezner Z. An Efficient Genetic Algorithm for the p-Median Problem // Annals of Operations Research. 2003. Vol. 122 (1-4). P. 21-42.
18. Neema M. N., Maniruzzaman K. M., Ohgai A. New Genetic Algorithms Based Approaches to Continuous p-Median Problem // Netw. Spat. Econ. 2011. Vol. 11. P. 83-99. DOI: 10.1007/s11067-008-9084-5.
19. Callier F. M. Linear System Theory. New York : Springer-Verlag, 1991. ISBN 0-387-97573-X.
20. Borg J. F. Patrick. Modern Multidimensional Scaling: Theory and Applications. New York : Springer, 2005. P. 207-212.
21. Kriegel H.-P., Kröger P., Zimek A. Outlier Detection Techniques (Tutorial) // 13th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2009). Bangkok, 2009. Retrieved 2010-03-26.
References
1. Hamiter L. The History of Space Quality EEE Parts in the United States//ESA Electronic Components Conference, ESTEC, Noordwijk, The Netherlands, 12-16 Nov. 1990, ESA SP-313 (March 1991).
2. Kirkconnell C. S., Luong T. T., Shaw L.S. et al. High Efficiency Digital Cooler Electronics for Aerospace
Applications. Proc. SPIE 9070, Infrared Technology and Applications XL, 90702Q (June 24, 2014); doi:10.1117/12.2053075
3. Fedosov V. V., Orlov V. I. [Minimum necessary tests of microelectronic devices at a stage of input control]. Izv. VUZov. Priborostroenie, 2011, Vol. 54 (4), P. 68-62 (In Russ.).
4. Kharchenko V. S., Yurchenko Yu. B. [Analysis of structures of fail-safe onboard complexes when using the Industry components]. Tekhnologiya i konstruirovanie v elektronnoi apparature, 2003, Vol. 2, P. 3-10 (In Russ.).
5. Subbotin V., Steshenko V. [Problems of providing the onboard space equipment of spacecrafts with electronic component base]. Komponenty i tekhnologii, 2011, Vol. 11, P. 10-12 (In Russ.).
6. Tan P.-N., Steinbach M., Kumar V Cluster Analysis: Basic Concepts and Algorithms, Chapter 8. Introduction to Data Mining, Addison-Wesley, 2006, P. 487-567.
7. MacQueen J. B. (1967) Some Methods of Classification and Analysis of Multivariate Observations.
Proceedings of the 5th Berkley Symposium on Mathematical Statistics and Probability, 1967, Vol. 1, P. 281-297.
8. Masich I. S., Kraeva E. M. [Selection of the decision rule in logical recognition algorithms]. Sistemy upravleniya i informatsionnye tekhnologii, 2013, Vol. 51 (1.1), P. 170-173 (In Russ.).
9. Kazakovtsev L. A., Stupina A. A., Orlov V. I. [Odification of the Genetic Algorithm with Greedy Heuristic for continuous location and classifying problems]. Sistemy upravleniya i informatsionnye tekhnologii, 2014, No. 2(56), P. 31-34 (In Russ.).
10. Weber A. Uber den Standort der Industrien, Erster Teil: Reine Theorie des Standortes, 1922, Tubingen, Mohr.
11. Weiszfeld E. Sur le point sur lequel la somme des distances de n points donnes est minimum. Tohoku Mathematical Journal, 1937, Vol. 43, No. 1, P. 335-386.
12. Drezner Z. The Fortified Weiszfeld Algorithm for Solving the Weber Problem. IMA Journal of Management Mathematics, 2013, publ. online. DOI: 10.1093/imaman/dpt019.
13. Cooper L. Location-allocation problem. Oper. Res., 1963, Vol. 11, P. 331-343.
14. Mishra N., Oblinger D., Pitt L. Sublinear time approximate clustering. 12th SODA, 2001, P. 439-447.
15. Ackermann M. R. et al. StreamKM: A Clustering Algorithm for Data Streams. J. Exp. Algorithmics, 2012, Vol. 17, Article 2.4 (May 2012), publ. online, DOI: 10.1145/2133803.2184450.
16. Sun Zh., Fox G., Gu W., Li Zh. A parallel clustering method combined information bottleneck theory and centroid-based clustering. The Journal of Supercomputing, 2014, Vol. 69, Is. 1, P. 452-467, DOI: 10.1007/s11227-014-1174-1.
17. Alp O., Erkut E., Drezner Z. An Efficient Genetic Algorithm for the p-Median Problem. Annals of Operations Research, 2003, Vol. 122 (1-4), P. 21-42.
18. Neema M. N., Maniruzzaman K.M., Ohgai A. New Genetic Algorithms Based Approaches to Continuous p-Median Problem. Netw. Spat. Econ., 2011, Vol. 11, P. 83-99, DOI:10.1007/s11067-008-9084-5.
19. Callier, Frank M. (1991). Linear System Theory. New York: Springer-Verlag. ISBN 0-387-97573-X.
20. Borg J. F. Patrick. Modern Multidimensional Scaling:Theory and Applications. New York: Springer, 2005, P. 207-212.
21. Hans-Peter Kriegel, Peer Kröger, Arthur Zimek (2009). Outlier Detection Techniques (Tutorial). 13th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2009) (Bangkok, Thailand). Retrieved 2010-03-26.
© Казаковцев Л. А., Орлов В. И., Ступина А. А., Масич И. С. 2014