УДК 303.717
Б01: 10.24412/2071-6168-2024-4-226-227
ПАРАЛЛЕЛЬНЫЙ АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИ СГЛАЖИВАНИЯ ЭКСПЕРИМЕНТАЛЬНЫХ ЗАВИСИМОСТЕЙ ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ
Е.А. Добрынина, Е.В. Ларкин, М.Б. Цудиков
Предложен метод решения задачи сглаживания экспериментальных зависимостей по методу наименьших квадратов. В рамках предложенного метода производится разработка алгоритма для минимизации случайной составляющей, которая появляется при погрешности измерений сигналов. Описан разработанный параллельный алгоритм, основанный на распараллеливании вычислительных операций для обеспечения быстродействия при обработке экспериментальных данных. Произведен анализ производительности метода.
Ключевые слова: параллельный алгоритм, экспериментальные данные, сеть Петри, кластерный способ распараллеливания, многопроцессорная обработка.
Производственные испытания объектов являются одним из важных этапов разработки изделий и постановки их на производство [1]. Одна из задач эксперимента - это определение реальных характеристик объекта, то есть анализ их значений в зависимости от различных параметров и сравнение их с требованием технического задания. Для определения характеристик в процессе проведения эксперимента задаются значения сигналов, подаваемых на объект, и измеряются их величины, которые характеризуют состояния объекта. Вследствие погрешности измерений из-за наличия шумов в измерительных каналах во входном и выходном сигнале кроме регулярной составляющей, определяемой физикой процесса в изделии, присутствует случайная составляющая, влияние которой на результат эксперимента, необходимо уменьшить. Для уменьшения влияния случайных факторов на результаты эксперимента осуществляется набор экспериментальных данных как по входным, так и выходным сигналам и сглаживание статистических данных по методу наименьших квадратов [2,9] .
Статистические данные, которые используются для сглаживания экспериментальных прямых, представляют собой массивы значительных объемов: массив входных воздействий X = {л},..., хп,..., хN} и массив значений состояния объекта У = {у1,..., уп,..., yN} [3]. Значения х, и уг ложатся на некоторую параметрическую кривую у = ф(х,) с ошибкой [6]:
£ = Е(Уг -Ф( Х)) .
г=1
При минимизации производные от ошибки по параметрам принимают вид:
дф(х,, а1,..., aj,...., а£)
Е (Угхг, а}ак ))
г=1
да
= 0, } = 1,...,к .
(1)
(2)
Выражение (2) представляет собой систему из к уравнений с к неизвестными, решение которой дает параметрическую кривую, наилучшим образом соответствующую статистическим данным [4]. В частном случае (р(хг) представляет собой прямую линию
у = ах + Ь, (3)
где а и Ь параметры, которые необходимо определить.
Дифференцирование по параметрам а и Ь дает следующую систему линейных уравнений:
Е[у, - (ахг + Ь)]х =0;
г=1
п
(4)
Е[у, - (ах, + Ь)] = 0.
г=1
Решение системы имеет вид:
гЕх,У, -Ехг ЕУг
г=1
г=1 г=1
(5)
п Е хг -
г=1
Е х
V г=1
Ь =
п п п п
Е х Е Уг -Е хг Е хгУг
г=1 г=1 г=1 г=1
2
п Е х -
2
(6)
г=1 Vг=1 У
Алгоритм расчета параметров а и Ь показан на рисунке 1.
Алгоритм состоит из двух частей. Первая часть циклическая. Она реализует накопление сумм г1 23 , г4 с использованием счетчика г. Вторая часть линейная [10]. Она реализует расчет числителей (25 , 26 ) в зависимостях (5), (6), знаменателя (27 ) и расчет собственно параметров а и Ь. Два последовательных цикла представляются сетью Петри, показанной на рисунке 2.
а
х
^ Начало ^
Z5 = nZ3-Z1 Z2 I
Z6 = Z2Z4-Z1 Z3 I
Z7 * = «Z4-Z1 Z1
* a:= z5/z7 I
b:= z6/z7
i
^ Конец ^
Рис. 1. Последовательный алгоритм сглаживания экспериментальных кривых
d5,9 d6,10 d7,11
d4t+1,4t+5
d4n-11, 4n-7 d4„-10, 4n-6 d4n-9,4n-5
d4n-6,4n-2
Рис. 2. Сеть Петри, представляющая циклическую часть алгоритма сглаживания экспериментальных кривых: а - начало сети; б - середина сети; в - конец сети
Линейная часть алгоритма представляется сетью, показанной на рисунке 3. Позиции в сети Петри моделируют выполнение операторов алгоритма, а переходы - переключение из предыдущего оператора в следующий. Дуги сети определяют передачу данных между операторами (d...) или передачу управления (с...).
Последовательное преобразование сети в параллельную структуру показано на рисунке 4.
Аналогичное преобразование циклической части дает параллельный алгоритм, структура которого приведена на рисунке 5.
Таким образом, модель параллельных вычислений представляет собой четыре независимых цепочки, начинающиеся в позициях 1, 2, 3, 4 соответственно. По физическому смыслу цепочка позиций 1-5-9-...-(4n-3) моде-
n n
лирует последовательное накопление суммы ^xt , цепочка 2-6-10-...- (4n-2) - накопление суммы ^yt ; цепочка 3-
i=1 i=1 227
б
7-11-...-(4п-1) - суммы ^х2 , а цепочка 4-8-12-...-4п моделирует накопление - суммы ^х^у^ . По временной вы-1=1 1=1
п п
числительной сложности эти цепочки неравнозначны. На накопление сумм ^ х^ и ^ у тратится гораздо меньше
1=1 1=1
п 2 п
времени, чем на накопление сумм ^ х^ и ^ х^ у^ , поскольку при накоплении сумм элементов массива тратится
1=1 1=1
Т единиц машинного времени, а на накопление сумм произведений и возведений в квадрат - т^+ТП единиц машинного времени. Для команд формата регистр-регистр
тЕ = 4т ; тп = 20т, (7)
где т - период сигнала частоты процессора (физическое время).
0 ф0,1
Рис. 3. Сеть Петри, моделирующая линейную часть алгоритма
¿2,5
" '5
ф0
А.1 ф0,1
1
2,3,4
¿2,5 ф3,5
0 ф0,1
ф0,3 ф0,2
ф
0,1
<7>
Ч2> О
1,2,3,4
к0>|
d2,5, ф3,5
И2Н
d1,4, ф3,4
Рис. 4. Последовательное преобразование (а, б) алгоритма в параллельную модель (в)
Пусть обработка результатов эксперимента проводится на четырехпроцессорной МГМБ-ЭВМ. При параллельном представлении алгоритма, показанном на рисунке 5 массив объемом п точек обрабатывается за
Т = (тЕ+тп)п = 24тп (8)
пп
единиц времени, причем 20тпп = Тпп ед. времени процессоры, производящие расчет ^ х^ и ^у1 , будут проста-
1 =1 1 =1
ивать.
В целом отношение суммарного времени простоя к общему процессорному времени, затрачиваемому на решение задачи, равно
а
5
б
5
Е =
2 ТП
4(т1+тп)
(9)
¿0,4 4 ¿4,8 8 ¿6,10 12 ¿12,16 "^С^У* "К12)"*
¿0,3 3 ¿3,7 7 ¿7,11 11 ¿1115
"К!!)-*
¿0,2 2 ¿2,6 6 ¿6,10 10 ¿1014
¿4п-8,4п-4 а4п-4,4п
4п-9,4п-5 ¿4и-5а4и-1 ¿4я-10,4я-6 ¿4п-6,4п-2
1 1 ¿1,5 5 «5,9 9 ¿913
Ч4п-6,
4п-2>
<4я-11,4я-7 "4п-7,4п-3
Ч4п-7;
4п-3
б
Рис. 5. Параллельная сеть Петри, моделирующее начало (а) и конец (б) циклической части алгоритма
п
Другой способ решения задачи - это формирование кластеров, в которых вычисляются тетрады - Е х,
г=1
пп
Еу, , Е х , Е х,у, (смотри рисунок 6).
г=1 г=1 г=1
Рис. 6. Кластерный способ распараллеливания
Каждый кластер обрабатывается в течение времени 4г% + 2тп . Количество подобных кластеров равно п. В четырехпроцессорной ЭВМ общее время обработки равно примерно
Т = |тЕ+ "2"ГП \п = 14тп . 229
0
Отношение суммарного времени простоя к общему процессорному времени, затрачиваемому на решение задачи, равно нулю.
Выигрыш по времени по сравнению с предыдущей схемой равен 41,7%.
Таким образом, приведенные исследования показывают, что при сглаживании экспериментальных кривых целесообразно применение параллельной обработки данных. Из двух возможных реализаций расчета параметров линейного сглаживания более эффективным является кластерный метод [8], который обеспечивает повышенное быстродействие при обработке экспериментальных данных.
Список литературы
1.ГОСТ Р 15.301-2016. Система разработки и постановки продукции на производство. Продукция производственно-технического назначения. Порядок разработки и постановки продукции на производство. М.: Стандар-тинформ, 2018. 12 с.
2.Задорина Н.А. Обработка экспериментальных данных на ЭВМ. Учебное пособие. Рыбинск: РГАТА, 2009.
100 с.
3.Радченко С.Г. Устойчивые методы оценивания статистических моделей. К.: ПП «Санспарель», 2005.
504 с.
4.Дайнтбегов Д.М., Калмыкова О.В., Черепанов А.И. Программное обеспечение статистической обработки данных: Учебное пособие. М.: Финансы и статистика, 1984. 192 с.
5.Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия = Applied Regression Analysis. 3-е изд. М.: «Диалектика», 2007. 912 с.
6.Фёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа = Methoden der Korrelation - und Regressiolyns analyse. М.: Финансы и статистика, 1981. 302 с.
7.Захаров С.И., Холмская А.Г. Повышение эффективности обработки сигналов вибрации и шума при испытаниях механизмов // Вестник машиностроения. М.: Машиностроение, 2001. № 10. С. 31-32.
8.Радченко С.Г. Методология регрессионного анализа. К.: «Корнийчук», 2011. 376 с.
9. Лоусон Ч., Хенсон Р. Численное решение задач методом наименьших квадратов. М.: Наука, 1986. 232 с.
10. Отнес Р., Эноксон Л. Прикладной анализ временных рядов. М.: Мир, 1982. 427 с.
Добрынина Елизавета Андреевна, студент, dobryninaeliZaveta2021@gmail. com, Россия, Тула, Тульский государственный университет,
Ларкин Евгений Васильевич, д-р техн. наук, профессор, elarkin@mail. ru, Россия, Тула, Тульский государственный университет,
Цудиков Михаил Борисович, канд. техн. наук, доцент, [email protected], Россия, Тула, Тульский государственный университет
SMOOTHING EXPERIMENTAL DEPENDENCE PROBLEM SOLVING BASED ON ORDINARY LEAST SQUARES METHOD PARALLEL ALGORITHM
E.A. Dobrynina, E.V. Larkin, M.B. Tsudikov
Smoothing experimental dependence problem solving based on ordinary least squares method is offered. Developing an algorithm for random component minimiZation caused by measurement inaccuracy is executed. Parallel algorithm based on computing operation paralleling for upping the speed of experimental data processing is described. Method efficiency is analyZed.
Key words: parallel algorithm, measured data, Petri net, cluster type, multiprocessing.
Dobrynina EliZaveta Andreeveta, student, dobryninaeliZaveta2021@gmail. com, Russia, Tula, Tula State University,
Larkin Eugene Vasylyevich, doctor of technical science, professor, [email protected], Russia, Tula, Tula State
University,
Tsudikov Mikhail Borisovich, candidate of technical sciences, docent, tsudickov. mb@yandex. ru, Russia, Tula, Tula State University