Научная статья на тему 'РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ И АЛГОРИТМОВ ДЛЯ СИСТЕМЫ ПОСТРОЕНИЯ АППРОКСИМИРУЮЩЕГО ПОЛИНОМА'

РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ И АЛГОРИТМОВ ДЛЯ СИСТЕМЫ ПОСТРОЕНИЯ АППРОКСИМИРУЮЩЕГО ПОЛИНОМА Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
30
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
математическая модель / функциональная схема / аппроксимация данных / алгоритмы аппроксимации / по-лином регрессии / аппроксимирующий полином / mathematical model / functional diagram / data approximation / approximation algorithms / regression polynomial / polynomial approximant

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Киселёва Владислава Андреевна, Рыжкова Мария Николаевна

В статье рассмотрен процесс разработки математической модели системы построения аппроксимирую-щего полинома. В качестве исходной модели для построения уравнения был выбран полином пятой сте-пени, который может содержать от 1 до 5 нецелевых факторов. В работе была построена функциональная модель системы, которая содержит в себе такие блоки как: блок предварительной обработки данных; блок отбора признаков при построении уравнения; блок построения аппроксимирующего уравнения на основе метода наименьших квадратов; блок тестирования, который определяет точность построения мо-дели. В основу работы каждого блока были положены алгоритмы, использующие известные методы ана-лиза экспериментальных данных – метод наименьших квадратов и методы корреляционного и регресси-онного анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Киселёва Владислава Андреевна, Рыжкова Мария Николаевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF MATHEMATICAL MODEL AND ALGORITHMS FOR POLYNOMIAL APPROXIMANT ARCHITECTURE

The paper objective is to develop a model and operation algorithms for polynomial approximant architecture to process testing data. Quintic was chosen as the source model to form the equation, which can comprise from 1 to 5 off-target factors. Such a degree is sufficient for a detailed description of behaviour regularities for testing data, degree increase would not result most often in approximation accuracy improvement but it contributes to com-plexity of model development by times. The article describes development of system functional model, which implies a mathematical description of methods to transform system input data into the output one. To implement the functional model there were consecutively reviewed the following: 1) black box" model to define the type of input and output parameters; 2) composition model to define basic data processing units; 3) structural model to define data migration in units; 4) functional model to define operation of individual system units. The following was developed as part of constructing a functional model of the system: 1) data pre-processing algorithms that analyze initial input data for the system, normalize the obtained values, restore missing values, if there are any in selection, find outliers and anomalies in selection values and correct them; 2) when forming an equation feature selection algorithms use methods of correlation analysis to determine factors’ significance in constructing a functional dependence; 3) algorithm to form an approximating equation based on the least-squares method; 4) testing algorithm for the obtained model, which defines model construction accuracy using one of the simplest МАРЕ properties. Model development precedes the development of information system for testing data pro-cessing, which is currently relevant and in demand.

Текст научной работы на тему «РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ И АЛГОРИТМОВ ДЛЯ СИСТЕМЫ ПОСТРОЕНИЯ АППРОКСИМИРУЮЩЕГО ПОЛИНОМА»

DOI УДК 519.711.2

РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ И АЛГОРИТМОВ ДЛЯ СИСТЕМЫ

ПОСТРОЕНИЯ АППРОКСИМИРУЮЩЕГО ПОЛИНОМА

Киселёва Владислава Андреевна

магистрант Муромского института (филиала) ФГБОУ ВО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых».

Рыжкова Мария Николаевна

кандидат технических наук, доцент кафедры физики и прикладной математики Муромского института (филиала) ФГБОУ ВО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых».

E-mail: masmash@mail.ru

Адрес: 602264, Российская Федерация, Владимирская обл., г. Муром, ул. Орловская, д. 23.

Аннотация: В статье рассмотрен процесс разработки математической модели системы построения аппроксимирующего полинома. В качестве исходной модели для построения уравнения был выбран полином пятой степени, который может содержать от 1 до 5 нецелевых факторов. В работе была построена функциональная модель системы, которая содержит в себе такие блоки как: блок предварительной обработки данных; блок отбора признаков при построении уравнения; блок построения аппроксимирующего уравнения на основе метода наименьших квадратов; блок тестирования, который определяет точность построения модели. В основу работы каждого блока были положены алгоритмы, использующие известные методы анализа экспериментальных данных - метод наименьших квадратов и методы корреляционного и регрессионного анализа.

Ключевые слова: математическая модель, функциональная схема, аппроксимация данных, алгоритмы аппроксимации, полином регрессии, аппроксимирующий полином.

Введение

Аналитическое представление экспериментальных данных необходимо и важно, особенно для обеспечения высокой точности проводимых исследований. Аппроксимация данных является одной из задач регрессионного анализа, который стремительно развивается в машинном обучении. Преимущество данного подхода заключается в получении единственной модели, которая полностью опишет множественные взаимные связи между входными и выходными данными, даже в случае нелинейности связи между ними. Аппроксимация распространена в различных областях науки и техники, например, для прогнозирования величин или для фильтрации помех.

Целью научного исследования является разработка модели и алгоритмов работы системы построения аппроксимирующего полинома для обработки экспериментальных данных.

В качестве исходной модели для построения

уравнения выберем полином пятой степени, который может содержать от 1 до 5 нецелевых факторов. Такая степень достаточна для полного описания закономерностей поведения экспериментальных данных, увеличение степени чаще всего не приводит к увеличению точности аппроксимации, зато на порядок увеличивает сложность построения модели.

Для достижения поставленной цели, требуется выполнить следующие задачи:

- изучить предметную область исследования;

- выбрать алгоритмы предварительной обработки данных;

- выбрать алгоритм построения аппроксимирующего полинома;

- описать способ вычисления оценки точности аппроксимации;

- разработать функциональную модель системы.

В ходе разработки системы используются

■■■ Х5, ___ У1. У2. Уз_

Y *

Рис. 1. Модель «Чёрный ящик»

известные методы обработки экспериментальных данных, описанные в работах [1-10].

Разработка функциональной модели

При разработке информационной системы начинают в первую очередь с разработки её модели и алгоритмов работы. Опишем разработку функциональной модели системы, которая подразумевает математическое описание способов преобразования входной информации системы в выходную [11].

Для реализации функциональной модели необходимо последовательно разработать:

1) модель «чёрный ящик» для определения вида входных и выходных параметров;

2) модель состава для определения основных блоков обработки данных;

3) структурную модель для определения перемещения данных в блоках;

4) функциональную модель для определения работы отдельных блоков системы.

Модель типа «черный ящик» (рис. 1) предполагает описание взаимодействия системы с пользователем. Для этого в модели показаны данные, которые поступают на входы системы, и выходные данные, которые выводятся пользователю в качестве результата работы. На вход

Х-|, X;, ... X;,,

системы подаётся набор экспериментальных данных, который может содержать 1-5 нецелевых факторов X и одно значение отклика У.

Выходными данными системы являются: у1 — аппроксимирующее уравнение в виде полинома 5-ой степени; у2 — значение точности работы системы в процентах; у3 — рекомендация для пользователя.

На рис. 2 представлена модель состава системы, которая включает в себя основные блоки обработки экспериментальных данных.

На рис. 3 основное внимание уделено перемещению данных внутри системы. Таким образом, получаем модель структуры, которая содержит не только основные блоки, но и взаимосвязи между ними.

Перейдём к математическому описанию преобразования данных, в результате чего получим функциональную модель системы (рис.

4).

Опишем каждый из блоков полученной функциональной модели.

К1 — блок предварительной обработки данных:

• К11 — разбиение входного набора на обучающую (80%) и тестовую (20%) выборки;

• К12 — предварительная обработка данных:

- К^ — нормирование обучающей выборки;

- К12 — восстановление пропущенных

значений;

Блок предварительной обработки данных Блок отбора признаков

Блок вычисления коэффициентов аппроксимирующего уравнения Блок тестирования полученной математической модели

Уч. У:. Уз

Рис. 2. Модель состава

- К12 — поиск

аномалий и замена их на медианное значение. К2 — блок отбора признаков:

• К21 — вычисление матрицы корреляции;

• К22 — поиск линейной зависимости между нецелевыми факторами и откликом.

У? У:5

Рис. 3. Модель структуры

Кз — блок вычисления коэффициентов аппроксимирующего уравнения:

• К31 — применение метода наименьших квадратов для вычисления коэффициентов аппроксимирующего уравнения:

- Кз^ — составление системы уравнений по предварительно обработанным данным;

Кз^ — нормирование системы

уравнений;

Кз1 — решение системы методом

Гаусса;

• К32 — переход от нормированных коэффициентов и вычисление свободного члена и составление аппроксимирующего уравнения.

П<

Х-), Х2, ... Хб, У

1 80% I

КЦ

20%

К12

т

К-122

Кт 2э

К,

«21

к22

Кл

т +

М1,

^412

42

^31,

и

<312

т:

<31,

к

32

У1

У2

Уз

Рис. 4. Функциональная модель

К4 — блок тестирования, полученной математической модели:

• К41 — вычисление точности, которое заключается в подстановке нецелевых факторов из тестовой выборки в полученную математическую модель для вычисления теоретического значения отклика, которое после сравнивается с экспериментальным значением отклика;

• К42 — оценка математической модели, а именно вывод рекомендации для пользователя если значение точности менее 90%.

Описание алгоритмов обработки данных в системе

Среди алгоритмов работы системы выделим наиболее важные:

- алгоритмы предварительной обработки данных, которые анализируют исходные данные, поступающие в систему, нормализуют полученные значения, восстанавливают пропущенные значения, если таковые присутствуют в выборке, находят выбросы и аномалии в значениях выборки и корректируют их;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- алгоритмы отбора признаков при построении уравнения используют методы корреляционного анализа для установления значимости факторов при построении функциональной зависимости;

- алгоритм построения аппроксимирующего уравнения на основе метода наименьших квадратов;

- алгоритм тестирования полученной модели, который определяет точность построения модели с помощью одной из простейших характеристик МАРЕ.

1. Блок предварительной обработки данных К1 выполняет предварительный отбор и предобработку данных. Эта процедура необходима в силу высокой чувствительности регрессионной модели к вариациям входного набора данных.

В подблоке К11 генеральная совокупность делится на обучающую и тестовую выборки,

80% данных передаются в подблок К12, а 20% в блок тестирования модели К4.

В подблоке К12 обучающая выборка предварительно обрабатывается.

Кщ — нормирование обучающей выборки.

Для нормирования данных стоит выполнить преобразование:

А =-

А " Р

s

(1)

где р — среднее значение признака; 5 — среднее квадратичное отклонение.

Среднее квадратичное отклонение вычисляется по формуле:

1

s = .

TZ (pi - p)2, 1 i=1

(2)

где п — количество значений признака.

К12 — восстановление пропущенных значений.

Пропуски могут возникать по разным причинам, и есть различные решения обхода данной проблемы. Можно заменить пустое значение на «0», моду или медиану фактора, а также можно избавиться от проблемы путём удаления строки или столбца, в котором был найден пропуск. Данные подходы могут значительно повлиять на качество аппроксимации, поэтому стоит применить более действенный метод.

Для вычисления пропущенного значения нужно взять линейную комбинацию со значениями признака, тогда формула для восстановления данных выглядит так:

1 » P(A )

P( A) = , 1

1 i=i ,

(3)

z

X А, А,)'

"г р( А, А,)

где р( А, А,) — расстояние от объекта с пропущенным значением до другого объекта; Р( А.)

— значение признака объекта.

Расстояние между объектами можно вычислить при помощи максимальной метрики:

р(р,Q) = max{p - Р2 - q2\,..\pn - qn

n

К12 — поиск аномалий и замена их на медианное значение.

Выбросы — это измерения, лежащие аномально далеко от результатов общей выборки. Подобные явления негативно влияют на результат аппроксимации. Для определения более точной функциональной зависимости между данными необходимо исключить выбросы из выборки.

Первым шагом в данном анализе является упорядочивание исходного набора данных по возрастанию, и вычисление в нём медианы (значение, делящее выборку пополам). Пусть имеется ряд значений с количеством элементов п, тогда в случае нечётного количества элементов медианой является значение, стоящее ровно в середине выборки:

М = х

П +1 •

2

(5)

Если выборка содержит чётное количество элементов, медиана вычисляется по формуле:

Хп+1 + Хп-1

Ме = 2 2 2 . (6)

Верхний Ql и нижний Q2 квартили вычисляются подобно медиане. Для этого выборка делится пополам и находятся медианы полученных рядов. Диапазон между квартилями вычисляется как:

в=е2 - е1. (7)

Важнейший этап нахождения выбросов, это определение внешних границ выборки. Внешние границы — это отрезок, который включает все значения ряда, не являющиеся выбросами, координаты которого вычисляются по формулам:

Ох = - 3Д (8)

= + зВ. (9)

Все значения из набора данных, которые не входят в интервал \01, 02 ], считаются выбросами.

Таким образом, алгоритм определения выбросов в данных:

- упорядочить данные по возрастанию;

- вычислить медиану упорядоченного ряда;

- найти нижний квартиль упорядоченного ряда;

- найти верхний квартиль упорядоченного ряда;

- вычислить диапазон между квартилями;

- найти внешние границы набора данных;

- выявить выбросы в данных;

- заменить выбросы на медиану данного ряда;

- повторить алгоритм для каждого фактора.

2. Блок отбора признаков.

Одной из важнейших задач обработки данных, является анализ зависимостей между анализируемыми величинами. Для многих явлений характерно, что существующие связи «размыты» под влиянием случайных факторов. Для установления взаимосвязи между факторами и применяют корреляционный анализ.

К21 — вычисление матрицы корреляции.

Для вычисления выборочного коэффициента корреляции необходимо знать ковариацию и дисперсию выбранных признаков:

соув (X, У) = ТУ - ХУ, (10)

где соук(Х,У) — выборочная ковариация между факторами X и У; X — нецелевой признак; У — результативный признак;

В (X) = X2 - X

(11)

где Ве (X) — дисперсия выбранного фактора.

Тогда коэффициент корреляции между выбранными факторами:

соув (X ,У)

г (X,У) = -

(12)

(X) • Ве (У) "

Матрица корреляции для 5-ти нецелевых и 1-го целевого признаков:

1 Г ^2,^)

Я =

Г (Xl,X2) 1

Г (XI,Xз) ^ (,Xз)

Г (XI, X 4) г (, X4)

Г (XI, X5) Гв (^^2, X5)

Гв (XI, У) Гв (X 2, У)

Гв (Xl,У )>

Г (X 2 , У)

Гв (Xз,У) Гв (X 4 , У ) Гв (X5 , У ) 1

(13)

К22 — поиск линейной зависимости между нецелевыми факторами и откликом.

Коэффициент корреляции определяет количественную оценку тесноты функциональной связи. Будем определять коэффициент корреляции как между откликом и нецелевыми факторами, так и между самими нецелевыми факторами. Это позволит убрать из дальнейшего исследования те нецелевые факторы, связь между которыми линейна, а также те факторы, которые не влияют на отклик.

Факторы, которые необходимо исключить:

- если г (Хп, ) > 0,7 то один из нецелевых факторов нужно исключить;

- если г (Хп,У) < 0,3, то нецелевой фактор нужно исключить.

3. Блок составления аппроксимирующего уравнения

После того, как обучающая выборка предварительно обработана, а факторы не имеющие зависимости исключены, можно приступать к процедуре составления аппроксимирующего полинома.

Метод регрессионного анализа использует описание объекта исследования в виде некоторого полинома — отрезка ряда Тейлора, в который разлагается неизвестное уравнение связи отклика объекта У и входных факторов X. Необходимо использовать полином такой формы, который включает в себя все возможные сочетания факторов:

к к р ^ Х2,...Хк) = Д, + + X 5х<х, +

i=1

i=1,j>i

k

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ Z ß xx x +... +

Z_i " jq • j q

i=1,j >i,q>j

k k

i=1 i=1

к

+ Z \ ßiiiii Xi , i=1

(14)

где р(х,х2,..хк) — отражение неизвестной функции истинного отклика; х, х2 ,...хА — входные факторы; 5— коэффициенты, являющиеся

др

производными вида — ; к — количество вход-

дх1

ных факторов; д — номера входных факторов.

Число входных факторов может быть от одного до пяти для одного значения функции, тогда на переменную к накладывается ограничение 1 < к < 5, к е %, где Ъ — множество целых чисел.

Так как по числу факторов математическая модель объекта исследования не всегда является полной, что делает отклик (соответствующее значение у для входных факторов) случайной величиной, поэтому зависимость р(х, х2, ...хк) не даёт точной связи между у и

х. В связи с этим 5 необходимо заменить выборочными коэффициентами, которые и необходимо найти. Тогда уравнение (14) примет вид:

Л = b0 +Z b'X + Z bPX'Xj +

кз

i=1,j >i к

(15)

+

Z ь>Х +...+Z b

m i i

5

iiiiiXi ,

где Ь — выборочные коэффициенты; у — значение отклика.

В подблоке К31 применяется метод наименьших квадратов для вычисления коэффициентов аппроксимирующего уравнения.

К31 — составление системы уравнений по

предварительно обработанным данным.

Чтобы приступить к обработке по методу наименьших квадратов необходимо составить систему уравнений, число строк в которой будет соответствовать числу строк обучающей выборки:

b1X11 +... + bkXk1 + ... + b11x121 + ... + bkkkkkx« = Уг, b1X12 + ... + bkXk2 + ... + b12X12 + ... + bkkkkkXk2 = У2 ,

(16)

Лх18 +...+ьле +...+Кх1е +...+ьшмх1 = уе,

где g — это номер строки обучающей выборки.

i=1

Кз1 — нормирование системы уравнений.

Процедура преобразования системы в нормальный вид состоит из двух шагов. На первом необходимо каждое уравнение из системы (16) умножить на множитель при коэффициенте Ьо (в данном случае множитель равен 1). Второй шаг заключается в суммировании каждого уравнения полученной системы сверху вниз. В итоге получим одно уравнение, которое будет являться первым для системы нормальных уравнений:

X х1У=Ь1X х12 +...+ьк X х1 хк +... +

+Ь12 X х12х2 + ... + К Xх1 хк + ... + (17) +¿11111 Xх1 + ... +Ьккккк .

Следующим шагом станет умножение каждого уравнения исходной системы (16) на множитель при Ь1 (первое уравнение системы умножаем на хц, второе на Х12, g-ое на х^). Снова суммируем полученные уравнения сверху вниз, получая при этом второе уравнение системы нормальных уравнений. Процедура продолжается для всех Ь, тем самым формируются остальные уравнения нормальной системы. По итогу в сформированной системе число уравнений соответствует числу коэффициентов в исходном полиноме.

Система нормальных уравнений для полинома, которая совместна и минимизирует отклонения, будет иметь следующий вид:

X ху=Ь1X х12+...+ък X х1 хк +... +

+Ь12 X х12 х2 + ... + Ькк X х1

х + ... +

хк,

+Ь11111 X х1 + ... +Ьккккк X х1х5

X х2 У = Ь1 X х1 х2 + ... + Ьк X х2 хк + ... +

+Ь12 X х1 х22 + ... + Ькк X

+Ь11111 X х1 х2 + ... +Ьккккк X х2 хк ,

х2 хк + ... +

5

(18)

Xх5 у=Ь1X х1 х+...+к Xх6+... + +Ь12 X х1 х2хк+...+ькк X хк +... + +Й11111X х х5+... +Ьккк X х10.

Кз1 - решение системы методом Гаусса.

Нормированная система является линейной, следовательно, её можно решить методом Гаусса, который заключается в последовательном исключении неизвестных из уравнений системы. Для решения системы (18) необходимо найти расширенную матрицу.

Правая часть системы (18) — это произведение матрицы на вектор коэффициентов Ь. Обозначим их как ^ и В соответственно и выделим, тогда:

^ =

' X х2 X х х

X хх

X х12. X х1:

X х1 хк ^ X

хх

'2 хк

и

X \ х1 (18)

¿1

X х

в =

-'12

V ¿ккккк У

(20)

Левая часть системы (18) — это вектор

суммы парных произведений:

л

У =

X х1У X х2 у

(21)

vX хку у

Тогда расширенная матрица для системы (18): _

А = (^|У). (22)

Для решения системы (18) нужно провести

элементарные преобразования с матрицей А :

- изменить порядок строк (что соответствует изменению порядка уравнений);

- умножить строки на любые отличные от нуля числа (что соответствует умножению соответствующих уравнений на эти числа);

- прибавить к любой строке расширенной матрицы любую другую её строку, умножен-

ную на любое число (что соответствует прибавлению к одному из уравнений системы другого уравнения, умноженного на это число).

После выполнения элементарных преобразований получается система, равносильная исходной, матрица которой приведена к ступенчатому виду. Далее записывается новая система линейных уравнений, соответствующая матрице ступенчатого вида. Начиная с последнего уравнения, находится решение для данной системы. В результате решения получаем набор нормированных коэффициентов Ь, которые и являются коэффициентами полинома регрессии (15).

В подблоке К32 выполняется переход от нормированных коэффициентов и вычисление свободного члена. Для вычисления исходных коэффициентов аппроксимирующего уравнения необходимо вычислить среднее квадратичное отклонение по формуле (2) для каждого произведения факторов х при коэффициентах Ь в уравнении (15).

Формула перехода от нормированных коэффициентов:

ь = 5-1-. (23)

Формула вычисления свободного члена:

ь0 = у - ь1 х1 - ... - ькхк - ... -

b11111 X5 ... bkkkkkxk

x5.

(24)

Далее полученные коэффициенты 5 подставляются в исходное уравнение (14) и таким образом, составляется аппроксимирующий полином, который выводится пользователю.

4. Блок тестирования полученной модели.

Блок К4 отвечает за тестирование полученной математической модели. В подблоке К41 вычисляется средняя абсолютная ошибка в процентах.

К 41 — вычисление теоретических значений

у на основе подстановки нецелевых факторов из тестовой выборки в полученный аппроксимирующий полином.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

К 41 — вычисление средней абсолютной

ошибки в процентах.

Оценка качества построенной математической модели осуществляется по формуле:

MAPE = - Z

У - У '

•100%,

(25)

" 1=1 \УА

где МАРЕ — средняя относительная ошибка, выраженная в процентах; п — объём тестовой выборки; у — истинное значение целевого

признака; у

полученное значение целе-

вого признака.

В подблоке К42 полученное значение МАРЕ сравнивается с пороговым значением «10%», которое наиболее часто используется экспертами при оценке точности регрессионной модели. Если ошибка превышает этот уровень, то делается вывод о некорректном наборе данных.

Заключение

В результате исследований была разработана модель работы системы для построения аппроксимирующего полинома пятой степени для количества нецелевых факторов от 1 до 5.

При разработке модели системы были использованы известные методы обработки экспериментальных данных. При этом были получены алгоритмы для предварительной обработки, которые обеспечивают анализ исходных данных, поступающих в систему, нормализацию полученных значений, восстановление пропусков, если таковые присутствуют в выборке, выявление выбросов и аномалий в выборке и их коррекцию. Разработанные алгоритмы отбора признаков используют методы корреляционного анализа для установления значимости факторов при построении функциональной зависимости. В основу построения блока аппроксимирующего уравнения были положены метод наименьших квадратов и алгоритм тестирования полученной модели

Литература

1. Бердыше в В.И., Петрак Л.В. Аппроксимация функций, сжатие численной информации, приложения. Екатеринбург: УрО РАН, 1999. 296 с.

2. Стрижов В.В. Методы индуктивного порождения регрессионных моделей. М.: ВЦ РАН. 2008

3. Овчинников А.В., Красночуб Е.К., Бронштейн В.М. Обработка экспериментальных данных методом наименьших квадратов [Электронный ресурс] // Вестник СГАУ. 2009. №3. URL: https://cyberleninka.ru/artirie/n/obrabotka-eksperimentalnyh-dannyh-metodom-naimenshih-kvadratov-1 (дата обращения: 15.10.2022).

4. Овчинников А.В., Красночуб Е.К., Бронштейн В.М. Обработка экспериментальных данных методом наименьших квадратов [Электронный ресурс] // Вестник СГАУ. 2010. №2. URL: https:// cyberleninka.ru/artirie/n/obrabotka-eksperimentalnyh-dannyh-metodom-naimenshih-kvadratov (дата обращения: 21.10.2022).

5. Ивановский Р.И. Обработка экспериментальных данных энергетических объектов как начальный этап их моделирования [Электронный ресурс] // Информатика, телекоммуникации и управление. 2010. №2 (97). URL: https ://cyberleninka. ru/article/n/ obrabotka-eksperimentalnyh-dannyh-energeticheskih-obektov-kak-nachalnyy-etap-ih-modelirovaniya (дата обращения: 20.10.2022).

6. Усмонов М. Метод наименьших квадратов [Электронный ресурс] // Science and Education. 2021. №7. URL: https ://cyberleninka.ru/artide/ n/metod-naimenshih-kvadratov-1 (дата обращения: 30.10.2022).

7. Лукьянов В.Д. О построении интерполяци-онно-аппроксимационного многочлена // Наноси-стемы: физика, химия, математика. 2012. №6. С. 515.

11. Рыжкова М.Н. Универсальная модель образовательной системы: кибернетический подход // Вестник РГРТУ. 2015. №53. С. 99-105.

12. Рыжкова М.Н., Кутарова Е.И. Когнитивное моделирование результатов образовательной деятельности студентов радиотехнического направления подготовки // Радиотехнические и телекоммуникационные системы. 2016. №2. С. 79-86.

13. Рыжкова М.Н., Кутарова Е.И. Модель процесса обучения студентов радиотехнического направления подготовки дисциплинам естественнонаучного цикла // Радиотехнические и телекоммуникационные системы. 2017. №2. С. 68-73.

Поступила 30 октября 2022 г.

English

DEVELOPMENT OF MATHEMATICAL MODEL AND ALGORITHMS FOR POLYNOMIAL APPROXIMANT ARCHITECTURE

Vladislava Andreyevna Kiselyova — Master's Degree Student, Murom Institute (branch) "Vladimir State University named after A.G. and N.G. Stoletovs".

Maria Nikolayevna Ryzhkova — PhD, Associate Professor, Associate Professor of Department of Physics and Applied Mathematics, Murom Institute (branch) "Vladimir State University named after A.G. and N.G. Stoletovs".

E-mail: masmash@mail.ru

Address: 602264, Russian Federation, Vladimir region, Murom, Orlovskaya st., 23.

Abstract: The paper objective is to develop a model and operation algorithms for polynomial approximant architecture to process testing data. Quintic was chosen as the source model to form the equation, which can comprise from 1 to 5 off-target factors. Such a degree is sufficient for a detailed description of behaviour regularities for testing data, degree increase would not result most often in approximation accuracy improvement but it contributes to complexity of model development by times. The article describes development of system functional model, which implies a mathematical description of methods to transform system input data into the output one. To implement the functional model there were consecutively reviewed the following: 1) black box" model to define the type of input and output parameters; 2) composition model to define basic data processing units; 3) structural model to define data migration in units; 4) functional model to define operation of individual system units. The following was developed as part of constructing a functional model of the system: 1) data pre-processing algorithms that analyze initial input data for the system, normalize the obtained values, restore missing values, if there are any in selection, find outliers and anomalies in selection values and correct them; 2) when forming an equation feature selection algorithms use methods of correlation analysis to determine factors' significance in constructing a functional dependence; 3) algorithm to form an approximating equation based on the least-squares method; 4) testing algorithm for the obtained model, which defines model construction accuracy using one of the simplest МАРЕ properties. Model development precedes the development of information system for testing data processing, which is currently relevant and in demand.

Keywords: mathematical model, functional diagram, data approximation, approximation algorithms, regression polynomial, polynomial approximant.

References

1. Berdyshev V.I., PetrakL.V. Approximation of functions, compression of numerical information, applications. Ekaterinburg: Ural Branch of the Russian Academy of Sciences, 1999. 296 p.

2. Strizhov V. V. Methods of inductive generation of regression models. Moscow: VTs RAN. 2008

3. Ovchinnikov A.V., Krasnochub E.K., Bronstein V.M. Processing of experimental data by the least squares method [Electronic source]. Vestnik SSAU. 2009. No. 3. URL: https://cyberleninka.ru/article/n7obrabotka-eksperi-mentalnyh-dannyh-methodom-naimenshih-kvadratov-1 (Access date: 15.10.2022).

4. Ovchinnikov A.V., Krasnochub E.K., Bronstein V.M. Processing of experimental data by the least squares method [Electronic source]. Vestnik SSAU. 2010. No. 2. URL: https://cyberleninka.ru/article/n/obrabotka-eksperi-mentalnyh-dannyh-methodom-naimenshih-kvadratov (Access date: 21.10.2022).

5. Ivanovsky R.I. Processing of experimental data of power facilities as the initial stage of their modeling. Informatics, telecommunications and management [Electronic source]. 2010. No. 2 (97). URL: https ://cyberleninka. ru/ar-ticle/n/obrabotka-eksperimentalnyh-dannyh-energeticheskih-obektov-kak-nachalnyy-etap-ih-modelirovaniya (Access date: 20.10.2022).

6. Makhsud Tulqin Ogli Usmonov. Method of least squares. Science and Education [Electronic source]. 2021. No. 7. URL: https ://cyberleninka. ru/article/n/method-naimenshih-kvadratov-1 (Access date 30.10.2022).

7. Lukyanov V.D. On the construction of an interpolation-approximation polynomial. Nanosystems: physics, chemistry, mathematics. 2012. No. 6. Pp. 5-15.

11. Ryzhkova M.N. Universal model of the educational system: a cybernetic approach. Bulletin of the Russian State Technical University. 2015. No. 53. Pp. 99-105.

12. RyzhkovaM.N., Kutarova E.I. Cognitive modeling of the results of educational activity of students of the radio engineering direction of training. Radio engineering and telecommunication systems. 2016. No.2. pp. 79-86.

13. Ryzhkova M.N., Kutarova E.I. Model of the process of teaching students of the radio engineering direction of training disciplines of the natural science cycle. Radioengineering and telecommunication systems. 2017. No. 2. Pp. 68-73.

i Надоели баннеры? Вы всегда можете отключить рекламу.