УДК 004.827
ПОСТРОЕНИЕ ПРЯМЫХ ХАРАКТЕРИСТИК ОБЪЕКТА ПО ИНТЕРВАЛЬНЫМ ДАННЫМ
И.С. Боровков, В.А. Фатуев
Исследуется проблема решения прикладных задач с неточными или неопределенными данными. Разработан алгоритм построения моделей по интервальным данным. Выполнена программная реализация алгоритма построения прямых статистических характеристик модели. Построена интервальная регрессионная статическая модель.
Ключевые слова: прямые характеристики объекта, интервальные данные, неточные данные, регрессионный анализ.
Для решения некоторых прикладных задач неизбежно использование неточных данных. В ходе решения таких задач результат может меняться в зависимости от принятой модели.
Методика построения прямых характеристик по интервальным данным включает следующие этапы [1,2]:
- определение интервальных данных;
- выбор вида функции;
- расчет области возможных значений коэффициентов;
- проверка гипотезы о нулевом значении интервальных переменных;
- расчет интервала неопределенности сглаживаемой кривой;
- проверка гипотезы об однородности выборочных данных.
Для определения интервалов неопределенности точечных наблюдений может быть использована любая априорная информация, как статистической, так и не статистической природы.
Допустим, что для каждого измерения известна абсолютная или относительная ошибка, зная которую можно представить экспериментальные данные в виде двух интервальных векторов:
[х] = ([х±] ... [х2] ... [хм]);
[у] = (Ы ■■■ Ы ■■■ Ы)-
При этом каждый интервал [х^] или [у^]определяет множество всех возможных значений переменной в данном опыте.
Выбор вида функции при интервальном подходе обусловлен любой функцией, которая проходит через все интервальные наблюдения. Параметры каждой функции из заданного набора рассчитываются методом наименьших квадратов.
Через интервальные наблюдения можно провести множество функций заданного вида, каждая, из которых будет иметь одну и ту же форму,
25
но определяться своим вектором параметров Ь. Множеству всех адекватных моделей соответствует область Ввсех возможных векторов Ь, которая является решением интервальной системы линейных уравнений[1,2]:
В = (b\ Fb = у, F Е [F],y Е [у]}, где Ь - вектор искомых коэффициентов, [F] - матрица интервальных значений базисных функций, [у]-вектор интервальных наблюдений выходной переменной.
При этом вершина Ьг рассчитывается для эксперимента, в котором переменные установлены на своих верхних границах ximax,yimax, а вершина Ь2 - по данным нижних границ ximin,yimin. Векторы коэффициентов
Ь3, Ь4определяются по двум наиболее разнесенным в области переменной у экспериментальным точкам.
Программно-алгоритмическое обеспечение
Входными данными для программной реализации алгоритма являются:
- вектор переменных х;
- вектор наблюдений у;
- относительная или абсолютная ошибка.
Выходным данным будет являться итоговая интервальная функция.
На начальных этапах работы программы рассчитываются информационные матрицы для типовых функций по средним значениям.
Далее методом наименьших квадратов рассчитываются коэффициенты b регрессионной модели. В результате получаются регрессионные модели основных типов, полученные по средним значениям входных данных. Выбирается вид функции, который максимально точно описывает все заданные интервалы. Завершающим этапом будет расчет итоговой функции по описанной выше методике. Блок-схема алгоритма представлена на рис. 1.
По данной блок-схеме было реализовано программное обеспечение для построения регрессионной модели по интервальным данным.Языком для написания программного обеспечения был выбран Python 3.5. Программа выполнена как прикладное приложение. Входные данные поступают в виде текстового файла, выходная полученная модель и графики функций сохраняются в отдельный файл.
Так же при создании программного обеспечения использовались встроенные библиотеки языка Python такие, как:
- numpu - библиотека для работы с многомерными массивами и высокоуровневыми математическими функциями;
- scikit-learn - библиотека для работы с регрессионными моделями;
- pandas - библиотека для обработки и анализа данных.
26
Рис. 1. Блок-схема алгоритма
В табл.1 приведены входные данные для построения модели
Таблица 1
Входные данные программы
Значение х Значение у Относительная Относительная
ошибка х, % ошибка у, %
10 12 5 2
100 14 5 2
500 15.4 5 2
1000 16 5 2
По входным данным были построены регрессионные модели (табл. 2).
Таблица 2
Полученные регрессионные модели
Вид модели Функция
Линейная 12.958 + 0.003 *х
Квадратичная 13.447 + 2.868 * х2
Логарифмическая 10.218 + 1.836 * log(x)
График полученных регрессионных моделей представлен на рис 2.
® Figure 1 -ОХ
О 200 400 600 800 1000
Рис.2. Графики полученных моделей
На рис. 2 наглядно видно, что логарифмическая функция проходит через все интервальные наблюдения, в отличие от линейной или квадратичной. Следовательно, она в представленном наборе функций является адекватной экспериментальным данным.
Далее находятся коэффициенты регрессионной модели по максимальным, минимальным и максимально удаленным точкам эксперимента. Итоговая регрессионная интервальная модель имеет вид
у = [9.96 ... 10.23] + [1.83 ... 2.02] * log (х).
28
Полученная в результате регрессионная интервальная модель адекватно описывает связь междувходными и выходными интервальными данными.
Список литературы
1. Скибицкий Н.В. Интервальные методы в задачах построения моделей объектов и процессов управления: дис. ... д-ра техн. наук. М., 2005. 310 с.
2. Вощинин А.П. Интервальный анализ данных:развитие и перспективы // Заводская Лаборатория, 2002. T. 68. No. 1. С. 118-126.
3. Ляпин Д.С. Программно-математические средства моделирования системных связей на основе анализа интервальных данных: дис. ... канд. техн. наук. М., 2006. 128 с.
4. Шарый С.П. Конечномерный интервальный анализ // Новосибирск: XYZ, 2015. 606 с.
Боровков Иван Сергеевич, бакалавр, ancord71 aigmail. com, Россия, Тула, Тульский государственный университет,
Фатуев Виктор Александрович, д-р техн. наук, проф, vfaliiev a inhox.ru, Россия, Тула, Тульский государственный университет
SOLVING PROBLEMS OF CONSTRUCTING DIRECT CHARACTERISTICS OF OBJECTS ON INTERVAL DATA.
I.S. Borovkov, V.A. Faluev
Explored the problem of solving applied problems with inaccurate or indeterminate data. An algorithm for constructing models on interval data is developed. A software implementation of the algorithm for constructing direct statistical characteristics of the model is performed. An interval regression static model is constructed.
Key words: direct object characteristics, interval data, inaccurate data, regression
analysis.
Borovkov Ivan Sergeevich, bachelor, ancord71 a gmail. com, Russia, Tula, Tula State University,
Fatuev Viktor Alexandrovich, doctor of technical sciences, professor, vfalueva inhox.ru, Russia, Tula, Tula State University