Научная статья на тему 'АЛГОРИТМЫ ОНЛАЙН СППР ДЛЯ ВЫБОРА ЗАКОНА РАСПРЕДЕЛЕНИЯ ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ'

АЛГОРИТМЫ ОНЛАЙН СППР ДЛЯ ВЫБОРА ЗАКОНА РАСПРЕДЕЛЕНИЯ ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ Текст научной статьи по специальности «Математика»

CC BY
86
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
СППР / многокритериальный выбор / случайная величина / закон распределения / статистическая обработка данных / DSS / multi-criteria selection / random variable / distribution law / statistical data processing

Аннотация научной статьи по математике, автор научной работы — Ивлева Анна Игоревна, Смирнов Сергей Викторович

Рассматривается задача создания онлайн системы поддержки принятия решений (СППР) при выборе двухпараметрического закона распределения непрерывной, положительно определенной случайной величины с конечным вторым моментом. Приводятся алгоритмы и сценарии работы системы. При этом основным приоритетом является ориентированный на практическое применение и критерии пользователя подход, позволяющий при минимальной информации выбирать наиболее соответствующий конкретному исследованию вид закона распределения из конечного множества заданных моделей. В основе предлагаемого алгоритма выбора закона распределения случайных величин лежит естественная факторизация пространства эмпирических характеристик — математического ожидания и среднеквадратического отклонения. Для наглядного сравнения законов распределения используются плотности распределения, значения параметров и дифференциальной энтропии; графики плотностей, функций распределений и интенсивностей отказов; диаграммы рассеяния; таблица метрик. Для ранжирования законов распределения предлагаются следующие простые, интуитивно понятные для пользователя (инженера, экономиста, биолога и др.), ориентированные на решение практических задач критерии: максимизация дифференциальной энтропии распределения, максимизация соответствия эмпирическим квантилям, максимизация соответствия эмпирическим моментам третьего и более порядков, наличие или отсутствие аналитически заданной функции восстановления, характер функции интенсивности, возможность разложения на экспоненциальные фазы. Разрабатываемая СППР может применяться в комбинации с другими существующими методами выбора закона распределения случайной величины.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ONLINE DSS ALGORITHMS FOR SELECTING THE DISTRIBUTION LAW OF A POSITIVELY DEFINED RANDOM VARIABLE

The problem of making online DSS for selecting a two-parametric distribution law of a continuous positively defined random variable with a finite second moment is considered. These RVs are very important for describing such parameters of real systems as distances, time intervals, value deviations, reliability characteristics, economic indices etc. Algorithms and scenarios of the system operation are given. The main priority is a practical application-oriented approach to selection of the most appropriate type of distribution law out of a finite set of models. The approach is based on usable criteria and is applicable in case of small datasets. The proposed algorithm for selecting the distribution law of random variables is based on a natural factorization of the space of empirical characteristics — the average and mean standard deviation. In exponential mode, if the average and mean standard deviation are close, the exponential distribution is suggested. In hyperexponential mode (mean standard deviation is greater than the average), the following distributions are proposed as models of a random variable: hyperexponential distribution of a special type, Weibull distribution, gamma distribution, lognormal distribution, inverse Gaussian distribution. For hvpoexponential mode (the average is greater than mean standard deviation), the following distributions are offered: hvpoexponential distribution, Erlang distribution, Weibull distribution, gamma distribution, lognormal distribution, left truncated normal distribution, inverse Gaussian distribution. If the average is divisible by mean standard deviation, Erlang distribution is used instead of hvpo-exponential distribution, and gamma distribution, which degenerates into a special case of a discrete parameter, coincides with the Erlang distribution. Special importance and attention are given to two-phase hyperexponential distribution of a special type, proposed by one of the co-authors of this article, and hvpoexponential distribution with two types of phases. These are convenient models for approximating two-parameter distributions of positively defined random variables. The advantages of these distributions are: requirement of two parameters only; existence and uniqueness of the solution of the system of moment equations for hyperexponential distribution of a special type; explicit solution of the system of moment equations for hvpoexponential distribution; the physical meaning of the RV distributed according to hyperexponential distribution is the sojourn time in two parallel connected states with exponential distribution laws; the physical meaning of the RV distributed according to hvpoexponential distribution is the sojourn time in a series-coupled states with exponential distribution laws; explicit analytical view of the restoration function. Distribution parameters are determined by numerical solution of systems of equations using functions of python libraries. To effectively search for solutions of systems of equations, the initial parameter values are selected adaptively using the equation root localization procedure. The online calculation system is being developed in Python using the Dash framework and is a convenient tool for modeling random variables, their distributions, and characteristics for engineers and economists. The advantages of the developed automated online system are interactive intuitive interface; availability without software installation; ability to save graphic elements as files; minimal set of statistically reliable and intuitive input data; ability to visually compare different models of random variables by means of various criteria. The input data block enables the user to upload a file with statistical data. Output forms are: RV distributions and characteristics (densities, parameters, entropies); graphs of densities, distribution functions, and failure rates; scattering diagrams; the table of metrics with quantitative difference estimation for pairs of distributions. These characteristics are applied to visually compare the distribution laws. The block of multi-criteria ranking of distribution laws is applied to rank the distribution laws. The following simple and intuitive criteria, focused on solving practical problems, are proposed for a user (engineer, economist, biologist, etc.): maximization of the differential entropy, fitting empirical quantiles, fitting empirical moments of higher orders, the presence or absence of analytically defined restoration function, the behaviour of the intensity function, the possibility of decomposition into exponential phases. The significance of these six criteria is determined by the user by assigning them to one of the four groups of significance: very important, important, slightly important, ignore. Quantification of these fuzzy assessments into criteria weight coefficients can be done by the method of Piyavsky S. A. Then the multi-criteria problem is to be solved by reducing it to a linear convolution with the criteria weight coefficients obtained. Herewith, each distribution is assigned the number of points (from 1 to N, where N is the size of distribution set according to the natural factorization of the space of empirical characteristics) due to predefined rules. Some additional data are to be specified by user. They are the number of higher-order moments, the number of quantiles, the behavior of the failure rate function (monotonic; non-monotonic (break-in character); other) if respective criteria are taken into account. The DSS can be applied in combination with other existing methods for selecting the distribution law of a random variable.

Текст научной работы на тему «АЛГОРИТМЫ ОНЛАЙН СППР ДЛЯ ВЫБОРА ЗАКОНА РАСПРЕДЕЛЕНИЯ ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ»

ONLINE DSS ALGORITHMS FOR SELECTING THE DISTRIBUTION LAW OF A POSITIVELY DEFINED RANDOM

VARIABLE

A. Ivleva, S. Smirnov

Samara Federal Research Scientific Center RAS, Institute for the Control of Complex Systems RAS 443020, Samara, Russia

DOI: 10.24412/2073-0667-2021-2-15-25

The problem of making online DSS for selecting a two-parametric distribution law of a continuous positively defined random variable with a finite second moment is considered. These RVs are very important for describing such parameters of real systems as distances, time intervals, value deviations, reliability characteristics, economic indices etc. Algorithms and scenarios of the system operation are given. The main priority is a practical application-oriented approach to selection of the most appropriate type of distribution law out of a finite set of models. The approach is based on usable criteria and is applicable in case of small datasets.

The proposed algorithm for selecting the distribution law of random variables is based on a natural factorization of the space of empirical characteristics the average and mean standard deviation. In exponential mode, if the average and mean standard deviation are close, the exponential distribution is suggested. In hvperexponential mode (mean standard deviation is greater than the average), the following distributions are proposed as models of a random variable: hvperexponential distribution of a special type, Wcibull distribution, gamma distribution, lognormal distribution, inverse Gaussian distribution. For hvpoexponential mode (the average is greater than mean standard deviation), the following distributions are offered: hvpoexponential distribution, Erlang distribution, Wcibull distribution, gamma distribution, lognormal distribution, left truncated normal distribution, inverse Gaussian distribution. If the average is divisible by mean standard deviation, Erlang distribution is used instead of hvpo-exponcntial distribution, and gamma distribution, which degenerates into a special case of a discrete parameter, coincides with the Erlang distribution. Special importance and attention are given to two-phase hvperexponential distribution of a special type, proposed by one of the co-authors of this article, and hvpoexponential distribution with two types of phases. These are convenient models for approximating two-parameter distributions of positively defined random variables. The advantages of these distributions are: requirement of two parameters only; existence and uniqueness of the solution of the system of moment equations for hvperexponential distribution of a special type; explicit solution of the system of moment equations for hvpoexponential distribution; the physical meaning of the RV distributed according to hvperexponential distribution is the sojourn time in two parallel connected states with exponential distribution laws; the physical meaning of the RV distributed according to hvpoexponential distribution is the sojourn time in a series-coupled states with exponential distribution laws; explicit analytical view of the restoration function. Distribution parameters are determined by numerical solution of systems of equations using functions of python libraries. To effectively search for solutions of systems of equations, the initial parameter values are selected adaptivelv using the equation root localization procedure. The online calculation system is being developed in Python using the Dash framework and is a convenient tool for modeling random

© A. Ivleva, S. Smirnov, 2021

variables, their distributions, and characteristics for engineers and economists. The advantages of the developed automated online system are interactive intuitive interface; availability without software installation; ability to save graphic elements as files; minimal set of statistically reliable and intuitive input data; ability to visually compare different models of random variables by means of various criteria.

The input data block enables the user to upload a file with statistical data. Output forms are: RV distributions and characteristics (densities, parameters, entropies); graphs of densities, distribution functions, and failure rates; scattering diagrams; the table of metrics with quantitative difference estimation for pairs of distributions. These characteristics are applied to visually compare the distribution laws. The block of multi-criteria ranking of distribution laws is applied to rank the distribution laws. The following simple and intuitive criteria, focused on solving practical problems, are proposed for a user (engineer, economist, biologist, etc.): maximization of the differential entropy, fitting empirical quantiles, fitting empirical moments of higher orders, the presence or absence of analytically defined restoration function, the behaviour of the intensity function, the possibility of decomposition into exponential phases. The significance of these six criteria is determined by the user by assigning them to one of the four groups of significance: very important, important, slightly important, ignore. Quantification of these fuzzy assessments into criteria weight coefficients can be done by the method of Pivavskv S. A. Then the multi-criteria problem is to be solved by reducing it to a linear convolution with the criteria weight coefficients obtained. Herewith, each distribution is assigned the number of points (from 1 to N, where N is the size of distribution set according to the natural factorization of the space of empirical characteristics) due to predefined rules. Some additional data are to be specified by user. They are the number of higher-order moments, the number of quantiles, the behavior of the failure rate function (monotonic; non-monotonic (break-in character); other) if respective criteria are taken into account. The DSS can be applied in combination with other existing methods for selecting the distribution law of a random variable.

Key words: DSS, multi-criteria selection, random variable, distribution law, statistical data processing.

References

1. Baranova A. A., Selvaninov A. A., Vihareva E.V. Kriterij dostovernosti vvbora zakona raspredeleniva pri modelirovanii processa biologicheskoj destrukcii // Matematicheskoe modelirovanie v estestvennvh naukah. Perm': Izd. Permskogo nacional'nogo issledovatel'skogo politekhnicheskogo universiteta, 2015. T. 1. S. 512-514.

2. Ponomarev V. P., Beloglazov I. Yu. K vvboru zakona raspredeleniva vremeni na remont neftvanvh skvazhin // Problemv ekonomiki i menedzhmenta. 2015. N 5 (45). S. 1 ID 1 13.

3. Duplvakin V. M., Knvazheva Yu. V. Vvbor zakona raspredeleniva vhodnogo potoka zavavok pri modelirovanii sistemv massovogo obsluzhivaniva torgovogo predprivativa // Vestnik SGAU. 2012. N 6 (37). S. 102-109.

4. Pushkareva L. A., Pushkareva T. A. Vvbor i obosnovanie analiticheskogo zakona raspredeleniva skorosti vetra v udmurtskoj respublike diva proektirovaniva vetroustanovki. // Teoreticheskie i prakticheskie aspektv razvitiva nauchnoj mvsli v sovremennom mire: sbornik statej Mezhdunarodnoj nauchno-prakticheskoj konferencii (Samara, 8 oktvabrva 2017g.). Ufa, 2017. S. 67-71.

5. Panov K.V. Vvbor zakonov raspredeleniva potoka zavavok i prostoev lokomotivov na obsluzhivanii v depo // Innovacionnve proektv i tekhnologii v obrazovanii, promvshlennosti i na transporte: sbornik trudov nauchnoj konferencii (Omsk, 8 fevralva 2019 g.). Omsk: Izd. Omskogo gosudarstvennogo universiteta putej soobshcheniva, 2019. S. 227 233.

6. Linec G.I., Nikulin V. I., Mel'nikov S.V. Vvbor kriteriva identifikacii zakona raspredeleniva sluchajnvh velichin transionosfernvh kanalov svvazi / / XLIV Akademicheskie chteniva po kosmonavtike, posvvashchennve pamvati akademika S.P. Korolvova i drugih vydavushchihsva

otechestvennvh uchenvh — pionerov osvoeniva kosmicheskogo prostranstva: sbornik tezisov (Moskva, 28-31 vanvarva 2020 g.). M.: Izd. Moskovskogo gosudarstvennogo tekhnicheskogo universiteta im. N. E. Baumana, 2020. S. 254-256.

7. Akimov S.S. Problema vvbora metoda vosstanovleniva zakona raspredeleniva verovatnosti // MNIZh. 2014. N 1-3 (20). S. 5-8.

8. Tvrsin A.N. Metod podbora nailuchshego zakona raspredeleniva neprervvnoj sluchajnoj velichinv na osnove obratnogo otobrazheniva // Vestnik YuUrGU. Seriva: Matematika. Mekhanika. Fizika. 2017. N 1. S. 31-38.

9. Smirnov S.V. Modelirovanie „sverhneregulyarnvh" sluchajnvh velichin po eksperimental'nym dannvm. // Avtomatizaciva nauchnvh issledovanij: Mezhvuz. sb. nauchn. trudov. Kujbvshev: KuAI, 1988. S. 52^57.

10. Kovalenko A. I., Smirnov S.V. Sravnenie gipereksponencial'nogo raspredeleniva s drugimi modelvami polozhitel'no opredelennvh sluchajnvh velichin // Infokommunikacionnve tekhnologii. Samara, 2019. Tom 17, N 1. S. 9-16.*

11. Ivleva A., Smirnov S. Comparison of Models of Positively Defined Random Variables // XXI International Conference Complex Systems: Control and Modeling Problems (CSCMP). Samara, 2019. P. 449-454.

12. Bladt M., Nielsen B.F. Matrix-Exponential Distributions in Applied Probability (Probability Theory and Stochastic Modelling 81). Springer: Science+Business Media LLC, 2017.

13. Rvzhikov Yu.I., Ulanov A. V. Primenenie giper-eksponencial'noj approksimacii v zadachah rascheta nemarkovskih sistem massovogo obsluzhivaniva // Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika. 2016. N 3. S. 60^65.

14. Bajhel't F., Franken M. Nadezhnost' i tekhnicheskoe obsluzhivanie. Matematicheskij podhod. M.: Radio i svvaz', 1988.

15. Kalashnikov V. V., Rachev S.T. Matematicheskie metodv postroeniva stohasticheskih modelej obsluzhivaniva. M.: Nauka, 1988.

16. Himenko V. I. Sluchajnve dannve: struktura i analiz. M.: TEHNOSFERA, 2018.

17. Pivavskij S.A. Metod universal'nvh koeflicientov pri prinvatii mnogokriterial'nvh reshenij // Ontologiva proektirovaniva. 2018. t. 8. N 3(29). S. 449-468. DOI: 10.18287/2223-9537-2018-8-3-449468.

18. Pivavskij S.A. Kak „numerizovat"' ponvatie „vazhnee" // Ontologiva proektirovaniva. 2016. T. 6, 34 (22). S. 414-435. DOI: 10.18287/2223-9537-2016-6-4-414-435.

АЛГОРИТМЫ ОНЛАЙН СППР ДЛЯ ВЫБОРА ЗАКОНА РАСПРЕДЕЛЕНИЯ ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННОЙ

СЛУЧАЙНОЙ ВЕЛИЧИНЫ

А. И. Ивдева, C.B. Смирнов

Самарский федеральный исследовательский центр РАН, Институт проблем управления сложными системами РАН, 443020, Самара, Россия

УДК 51-37

DOI: 10.24412/2073-0667-2021-2-15-25

Рассматривается задача создания онлайн системы поддержки принятия решений (СППР) при выборе двухпараметричеекого закона распределения непрерывной, положительно определенной случайной величины с конечным вторым моментом. Приводятся алгоритмы и сценарии работы системы. При этом основным приоритетом является ориентированный на практическое применение и критерии пользователя подход, позволяющий при минимальной информации выбирать наиболее соответствующий конкретному исследованию вид закона распределения из конечного множества заданных моделей. В основе предлагаемого алгоритма выбора закона распределения случайных величин лежит естественная факторизация пространства эмпирических характеристик математического ожидания и ереднеквадратичеекого отклонения. Для наглядного сравнения законов распределения используются плотности распределения, значения параметров и дифференциальной энтропии; графики плотностей, функций распределений и интенеивноетей отказов; диаграммы рассеяния; таблица метрик. Для ранжирования законов распределения предлагаются следующие простые, интуитивно понятные для пользователя (инженера, экономиста, биолога и др.), ориентированные на решение практических задач критерии: максимизация дифференциальной энтропии распределения, максимизация соответствия эмпирическим квантилям, максимизация соответствия эмпирическим моментам третьих) и более порядков, наличие или отсутствие аналитически заданной функции восстановления, характер функции интенсивности, возможность разложения на экспоненциальные фазы. Разрабатываемая СППР может применяться в комбинации с другими существующими методами выбора закона распределения случайной величины.

Ключевые слова: СППР, многокритериальный выбор, случайная величина, закон распределения, статистическая обработка данных.

Введение. Необходимость выбора теоретического закона распределения случайной величины (СВ) но экспериментальным данным подтверждается большим количеством публикаций но данной тематике |1-6|. Они охватывают постановки практических задач из самых различных отраслей науки и техники. Наличие аналитической модели случайного фактора важно дня описания различного рода систем, процессов, поскольку позволяет определять, прогнозировать и оптимизировать важные характеристики. Кроме того, законы распределения являются входными данными при построении имитационных моделей в современных системах расчетов (MatLab, Any Logic, ScilnTech и др.). В настоящее время

(с) А. И. Ивлева, С. В. Смирнов, 2021

существует множество подходов к решению задачи подбора теоретического распределения СВ. Обзоры большинства из них можно найти в [7, 8]. Основными недостатками упомянутых подходов являются:

1, Неоднозначность и субъективность результата по нескольким причинам: а) несколько распределений могут не противоречить нулевой гипотезе; б) выбор распределения зависит от критерия согласия; в) чувствительность результата к выбираемой длине интервала группировки данных,

2, Необходимость достаточно большой выборки данных или наличия априорной информации о форме распределения при малых выборках,

3, Сложность адекватного выбора и оценки эффективности методики обработки статистических данных для инженеров, экономистов, биологов и др.

В настоящей работе рассматривается задача создания интерактивной СППР при выборе двухпараметричеекого закона распределения непрерывной, определенной на положительной полуоси СВ. Эти СВ являются крайне важными для описания таких параметров реальных систем как расстояния, временные интервалы, отклонения от заданного значения, характеристики надежности, прочности, экономические показатели и др. При этом основным приоритетом является ориентированный на практическое применение и критерии пользователя подход, позволяющий при минимальной информации выбирать наиболее соответствующий потребностям конкретного исследования вид закона распределения из конечного множества заданных моделей, В основу СППР положены существующие простые, интуитивно понятные для пользователя количественные и качественные критерии, степень важности которых пользователь сможет настраивать самостоятельно, учитывая необходимость нахождения компромисса между точностью модели и ее конструктивностью (вычислимостью),

1. Сценарий и алгоритм работы СППР при выборе закона распределения. Сценарий работы СППР при выборе закона распределения СВ можно описать следующим образом.

Действующее лицо: пользователь.

Цель: сравнение и ранжирование законов распределения на основе имеющихся у пользователя статистических данных.

Предусловия: пользователь открыл \vob-ci раннпу СППР,

Главная последовательность:

1) Пользователь загружает файл со статистическими данными,

2) Система вычисляет математическое ожидание и среднеквадратическое отклонение с интервалами доверия; список распределений, их параметры, значения диференциальных энтропий; графики функций распределений, плотностей распределений, интенсивностей распределений, функций восстановления; окна диаграмм рассеяния с возможностью выбора из выпадающего списка распределения на каждой оси; таблицу метрик распределений; окно выбора групп важности критериев и ввода дополнительных параметров,

3) Пользователь выбирает пару законов распределения на осях диаграммы рассеяния,

4) Система автоматически выводит диаграмму рассеяния для выбранных распределений,

5) Пользователь выбирает в выпадающих списках для каждого из 6 критериев выбора закона распределения группу важности и дополнительные параметры по некоторым критериям.

6) Система выдает пользователю рекомендацию по выбору закона распределения СВ; при необходимости пользователь может открыть справку о генезисе данной рекомендации.

Альтернативная последовательность:

В случае, если введенные пользователем данные соответствуют экспоненциальному распределению, система выведет математическое ожидание и среднеквадратическое отклонение с интервалами доверия; список распределений, их параметры, значения дифе-ренциальных энтропий; графики функций распределений, плотностей распределений, ин-тенсивностей распределений, функций восстановления; рекомендацию по применению экспоненциального распределения без окна многокритериального выбора.

Алгоритм сравнения и ранжирования законов распределения, который лежит в основе разрабатываемой СППР, представлен на рис, 1, Вывод 1 содержит экспоненциальное распределение; параметр распределения; значение дифференциальной энтропии; графики функции распределения, плотности распределения, интенсивности распределения, функции восстановления; рекомендация по применению экспоненциального распределения, Вывод 2 содержит список распределений для гипер- или гипоэкспоненциального случая; параметры распределений; значения дифференциальной энтропии; графики функций распределения, плотности распределения, интенсивности распределения, функции восстановления; таблицу метрик,

1,1, Определение множества распределений и параметров законов распределения. Для определения множества законов распределений, которые на следующих этапах алгоритма будут сравниваться и ранжироваться, используется естественная факторизация пространства эмпирических характеристик — математического ожидания (МО) М > 0 и ереднеквадратичеекого отклонения (СКО) О > 0, Соответственно такой факторизации предлагается три основных набора законов распределений,

1) Экспоненциальный случай. Ситуация, когда математическое ожидание и СКО близки, |М — О| < е (е — малое число, заданное по умолчанию) моделируется экспоненциальным распределением,

2) Гиперэкспоненциальный случай. Когда СКО больше математического ожидания, т. е, О > М + е, в качестве моделей СВ предлагаются следующие распределения [9]: — гиперэкспоненциальное распределение специального вида; — распределение Вейбулла-Гнеденко; — гамма-распределение; — логарифмически нормальное распределение; — обратное распределение Гаусса,

Двухфазное гиперэкспоненциальное распределение специального вида впервые предложено одним из соавторов данной статьи в [10] как способ аппроксимации двухпарамет-рических распределений положительно определенных СВ, Его свойства исследовались в [11, 12], Преимуществами данного распределения являются:

- двухпараметричноеть (в отличие от хорошо изученного в [13, 14] гиперэкспоненциального распределения общего вида, для применения которого необходимо минимум три параметра);

- существование и единственность решения системы уравнений моментов для гиперэкспоненциального режима [10];

- смысл распределенной по данному закону СВ — время пребывания системы в двух параллельно связанных состояниях, время пребывания в каждом из которых распределено по экспоненциальному закону;

- явный аналитический вид функции восстановления.

Рис. 1. Алгоритм сравнения и ранжирования законов распределения

За.) Гипоэкепоненциальный случай, М не кратно D. Когда математическое ожидание больше СКО, т. е. М > D + е, в качестве моделей СВ предлагаются следующие распределения [9]: — гипоэкепоненциапьное распределение; — распределение Вейбулла-Гнеденко; — гамма-распределение; — логарифмически нормальное распределение; — усеченное слева нормальное распределение; — обратное распределение Гаусса,

Гипоэкепоненциальное распределение с фазами двух типов удобно для аппроксимации двухпараметричееких распределений положительно определенных СВ, Смысл распределенной по данному закону СВ — время пребывания системы в последовательно связанных состояниях, время пребывания в каждом из которых распределено по экспоненциальному закону: n — 1 фаз с одной интенсивностью и 1 фаза — с другой интенсивностью. Распределение имеет три параметра, для определения которых достаточно двух эмпирических характеристик,

36.) Гипоэкепоненциальный случай, М кратно D, Гипоэкепоненциальное распределение применимо, если М не кратно D, В противном случае используется распределение Эрланга с однотипными фазами. Остальные распределения в таком случае сохраняются, кроме гамма-распределения, которое вырождается в частный случай и совпадает с распределением Эрланга,

— алгоритм локализации корней уравнений методом равномерного поиска;

— расчет корней систем уравнений моментов функцией fsolveQ из библиотеки seipv (Python);

— в случае неединственности решения — выбор по критерию максимизации близости плотности данного распределения к среднему арифметическому плотностей распределений, для которых система уравнений моментов имеет единственное решение,

1,2, Сравнение и многокритериальное ранжирование законов распределения. Для количественного и визуального сравнения законов распределения из выбранного набора в СППР используются:

— графики плотностей, функций распределения, интенеивноетей и функций восстановления;

— аналитические метрики [15];

— диаграммы рассеяния [16].

Многокритериальная задача выбора наиболее подходящего распределения решается с помощью подхода, развитого Пиявским С, А, [17]. Важность приведенных шести критериев определяется пользователем путем отнесения к одной из четырех групп важности: очень важен, важен, не очень важен, не учитывать. Перевод данных нечетких оценок важности критериев пользователем в весовые коэффициенты важности критериев позволяет осуществить методика из [18]. Далее многокритериальная задача решается сведением к линейной свертке отдельных критериев. При этом каждому распределению ставится в соответствие количество баллов (от 1 до N, где N — количество возможных распределений для данного случая согласно естесвенной факторизации пространства эмпирических характеристик) по правилам из таблицы (столбец „Способ ранжирования распределения"). Дополнительные данные, которые указывает пользователь, отражены в последнем столбце таблицы.

Выводы, Приведенные алгоритмы и сценарии составляют основу интерактивной онлайн СППР при выборе закона распределения положительно определенной случайной величины. По нашему мнению, такая СППР может стать удобным для пользователей (инженеров, экономистов, биологов и др.) инструментом моделирования случайных

Таблица

Способ многокритериального выбора закона распределения случайной величины

№ Критерий выбора распределения Уровень важности критерия (определяется пользователем)

1. М акси мизация о очень важен

д ифференци аль- о важен

ной о не очень важен

энтропии о не учитывать

2. М акси мизация о очень важен

соответствия о важен

эмпирическим о не очень важен

моментам более о не учитывать

высокого

порядка

3. М акси мизация о очень важен

соответствия о важен

эмпирическим о не очень важен

квантилям о не учитывать

4. Наличие о очень важен

аналитически о важен

заданной о не очень важен

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

функции о не учитывать

восстановления

5. Характер о очень важен

функции о важен

интенсивности о не очень важен

о не учитывать

6. Возможность о очень важен

разложения на о важен

экспоненциаль- о не очень важен

ные о не учитывать

фазы

Способ ранжирования распределения

Дополнительная информация (предоставляет пользователь)

от 1 до N баллов по возрастанию значения дифференциальной энтропии

от 1 до N баллов по убыванию значения эвклидовой нормы разностей моментов, расчи-танных по данным и по законам распределений

от 1 до N баллов по убыванию значения эвклидовой нормы разностей уровней квантилей, расчитанных по данным и по законам распределений 1 балл — при отсутствии аналитически заданной

функции восстановления;

N/2 балла — при наличии трудновычислимой аналитически заданной функции восстановления; N баллов — при наличии аналитически заданной функции восстановления.

В случае выбора монотонного характера функции интенсивности: 1 балл — распределения с немонотонной функцией интенсивности; N баллов — распределения с монотонной функцией интенсивности. В случае выбора немонотонного характера функции интенсивности (с учетом приработки): наоборот. В случае выбора другого характера функции интенсивности: N/2 балла — все распределения.

N баллов — при возможности разложения на экспоненциальные фазы; 1 балл — при невозможности разложения на экспоненциальные фазы.

Выбор количества учитываемых моментов

Выбор количества и значения учитываемых

квантилей

Выбор желаемого характера функции интенсивности: монотонный; немонотонный (с учетом приработки); другой

величин, их распределений и характеристик. Преимущества системы — интуитивно понятный интерфейс; доступность без установки программного обеспечения; возможность сохранения графических элементов в виде файлов; минимальный набор статистически надежных, интуитивно понятных входных данных; возможность наглядного адаптивного сравнения законов распределения случайных величин по разным критериям. В основе

СППР лежат существующие количественные и качественные критерии, степень важности которых пользователь сможет настраивать самостоятельно, учитывая необходимость нахождения компромисса между точностью модели и ее конструктивностью (вычислимостью), Стоит отметить, что, если есть подозрение на распределение с тяжелым хвостом, следует воспользоваться другими специальными методиками для выбора распределения.

Список литературы

1. Баранова A.A., Селянинов A.A., Вихарева Е. В. Критерий достоверности выбора закона распределения при моделировании процесса биологической деструкции // Математическое моделирование в естественных науках. Пермь: Изд. Пермского национального исследовательского политехнического университета, 2015. Т. 1. С. 512—514.

2. Пономарев В. П., Белоглазов И.Ю. К выбору закона распределения времени на ремонт нефтяных скважин // Проблемы экономики и менеджмента. 2015. № 5 (45). С. 140—143.

3. Дуплякин В. М., Княжева Ю. В. Выбор закона распределения входного потока заявок при моделировании системы массового обслуживания торгового предприятия // Вестник СГАУ. 2012. № 6 (37). С.102—109.

4. Пушкарева Л. А., Пушкарева Т. А. Выбор и обоснование аналитического закона распределения скорости ветра в удмуртской республике для проектирования ветроустановки // Теоретические и практические аспекты развития научной мысли в современном мире: сборник статей Международной научно-практической конференции (Самара, 8 октября 2017 г.). Уфа: Общество с ограниченной ответственностью „Аэтерна", 2017. С. 67—71.

5. Панов К. В. Выбор законов распределения потока заявок и простоев локомотивов на обслуживании в депо // Инновационные проекты и технологии в образовании, промышленности и на транспорте: сборник трудов научной конференции (Омск, 8 февраля 2019 г.). Омск: Изд. Омского государственного университета путей сообщения, 2019. С. 227—233.

6. Липец Г. П., Никулин В. П., Мельников C.B. Выбор критерия идентификации закона распределения случайных величин трансионосферных каналов связи // XLIV Академические чтения по космонавтике, посвященные памяти академика С. П. Королева и других выдающихся отечественных ученых — пионеров освоения космического пространства: сборник тезисов (Москва, 28—31 января 2020 г.). М.: Изд. Московского государственного технического университета им. Н.Э. Баумана, 2020. С. 254-256.

7. Акимов С. С. Проблема выбора метода восстановления закона распределения вероятности // МНИЖ. 2014. № 1 3 (20). С. 5^8.

8. Тырсин А. И. Метод подбора наилучшего закона распределения непрерывной случайной величины на основе обратного отображения // Вестник ЮУрГУ. Серия: Математика. Механика. Физика. 2017. № 1. С. 31 ЗК.

"

тальным данным // Автоматизация научных исследований: Межвуз. сб. научн. трудов. Куйбышев: КуАИ, 1988. С. 52^57.

10. Коваленко А. П., Смирнов С. В. Сравнение гиперэкспоненциального распределения с другими моделями положительно определенных случайных величин // Инфокоммуникационные технологии. Самара, 2019. Том 17, № 1. С. 9—16.

11. Ivleva A., Smirnov S. Comparison of Models of Positively Defined Random Variables // XXI International Conference Complex Systems: Control and Modeling Problems (CSCMP). Samara, 2019. P. 449^454.

12. Bladt M., Nielsen B.F. Matrix-Exponential Distributions in Applied Probability (Probability Theory and Stochastic Modelling 81). Springer: Science+Business Media LLC, 2017.

13. Рыжиков Ю. И., Уланов А. В. Применение гииер-экспоненциальной аппроксимации в задачах расчета немарковских систем массового обслуживания // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 3. С. 60—65

14. Байхельт Ф., Франкен М. Надежность и техническое обслуживание. Математический подход. М.: Радио и связь, 1988.

15. Калашников В. В., Рачев С. Т. Математические методы построения стохастических моделей обслуживания. М.: Наука, 1988.

16. Хименко В. И. Случайные данные: структура и анализ. М.: ТЕХНОСФЕРА, 2018.

17. Пиявский С. А. Метод универсальных коэффициентов при принятии многокритериальных решений // Онтология проектирования. 2018. т. 8. № 3(29). С. 449-468. Б01: 10.18287/2223-95372018-8-3-449-468.

18. Пиявский С. А. Как „нумеризовать" понятие „важнее" // Онтология проектирования. 2016. т.6, 34(22). С. 414-435. Б01: 10.18287/2223-9537-2016-6-4-414-435.

Ивлева Анна Игоревна

— канд. техн. наук., старш. науч. сотр. Института проблем управления сложными системами РАН — обособленного подразделения Самарского федерального исследовательского центра РАН, e-mail: annushkal99@bk.ru. Окончила Севастопольский государственный университет в 2013 г. Количество печатных работ — 37. Область научных интересов: моделирование сложных систем, системный анализ, анализ данных, искусственный интеллект, концептуальное моделирование, онтологический инжиниринг, информационные технологии, марковские и полумарковские процессы, многокритериальная оптимизация.

Anna Ivleva — candidate of Engineering Sciences, senior researcher, Samara Federal Research Scientific Center RAS, Institute for the Control of Complex Systems RAS, e-mail: annushkal99@bk.ru. Graduated from Sevastopol State University in 2013. The number of publications: 37. Research interests: modeling of complex systems, system analysis, data analysis, artificial intelligence, conceptual modeling,

ontological engineering, information technologies, Markov and semi-Markov processes, multi-criteria optimization.

Смирнов Сергей Викторович — д-р техн. наук, главн. науч. сотр. Института проблем управления сложными системами РАН — обособленного подразделения Самарского федерального исследовательского центра РАН, e-mail: smirnov@ iccs.ru. Окончил Куйбышевский авиационный институт в 1975 г. Количество печатных работ: более 170 (в т.ч. 2 монографии). Область научных интересов: анализ данных, искусственный интеллект, информационные технологии.

Sergey Smirnov — PhD in Engineering Sciences, chief researcher, Samara Federal Research Scientific Center RAS, Institute for the Control of Complex Systems RAS, e-mail: smirnov@iccs.ru. Graduated from Kuibyshev Aviation Institute in 1975. The number of publications: more than 170 (including 2 monographs). Research interests: data analysis, artificial intelligence, information technologies.

Дата поступления — 06.03.2021

i Надоели баннеры? Вы всегда можете отключить рекламу.