Научная статья на тему 'ГИСТОГРАММНЫЙ ФИЛЬТР С НАСТРОЙКОЙ ПАРАМЕТРА СГЛАЖИВАНИЯ'

ГИСТОГРАММНЫЙ ФИЛЬТР С НАСТРОЙКОЙ ПАРАМЕТРА СГЛАЖИВАНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
21
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГИСТОГРАММНЫЙ ФИЛЬТР / ИДЕНТИФИКАЦИЯ / КОЭФФИЦИЕНТ СГЛАЖИВАНИЯ / ОБЪЕМ ДАННЫХ / ИНТЕРВАЛ ГРУППИРОВАНИЯ / ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Овсянников А. В., Козел Виктор Михайлович

В статье рассматривается гистограммный фильтр с настройкой параметра сглаживания. Гистограммный фильтр может быть эффективно применен в задачах идентификации (распознавания) законов распределения для малых объемов данных. Параметр сглаживания определяется с учетом имеющейся в наличии априорной информации относительно предполагаемого закона распределения. Установлено соотношение между математическими ожиданиями критерия согласия хи-квадрат стандартной гистограммной оценки и с использованием гистограммного фильтра. Такое соотношение определяется коэффициентом сглаживания. Численное значение коэффициента сглаживания зависит от параметров: объема данных, количества интервалов группирования данных, параметров формы закона распределения. Проведен анализ целесообразности применения гистограммного фильтра с учетом соотношения указанных выше параметров. Зависимость коэффициента сглаживания от этих параметров позволяет определить взаимосвязь между количеством интервалов группирования данных и их объемом. Гистограммный фильтр является простым для реализации инструментом, который легко может быть встроен в любой открытый алгоритм идентификации (распознавания) закона распределения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Овсянников А. В., Козел Виктор Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

HISTOGRAM FILTER WITH SMOOTHING PARAMETER SETTING

A histogram filter with smoothing parameter settings is discussed in the article. The histogram filter can be effectively applied in the problems of identification (recognition) of distribution laws for small amounts of data. The smoothing parameter is determined taking into account the available a priori information regarding the proposed distribution law. The relationship between the mathematical expectations of the chi-square fit criterion of the standard estimation histogram and the use of the histogram filter has been determined. This ratio is determined by the smoothing factor. The numerical value of the smoothing coefficient depends on the following parameters: the amount of data, the number of grouping intervals, and the shape parameters of the distribution law. The paper analyzes the feasibility of using a histogram filter, depending on the ratio of the above parameters. The dependence of the smoothing coefficient on the specified parameters allows one to determine the relationship between the number of data grouping intervals and their volume. The histogram filter is an easy-to-implement tool that can be easily integrated into any open distribution law identification (recognition) algorithm

Текст научной работы на тему «ГИСТОГРАММНЫЙ ФИЛЬТР С НАСТРОЙКОЙ ПАРАМЕТРА СГЛАЖИВАНИЯ»

ш

http://dx.doi.org/10.35596/1729-7648-2022-20-8-42-50

Оригинальная статья Original paper

УДК 519.2

ГИСТОГРАММНЫЙ ФИЛЬТР С НАСТРОЙКОЙ ПАРАМЕТРА СГЛАЖИВАНИЯ

А. В. ОВСЯННИКОВ1, В. М. КОЗЕЛ2

1Белорусский государственный университет (г. Минск, Республика Беларусь) 2Белорусский государственный университет информатики и радиоэлектроники (г. Минск, Республика Беларусь)

Поступила в редакцию 18.04.2022

© Белорусский государственный университет информатики и радиоэлектроники, 2022 Belarusian State University of Informatics and Radioelectronics, 2022

Аннотация. В статье рассматривается гистограммный фильтр с настройкой параметра сглаживания. Ги-стограммный фильтр может быть эффективно применен в задачах идентификации (распознавания) законов распределения для малых объемов данных. Параметр сглаживания определяется с учетом имеющейся в наличии априорной информации относительно предполагаемого закона распределения. Установлено соотношение между математическими ожиданиями критерия согласия хи-квадрат стандартной гистограммной оценки и с использованием гистограммного фильтра. Такое соотношение определяется коэффициентом сглаживания. Численное значение коэффициента сглаживания зависит от параметров: объема данных, количества интервалов группирования данных, параметров формы закона распределения. Проведен анализ целесообразности применения гистограммного фильтра с учетом соотношения указанных выше параметров. Зависимость коэффициента сглаживания от этих параметров позволяет определить взаимосвязь между количеством интервалов группирования данных и их объемом. Гистограммный фильтр является простым для реализации инструментом, который легко может быть встроен в любой открытый алгоритм идентификации (распознавания) закона распределения.

Ключевые слова: гистограммный фильтр, идентификация, коэффициент сглаживания, объем данных, интервал группирования, плотность распределения вероятности.

Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.

Для цитирования. Овсянников, А. В. Гистограммный фильтр с настройкой параметра сглаживания / А. В. Овсянников, В. М. Козел // Доклады БГУИР. 2022. Т. 20, №» 8. С. 42-50. http://dx.doi.org/10.35596/1729-7648-2022-20-8-42-50.

HISTOGRAM FILTER WITH SMOOTHING PARAMETER SETTING

ANDREI V. AUSIANNIKAU1, VICTOR M. KOZEL2

1Belarusian State University (Minsk, Republic of Belarus) 2Belarusian State University of Informatics and Radioelectronics (Minsk, Republic of Belarus)

Submitted 18.04.2022

Abstract. A histogram filter with smoothing parameter settings is discussed in the article. The histogram filter can be effectively applied in the problems of identification (recognition) of distribution laws for small amounts of data. The smoothing parameter is determined taking into account the available a priori information regarding the proposed distribution law. The relationship between the mathematical expectations of the chi-square fit criterion of the standard estimation histogram and the use of the histogram filter has been determined. This ratio is determined by the smoothing factor. The numerical value of the smoothing coefficient depends on the following parameters: the amount of data, the number of grouping intervals, and the shape parameters of the distribution law. The paper analyzes the feasibility of using a histogram filter, depending on the ratio of the above parameters. The dependence of the smoothing coefficient on the specified parameters allows one to determine the relationship between the number of data grouping intervals and their volume. The histogram filter is an easy-to-implement tool that can be easily integrated into any open distribution law identification (recognition) algorithm.

Keywords: histogram filter, identification, smoothing coefficient, data volume, grouping interval, probability density distribution.

Conflict of interests. The authors declare no conflict of interests.

For citation. Ausiannikau A. V, Kozel V M. (2022) Histogram Filter with Smoothing Parameter Setting. Doklady BGUIR. 20 (8), 42-50. http://dx.doi.org/10.35596/1729-7648-2022-20-8-42-50 (in Russian).

Введение

Проблематика гистограммных оценок плотности распределения вероятности (ПРВ) хорошо известна: отсутствие единых взглядов на определение числа интервалов группирования данных (Р 50.1.033-2001 «Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть 1. Критерии типа хи-квадрат») и сильная изрезанность гистограммы при относительно малом числе наблюдений [1, 2]. Особую важность и актуальность точные гистограммные оценки закона распределения приобретают в случае требований его быстрой идентификации (распознавания), возможной высокой стоимости измерительного эксперимента или процесса получения данных. Требование быстрой идентификации (распознавания) закона распределения в данном случае можно считать эквивалентным малому объему данных.

Устранение проблем изрезанности гистограммы заключается в применении гистограммных фильтров (ГФ), например, усредняющего, медианного, гауссовского и др. [1, 3-5]. В то же время их использование эмпирически интуитивно и исходит в основном из практических соображений. В статье предлагается теоретически обоснованная методика реализации ГФ, работающего на небольшом количестве данных, устраняющего изрезанность гистограммы, дающего «правильную» идентификацию закона распределения, ослабляющего зависимость «правильной» идентификации от числа интервалов группирования данных. Также развиты идеи, предложенные в [6]. Прежде всего, рекомендуется отказаться от единичной функции включения данных в интервал группирования: данные могут находиться вблизи границ интервала и при изменении числа интервалов оказаться в соседнем интервале; для относительно небольшого количества данных устранение эффекта изрезанности гистограммы может быть осуществлено сглаживанием данных на нескольких соседних интервалах. В этом случае целесообразно заменить единичную функцию включения взвешенной функцией, учитывающей возможный вес «ошибочно» попавших в соседние интервалы данных: Uj = a/v7-1 + tyj + P/v/+1, а + kj + Py = 1, где v - число данных, попавших в j-й интервал группирования; {а7, kj, Pj} - весовые коэффициенты интервалов (параметры сглаживания). В простейшем случае весовые коэффициенты являются постоянными величинами и могут быть выражены через один коэффициент k - параметр сглаживания. Введение весовых

коэффициентов для малых объемов данных позволяет перегруппировать эти данные так, чтобы обеспечить меньшую изрезанность гистограммы, увеличив при этом ее сглаженность и быструю идентификацию.

Вычисление параметра сглаживания, очевидно, требует некоторой априорной информации об идентифицируемой ПРВ. Принято, что такая идентификация проводится с помощью критерия согласия хи-квадрат, использование которого основано на предположении о возможном виде идентифицируемой ПРВ. Таким образом, априорная информация является естественным и необходимым элементом построения ГФ.

Цель исследований состояла в реализации гистограммного фильтра с настройкой параметра сглаживания на основе априорной информации об идентифицируемой ПРВ.

Общая методика построения гистограммного фильтра

с настройкой параметра сглаживания

Пусть имеется выборка случайных данных {хг}; i = 1, n и определено разбиение числовой прямой на m непересекающихся и примыкающих друг к другу интервалов A; j = 1, m равной

длины Ах = Xj+1 - Xj = ((x " Xmin ) 1 m'; Xm+l = Vax = maX Xi l X1 = Xmin = min Xi, где Xj - границы

интервалов; R — xmax - xmin - mAx - размах диапазона данных. Заменим обычную индикаторную функцию, используемую при стандартном способе построения гистограммы, весовой ступенчатой функцией jx), 0 < ц < 1, АЦ > Ax, которая будет характеризовать принадлежность данных интервалу группирования Aj:

ц (х) = {k для Aj; а = (1 — k) / 2 для Aj-1 и Aj+1}, j = 2, m-1;

Ц j (х) = {(1 + k )/2 для Aj ; а для A( j—m)( m—3)/( m—1)+( m—1) }, j = ^ m-

(1)

Такой выбор весовых коэффициентов обеспечивает выполнение общих условий нормировки:

j+1

(2)

!) X ^=1, * = 2т -1; 2) ХХ^/ (х) = п

-1 ] '

Используя в качестве критерия оценки коэффициента сглаживания критерий хи-квадрат и заменив число Vj в критерии х2М на число Uj - aVj_ + kvj + а^-+1 для у — 2, т -1

и uj = (1 - а)уу. + ау(j_т)(т_э)/(м-1)+(ш-1) Для j = 1 ^ полУчим

m 2

Х2Ф (м) = Х[М 1 - nPl ] 1 nPl ^ т/п- (3)

j=1

Решение оптимизационной задачи (3) приводит к выражению для коэффициента сглаживания по выборке данных

kBbl6 = 1 + 2

xu;/ np j

j=1

m

X(vj — npj)Uj / npj = 1 + 2

j=1

XUj / npj

j=1

Xv juJ / np j

(4)

j=1

где = vj-1 - + vj+1, = + ^ j)(т_3)/(И_!)+(„_!) - конечная разность второго порядка соот-

__т

ветственно для индексов j — 2,т -1 и 1 = 1, m; — 0; Pj - гипотетическая вероятность.

]—1

Статистическая конкретизация формулы (4) приводит к соотношению

4 (т -1) 1

k = 1 --

- = 1 --

(5)

6 (m -1) + nA4xA(f, f") 1,5 + 0,25nA 4 (m -1)-1 A (f, f *)'

где A(f, f *) = f"* / f j fdx - коэффициент формы ПРВ, эквивалентный информации Фишера

R * • г 1

второго порядка [7]; f - гипотетическая ПРВ; f — lim \uj / nA x I - эквивалент идентифицируемой ПРВ; J fdx — у - доверительная вероятность.

R

Проведем упрощенное обоснование формулы (5), для чего последовательно рассмотрим компоненты, входящие в (4). Совокупность статистическо-экспериментального метода, инженерного подхода и практических представлений приводит к следующим выражениям:

m-1

X Uj / npj = x(( - 2fj_i+/;+i ) / f+(-fi+f ) / fi+(- fm+fh )/ fm ;

j"2 x -A

m Лшах x

lim ^Uj / npj =(R / m ) f f/ fdx + Ax [ / f - / fm );

П^ю ^^ J J j \ /

; "i

Л ^0 j

xmin +AV

M

A T7 Л

fjUi

.>1 "Pj J

= -2 {n + m -1) + M

lim M

m^œ

A r ^0

^VjUj

X

j=2

1 {j-1 + Vj+1 )vj- Vi U, VmUm,

nPj

nP1

nPm

= -2 {m -1)-2M { + vm );

/=i nPi

= lim M

m^œ

A x ^0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-2(m -1) - 2 J fdx =-2{m -1);

(6)

lim M

m^œ

A v ^0

2 Л

m U ■

x—

V j=1 npj y

= lim M

m^œ Av ^0

+ lim M

m^œ

x

V j=2 2

vj _1 + xvj + j

nPj

- 2 lim M

y

x

12vj-1vj- vj-1 vj+1 + 2vjvj+1

Vj

=2

nPi

\-V1 + V2 )2 | ( Vm + vm-1 )

I f "

6(n + m -1)-6n + nA4x Jl -—

* V

"Pl nPm

= 6 (m -1) + nA 4xA(f, f * ).

* V f

fdx =

(7)

Далее, подставляя (6) и (7) в (4), получим непосредственно выражение (5). Формула (5) позволяет сделать ряд важных выводов.

Во-первых, при неограниченно возрастающем числе данных n ^ да очевидно, что коэффициент сглаживания должен стремиться к единице, что и следует из формулы (5). В этом случае целесообразность применения ГФ исчезает. При значении компоненты знаменателя 8 = 0,25яДX (m —1)—1 A(f, f *) меньше единицы или при ô ^ 0 коэффициент сглаживания стремится к 1/3. Такое значение коэффициента сглаживания отвечает случаю сильной изрезанности гистограммы; возможно, вследствие неправильно выбранного (относительно большого) значения количества интервалов при относительно небольшом количестве данных. Гистограммный фильтр в этом случае преобразуется в обычный усредняющий фильтр. Таким образом, диапазон изменения значений коэффициента сглаживания 1/3 < k < 1.

Во-вторых, подставляя значение коэффициента сглаживания (5) в формулу для критерия со/ vV л2

m \ m

гласия хи-квадрат, получаем Лгф

Хпь (u) = Х (v) -

Xu2 /"pj I IX/"pj

Отсюда следует

V 1=1 ) V 1=1

соотношение между средними критерия хи-квадрат: М (хГф ) = кМ (х2 ), М ) = т -1.

Таким образом, применение ГФ позволяет уменьшить значение стандартного критерия согласия в к раз. Соотношение входящих в коэффициент параметров характеризует целесообразность применения и эффективность идентификации ГФ. Так, при небольших значениях компоненты знаменателя 5 < 1 значение критерия хи-квадрат после применения фильтра практически уменьшается в три раза, в противном случае при п ^ да значение критерия хи-квадрат стремится к стандартному

(к ^ 1, М (хГф ) ^ (т -1)), и применение ГФ нецелесообразно. Следовательно, эффективность ГФ можно оценивать величиной, обратной значению коэффициента сглаживания: Эгф = к-1.

Показатель эффективности может быть использован в целях нахождения оптимального соотношения между числом данных и числом интервалов их группирования. Зафиксировав некоторое желаемое значение эффективности Э0ф, на основании (5) получаем

2K

m

(m -1) R4A

K=

3 - Э

гф

Эгф - 1

3k -1 1 - k '

(8)

Ax ^0

Ax ^0

Уравнение (8) нелинейное, требующее численных методов решения в общем случае. Из формулы следует, что число интервалов группирования данных зависит не только от числа данных, но и от коэффициента формы ПРВ A(f,f*), и от диапазона данных R. Для случая m >> 1 возможно приближенное аналитическое решение нелинейного уравнения (8): m — 5 nR4 A ^f, f * j / 2K.

Последняя формула близка к выражениям вида m ~ n°,2, приведенным в [1, 8] с коэффициентом пропорциональности, зависящим от параметров ПРВ и априорных установок ГФ по его эффективности Эгф.

В-третьих, перераспределение части данных между соседними интервалами не только уменьшает изрезанность гистограммы, но и способствует ослаблению требований к выбору числа интервалов группирования. Фиксируя некоторую нижнюю границу значения эффективности ГФ (Э°ф), можно определить значение числа интервалов группирования по формуле (8) из условия m4 (m -1)> 0,5nR4A(f) (K)-1.

В-четвертых, предположив высокую апостериорную точность оценки ПРВ, плотность f в коэффициенте формы формально можно заменить гипотетической и, следовательно, модифицированный коэффициент формы примет вид A(f) " / f )2 fdx. В этом случае формулы (5) и (8)

R

становятся полностью определенными. Следует заметить, что вычисление этого коэффициента требует существования второй производной ПРВ. Однако, если такой производной нет, нужно воспользоваться инженерными соображениями практической реализации. В частности, для равномерной ПРВ можно принять f" — 0 и, следовательно, коэффициент формы Af = 0. Тогда численное значение коэффициента сглаживания будет 1/3, и ГФ преобразуется в обычный усредняющий фильтр, что в случае идентифицируемой равномерной ПРВ вполне очевидно.

Рекомендации по реализации гистограммного фильтра

Полученные теоретические результаты показывают целесообразность применения ГФ с целью эффективной и быстрой (на малых объемах данных) идентификации изменяющихся законов распределения в описательной статистике при обработке гистограмм изображений. Программная реализация ГФ легко встраивается в существующие открытые алгоритмы построения гистограмм, например, в функции hist, histfit платформы MATLAB.

Структура алгоритма идентификации (распознавания) ПРВ следующая.

1. Получение выборки данных объемом n, определение размаха выборки R.

2. На основании предположений об идентифицируемой ПРВ вычисление коэффициента формы Af).

3. На основании выбранного числа интервалов группирования данных, размаха выборки, объема данных, коэффициента формы вычисляется значение коэффициента сглаживания по формуле (5).

4. Применение ГФ:

Uj - avj-1 + kvj + avj+1, j — 2, m -1 ;

< uj - (1 _ a)vj + «v( j-m)(m-3)/(m-1)+(m-1) , j - 1 m'; (9)

a-(1 - k) / 2.

5. Вычисление критерия согласия хи-квадрат. На основании заданного уровня значимости принятие решения об идентификации.

Процедуру идентификации ПРВ можно сделать многоканальной, где каждый канал будет ориентирован на определенный заранее возможный вид ПРВ. Принятие решения об идентификации в этом случае может быть реализовано различными методами, например, простым или взвешенным голосованием.

Моделирование гистограммного фильтра

На рис. 1 (n = 10°, m = 9, количество серий экспериментов 10°) приведены примеры работы ГФ для ПРВ: нормальной (рис. 1, а, ^ыб = 0,64, Эвыб = 1,56), логистической (рис. 1, b, ^ыб = 0,74,

Эвыб = 1,35), экспоненциальной (рис. 1, с, ^ыб = 0,53, Эвыб = 1,89), равномерной (рис. 1, ё, = 0,36, Эвыб = 2,78). Верхняя часть на рис. 1 соответствует обычной гистограмме, нижняя -результат обработки ГФ. Во всех приведенных на рисунке случаях выполняется соотношение

2 ^2^2 2

ХГф < Хкр - X , где хкр - критическое значение критерия согласия при заданном уровне значимости (0,05). Результаты моделирования наглядно подтверждают идею применения ГФ. Эффективность использования гистограммного фильтра на отмеченных плотностях указывает на существенное его превосходство перед стандартной гистограммной оценкой.

0.1 ■

■Jill..

-5 -4 -3 -2 -1 0 1 2 3 4 5 .4 -1-1-!-1-уИВГ-'-1-1-1-

[ —lllll--

-5-4-3-2-1 0 1 2 3 4 5

-3 -2 -1

jIL

-« -з -г -1 а 1 а з 4 5

b

а

0.8-,-,-,-,-,-,- 0 1 2 3 4 5 6 7

0 8i-r-.-.-.-.-.-1- 0.6 ^^ Ни,____ 0 12 3 4 5 6 7 0.4 г I lllll *2 -15 -1 -0.5 Hill 0 0.5 1 15 2

c d

Рис. 1. Результаты работы гистограммного фильтра Fig. 1. Histogram filter results

В табл. 1 (количество серий экспериментов 100) содержатся некоторые результаты моделирования работы ГФ с учетом формулы (4) в сопоставлении с теоретическими результатами, полученными на основе (5) для трех ПРВ: нормальной, логистической, лапласовской.

Таблица 1. Коэффициенты сглаживания и эффективность гистограммного фильтра, n = 100 Table 1. Smoothing coefficients and histogram filter efficiency, n = 100

m Плотность распределения вероятности

нормальная, A (f) = 1,73 логистическая, A(f) = 2,14 лапласовская, A(f) = 0,99

kBbi6 k Эгф kBbl6 k Эгф kBbl6 k Эгф

5 0,80 0,96 1,04 0,96 0,98 1,02 0,98 0,99 1,01

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7 0,81 0,81 1,23 0,90 0,92 1,09 0,94 0,97 1,03

9 0,66 0,61 1,64 0,75 0,77 1,30 0,86 0,91 1,10

На рис. 2 приведены зависимости коэффициента сглаживания, вычисленного по формуле (5), от количества интервалов группирования п для двух ПРВ: нормальной (кривые 1, 2) и лапласов-ской (кривые 3, 4). Численные (табл. 1) и графические результаты (рис. 2) позволяют сделать вывод о том, что значение коэффициента сглаживания нелинейно уменьшается с уменьшением объема данных. Это объясняется тем, что при уменьшающемся объеме данных увеличивается изрезанность обычной гистограммной оценки ПРВ и, следовательно, требуется ее большая сглаженность, стремящаяся к равномерному (усредняющему) сглаживанию ^ ^ 1/3) при одном и том же числе интервалов группирования.

09 08 07

ое

05 О 4

s ю 15 го

Рис. 2. Коэффициенты сглаживания гистограммного фильтра: 1, 3 - n = 100; 2, 4 - n = 500 Fig. 2. Histogram filter smoothing coefficients: 1, 3 - n = 100; 2, 4 - n = 500

На рис. 3 (количество серий экспериментов 100) на основе формулы (8) (кривые 1.1-1.3) приведены зависимости меду объемом данных и количеством интервалов их группирования для двух плотностей - гауссовской (рис. 3, а) и логистической (рис. 3, b) - для различных значений коэффициента эффективности: Эгф = 1,5 (k = 0,(6)) - кривая 1.1; Эгф = 1,3 (k = 0,77) - кривая 1.2; ЭГф = 1,1 (k = 0,91) - кривая 1.3. На рис. 3 для сопоставления приведены стандартно используемые формулы Старджеса m = 1 + log2n (кривая 2) и формула m = С(Ех)п0,4 (кривая 3), приведенная в [1, 8], где С(Ех) = (Ех + 4,5)/6; Ех - коэффициент эксцесса ПРВ.

а b

Рис. 3. Зависимость количества интервалов группирования данных от объема данных Fig. 3. Dependence of the number of grouping intervals of data on the amount of data

Заключение

1. Рассмотренный гистограммный фильтр (9) с настройкой параметра сглаживания может быть эффективно применен в задачах идентификации (распознавания) плотности распределения вероятности для малых объемов данных с учетом имеющейся в наличии априорной информации о предполагаемой плотности распределения вероятности.

2. Установлено соотношение между математическими ожиданиями согласия критерия хи-квадрат при стандартном подходе построения гистограммной оценки и с использованием ги-стограммного фильтра. Такое соотношение определяется коэффициентом сглаживания, определяемым по формуле (5). Численное значение коэффициента сглаживания зависит от следующих параметров: объема данных, количества интервалов группирования данных, параметров формы плотности распределения вероятности. Зависимость коэффициента сглаживания от указанных параметров позволяет определить взаимосвязь между количеством интервалов группирования данных и их объемом. Эта зависимость нелинейная, не имеющая аналитического решения. В случае выбранного большого количества интервалов группирования данных может быть получена приближенная формула в явном виде (8).

3. Гистограммный фильтр является простым для реализации инструментом, который легко может быть встроен в любой открытый алгоритм идентификации (распознавания) плотности распределения вероятности.

Список литературы

1. Орлов, Ю. Н. Оптимальное разбиение гистограммы для оценивания выборочной плотности функции распределения нестационарного временного ряда / Ю. Н. Орлов // Препринты ИПМ имени М. В. Келдыша. 2013. № 14. 26 с. http://library.keldysh.ru/preprint.asp?id.=2013-14.

2. Chong, Gu. Nonparametric Density Estimation in High-Dimensions / Gu. Chong, Jeon Yongho, Lin Yi // Statistica Sinica. 2013. No 23. Р. 1131-1153.

3. Devroye, L. Nonparametric Density Estimation: the L1 View / L. Devroye, L. Gyorfi. New York: John Wiley Sons, 1985.

4. Solomon, C. J. Fundamentals of Digital Image Processing: a Practical Approach with Examples in Matlab / C. J. Solomon, T. P. Breckon. USA: Wiley-Blackwell, 2010. DOI: 10.1002/9780470689776.

5. Gonzalez, R. Digital Image Processing / R. Gonzalez. New York: Pearson, 2018.

6. Овсянников, А. В. Фильтрация гистограммной оценки плотности вероятности на основе нечеткой принадлежности данных интервалу группирования / А. В. Овсянников, В. М. Козел // Доклады БГУИР. 2021. Т. 19, № 4. С. 13-20. https://doi.org/10.35596/1729-7648-2021-19-4-13-20.

7. Овсянников, А. В. Статистические неравенства в сверхрегулярных статистических экспериментах теории оценивания / А. В. Овсянников // Весщ Нацыянальнай акадэмп навук Беларуси Сер. фiз.-мат. навук. 2009. № 2. С. 106-110.

8. Новицкий, П. В. Оценка погрешностей результатов наблюдений / П. В. Новицкий, И. А. Зограф.; 2-е изд. перераб. и доп. Л.: Энергоатомиздат, Ленингр. отд-ние, 1991. 304 с.

References

1. Orlov Yu. N. (2013) Optimal Histogram Partitioning for Estimating the Sample Density of the Distribution Function of an Unsteady Time Series. Preprinty IPM imeni M. V. Keldysha = Preprints of the Institute of Applied Mathematics name after M. V. Keldysh RAS. (14), 26. http://library.keldysh.ru/preprint.asp?id=2013-14.

2. Chong Gu, Yongho Jeon, Yi Lin (2013) Nonparametric Density Estimation in High-Dimensions. Statistica Sinica, 23, 1131-1153.

3. Devroye L., Gyorfi L. (1985) Nonparametric Density Estimation: the L1 View. New York, John Wiley Sons Publ.

4. Solomon C. J., Breckon T. P. (2010) Fundamentals of Digital Image Processing: a Practical Approach with Examples in Matlab. USA, Wiley-Blackwell Publ. DOI: 10.1002/9780470689776.

5. Gonzalez R. (2018) Digital Image Processing. New York, Pearson Publ.

6. Ausiannikau A. V., Kozel V. M. (2021) Filtration of Histogram Evaluation of Probability Density Based on Fuzzy Data Accessibility to a Grouping Interval. Doklady BGUIR. 19 (4), 13-20. https://doi.org/10.35596/1729-7648-2021-19-4-13-20 (in Russian).

7. Ausiannikau A. V. (2009) Statisticheskie Neravenstva v Sverh Regulyarnyh Statisticheskih Eksperimentah Teorii Otsenivaniya. Vestsi Natsiyanal'naj Akademii Navuk Belarusi. Ser. Fiz-Mat. Navuk. (2), 106-110 (in Russian).

8. Novitskiy P. V., Zograf I. A. (1991) Evaluation of Errors of Measurement Results, 2-e izd. pererab. i dop. Leningrad, Energoatomizdat Publ., Leningrad. Otdelenie. 304 (in Russian).

Вклад авторов

Овсянников А. В. разработал общую методику построения гистограммного фильтра с настройкой параметра сглаживания.

Козел В. М. выполнил моделирование работы гистограммного фильтра.

Authors' contribution

Ausiannikau A. V. developed a general technique for constructing a histogram filter with adjustment of the smoothing parameter.

Kozel V. M. performed modeling of the histogram filter.

Сведения об авторах

Овсянников А. В., к.т.н., доцент, доцент кафедры информационных технологий Белорусского государственного университета.

Козел В. М., к.т.н., доцент, доцент кафедры информационных радиотехнологий Белорусского государственного университета информатики и радиоэлектроники.

Адрес для корреспонденции

220030, Республика Беларусь, г. Минск, просп. Независимости, 4 Белорусский государственный университет Тел. +375 17 209-58-94 E-mail: andovs@mail.ru Овсянников Андрей Витальевич

Information about the authors

Ausiannikau A. V., Cand. of Sci., Assistant Professor, Assistant Professor at the Department of Information Technologies of the Belarusian State University.

Kozel V. M., Cand. of Sci., Assistant Professor, Assistant Professor at the Department of Information Radiotechnologies of the Belarusian State University of Informatics and Radioelectronics.

Address for correspondence

220030, Republic of Belarus, Minsk, Nezavisimosti Ave., 4 Belarusian State University Tel. +375 17 209-58-94 E-mail: andovs@mail.ru Ausiannikau Andrei Vital'evich

i Надоели баннеры? Вы всегда можете отключить рекламу.