ИСПОЛЬЗОВАНИЕ ЛИНГВИСТИЧЕСКИХ ЗНАЧЕНИЙ ПОКАЗАТЕЛЕЙ В СТАТИСТИЧЕСКИХ МОДЕЛЯХ

Меньших Валерий Владимирович; Морозова Валерия Олеговна

В. В. Меньших, В. О. Морозова

доктор физико-математических наук, профессор

ИСПОЛЬЗОВАНИЕ ЛИНГВИСТИЧЕСКИХ ЗНАЧЕНИЙ ПОКАЗАТЕЛЕЙ В СТАТИСТИЧЕСКИХ МОДЕЛЯХ

THE USE OF LINGUISTIC VALUES OF PARAMETERS IN STATISTICAL MODELS

В работе описаны методы представления статистических показателей в виде лингвистических переменных и использования лингвистически заданных значений показателей в статистических моделях. Рассмотрен численный пример использования разработанных методов при построении регрессионной модели уровня криминогенной обстановки.

The paper describes methods for representing statistical indicators in the form of linguistic variables and using linguistically specified values of indicators in statistical models. A numerical example of the use of the developed methods in constructing a regression model of the level of criminogenic situation is considered.

Введение. Совершенствование аналитической работы и повышение обоснованности принятия управленческих решений в органах внутренних дел в значительной степени может быть достигнуто на основе углубленного анализа статистических данных, что делает актуальной задачу их исследования. Статистические данные, используемые органами внутренних дел [1], могут относиться к:

- состоянию преступности и общественного порядка;

- эффективности деятельности органов внутренних дел;

- объему проделанной работы;

- состоянию самих органов внутренних дел.

Сложность анализа перечисленных категорий данных определяется тем, что официальная статистика [2] содержит только количественные значения статистических показателей, которые не могут в полной мере отражать их качественные характеристики (например, степень опасности, важность и т.п.), что необходимо при осуществлении

46

аналитической работы сотрудников правоохранительных органов. Это связано с тем, что лица, принимающие решения (ЛИР), как это доказано в психологии, могут эффективно оперировать лишь небольшим количеством значений показателей (по разным источникам, для различных категорий данных от 3 до 7 или 7 ± 2 (число Миллера)) [3, 4]. Иоэтому в криминологии принято наряду с количественными использовать качественные, т. е. представленные в нечисловом виде, показатели преступности. Ирименительно к деятельности органов внутренних дел используется, например, показатель «уровень преступности», принимающий значения «низкий», «средний», «высокий» [5, 6]. При этом качественные значения показателей, описываемые вербально с помощью значений, которые принято называть лингвистическими [4, 7, 8], упорядочены в соответствии с некоторой шкалой, которую также называют лингвистической.

Указанные обстоятельства приводят к необходимости нахождения лингвистических значений качественных показателей на основе количественно выраженных значений статистических данных.

С другой стороны, показатели, используемые в криминологии, тесно связаны между собой. Поэтому одной из важных задач их анализа является выявление зависимостей между ними и оценка степени влияния друг на друга. Указанные зависимости позволяют осуществлять прогноз значений одних показателей при изменении значений других, выявлять наиболее существенные показатели и решать целый ряд других задач, используемых при принятии управленческих решений.

Все статистические модели, направленные на решение данной задачи, описывают зависимости одних показателей, называемых эндогенными, от значений других показателей, называемых экзогенными.

Однако математические методы, которые позволяли бы использовать в моделях описанного вида показатели, принимающие лингвистические значения, не разработаны. В связи с этим возникает необходимость решения ещё одной задачи — количественного описания лингвистических значений показателей, которое позволяло бы, с одной стороны, сохранять связь с вербальным описанием значений этих показателей, а с другой — использовать их в статистических моделях.

Решению указанных задач посвящена настоящая статья.

Описание лингвистических значений качественных показателей. Лингвистические значения показателей имеют преимущественно субъективный характер и определяются, как правило, экспертами с учётом количественно выраженных статистических показателей. Очевидно, что количество лингвистических значений показателей преступности существенно меньше, чем количественных, поскольку последние определяются для всех регионов. В этом случае перед экспертами ставят задачу соотнесения количественных и качественных значений показателей.

Оказывается, что для каждого качественного значения существует группа количественных значений, которые безусловно ему соответствуют, а также есть те, которые соответствуют ему условно, т. е. с той или иной степенью достоверности. Поэтому выделяют диапазоны значений, которые точно соответствуют лингвистическим значениям, и интервалы, которые соответствуют им в той или иной степени. Заметим, что интервалы количественных значений, условно соответствующих качественным, зацеплены друг за друга. Это отражает как субъективность лингвистических оценок, так и тот факт, что нет резкого разделения между соседними лингвистическими оценками.

Для описания качественных значений показателей используются лингвистические переменные [7, 8], т. е. наборы нечётких множеств, каждое из которых соответ-

ствует отдельному лингвистическому значению показателя. Нечёткие множества задаются функциями принадлежности ¡л{х), значение которых тем больше, чем выше оно находится в лингвистической шкале.

Обратимся к вопросу нахождения явного вида функций принадлежности нечётких множеств, описывающих лингвистические переменные.

Если про изменение значений функции принадлежности на интервалах, условно соответствующих качественным значениям, известно только то, что оно является монотонным, целесообразно для упрощения математических моделей считать его линейным. В этом случае функция принадлежности будет иметь трапецеидальный вид (рис. 1).

а! а2 аз а4

Рис. 1. Функция принадлежности нечеткого множества соответствующего отдельному значению лингвистического показателя

Любой из указанных промежутков может оказаться вырожденным (иметь нулевую длину), но не все три промежутка одновременно. В частности, это может приводить к появлению функций принадлежности треугольного вида.

Если имеется дополнительная информация о характере изменений значений функции принадлежности на интервалах, условно соответствующих качественным значениям, то могут быть использованы их представления, полученные в [9].

В качестве примера рассмотрим использование полученного представления для описания показателя «Уровень криминогенной обстановки» в регионах России. Для нахождения количественных значений воспользуемся методом, описание которого приведено в статье [5]. Суть метода заключается в составлении рейтинга, формируемого на основе статистических показателей «Относительное количество преступлений» в соответствии с методом средних арифметических рангов [5, 10]:

- рассчитываются средние арифметические рангов, присвоенных регионам за несколько последовательных периодов времени (месяцев);

- осуществляется итоговое ранжирование по принципу: чем меньше средний ранг, тем больше уровень преступности.

В статье [5] предлагается считать, что безусловно низкий уровень криминогенной обстановки в 10% регионов с наименьшим средним рангом и безусловно высокий — в 10% регионов с наибольшим средним рангом. Исходя из этого, предлагается следующее условное описание нечётких множеств, соответствующих лингвистическим значениям рассматриваемого показателя (рис. 2).

1 I 1 1

низкий средний ЕЫСОКИН

/

\ /

\ ' /

V' ■, /

А ! \

V' \ | |

30 40

30 90 100

Рис. 2. Функции принадлежности нечётких множеств, описывающих лингвистические значения показателя «Уровень криминогенной обстановки»

Таким образом, описание лингвистической переменной «Уровень криминогенной обстановки» включает 3 нечётких множества, имеющих трапецеидальные функции принадлежности.

Использование лингвистических значений показателей в статистических моделях. Обратимся к рассмотрению обратной задачи, т. е. разработке подхода к использованию лингвистических значений показателей в статистических моделях. С этой целью используем лингвистические переменные. Каждое лингвистическое значение соотнесено с нечётким множеством. Заменим функцию принадлежности этого нечёткого множества одним или несколькими числовыми значениями.

Выделим два случая.

Для уменьшения сложности вычислений или в связи со сложностью вида функции принадлежности, как это предложено создателем теории нечётких множеств L. Za-deh [11], в качестве единственного соотносимого с ней числового значения может выступать медианное значение функции принадлежности d, которое находится в результате решения следующего уравнения [9]:

d Т^

| Jл(х)dx = | Jл(x)dx .

(1)

Если функция принадлежности ^ (х) имеет достаточно простой вид или имеется достаточный ресурс времени для решения задачи, то можно использовать несколько наиболее характерных числовых значений. Например, для приведённой на рис. 1 функции принадлежности трапецеидального вида в качестве числовых значений, соотносимых с ней, следует выбрать ах, а2, а3, а4 .

В первом из указанных случаев следует использовать в статистической модели вместо лингвистических значений показателей их медианные значения, найденные по формуле (1), а во втором случае — совокупность моделей, построенных для каждого из выбранных числовых значений.

Наиболее распространённой среди статистических моделей является модель множественной регрессии

7 = /{Хх, Х2,..., Хт ) + £, (2)

d

позволяющая по значениям нескольких экзогенных показателей X,X2,...,Xm определять значение эндогенного показателя Y [1, 2] (s — случайная величина, отражающая точность модели).

Рассмотрим возможность использования описанного выше подхода на примере данной модели.

Пусть zx,z2,..., zs — возможные лингвистические значения показателя Y . Если

эндогенный показатель Y первоначально описывался лингвистически, то после использования регрессионной модели его значение будет описываться количественно, и поэтому необходимо осуществить обратный переход от количественного представления к лингвистическому. Рассмотрим решение этой задачи для каждого из описанных выше случаев.

В первом случае найденное с помощью регрессионного уравнения (2) значение d для показателя Y следует принять за оценку медианного значения функции принадлежности нечёткого множества, соответствующего искомому лингвистическому значению эндогенного показателя Y .

Во втором случае используем значения d, d,..., d, полученные в результате решения совокупности регрессионных уравнений вида (2) для каждого численного значения a, a, . ., a, выбранного для функции принадлежности. Функция принадлежности в этом

случае может быть аппроксимирована кусочно-линейной функцией /( х), такой, что

/(х) = d'+1 d (х-a) + dt (3)

a+i- a

на отрезках \at, ai+1 ], i = 1,..., I -1.

Медианное значение функции /( х) также обозначим d .

Пусть d (z ), d (z2 ),..., d (zs) — медианные значения функций принадлежности соответствующих им нечётких множеств / (х),/ (х),...,/ (х). В таком случае в качестве лингвистической оценки показателя Y следует принять значение

zk = Argmin(d - d(zi)) , (4)

i=1,2,...,s V '

которое наиболее близко отстоит от полученного в результате регрессионного анализа значения Y .

Таким образом, решение данной задачи сводится к нахождению медианных оценок функций принадлежности нечётких множеств, описывающих лингвистически заданные оценки эндогенного показателя.

Численный пример. Проиллюстрируем описанный подход на примере анализа фрагмента уголовной статистики [2], использующей показатели за 2020 год:

Y — уровень криминогенной обстановки;

X — численность населения;

X — количество совершенных преступлений;

X — количество безработных в указанном регионе.

Показатели X, X, X являются количественными значениями и представлены в статистике за указанный период [2]. Для нахождения качественного показателя Y использован описанный в статье [5] метод и для каждого региона было найдено одно из

50

трёх значений : «низкий», «средний» или «высокий» и медианные значения для них — d ( zx ) = 0,1, d ( z2 ) = 0,5, d ( z3 ) = 0,9 соответственно.

После этого была построена регрессионная модель

Y = 0,36 + 2,21 -10-1 ■ X + 6,24-10• X2 + 3,51 -10~10 • X3 + е.

Индекс детерминации r2 = 0,61 свидетельствует о том, что изменение криминогенной обстановки ( Y ) на 67% обусловлено изменением указанных выше показателей X, X, X, а 33% приходятся на остальные неучтённые в модели (4) факторы. Указанное обстоятельство позволяет считать точность данной модели приемлемой [6, 13].

Заключение. Применение разработанных подходов к использованию лингвистических значений статистических показателей полезно при осуществлении аналитической работы и принятии управленческих решений в правоохранительных органах. Дальнейшие исследования могут быть направлены на совершенствование методов описания лингвистических значений показателей, сопоставления количественных и качественных значений показателей.

ЛИТЕРАТУРА

1. Антонян Ю. М. Криминология : учебник для бакалавров. — М. : Юрайт, 2013.

— 523 с.

2. Сведения о состоянии преступности в Российской Федерации за январь — декабрь 2020 года : аналитический отчет ФКУ ГИАЦ МВД России. [Электронный ресурс]. — URL: https://xn--b1aew.xn--p1ai/reports/item/21933965/

3. Миллер Дж. А. Магическое число семь плюс или минус два. О некоторых пределах нашей способности перерабатывать информацию // Инженерная психология.

— М., 1964. — С. 564—581.

4. Новосельцев В. И. Системный анализ: современные концепции. — Воронеж : Кварта, 2003. — 360 с.

5. Рейтинг криминогенности регионов / Институт региональных проблем [Электронный ресурс]. — URL: https://www.irpr.ru/2019/12/23/rejting-kriminogen-nosti-regionov-vypusk-8/

6. Меньших В. В., Данилова О. Ю., Синегубов С. В. Правовая статистика: методы и модели : учебное пособие. — Воронеж : Воронежский институт МВД России, 2018. — 302 с.

7. Нечеткие множества в моделях управления и искусственном интеллекте / под ред. Д. А. Поспелова. — М. : Наука, 1986. — 312 с.

8. Борисов А. Н., Крумберг О. А., Федоров И. П. Принятие решений на основе нечетких моделей : примеры использования. — Рига, 1990. — 184 с.

9. Men'shikh V.V. Estimating fuzzy variables in décision models // Automatic Control and Computer Sciences. — 2000. —Т. 34. — № 6. — С. 30—36.

10. Орлов А. И. Организационно-экономическое моделирование. Ч. 1: Нечисловая статистика. — М. : Изд-во МГТУ им. Н. Э. Баумана, 2009. — 544 с.

11. Zadeh L. Communication: Fuzzi Algorithms // Information and Control. — 1968. — V. 12. — № 2. — P. 94—102.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Информационные технологии в деятельности органов внутренних дел : учебник / А. В. Заряев [и др.]. — Воронеж : ВИ МВД России, 2001. — 209 с.

13. Елисеева И. И. Эконометрика : учебник для бакалавриата и магистратуры. — М. : Юрайт, 2017. — 449 с.

REFERENCES

1. Antonyan Yu. M. Kriminologiya : uchebnik dlya bakalavrov. — M. : Yurayt, 2013.

— 523 s.

2. Svedeniya o sostoyanii prestupnosti v Rossiyskoy Federatsii za yanvar — dekabr 2020 goda : analiticheskiy otchet FKU GIATs MVD Rossii. [Elektronnyiy resurs] — URL: https://xn--b1aew.xn--p1ai/reports/item/21933965/

3. Miller Dzh. A. Magicheskoe chislo sem plyus ili minus dva. O nekotoryih predelah nashey sposobnosti pererabatyivat informatsiyu // Inzhenernaya psihologiya. — M., 1964. — S. 564—581.

4. Novoseltsev V. I. Sistemnyiy analiz: sovremennyie kontseptsii. — Voronezh : Kvarta, 2003. — 360 s.

5. Reyting kriminogennosti regionov / Institut regionalnyih problem / [Elektronnyiy resurs] URL: https://www.irpr.ru/2019/12/23/rejting-kriminogennosti-regionov-vypusk-8/

6. Menshih V. V., Danilova O. Yu., Sinegubov S. V. Pravovaya statistika: metodyi i modeli : uchebnoe posobie. — Voronezh : Voronezhskiy institut MVD Rossii, 2018. —302 s.

7. Nechetkie mnozhestva v modelyah upravleniya i iskusstvennom intellekte / pod red. D. A. Pospelova. — M. : Nauka, 1986. — 312 s.

8. Borisov A. N., Krumberg O. A., Fedorov I. P. Prinyatie resheniy na osnove nechetkih modeley : primeryi ispolzovaniya. — Riga, 1990. — 184 s.

9. Men'shikh V.V. Estimating fuzzy variables in decision models // Automatic Control and Computer Sciences. — 2000. —T. 34. — # 6. — S. 30—36.

10. Orlov A. I. Organizatsionno-ekonomicheskoe modelirovanie. Ch. 1: Nechislovaya statistika. — M. : Izd-vo MGTU im. N. E. Baumana, 2009. — 544 s.

11. Zadeh L. Communication: Fuzzi Algorithms // Information and Control. — 1968.

— V. 12. — # 2. — P. 94—102.

12. Informatsionnyie tehnologii v deyatelnosti organov vnutrennih del : uchebnik / A. V. Zaryaev [i dr.]. — Voronezh : VI MVD Rossii, 2001. — 209 s.

13. Eliseeva I. I. Ekonometrika : uchebnik dlya bakalavriata i magistraturyi. —M. : Yurayt, 2017. — 449 s.

СВЕДЕНИЯ ОБ АВТОРАХ

Меньших Валерий Владимирович. Профессор кафедры математики и моделирования систем. Доктор физико-математических наук, профессор, заслуженный деятель науки Российской Федерации. Воронежский институт МВД России. E-mail: menshikh@list.ru

Россия, 394065, г. Воронеж, проспект Патриотов, 53. Тел. (473) 200-52-10.

Морозова Валерия Олеговна. Адъюнкт. Воронежский институт МВД России. E-mail: dudckolera@yandex.ru.

Россия, 394065, г. Воронеж, проспект Патриотов, 53. Тел. (473) 200-52-16.

Menshikh Valeriy Vladimirovich. Professor of the chair of Mathematics and Systems Modeling. Doctor of Physical and Mathematical Sciences, Professor, Honored Scientist of the Russian Federation.

Voronezh Institute of the Ministry of the Interior of Russia. E-mail: menshikh@list.ru.

Work address: Russia, 394065, Voronezh, Prospect Patriotov, 53. Tel. (473) 200-52-10.

Morozova Valeria Olegovna. Post-graduate cadet. Voronezh Institute of the Ministry of the Interior of Russia. E-mail: dudckolera@yandex.ru.

Work address: Russia, 394065, Voronezh, Prospect Patriotov, 53. Tel. (473) 200-52-16.

Ключевые слова: качественные и количественные показатели преступности; лингвистические переменные; уровень преступности; нечеткие множества; функции принадлежности; статистические данные.

Key words: qualitative and quantitative indicators of crime; linguistic variables; crime rate; fuzzy sets; membership functions; statistical data.

УДК 004.94

ИЗДАНИЯ ВОРОНЕЖСКОГО ИНСТИТУТА МВД РОССИИ

ВОРОНЕЖСКИЙ ИНСТИТУТ МВД РОССИИ

Думачев В. Н.

Интегральное исчисление : практикум / В. Н. Думачев, С. А. Телкова. — Воронеж : Воронежский институт МВД России,

Практикум содержит систематизированное изложение материала по интегральному исчислению функций одной переменной и предназначен для проведения практических и лабораторных занятий, самостоятельной работы, а также выполнения типового расчета курсантами радиотехнического факультета.

2020. — 258 с.

B. Н. Думачев

C. А.Телкова

ИНТЕГРАЛЬНОЕ ИСЧИСЛЕНИЕ

Воронеж 2020

ИСПОЛЬЗОВАНИЕ ЛИНГВИСТИЧЕСКИХ ЗНАЧЕНИЙ ПОКАЗАТЕЛЕЙ В СТАТИСТИЧЕСКИХ МОДЕЛЯХ Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Меньших Валерий Владимирович, Морозова Валерия Олеговна

Похожие темы научных работ по математике , автор научной работы — Меньших Валерий Владимирович, Морозова Валерия Олеговна

THE USE OF LINGUISTIC VALUES OF PARAMETERS IN STATISTICAL MODELS

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ ЛИНГВИСТИЧЕСКИХ ЗНАЧЕНИЙ ПОКАЗАТЕЛЕЙ В СТАТИСТИЧЕСКИХ МОДЕЛЯХ»