Научная статья на тему 'Прогнозирование значений обобщенного показателя качества объемных извещателей вневедомственной охраны'

Прогнозирование значений обобщенного показателя качества объемных извещателей вневедомственной охраны Текст научной статьи по специальности «Математика»

CC BY
143
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОКАЗАТЕЛИ КАЧЕСТВА ПРИБОРОВ / КОЛЛИНЕАРНОСТЬ / МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ / ПРОГНОЗИРОВАНИЕ ОБОБЩЕННОГО ПОКАЗАТЕЛЯ / INDICATORS OF QUALITY OF THE DEVICES / COLLINEARITY / MULTIPLE LINEAR REGRESSION / FORECASTING OF THE GENERALIZED INDICATOR

Аннотация научной статьи по математике, автор научной работы — Волков Дмитрий Александрович, Мельников Александр Владимирович, Навоев Виктор Владимирович

Рассматривается многомерная калибровочная модель обобщенного показателя качества объемных извещателей. Обсуждается проблема мультиколлинеарности данных и способ ее преодоления. Для предсказания значений показателя нового прибора используется метод гребневой регрессии. Результаты численного анализа подтверждают достаточную точность прогнозирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Волков Дмитрий Александрович, Мельников Александр Владимирович, Навоев Виктор Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECASTING OF THE GENERALIZED INDICATOR OF QUALITY OF THE VOLUME DETECTORS IN DIVISIONS OF PRIVATE SECURITY

The multidimensional calibration model of the generalized indicator of quality of the volume detectors is considered. The problem of a multiсollinearity of data and way of its overcoming is discussed. For a prediction of values of an indicator of the new device the method of ridge regression is used. Results of the numerical analysis confirm the sufficient accuracy of forecasting.

Текст научной работы на тему «Прогнозирование значений обобщенного показателя качества объемных извещателей вневедомственной охраны»

Д.А. Волков,

Главное управление МВД России по Свердловской области

А.В. Мельников,

кандидат технических наук

В.В. Навоев,

кандидат технических наук, Главное управление МВД России по Свердловской области

ПРОГНОЗИРОВАНИЕ ЗНАЧЕНИИ ОБОБЩЕННОГО ПОКАЗАТЕЛЯ КАЧЕСТВА ОБЪЕМНЫХ ИЗВЕЩАТЕЛЕЙ ВНЕВЕДОМСТВЕННОЙ охраны

FORECASTING OF THE GENERALIZED INDICATOR OF QUALITY OF THE VOLUME DETECTORS IN DIVISIONS

OF PRIVATE SECURITY

Рассматривается многомерная калибровочная модель обобщенного показателя качества объемных извещателей. Обсуждается проблема мультиколлинеарности данных и способ ее преодоления. Для предсказания значений показателя нового прибора используется метод гребневой регрессии. Результаты численного анализа подтверждают достаточную точность прогнозирования.

The multidimensional calibration model of the generalized indicator of quality of the volume detectors is considered. The problem of a multiсollinearity of data and way of its overcoming is discussed. For a prediction of values of an indicator of the new device the method of ridge regression is used. Results of the numerical analysis confirm the sufficient accuracy of forecasting.

В практике деятельности вневедомственной охраны МВД России актуальной задачей является выбор наиболее качественных технических средств, удовлетворяющих одновременно требованию приемлемости цены. Научно обоснованный подход к решению этой задачи заключается в использовании методов теории экспертных систем. В частности, представляется целесообразным введение комплексного показателя «качество-цена», основанного на теории множественной линейной регрессии [1,2], а также прогнозирование его значения.

Постановка задачи. Для n образцов (приборов), обладающих m характеристиками (признаками), модель множественной линейной регрессии имеет вид

" J1"

J 2 =

_J п _

x

11

x

12

x 21 x22

xn1 x n2

1x m I " V1"

s . <N x V2

x nm _ V. і

(1)

где Ji — обобщенный показатель для /-го образца; Х^ — значение]-го признака для i-

го образца; У1 — коэффициент регрессии.

Для применения в теории экспертных систем уравнение (1) необходимо модифицировать [3]:

где J,X,V— нормированные матрицы соответствующей размерности. Процедура нормировки не тривиальна: она является многоступенчатой и требует использования определения нормы в различных функциональных пространствах: Rm ,Rm ,Rm [4]. Кроме того, для определения вектора коэффициентов регрессии (весовых коэффициентов обобщенного показателя) V может использоваться метод анализа иерархий Т. Саати [5].

Во многих случаях необходимо решить обратную задачу: зная обобщенные показатели качества известных образцов (приборов) J и матрицу X для нескольких известных образцов, определить множество весовых коэффициентов {Vi}, а затем использовать это множество для оценки показателей новых приборов, т.е. осуществить их прогноз. Такая процедура в эконометрике называется многомерной калибровкой [1]. Решение этой задачи требуется в ряде практических ситуаций: 1) алгоритм расчета весовых коэффициентов неизвестен; 2) алгоритм известен, но сложен (например, метод анализа иерархий); 3) отсутствует необходимое программное обеспечение и др.

В целом процедура многомерной калибровки распадается на два этапа: а) собственно калибровка, т.е. оценка вектора весовых коэффициентов по данным заранее известных приборов; б) прогнозирование обобщенного показателя качества для новых приборов. Основой данной процедуры являются следующие методы эконометрики: линейная множественная регрессия, метод наименьших квадратов и гребневая (ridge) регрессия. С учетом сложившейся в эконометрике терминологии [1,2] для этого процесса будем использовать следующие термины: обучение многомерной регрессионной модели по референтным данным известных образцов и прогноз обобщенного показателя качества новых приборов.

Целью данной работы является оценка методом гребневой регрессии множества весовых коэффициентов!Vi} по заданным референтным даннымX, J известных приборов и последующее прогнозирование обобщенного показателя качества нового прибора.

Формирование калибровочной модели. Осуществим вначале многомерную калибровку для данных трех известных промышленных объектовых извещателей (референтных данных), используемых в подразделениях вневедомственной охраны МВД

Л

России. Затем осуществим второй этап калибровки — оценку вектора V и прогноз обобщенного показателя качества.

Согласно принципу разделения признаков объекта экспертизы, выберем аддитивную форму обобщенного показателя «качество-цена» [3]:

А j,K0.4Xj,K0.4 ^ X ^ijiai 2^/,кач.пр. Х1 ,кач.пр. Л .

/ = у 1_____________+ у А____________+ у 1___________________+ у . р(х I

кол v J7 нал -vt/ кач.пр. v'T/ цены \гцены) (3)

-2-." j,кол L i, нал Lкач.пр. ’

j i I

где Xj — нормированные количественные признаки; ХИ^ё — нормированные признаки наличия определенного свойства прибора; Xi — нормированные качественные признаки, усредненные по множеству экспертов; P(хд^й ) — нормированная функция

цены; ^ кол нал ’^кач’^ цены—групповые весовые коэффициенты, учитывающие относительную важность различных групп признаков.

Все множество признаков делится на признаки положительного эффекта (ППЭ), увеличение которых приводит к росту показателя J, и признаки отрицательного эф-

фекта (ПОЭ), увеличение которых приводит к уменьшению J . Для того чтобы обеспечить однородный вклад различных слагаемых во взвешенную сумму (3), необходимо привести их значения к единому диапазону. Для признаков ППЭ введем следующую нормировку:

''/ ' ' ' 1 '...(4)

_/, баз

где знаменатель — максимальное значение признака по всем объектам.

Подробные характеристики трех известных промышленных объемных извеща-телей приведены в статье [6]. Поэтому здесь мы ограничимся краткой таблицей значений признаков _і и нормированных значений признаков Хсі извещателей (табл.1).

Как видим, большинство признаков являются признаками положительного эффекта. Признаками отрицательного эффекта являются Х3 ,Х4 и Хц. В отличие от формулы (4) для них требуется иная нормировка:

Х ■ ГГ

_ _ , (5) хі

где числитель — минимальное значение признака по группе сравниваемых объектов.

Цена объекта также является признаком отрицательного эффекта, и для ее нормировки используем разновидность формулы (5)

р(к) _ Рдае (6)

Р _ Р (к) , (6)

где Рбаз — минимальная цена по группе сравниваемых объектов, Р(к) — цена к-го объекта экспертизы.

Таблица 1

Характеристики промышленных объектовых извещателей

Показатели «Астра-551» «Сокол-2» «Орлан»

№ Содержание _і _і _і _і _і

1 Длина минимальной зоны обнаружения, м 10 0,833 12 1,000 6 0,500

2 Ширина минимальной зоны обнаружения, м 6 1,000 6 1,000 5 0,833

3 Контролируемая минимальная скорость детекции, м/с 0,3 1,000 0,3 1,000 0,35 0,857

4 Токопотребление в дежурном режиме, мА 16 1,000 20 0,800 35 0,457

Сумма количественных взвешенных признаков — 0,929 0,976 0,651

5 Наличие регистрации вскрытия извещателя Нет 0,000 Да 1,000 Да 1,000

6 Наличие радиоканала (эффект Доплера) Да 1,000 Да 1,000 Нет 0,000

7 Наличие радиоволновой или инфракрасной зоны обнаружения извещателя Да 1,000 Да 1,000 Нет 0,000

Сумма взвешенных признаков наличия 0,460 1,000 0,539

8 Помехозащищенность (дополнительные каналы связи, специализированные алгоритмы и процессоры распознавания помех ) 3,2 0,640 3,2 0,640 4,8 0,960

9 Эргономичность для клиента (наличие внешних индикаторов, возможность установки без прокладки проводов) 3,1 0,620 3,1 0,620 3,8 0,760

10 Эстетичность (внешний вид, цветовая гамма, размеры, возможность скрытой установки) 3,6 0,720 2,9 0,580 3,6 0,720

Сумма качественных взвешенных признаков — 0,646 — 0,628 — 0,887

11 Цена устройства, руб. 1054 1,000 1348 0,782 1106 0,953

Обычно для построения адекватной калибровочной модели требуется, чтобы число образцов П было в 2-3 раза больше, чем число признаков т . В нашем случае количества известных образцов явно недостаточно: мы имеем всего 3 образца, обладающих 10 признаками. Воспользуемся приемом выделения характеристических то-

чек, хорошо зарекомендовавшим себя в задачах обработки спектров, когда множество признаков (интервалов частот спектра) достигает нескольких сотен [1].

Выберем в качестве характеристических точек взвешенные суммы групп количественных признаков, признаков наличия, качественных признаков. Для расчета этих сумм в статье [6] был неоднократно использован метод анализа иерархий Т. Саати и получены для векторов приоритетов признаков выражения

V~em = (0,424 0,227 0,227 0,122)T; (7)

=(0,540 0,297 0,163)Г . (8)

V^ = (0,662 0,213 0,125)T, (9)

а для вектора трех групповых признаков — выражение

V =(0,649 0,122 0,229). (10)

Рассчитанные с учетом формул (7)—(9) взвешенные суммы признаков также сведены в таблицу (см. табл.1).

В упомянутой выше статье рассматривалась мультипликативная форма обобщенного показателя качества, а в данной работе мы выбрали аддитивную форму (3). Поэтому к перечисленным трем групповым признакам следует добавить четвертый — признак цены, выделяя тем самым четыре характеристические точки.

В начале экспертизы мы имели слишком большое количество признаков (т = 11) по сравнению с референтными данными всего лишь трех объемных извеща-телей. После выбора 4 характеристических точек соотношение количества образцов (п = 3) и признаков (т = 4) несколько улучшится, хотя по-прежнему мы имеем недостаточное количество известных образцов (п < т). Сформируем матрицу нормированных групповых признаков (добавив признак цены)

'0,929 0,460 0,646 1,000"

X = 0,976 1,000 0,628 0,782 , (11)

_ 0,651 0,539 0,887 0,953_

соответствующую трем известным образцам.

В работе [6] после неоднократного применения метода анализа иерархий и достаточно громоздких выкладок был определен вектор обобщенного показателя качества для трех известных объемных извещателей

/ = (0,807 0,899 0,691)T .

л

Для аддитивной формы обобщенного показателя (3) выберем V д°{й = 1, что означает равнозначность учета качественных и ценовых характеристик. Тогда после сложения показателей качества и цены (см. табл.1) получим для калибровки окончательный вид вектора показателей «качество-цена»

/=(1,807 1,681 1,644)T. (12)

Обучение калибровочной модели. Воспользовавшись референтными данными (11), (12), произведем обучение модели, т.е. попытаемся найти неизвестные весовые

Л

коэффициенты Vj. В эконометрике для решения задач линейной множественной регрессии используется метод наименьших квадратов (МНК) [2,7], согласно которому искомое решение должно определиться формулой

Однако на самом деле это не так: нам не удается вычислить первый сомножитель выражения (13), т.е. найти обратную матрицу, поскольку определитель произведения матриц равен нулю.

Причиной этого факта является то обстоятельство, что матрица X содержит слишком малый объем референтных данных, причем количество образцов П =3 (известных приборов) оказывается меньшим числа признаков т = 4, что явно недостаточно. В теории множественной линейной регрессии считается [1], что для достаточной точности калибровки количество образцов должно быть в 2-3 раза большим, чем число признаков.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В нашей ситуации наблюдается явление мультиколлинеарности референтных данных, которое отражает сильную корреляционную (или даже функциональную) связь

между векторами матрицы

(такая матрица называется плохо обусловленной). В теории линейной множественной регрессии известны различные способы преодоления вычислительных проблем, связанных с мультиколлинеарностью [7], среди которых мы выберем метод гребневой регрессии.

Гребневая регрессия предполагает оценку неизвестных весовых коэффициентов

Л

калибровочной модели Ус1 по следующей формуле:

Л / Л Т Л \—1 Л Ф Л

IГш[хтх + а1) XTJ. (14)

Добавление регуляризирующего параметра а решает проблему плохой обусловленности матрицы ХТХ. Эти оценки смещены, в отличие от МНК-оценок. Однако доказано [7], что существует такое а, при котором получаемые оценки оказываются более эффективными, чем оценки МНК (известно, что МНК-оценки наиболее эффективны среди несмещенных оценок). Тем не менее, четких правил выбора этого параметра нет. Поэтому в дальнейшем при вычислениях мы будем последовательно уменьшать величину а, начиная с а =0,1 до достижения наилучшей точности оценок.

Для оценки погрешности калибровочной модели в процессе обучения сравним

между собой «точный» вектор весовых коэффициентов У = ( V,...,УЛт Т, рассчитанный в статье [6] методом анализа иерархий и расширенный за счет введения группового коэффициента цены:

V =(0,649 0,122 0,229 1,000)г,

(15)

Л / Л Л \

и оцениваемый по формуле (14) вектор Ус = (Vс 1 ,...,У ст ), последовательно уменьшая величину а. Относительная ошибка калибровки определяется формулами

І = 1

V

где

А т

V Е =І

ZV/

І=1

(16)

Рассчитаем вектор весовых коэффициентов Ус и относительную ошибку калибровки 5у для различных величин регуляризирующего множителя а (табл. 2).

Таблица 2

Зависимость ошибки калибровки 6у от параметра а

т

Параметр а 10-1 10-2 10-6 10-12 10-14

<5у 0,299 0,212 0,208 0,208 0,253

Как видим, с уменьшением значений а относительная ошибка калибровки 5 у снижается до 20,8 %. Предпоследняя графа табл.2 содержит минимально достижимую ошибку 0,208, а последняя графа отражает тот факт, что при а = 10-14 матрица _ ЛТХ ] уже плохо обратима из-за ограниченной разрядности компьютера. Наилучшее приближение к вектору весовых коэффициентов после калибровки примет вид

УЛс = (0,771 0,049 0,360 0,83б)Т. (17)

На первый взгляд ошибка в 20,8 % кажется большой. Однако это объясняется слишком малым количеством референтных данных: мы проводили обучение калибровочной модели по данным всего лишь 3 известных образцов, а обычно процесс калибровки требует для четырех признаков х{ объекта экспертизы референтных данных 8-12

образцов (известных приборов) [1]. С учетом этого обстоятельства полученный результат можно считать вполне объяснимым.

Прогноз обобщенного показателя качества нового объемного извещателя.

Итак, на первом этапе многомерной калибровки на основе обучения калибровочной модели (2) получена оценка неизвестного вектора групповых весовых коэффициентов (17). Перейдем ко второму этапу многомерной калибровки — прогнозированию обобщенного показателя J нового прибора.

Рассмотрим новый объемный извещатель «Сокол-Р» и выберем его признаки х1 такими же, как и для трех известных образцов (см. табл.1). Получим нормированные значения х^ его признаков согласно формулам (4)— (6) и сведем полученные результаты в таблицу (табл.3).

Таблица 3

Характеристики нового объемного извещателя «Сокол-Р»

Признаки

Вид количественные 1-4 наличия 5-6 качественные 7-10 цены

N° 1 2 3 4 5 6 7 8 9 10 11

х,- 12 м 9 м 0,3 м/с 16тА Да Нет Нет 4,3 3,8 4,2 1888

А х 1,00 1,00 1,00 1,00 1,00 0,00 0,00 0,86 0,76 0,84 0,558

1,000 0,540 0,836 0,558

Рассчитаем обобщенный показатель «качество-цена» нового прибора двумя способами : 1) используя полученную после калибровки оценку вектора групповых весовых коэффициентов (15) — показатель Jс ; 2) используя «точный» вектор весовых коэффициентов (10), рассчитанный в статье [6] методом анализа иерархий и расширенный за счет группового коэффициента цены — показатель J :

Jc = 1,565 , J = 1,464. (16)

Относительная ошибка предсказания обобщенного показателя структуры капитала

8J = = 0,069. (17)

Итак, относительная ошибка прогноза составляет 6,9 %, что является вполне удовлетворительным результатом. Обратим внимание на то, что эта небольшая погрешность предсказания достигается при значительно большей относительной ошибке

оценки весовых коэффициентов Vc = 20,8%. Это объясняется тем, что при суммировании слагаемых Vc i!ki обобщенного показателя J по формуле (3) часть из них имеет

большую величину, чем соответствующие слагаемые референтного показателя J, а другая часть — меньшую величину. Поэтому наблюдается эффект частичной взаимной компенсации слагаемых. Последнее утверждение можно доказать, используя известное из функционального анализа неравенство Коши [4]:

|(Vc -V,X)<|Vc - VI-IXI. (18)

Л

Объединив значения обобщенного показателя качества J для трех известных объемных извещателей (см. формулу (12)) и полученное значение (16) для прогнозируемого прибора, для лучшей сравнимости результатов разделим их на максимальное

Л

значение 1,807. Тогда показатель «качество-цена» сравниваемых приборов J примет значения (в порядке возрастания): 0,866 — «Сокол-Р»; 0,909 — «Орлан»; 0,930 —

«Сокол-2»; 1,000 — «Астра-551». Таким образом, новый объемный извещатель «Сокол-Р» по результатам экспертизы получил наихудшую оценку, что объясняется его излишне завышенной ценой.

Вывод. Обычное для теории множественной линейной регрессии применение метода наименьших квадратов в нашем случае оказалось невозможным, поскольку количество признаков m было даже большим, чем число образцов n . В этом случае мат-

T

рица X X необратима. Как известно [1,2,7], для высокой точности оценивания требуется совершенно обратное соотношение n > (2,5 - 3)m .

Для преодоления указанного затруднения использован метод гребневой (ridge) регрессии. Результаты численного анализа подтверждают эффективность данного подхода для обучения (калибровки) регрессионной модели.

Так, даже в случае явной недостаточности количества образцов (известных объемных извещателей) погрешность прогнозирования обобщенного показателя качества составила 6,9 %, что вполне приемлемо для поставленной задачи. Привлечение для калибровки большего количества данных об известных приборах позволит получить еще более точную оценку.

ЛИТЕРАТУРА

1. Эсбенсен К. Анализ многомерных данных. Избранные главы: пер. с англ. / под ред. О.Е. Родионовой. — Черноголовка: Изд-во ИПХФ РАН, 2005. — 160 с.

2. Доугерти К. Введение в эконометрику: пер. с англ. — М: ИНФРА-М, 1999.

— 402 с.

3. Бухарин С.В., Мельников А.В. Кластерно-иерархические методы экспертизы экономических объектов: монография. — Воронеж: Научная книга, 2012. — 276 с.

4. Треногин В. А. Функциональный анализ: учеб. пособие. — М.: Наука, 1980.

— 495 с.

5. Саати Т. Принятие решений: Метод анализа иерархий: пер. с англ. — М.: Радио и связь, 1993. — 278 с.

6. Волков Д.А., Мельников А. В., Навоев В. В. Технико-экономическая экспертиза объемных извещателей охранно-пожарной сигнализации // Вестник Воронежского института МВД России. — 2013. — №2. — С. 172—181.

7. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. — М.: Дело, 1997. — 248 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.