Кораблев Е.Н., Влацкая И.В.
Оренбургский государственный университет E-mail: liss-evgenii@mail.ru
ПРИМЕНЕНИЕ ДИСПЕРСИОННОГО АНАЛИЗА ДЛЯ ОПТИМИЗАЦИИ КОЛИЧЕСТВА ДАТЧИКОВ ОХРАННОЙ ЗОНЫ ПРОДУКТОПРОВОДА
Для защиты продуктопровода от несанкционированных врезок с целью хищения перекачиваемого агента (нефть, газ и пр.) применяются автоматизированные системы мониторинга несанкционированных действий в охранной зоне продуктопровода. В качестве датчиков обнаружения злоумышленников используются геофоны. С помощью метода дисперсионного анализа предложено оптимальное количество датчиком на разные участки продуктопроводов.
Ключевые слова: дисперсионный анализ, несанкционированные действия, врезки, геофоны, автоматизированная система, продуктопровод.
Транспорт нефти и газ на территории РФ осуществляется с помощью многокилометровых систем продуктопроводов. Для защиты данных систем транспорта от несанкционированных врезок со стороны злоумышленников с целью хищения перекачиваемого агента предусматриваются различные технолологии и технические средства защиты. Одно из таких решений защиты - автоматизированная система мониторинга несанкционированных действий в охранной зоне продуктопровода (АСМНД).
Принцип работы системы [1]:
Несанкционированные действия сопровождаются механическими воздействиями, производимыми человеком или техникой на грунт в охранной зоне продуктопровода. Данные воздействия создают шум, который улавливают геофоны (датчики), расположенные на охраняемом участке. Группа геофонов располагается на охраняемом участке продуктопровода. Информация с геофонов в виде нормируемого сигнала передаётся на шкаф сбора данных с микропроцессорными устройствами. Микропроцессорные устройства фиксируют и накапливают информацию с геофонов. Далее по заложенным алгоритмам в шкафе сбора данных происходит анализ параметров. Обработанные данные с микропроцессорных устройств передаются на уровень оперативно-производственной службы, на АРМ диспетчера.
На рисунке 1 приведена структурная схема регистрации сигнала с геофонов.
Экспериментальными данными установлено следующее: для охраны участка длиной 10 км от несанкционированных врезок в системе необходимо использовать 9-11 датчиков. Однако существуют участки меньшей длины. Следователь-
но, для таких участков необходимо меньшее количество датчиков. Рассмотрим предположение, что минимальное количество датчиков равно 3 шт. на 1 км. Минимальное количество выбрано с учётом возможных погрешностей и вероятностью выхода из строя одного из датчиков.
Рассмотрим несколько продуктопроводов с разными длинами участков и разным количеством датчиков на этих участках. Для проверки нашего утверждения о минимальном количестве датчиков на различных участках продуктопроводах впервые применен метод дисперсионного анализа.
Дисперсионный анализ был разработан и предложен английским ученым, математиком и генетиком Рональдом Фишером в 20-х годах XX века.
Дисперсионный анализ - это статистический метод оценки связи между факторными и результативным признаками в различных группах, отобранный случайным образом, основанный на определении различий (разнообразия) значений признаков.
Дисперсионный анализ - метод, проверки гипотез о равенстве трёх и более средних, основанный на F-критерии [2].
Ф - фильтр, У - усилитель, РУ - регистрирующее устройство
Рисунок 1. Структурная схема регистрации сигнала с геофона
Анализ, который рассматривает только одну переменную, называют однофакторным дисперсионным анализом (метод, проверяющий влияние на зависимую переменную одной независимой переменной (фактора)). В нашем случае исследуемая зависимая переменная -количество датчиков. Рассматривается только один воздействующий фактор - участок про-дуктопровода (участок 1,2,3,4), который имеет 5 различных интервалов.
В основе дисперсионного анализа лежит анализ отклонений всех единиц исследуемой совокупности от среднего арифметического. В качестве меры отклонений берется дисперсия - средний квадрат отклонений. Отклонения, вызываемые воздействием факторного признака (фактора) сравниваются с величиной отклонений, вызываемых случайными обстоятельствами. Если отклонения, вызываемые факторным признаком, более существенны, чем случайные отклонения, то считается, что фактор оказывает существенное влияние на результативный признак.
Факторные признаки - это те признаки, которые влияют на изучаемое явление. Результативные признаки - это те признаки, которые изменяются под влиянием факторных признаков.
Для расчёта используем Метод по Фишеру (Fisher) с критерий F (значения F выбираются с помощью теоретических значений распределения Фишера-Снедекора). Метод применяется в однофакторном дисперсионном анализе, когда совокупная дисперсия всех наблюдаемых значений раскладывается на дисперсию внутри отдельных групп и дисперсию между группами.
Принцип применения метода дисперсионного анализа
Формулируем нулевую гипотезу ( Н0 ), то есть, предполагаем, что исследуемые факторы (количество датчиков) не оказывают никакого влияния на значения результативного признака (длины участков) и полученные различия случайны.
Затем определяем, какова вероятность получить наблюдаемые (или более сильные) различия при условии справедливости нулевой гипотезы.
Если эта вероятность мала, то мы отвергаем нулевую гипотезу и заключаем, что результаты исследования статистически значимы.
Алгоритм расчёта:
1. Построение дисперсионного комплекса.
2. Вычисление средних квадратов отклонений.
3. Вычисление дисперсии.
4. Сравнение факторной и остаточной дисперсий.
5. Оценка результатов с помощью теоретических значений распределения Фишера-Сне-декора.
1. Построение дисперсионного комплекса.
Построим таблицу 1 с результативными и факторными признаками
2. Вычисление средних квадратов отклонений.
Вычисление суммы вариант по каждой градации факторов осуществляется по следующей формуле:
£ у. = VI + V 2 + V 3
Вычисление общей суммы вариант ( £ Уобщ. )
по всем градациям факторного признака осуществляется по следующей формуле:
£ Уобщ. = £ ^+£ ^2+£ ^з
Расчёт средних квадратов отклонений представлен в таблице 2.
3. Вычисление дисперсий.
Вычисление дисперсии:
^общ. ^факт.+^ост.
где Д,бщ. - общая дисперсия, характеризуется разбросом вариант (наблюдаемых значений) от общего среднего;
Дфакт. - факторная (межгрупповая) дисперсия, характеризует разброс групповых средних от общего среднего;
А,ст. - остаточная (внутригрупповая) дисперсия, характеризует рассеяние вариант внутри групп.
Вычисление факториальной дисперсии: %кт. = £ Ь-И
Вычисление Ь проводится по формуле:
* = £у1 ;
п
Вычисление Н проводится по формуле:
(£у)
H=
I'
Вычисление остаточной дисперсии:
Поет. — Х^бщ. - X Й ’
Вычисление общей дисперсии:
П — X V2 — ^
общ. общ.
Расчёт дисперсий представлен в таблице 3.
4. Расчет основного показателя силы влияния изучаемого фактора.
Показатель силы влияния г\2 факторного признака на результат определяется долей фак-
ториальной дисперсии пфакт в общей дисперсии Ообщ., п2 (эта) - показывает какую долю, занимает влияние изучаемого фактора среди всех других факторов и определяется по формуле:
п2 — °окт_ *100%
п
общ.
Расчёт основного показателя представлен в таблице 4.
Таблица 1. Результативные и факторные признаки
Участок продуктопровода Количество геофонов (факторный признак)
группировки фактора
до 1 км от 1 до 2 км от 2 до 4 км от 4 до 8 км от 8 до 10 км
участок 1 3 3 3 5 9
участок 2 3 3 4 6 10
участок 3 3 3 4 7 11
участок 4 3 3 4 8 11
Таблица 2. Расчёт средних квадратов отклонений
Применяемые формулы и условные обозначения Градации факторного признака г=4 (количество градаций)
V 3,3,3,3 3,3,3,3 3,4,4,4 5,6,7,8 9,10,11,11
N 4 4 4 4 4
XV 3+3+3+3=12 3+3+3+3=12 3+4+4+4=15 5+6+7+8=26 9+10+11+11=41
м 1“ 12+12+15+26+41=106
М (V2 ) = V!2 +^22 + V2 9+9+9+9=36 9+9+9+9=36 9+16+16+16=57 25+36+49+64=174 81+100+121+121=423
І м 36+36+57+174+423=726
<Мкг 144 144 225 676 1681
Таблица 3. Расчёт дисперсий
Применяемые формулы и условные обозначения Градации факторного признака г=4 (количество градаций)
*—Х 'I2 п 144/4=36 144/4=36 225/4=56,25 676/4=169 1681/4=420,25
X * 36+36+56,2+169+420,25=717,45
йИ и 11236/20=561,8
^„т.=мЬ-Н 717,45-561,8=155,65
Dcбщ. = М- Н 726-561,8=164,2
я^М^-МА 726-717,45=8,55
Таблица 4. Расчет основного показателя силы влияния изучаемого фактора
Применяемые формулы и условные обозначения Градации факторного признака г=4(количество градаций)
, Дф п — ф * 100% Дс6щ. 155,65/164,2=94,79
О2 — Дфакт. факт- г -1 155,65/3=51,88
N - г 8,55/15=0,57
о 2 г, О факт. Г — О2 „ст. 51,88/0,57=91,01
степени свободы VI — п -1 v2 — N -1 •Г) т 1-н II II 1-н тГ о >
¥ > Fst. 91,01 ^ от 3,3 до 5,4
5. Оценка результатов с помощью теоретических значений распределения Фишера-Снедекора
О 2
Р = О Факт- > Р„{.
О ост.
где ¥- критерий Фишера;
¥&. - табличное значение [3]. о2 факт. ,О2 ост. - факториальная и остаточная девиаты отклонение от средней линии, определяются по формулам:
„.2 _ ^ ост.
О ост. —
N - г
где г - число градаций факторного признака.
Сравнение критерия Фишера ^) со стандартным (табличным) F проводим по графам таблицы с учетом степеней свободы: у1 — п -1 у2 — N -1
По горизонтали определяем у1 по вертикали у2, на их пересечении определяют табличное значение ¥, где верхнее табличное значение р > 0,05, а нижнее соответствует р > 0,01, и сравнивают с вычисленным критерием ¥. Если значение вычисленного критерия ¥ равно или больше табличного, то результаты достоверны и Н 0 не отвергается [4].
Вывод
Выявлено, что сила влияния количества датчиков на участках продуктопровода составляет 94,79%. Для всех участков можно с вероятностью 91,01 утверждать, что выбранное количество датчиков соответствует длинам участков. Таким образом, нулевая гипотеза ( Н 0) не отвергается и предложенное количество датчиков на разные длины участков считается доказанным.
28.10.2013
Работа выполнена при поддержке Российского фонда фундаментальных исследований (Договор №НР 13-07-97025/13 от 10.07.2013 г.), а также Министерства образования Оренбургской области (Соглашение №13-07-97025 от 23.07.2013 г.)
Список литературы:
1. Кораблев Е.Н., Ягудина Л.В., Сосновцева Е.В. Решения по структуре и функционированию автоматизированной системы мониторинга несанкционированных действий в охранной зоне продуктопровода, требования к основным элементам системы // Проблемы сбора, подготовки и транспорта нефти и нефтепродуктов. - 2012. - №4. - С. 137-142.
2. Иванов О.В. Статистика. Учебный курс для социологов и менеджеров. Часть 2. Доверительные интервалы. Проверка гипотез. Методы и их применение. - М. 2005. - 220 с.
3. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 592 с.
4. Шеффе Г. Дисперсионный анализ. - М.: Наука. Главная редакция физико-математической литературы, 1980 - С. 476485.
Сведения об авторах:
Кораблев Евгений Николаевич, магистрант кафедры алгебры и математической кибернетики математического факультета Оренбургского государственного университета 460018, г. Оренбург, пр-т Победы, 13, ауд. 1410, тел. (3532) 276976, e-mail: liss-evgenii@mail.ru Влацкая Ирина Валерьевна, заведующая кафедрой компьютерной безопасности и математического обеспечения информационных систем математического факультета Оренбургского государственного университета, кандидат технических наук, доцент 460018, г. Оренбург, пр-т Победы, 13 ауд. 2131, тел. (3532) 372534, e-mail: mois@mail.osu.ru
UDC 681.5:658.382 Korablev E.N. Vlatskaya I.V.
Orenburg state university, e-mail: liss-evgenii@mail.ru
APPLICATION OF THE DISPERSIVE ANALYSIS FOR OPTIMIZATION OF NUMBER OF SENSORS SECURITY ZONE OF THE PRODUCTS PIPELINE.
For the purpose of plunder of the pumped-over agent (oil, gas and so forth) are applied to protection of the products pipeline against unauthorized inserts the automated systems of monitoring of unauthorized actions in a security zone of the products pipeline. As sensors of detection of malefactors geophones are used. By means of a method of the dispersive analysis the optimum quantity the sensor on different sites of products pipelines is offered.
Key words: the dispersive analysis, unauthorized actions, inserts, the geophones, the automated system, the products pipeline.
Bibliography:
1. Korablev E.N. Yagudin L.V. Sosnovtseva E.V. Decisions on structure and functioning of the automated system of monitoring of unauthorized actions in a security zone of the products pipeline, the requirement to basic elements of system// Problems of collecting, preparation and transport of oil and oil products. - 2012. - No. 4. - Page 137-142.
2. Ivanov O. V. Statistics. Training course for sociologists and managers. Part 2. Confidential intervals. Check of hypotheses. Methods and their application. - M 2005. - 220 pages.
3. Kobzar A.I. Prikladnaya mathematical statistics. For engineers and scientists. - M: FIZMATLIT, 2006. - 592 pages.
4. Scheff G. Dispersive analysis. - M: Science. The main edition of physical and mathematical literature, 1980 - Page 476-485.