Моделирование и оценка показателей надежности и отказоустойчивости
систем связи
А.Н. Земцов, Ньяти Рональд Свондо Волгоградский государственный технический университет
Аннотация: Отказы в современных сетях связи являются фактором, влияющим на показатели экономической эффективности организации. Основной задачей проекта является исследование отказов элементов сети с целью повышения показателей надежности и отказоустойчивости систем связи путем внесения изменений в ее структуру. Выбранная стратегия восстановления отказавшего элемента может существенно влиять на показатели надежности. Результаты имеют важное значение для обеспечения требуемого уровня отказоустойчивости при ограниченных эксплуатационных расходах. Ключевые слова: отказоустойчивость, высокая доступность, отказ, надежность, восстановление, моделирование.
В настоящее время отечественная телекоммуникационная отрасль стоит на пороге внедрения пятого поколения связи, который даст толчок развитию не только телекоммуникационной, но и другим отраслям экономики, развитию инновационных цифровых услуг. Этот этап развития телекоммуникационных сетей характеризуется значительным ростом сложности инфраструктуры с поддержкой до 1 млн. абонентских устройств на 1 кв. км, повышением требований к качеству предоставляемых услуг, в том числе, снижением задержки передачи до 1 мс, и менее. При этом сетевая инфраструктура удовлетворять требованиям к показателям экономической эффективности [1], как следствие, предъявляются все более высокие требования к надежности систем связи. Низкая отказоустойчивость гарантированно приводит к потере клиентов и убыткам [2]. Повышение отказоустойчивости сети связи сопряжено с дополнительными затратами, которые могут превысить прибыль, получаемую от предоставления услуг связи. В связи с этим задача обеспечения требуемых показателей надежности [3] и отказоустойчивости сети связи при заданных затратах на ее проектирование или модернизацию является актуальной задачей. Жизненный цикл работы программного обеспечения показан на рис. 1.
Рис. 1. - Жизненный цикл работы программы В административных центрах субъектов РФ установлено порядка 1 -г 1 Гн шкафов с оборудованием. Помимо телекоммуникационного и
связного оборудования, каждая базовая станция сотовой связи содержит источник бесперебойного питания, предназначенный для обеспечения работоспособного состояния базовой станции в случае отключения электроэнергии, а также климатическую технику, задача которой заключается в обеспечении температурного режима, в первую очередь, для функционирования аккумуляторных батарей.
Например, типичной является ситуация, когда на базовой станции кондиционеры работают в конфликтующих режимах: один на обогрев, а другой - на охлаждение. При отказе кондиционера температура внутри климатического телекоммуникационного шкафа значительно превышает
максимально допустимые предельные значения и, как следствие, оборудование выгорает, или разрушается со скоростью взрыва из-за деформации и отсоединения газоотводных трубок, что приводит к накоплению водорода в термошкафе, который детонирует. Другими словами, в сетях связи нередки зависимые, частичные и неявные отказы, исследованию которых посвящен ряд работ [3-5].
Широко известны многие аналитические методы оценки показателей надежности и отказоустойчивости сетевых структур, такие как: полный перебор всех состояний, метод особой точки, определение возможных путей, нахождение возможных сечений [6]. Получили развитие методы оценки на основе теории графов, а также логико-вероятностные методы. Для сетей связи большой размерности наиболее приемлемым методом является имитационное моделирование.
Сети связи относятся к сложным системам, имеющим, как правило, внутреннюю избыточность, при которой выходы из строя отдельных узлов могут не приводить к прекращению обмена сообщениями между другими узлами сети. Отказом системы считается такое сочетание вышедших узлов в сети, при котором все соединительные тракты передачи между рассматриваемыми узлами прерываются. Имеются различные подходы к решению этой проблемы [7, 8].
Основным элементом приложения является модуль-симулятор, который проводит моделирование отказов элементов заданной телекоммуникационной сети. Алгоритм моделирования отказов представлен на рис. 2. Предлагаемый подход позволяет выполнять моделирование отказов и оценку надежности и отказоустойчивости систем связи.
Для моделирования отказа п элементов сети связи определим суммарную интенсивность отказов как Л—[5]. Найдем условные
интенсивности отказов элементов сети связи как у1 = —.
Определим соответствие между вероятностью отказа 1-го элемента
сети связи и интервалом, пропорциональным его интенсивности отказа
Разобьем интервал [0,1] на п интервалов так, чтобы длина ¿-го интервала
равнялась Выбирая из равномерного в интервале [0,1] распределения
случайную величину будем определять, на какой интервал попадает
случайная величина ^ Попадание случайной величины на ¿-й интервал
определяет отказ ¿-го элемента
Очевидно, что при достаточно большом количестве испытаний количество попаданий на ¿-й интервал будет пропорционально его ширине -
интенсивности отказа Д^ т.е. отказы элементов сети связи воспроизводятся в
соответствии с заданными интенсивностями.
Используется восстановление?
Рис. 2. - Обобщенный алгоритм работы единичной симуляции отказа
системы.
После определения отказавшего элемента сети связи путем розыгрыша случайной величины необходимо определить время до отказа этого
элемента Для экспоненциального распределения времен отказов
.
Если используется восстановление, задействованы очереди ожидания обслуживания и ремонтные единицы или бригады (РЕ).
Количество РЕ может быть ограниченным и неограниченным. В первом случае если к текущему моменту все РЕ заняты (обслуживают заявки), то вновь прибывшие заявки остаются в очереди ожидания
:
обслуживания (бесконечная). Иллюстрация жизненного цикла заявок при восстановлении показана на рис. 3.
Рис. 3. - Схема обслуживания заявок на восстановление.
В случае отказа каждого элемента формируется заявка на выполнение ремонтных работ, которая попадает в очередь заявок, затем заявки из очереди, при наличии свободных РЕ, обслуживаются и удаляются после выполнения ремонтных работ. При этом возможны различные дисциплины постановки заявок из очереди на обслуживание. В среде моделирования реализованы различные дисциплины обслуживания: FIFO - сначала восстанавливаются элементы, отказавшие первыми; LIFO - сначала восстанавливаются элементы, отказавшие в последнее время; IMPORTANT FIRST - приоритет имеют элементы с наибольшим индексом встречаемости в маршрутах; FAST FIRST - приоритет имеют элементы с наименьшим временем восстановления.
В ходе экспериментов анализируется возможность применения различных стратегии восстановления на разных ситуациях и при различных параметрах восстановления, таких как производительность ремонтных бригад - интенсивность восстановления, время подъезда бригады к объекту, и другие.
Обобщенный алгоритм восстановления показан на рис. 4. Восстановление заканчивается, когда отремонтированы все элементы, время
окончания восстановления которых меньше либо равно текущему времени -времени отказа текущего элемента, при условии, что очередь пуста, или, когда заканчиваются свободные ремонтные единицы.
Есть восстанавливаемые элементы к текущему времени?
Все элементы восстановлены и нет в очереди?
Рис. 4. - Обобщенный алгоритм восстановления. Пример гистограммы эмпирического распределения опытной вероятности появления отказа в интервалах наработки [9] показан на рис. 5. Все технические характеристики взяты из отчетов производителей РЭА, а также операторов связи и региональных интернет-провайдеров.
......
0,000 24 468,814 48 937,627 73 406,441 97 875,255 122 344,068
Рис. 5. - Гистограмма отказов. Разработанное программное обеспечение позволяет осуществлять моделирование и оценку показателей надежности и отказоустойчивости систем связи. Были исследованы процессы отказов функционирования систем связи, а также проведено моделирование различных стратегий восстановления и их влияние на показатели надежности сети, предложена схема обслуживания заявок на восстановление. Предлагаемый подход позволил снизить убытки и оптимально распределить задания для ремонтных бригад, в том числе, и при проведении профилактических работ.
Литература
1. Шапошников, Д.Е. Применение принципа гарантированного результата для учёта качественной информации о предпочтениях при комплексной оценке качества функционирования телекоммуникационных сетей // Инженерный вестник Дона, 2014, № 4. URL: ivdon.ru/ru/magazine/archive/N4y2014/2574.
2. Пащенко У.Ю. Корпоративная сеть как инструмент повышения эффективности управления предприятием // Экономика и предпринимательство, 2018. №10 (99). С. 1250-1254.
3. Шурыкин А. А., Полуянович Н.К. Оценка математического ожидания ресурса изоляции в задачах повышения надежности электрооборудования // Инженерный вестник Дона, 2019, № 2. URL: ivdon.ru/ru/magazine/archive/n2y2019/5756.
4. Зотов А.И., Гриценко В.В., Черпаков А.В. Частичный отказ в теории надежности // Инженерный вестник Дона, 2018, № 4. URL: ivdon.ru/ru/magazine/archive/n4y2018/5350.
5. Каяшев А.И., Рахман П.А., Шарипов М.И. Анализ показателей надежности локальных компьютерных сетей // Вестник УГАТУ, 2014. Т.17. № 5(58). С. 140-149.
6. Таранов М.А., Корчагин П.Т., Системный анализ надежности и перспективы её повышения для систем электроснабжения потребителей // Инженерный вестник Дона, 2018, № 3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5084.
7. Girao-Silva R. Improving network availability - A design perspective // Third International Congress on Information and Communication Technology ICICT 2018, 2018. Vol.797 .pp. 799-817.
8. Peralta J.A. High availability WAN implementation with MPLS to improve network connectivity in a financial institution // Lecture Notes in Engineering and Computer Science, 2017. pp. 47-50.
9. Гришко А.К. Определение показателей надежности структурных элементов сложной системы с учетом отказов и изменения параметров // Измерение. Мониторинг. Управление. Контроль, 2016. №2 (16). С. 51-57.
References
1. Shaposhnikov, D.E. Inzenernyj vestnik Dona (RUS), 2014, № 4. URL: ivdon.ru/ru/magazine/archive/N4y2014/2574.
2. Pashhenko U.Ju. Jekonomika i predprinimatel'stvo, 2018. №10 (99). pp. 1250-1254.
3. Shurykin A.A., Polujanovich N.K. Inzenernyj vestnik Dona (RUS), 2019, № 2. URL: ivdon.ru/ru/magazine/archive/n2y2019/5756.
4. Zotov А.I., Gricenko V.V., Cherpakov А.V. Inzenernyj vestnik Dona (RUS), 2018, № 4. URL: ivdon.ru/ru/magazine/archive/n4y2018/5350.
5. Kajashev A.I., Rahman P.A., Sharipov M.I. Vestnik UGATU, 2014. ^17. № 5(58). pp. 140-149.
6. Taranov M.A., Korchagin P.T., Inzenernyj vestnik Dona (RUS), 2018, № 3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5084.
7. Girao-Silva R. Third International Congress on Information and Communication Technology ICICT 2018, 2018. Vol.797 .pp. 799-817.
8. Peralta J. A. Lecture Notes in Engineering and Computer Science, 2017. pp. 47-50.
9. Grishko A.K. Izmerenie. Monitoring. Upravlenie. Kontrol', 2016. №2 (16). pp. 51-57.