УДК 004.2l2, 519.8l, 519.248
Посвящается чл.-корр. РАН Хорошевскому Виктору Гавриловичу
В.А. Павский, К.В. Павский
ВЕРОЯТНОСТНАЯ МОДЕЛЬ ОЦЕНКИ ПОКАЗАТЕЛЕЙ ФУНКЦИОНИРОВАНИЯ ВЫСОКОНАДЕЖНЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ С РЕЗЕРВОМ*
Построена математическая модель функционирования вычислительных систем с резервом. Рассчитаны показатели эффективности, позволяющие оценить функционирование системы как в момент времени, так и на промежутке.
______Распределенные вычислительные системы, структурная избыточность, надежность._____________________
Хорошевский Виктор Гаврилович - член-корреспондент Российской академии наук, профессор, доктор технических наук, заслуженный деятель науки РФ, заведующий Лабораторией вычислительных систем Института физики полупроводников им. А.В. Ржанова СО РАН, заведующий кафедрой «Вычислительные системы» ФБГОУ ВПО «Сибирский государственный университет телекоммуникаций и информатики».
Им разработаны основы теории параллельного мультипрограммирования, построены стохастические дискретные и континуальные модели, позволяющие анализировать и оптимизировать функционирование распределенных вычислительных систем (ВС); получили завершение работы по теории потенциальной живучести ВС; созданы математический аппарат и технология экспресс-анализа эффективности функционирования большемасштабных распределенных ВС и осуществимости параллельного решения сложных задач. Разработаны параллельные алгоритмы организации функционирования вычислительных систем. Алгоритмы основываются на точных, эвристических и стохастических методах, обеспечивают экстремумы целевых функций и, следовательно, гарантируют оптимальную (суб- или стохастически оптимальную) параллельную обработку информации в вычислительных системах.
Широко известны работы В.Г. Хорошевского по архитектуре и проектированию распределенных ВС с программируемой структурой. Он является ведущим разработчиком первых в мире распределенных ВС с программируемой структурой «Минск-222» (МРП СССР, 1965) и управляющей системы (1967). Данные ВС позволили отработать инструментарий параллельного программирования, предвосхитивший появление Message Passing Interface (MPI).
Системы распределенной обработки информации и параллельные вычислительные технологии относятся к базовым средствам вычислительной техники нашего времени, обеспечивающим интенсификацию научно-технического прогресса.
Одним из ведущих быстроразвивающихся направлений в этой области являются большемасштабные распределенные вычислительные системы. Следует заметить, что под распределенностью понимается не территориальное удаление машин, а обработка информации.
Исследования проблемы организации эффективного функционирования распределенных вычислительных систем активно ведутся во многих странах. Предложен ряд эффективных архитектурных решений для построения высокопроизводительных ВС, наблюдается постоянное совершенствование аппаратурных компонентов обработки информации, созданы и продолжают развиваться технологии построения коммуникационных сетей высокой пропускной способности. Разработаны модели и инструментарий параллельного программирования. Ведутся активные исследования в области создания языков параллельного программирования. Согласно списку ТОР500 пиковая и фактическая производительности наиболее мощных вычислительных систем постоянно увеличиваются.
На июнь 2012 года первое место в списке TOP500 лучших суперкомпьютеров мира принадлежит США, суперкомпьютер Sequoia-BlueGene с числом ядер 1572864, пиковым быстродействием 20,132 p (petaflops, петафлопс, 1p = 1015 операций с плавающей запятой в секунду); второе перешло к Японии, Computer SPARC64, число ядер 705024, быстродействие 11,280 p; на пятом - Китай, Tianhe-1A-NUDTYHMPP, 186368, 4,7 p; на двадцать втором -Россия, «Ломоносов» (МГУ), 78660, 1,7 p.
Работа выполнена при поддержке Совета по грантам Президента РФ (грант № НШ-2175.2012.9), РФФИ (грант № 12-07-00145) и Министерства образования и науки РФ в рамках реализации Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009-2013 годы (грант № 2012-1.1-12-000-1005-018).
В области распределенных и высокопроизводительных ВС существует значительное количество проблем, заслуживающих пристального внимания исследователей. К таким проблемам относятся:
1) обеспечение отказоустойчивого функционирования большемасштабных ВС, насчитывающих в своем составе более миллиона компонентов;
2) эффективное использование ресурсов таких сложных комплексов по обработке информации;
3) анализ существующих и разработка новых, более перспективных архитектур ВС;
4) совершенствование инструментов параллельного мультипрограммирования распределенных ВС.
В США существуют национальные программы. Американцы считают, что создание суперкомпьютеров осуществляется исключительно в интересах национальной безопасности (!). И производящую компанию Сгау правительство США эффективно поддерживает. Так, например, проект Сгау XI получил финансовую поддержку от нескольких организаций правительства США, включая №А -агентство национальной безопасности. Первый вариант проекта уже создан, и с 2002 года осуществляются поставки Сгау XI. Их производительность в диапазоне 1,5-50 триллионов операций в секунду.
Если обратиться к истории, то созданная Сгау-1 (1976) конвейерная система обладала быстродействием 160 мегафлопс (160 миллионов операций с плавающей запятой в секунду). И она, в самом деле, была «большой» - это 12 клинообразных стоек, имеющих высоту 1,96 м и расположенных по дуге в 270° внутри окружности диаметром 2,63 м; ее цена была 5-9 млн долларов (в зависимости от конфигурации).
Сгау-1 - одна из самых лучших систем суперкомпьютеров своего времени. Это сейчас она кажется громоздкой, так как теперь компьютер с быстродействием на порядок большей производительностью размещается в одном кристалле. Фактически Сгау «присутствует» в каждом персональном компьютере. В подобные машины «вмонтирован» конвейерный способ обработки информации. Совершен переход с макроуровня на микроуровень, то есть архитектура суперкомпьютера 70-х годов прошлого столетия реализована в виде кристалла площадью в несколько десятков квадратных миллиметров. Современный суперкомпьютер является не чем иным, как множеством связных кристаллов (коллективом вычислителей).
Создание и развитие ЭВМ связывают с именем Джона фон Неймана, который в 40-50-е годы прошлого столетия создал концептуальную машину, по существу дела, имитирующую работу человека, занятого расчетами. Созданная в США на основе принципов Дж. фон Неймана ЭВМ ББУАС (1944-1950), а также независимо построенная в СССР под руководством С. Лебедева машина МЭСМ (1948-1951) по архитектурным возможностям и техническим характеристикам были приблизительно близки. В эти машины был заложен последовательный способ обработки информации. Однако последовательные ЭВМ уже в 60-х годах прошлого века не могли удовлетворить все потребности в вычислениях.
Пределом модификации архитектуры ЭВМ является вычислительный конвейер - «цепочка» блоков обработки информации. При заполнении конвейера все его блоки работают параллельно (как на конвейере по сборке, например, автомобилей), но каждый из них - над своими данными. Этот параллелизм обеспечивает необходимую производительность конвейера. При этом ясно, что каждые конкретные данные (операнды) последовательно проходят все этапы обработки на конвейере. Последнее накладывает ограничение в наращиваемости производительности конвейера. Конвейерные архитектуры являются основой идеологии компании Сгау.
Второй подход, который также зародился в 1960-х годах, основывался на использовании единого устройства управления и множества взаимосвязанных одинаковых «простых» процессоров, называемого матрицей. В результате такого параллелизма можно было достичь сколь угодно большой производительности. Классикой здесь явилась разработка американской матричной системы 1ЬЫАС-1У (прообраз Шегпег). В те же годы у нас в стране (в частности, в Сибирском отделении Академии наук СССР) был предложен более перспективный подход к построению вычислительных систем. Принцип такой: единого ресурса, единого управления нет. Имеется коллектив равноправных взаимосвязанных вычислителей, способных решать сложную задачу, представленную в параллельном виде.
При конструировании параллельных вычислительных систем следует поступать так же, как и при организации коллективов, объединенных общей работой. Именно сложность (трудоемкость) решаемых проблем определяет количественный состав коллектива. Хорошо известны задачи, решаемые таким коллективом, как бухгалтерия. Сложности решения проблем, связанных с созданием ядерной энергетики и космических аппаратов, потребовали организации суперколлективов (объединений НИИ, КБ, заводов и т.п.). Потребности общества в решении суперсложных вычислительных задач однозначно определяют построение соответствующих «вычислительных коллективов», представляющих собой множества связанных процессоров. Последнее и есть параллельная вычислительная система (ВС).
Иначе говоря, функционирование ЭВМ основывается на имитации работы вычислителя (человека, занимающегося расчетами), а ВС - коллективов вычислителей.
Распределенные вычислительные системы. В 60-е годы прошлого века в Сибирском отделении АН СССР, в Институте математики совместно с Вычислительным центром зародилась концепция распределенных вычислительных систем, в которых нет единого управления. Например, в какой-то определенный момент времени один из вычислителей будет управляющим, а затем, в иной ситуации, - другой. Это обеспечивает, в частности, живучесть и надежность ВС. Полная аналогия с обществом. В самом деле, в любом жизнеспособном коллективе могут происходить смены лидеров, но коллектив сохраняет свою работоспособность.
Концепция распределенных вычислительных систем основывается на принципе программируемости структуры (или автоматической реконфигурации). Последнее позволяет адаптировать архитектуру ВС под класс и сложность решаемых задач.
Инициаторами работ в области параллельных вычислительных технологий в Сибирском отделении были академики М.А. Лаврентьев и С.Л. Соболев. Кстати, Михаил Алексеевич много труда положил и для создания первой ЭВМ в СССР. Фундаментальный вклад в данное направление в 70-х и 80-х годах прошлого века внесли академики Н.Н. Яненко и Г.И. Марчук.
Непосредственным руководителем работ в Институте математики СО АН СССР в 60-х годах XX века был специалист по вычислительной технике Э.В. Евреинов. Его первая работа в соавторстве с Ю.Г. Косаревым о возможности построения ВС высокой производительности опередила американские публикации в данной области примерно на полгода. Под руководством Э.В. Евреинова создаются первые ВС: «Минск-222» (1965-1966) и управляющая вычислительная система для автоматизации научных исследований (1964-1967). К началу 1970-х годов завершается формирование концепции ВС с программируемой структурой как средств обработки информации, основанных на модели коллектива вычислителей.
Начиная с 1970-х годов теоретические и проектные работы в Сибирском отделении АН СССР по ВС с программируемой структурой ведутся под руководством чл.-корр. РАН В.Г. Хорошевского. Эти работы из академической сферы распространяются в промышленность, создается ряд систем: МИНИ-МАКС (1975), СУММА (1976), МИКРОС-1 (1986), МИКРОС-2 (1992), МИКРОС-Т (1996). В 1978 году издательством «Наука» публикуется монография
Э.В. Евреинова и В.Г. Хорошевского «Однородные вычислительные системы».
Следует заметить, что, когда строят компьютер или суперкомпьютер (параллельную ВС), никто не ссылается на авторов первых идей, а американцы признают и популяризируют только свои разработки. Мы, создав распределенную ВС «Минск-222», на шесть лет опередили американскую разработку 1ЬЫАС-1У [1].
Почему же у нас в научных кругах так устойчивы пессимистические настроения о том, что нам никогда не догнать ни Америку, ни Европу по части ЭВМ, не говоря уже о микроэлектронике? Мы никак не отстаем ни от американцев, ни от европейцев в области параллельных вычислительных технологий. Системы, сделанные для обороны и для космоса, до сих пор работают. В науке, в теории мы никогда не отставали, а по многим направлениям 1Т лидировали и не теряли своих позиций. Вопрос в другом - в технологии микроэлектронного производства и недостатке финансирования. В свое время произошло отставание в микроэлектронике. Но направления, которые мы развиваем, не предъявляют высоких требований к микроэлектронике. Мы имеем большие достижения в ряде разделов 1Т, которые на Западе стали разрабатываться заметно позже. Можно при-
вести пример из теории структур (топологии) ВС: как соединить большое число процессоров между собой? Каждый с каждым, практически нонсенс, нельзя. Оригинальный подход и решения получены школой В.Г. Хорошевского. Не только предложены специальные графы для описания масштабируемых структур ВС, но и построены каталоги оптимальных структур (обеспечивающие, в частности, живучесть ВС). Это, например, относится к диофантовым структурам, которые были определены и исследованы еще в начале 1970-х годов (названы в честь древнегреческого математика из Александрии Диофанта - III век н.э.). Примерно через 10 лет появились подобные американские работы. Свои графы они назвали «циркулянтными» [2].
В 60-х годах прошлого столетия основателями нашей школы (Э.В. Евреинов, Ю.Г. Косарев) была разработана методика крупноблочного распараллеливания сложных задач. На системе «Минск-222» были отработаны инструментарий и, в частности, схемы обмена информацией между ветвями параллельной программы. На Западе только в 1990-х годах получает широкое внедрение эквивалентный инструментарий MPI (Message Passing Interface) -библиотека функций для поддержки параллельных процессов. Эти средства необходимы для организации работы ВС в монопрограммном режиме (когда все ресурсы системы используются для решения одной сложной задачи, представленной в параллельной форме).
Современные ВС состоят из огромного количества процессоров (до полутора миллионов). Их ресурсы должны эффективно использоваться и при одновременном решении множества задач различной сложности (когда для каждой из них не требуется вся система). Речь идет о параллельном мультипрограммировании. Первые оригинальные методы и алгоритмы оптимизации функционирования распределенных ВС в мультипрограммных режимах были созданы нами еще в 1960-х и 1970-х годах. Но востребованными они оказались только сейчас. А результаты по надежности и живучести распределенных ВС? Мы продолжаем активно работать в этой области. Это относится и к другим математическим школам.
Модное слово «кластер» широко используется в науке: в биологии, физике, химии. А в вычислительной технике это синоним параллельной вычислительной системы. Само понятие введено в научный оборот американской фирмой DEC (Digital Equipment Corporation). Как строят кластеры и в чем оригинальность системы, созданной совместно Лабораторией вычислительных систем ИФП СО РАН и Центром параллельных вычислительных технологий СибГУТИ?
Например, Cray X - это специально разработанный кластер. Но существуют доступные стандартные программные компоненты, которые позволяют конфигурировать кластеры из персональных компьютеров. Если кластер построен из стандартных аппаратурных и программных компонентов, то он обладает некой свободой наращивания или сокращения числа процессоров. В этом случае применяют термин - масштабирование системы. Количество компьютеров в
кластере произвольное. Следовательно, из компьютеров можно сконфигурировать и суперкомпьютер. Надо понимать, что суперкомпьютер - это не класс систем, это средство обработки информации, дающее рекордные показатели по быстродействию.
Кластер, разработанный в лаборатории ВС ИФП, имеет свои особенности. Программируемость структуры - важнейший принцип, который делает ВС архитектурно универсальной, позволяет адаптировать ее к конкретной области применения. Система «Минск-222», созданная в 1965 году коллективом лаборатории ИМ СО РАН СССР совместно с КБ завода им. С. Орджоникидзе (г. Минск), была первой в мире ВС с программируемой структурой. Все последующие разработки (выполненные совместно с радио- и электронной промышленностью) также обладали этим свойством. Система МИКРОС, по сути, послужила прототипом для первой модели отечественных суперкомпьютеров семейства МВС-1000 (руководитель работ - академик В. Левин, НИИ «Квант», г. Москва). Последняя разработка - наш кластер. Он программно реконфигурируем, допускает масштабирование и является пространственно распределенным. Система обладает способностью самодиагностики - ищет неисправные ресурсы, реконфигурируется и пользователю выдает тот ресурс, который ему необходим. Это эквивалентно подходу в электроэнергетике. Когда вы включаете в розетку какой-либо прибор, то не интересуетесь, откуда выдана электрическая энергия. Так же и здесь - с любого узла кластера можно получить необходимую мощность для решения задачи. Это называют gгid-подходом. Существуют определенные технологии, стандартизация. Кластер - это параллельная система, но он может работать и как обычная сеть. Каждый компьютер может эксплуатироваться как в автономном режиме, так и в качестве одного из узлов кластера. Кластеры объединяют, и их множество составляет мультикластер. Такие системы - распределенные по управлению и в пространстве. Их быстродействие растет пропорционально увеличению числа машин.
Следует обратить внимание на то, что это достигается и в моно-, и в мультипрограммных режимах работы ВС. Параллельное мультипрограммирование имеет место и при обработке наборов задач и обслуживании потоков задач, представленных программами с различным числом ветвей. Например, управление полетом ракеты и даже космического аппарата. В данном случае набор задач раз и навсегда задан. А есть вычислительные системы коллективного пользования, задачи на них поступают в случайные моменты времени и со случайными характеристиками, или, как говорят, имеет место поток задач. Мы создали много точных, эвристических и стохастических методов и алгоритмов, простых в реализации не только на ЭВМ, но и на параллельных системах. Важно, чтобы они не были трудоемкими. Если средства организации функционирования не удовлетворяют этим требованиям, то ВС будет заниматься самоорганизацией, самосовершенствованием, а не обслуживанием поступающих задач. Во многих практических важных приложениях хорошо работает
стохастический подход. В самом деле, ВС - это вероятностный объект, в ней происходят отказы, выполняются процедуры самовосстановления или са-мореконфигурации. Поток задач по определению случайный. При оптимизации функционирования ВС используются различные целевые функции и, в частности, штраф за задержку решения задач (если это ВС коллективного пользования, то она обслуживает многих пользователей, штрафы можно истолковывать как выплаты пользователям в случае неудовлетворения их заявок, и наоборот, если заявки удовлетворяются, то ВС получает прибыль).
Эта ВС включает в себя кластер Лаборатории вычислительных систем и несколько кластеров Сиб-ГУТИ. Центр параллельных вычислительных технологий постоянно развивает ВС, наращивает аппаратурные и программные средства. Эта ВС используется для моделирования сложных проблем. Для нас же ВС - это инструмент для моделирования проблем анализа и организации функционирования распределенных систем обработки информации: как организовать огромные суперсистемы пространственно распределенных вычислительных ресурсов, чтобы они были эффективны. Здесь допустимы любые архитектуры. Уже есть средства, которые учитывают все ресурсы и оптимизируют их использование во всех режимах. Применяется весь арсенал соответствующих разделов математики: и континуальные, и дискретные модели, и динамическое, и стохастическое программирование, и теория массового обслуживания, и теория игр.
В СО РАН под руководством академика А. Алексеева работает Совет по супервычислениям. В его функции входит и формирование суперкомпьютера в Сибирском отделении АН. Сейчас 128-процессорный фрагмент отечественной системы МВС-1000 установлен в ИВМиМГ (Институт вычислительной математики и математической геофизики). На данной конфигурации уже можно моделировать сложные проблемы. Имеется доступ к ресурсам Межведомственного суперкомпьютерного центра, находящегося в Москве. Но ни в Москве, ни в Новосибирске пока не могут быть решены суперсложные задачи, представленные в параллельной форме; вычислительные возможности наших суперкомпьютеров достаточно скромны (см. Т0Р500). Поэтому единственный выход - создание пространственно распределенных систем. Такой подход позволяет объединить колоссальные вычислительные ресурсы и не связан со значительными финансовыми затратами.
Наша задача - создавать отечественную вычислительную индустрию. Может быть, мы будем отставать по микроэлектронике, но за счет наших архитектурных решений можно создавать суперкомпьютеры.
Мы решаем проблемы, связанные и с экономикой, и с обороной, и всевозможные научные проблемы в химии, физике, биологии и других отраслях науки, в которых нельзя обойтись без мощных средств вычислительной техники. Если мы хотим быть государством, иметь достойный уровень жизни граждан, значит, необходимо создавать, развивать современные средства обработки информации. Создавать, а не заимствовать, тем более что самые
лучшие компьютеры нам не продадут, но если даже продадут, то наша страна снова окажется в зависимости. В том числе помехой могут стать так называемые «закладки», не только программные, но и аппаратурные, благодаря которым вся информация может быть перекачана либо через Шете! либо через эфир. А у каждого государства есть свои секреты. Если мы будем использовать только западные технологии, у нас и вертолеты не взлетят. И суперкомпьютеры тоже нужно строить, потому что без них государство существовать не может. И мы обязаны этим заниматься. Необходимо интенсифицировать работы по созданию пространственных распределенных кластерных систем, систем с реконфигурируемой архитектурой, развивать свою элементную базу.
Одним из основных направлений развития теории вычислительных систем является анализ эффективности их функционирования. Анализ производится с использованием показателей, характеризующих надежность и живучесть, а также осуществимость параллельного решения задач.
Введение
При исследовании работы ВС как коллектива элементарных машин-вычислителей в качестве показателей эффективности используют либо вероятности состояний системы, либо математические ожидания случайных величин, характеризующих, например, число неисправных машин в момент времени /. Однако для полного анализа функционирования ВС требуется применение моментов (начальных, центральных) высших порядков (дисперсия, асимметрия, эксцесс и т.п.), вычисление которых затруднено ввиду отсутствия эффективных методов расчета и достоверной статистики для современных действующих и проектируемых ВС.
Поэтому при построении математических моделей желательно минимизировать число параметров, зависящих от проблемной статистики. Современные ВС требуют создания сложных многопараметрических моделей, а это приводит к тому, что оценка меры адекватности модели становится трудновыполнимой. Построение простых моделей приводит, скорее, к качественным оценкам функционирования систем, чем к количественным. Следовательно, создание простых и эффективных математических моделей с параметрами, имеющими качественную или достоверную, потенциально возможную статистику, является актуальным.
Предлагается расчет и оценки показателей функционирования ВС со структурной избыточностью.
Объекты и методы исследований
Большемасштабные вычислительные системы, состоящие из N достаточно высоконадежных элементарных машин (ЭМ) [2], из которых структурную избыточность составляют п ЭМ, при относительно быстрой замене отказавших ЭМ машинами из структурной избыточности позволяют поддерживать необходимую производительность в течение длительного промежутка времени. Это означает, что до тех пор, пока множество ЭМ, составляющих структур-
ную избыточность, не пустое, считается, что ВС имеет высокую производительность, иначе она переходит в состояние низкой производительности. Это условие позволяет получить дополнительную информацию относительно времени нахождения ВС в состоянии высокой производительности и, не усложняя модели, дать рекомендации относительно ее эффективной работы.
Итак, объектом исследования является резерв (структурная избыточность), исследовав состояния которого мы постараемся получить оценки для показателей функционирования данной ВС. Исследования будем проводить в рамках теории массового обслуживания [2-5].
Постановка задачи
Пусть ВС состоит из N ЭМ, п из них составляют структурную избыточность, а остальные N - п образуют основную подсистему. В случайные моменты времени любая из N - п ЭМ может выйти из строя. Вышедшая из строя ЭМ заменяется на одну из ЭМ структурной избыточности, а сама попадает в восстанавливающую систему (ВУ) и вместе с другими машинами, число которых не более чем п -1 , ждет начала обслуживания. В произвольные моменты времени ВУ начинает восстанавливать отказавшие машины все сразу. Время восстановления случайное. Если из строя выходит очередная ЭМ, а структурная избыточность пуста, то ВС переходит из состояния высокой производительности в низкую, но продолжает работать.
Построение модели основано на следующих допущениях: 1) так как п << N, система высоконадежна, выход из строя любой из ЭМ подчиняется экспоненциальному закону, то можно считать, что поток отказов генерируется бесконечным источником излучения, образуя пуассоновский процесс с интенсивностью N -Л; 2) восстановление любого числа 1 < к < п ЭМ осуществляется в соответствии с экспоненциальным законом распределения с общей интенсивностью ц . После восстановления ЭМ включается в основную подсистему ВС. О терминологии: ЭМ - требование, а восстановление - обслуживание.
Математическая модель
На систему массового обслуживания (СМО) поступает пуассоновский поток требований интенсивностью N -Л . Требование, поступившее в СМО, вместе с другими 0 < к < п требованиями ждет начала обслуживания. Если в системе уже находится п требований, то поступившее новое требование получает отказ и считается потерянным. Через некоторое время начинается обслуживание сразу всех к+1 требований. Время обслуживания - случайная величина, подчиняющаяся экспоненциальному распределению с общей интенсивностью л . Требуется вычислить
Рк (/) - вероятность того, что в момент времени t в СМО находится п - к требований, / е [0, ^),
к = 0,1,...,п, и провести анализ функционирования ВС.
Система дифференциальных уравнений имеет
вид
Ро(0=-и-Ро(0+N-Л-Д(0,
Рк(г) = -(N-Л+и)-Рк(г)+N-Л-Рк+Х(г), к=\,2,...,п-1, (1)
п-1
Рп(г) = -N-Л-Рп (г)+и-Ёрк (<)> к=0
с начальными условиями
Рп (0) = 1, Рк (0) = 0,0 < к < п-1 (2)
и условием нормировки
Ё Рк (т) = 1, Vте [0,~).
к=0
(3)
Преобразуем последнее уравнение системы (1) с учетом условия (3):
Решение (4)-(6) для уравнений системы (1) позволяет оценить скорость вхождения системы в стационарный режим.
Если система функционирует достаточно долго, то для вероятностей Рк (/) достаточно иметь решение для стационарного режима рк = Иш Рк (?), тогда решение системы (1) примет вид
Рп =
И
Рк =■
И- (N -Л)к
N-Л + И Гк (N -Л +и)к+1 N-Л
Р0 =
N-Л + и
Как уже было сказано, отсутствие элементов в резерве равносильно нахождению ВС в состоянии низкой производительности, вероятность попадания которой в это состояние равно Po, тогда
ДГ N-Л
ротк =1
И + N-Л
(7)
Рп (г) = -(NЛ + И) - Рп (г) + И .
Решение этого уравнения при начальных условиях (2) записывается в виде
Р (г) =
р
+-
N■ 1 + р N ■ 1
- +
(4)
■ е
-(N■X+р)г
N ■ X + р Далее, при к = п -1, получаем
р_,(0+ №)2 г
хе
-(т.+р) г
(N1 + р) (N1 + р)
NXр ■ е-( т+р )г
(5)
(N1 + р)2
Аналогично вышеизложенному получаем, что
Р0(г) =
(Ж)п р(Ж)
+-
(N1 + р)п (N1 + р)
хе
-(Ж+р)г
(М)п
(п -1)!( N1 + р)
-(NX+р)г .
гп-1 + (п-1)!-Е
1(М)к ■ (п - к-1)!
п-1 - (^+р)г
Е
-(Ж+р) ,
1 г !-(М + р)п
+(Ж)п-1 р ■ е +(Ж)п-1 ■ р ■ е
п-2 г ,г-к
хЕЕ—к--------г---------.
ии(N1) ■ (N1 + р)п-г ■ (г - к)!
+
- +
(6)
Зададим доверительную вероятность у того, что ВС находится в состоянии высокой производительности, тогда 1 - у = ротк. Логарифмируя (7), находим
кср =
1п(1 - у)
1п NЛ- 1п^ -Л + И)
+1,
где кср - среднее число элементов, составляющих
резерв; [х] - целая часть числа х.
В табл. 1 приведен пример зависимости среднего числа ЭМ структурной избыточности от числа ЭМ в ВС при заданной надежности.
а) 1 - у = 0,01; И = 2.5
Таблица 1 б) 1 - у = 0,05 ; и = 2.5
\ 103 104 105
10-3 5 22 188
10-4 3 5 22
\ N Л\ 103 104 105
10-3 4 15 123
10-4 2 4 15
Из таблиц следует, что, например (табл. 1б), при числе ЭМ в ВС < 105 структурная избыточность не превышает 0,15 % от общего числа ЭМ в ВС и Л = 10-4 ч-1.
Оценка вероятности нахождения ВС в состоянии низкой производительности в течение времени
Как уже отмечалось, многомашинные ВС в силу своего предназначения не должны находиться в состоянии отказа. Именно поэтому при их функционировании в состоянии низкой производительности
п
г
продолжает работу восстанавливающая система, в которую, очевидно, имеется очередь на восстановление отказавших ЭМ. Ясно, что как только очередь исчезает, так сразу ВС можно считать вошедшей в состояние высокой производительности.
Пусть £ - случайная величина, описывающая время восстановления элементарных машин в восстанавливающей системе. Пусть Е(т) = Р{£ > т} - вероятность того, что ВС в состоянии низкой производительности останется в течение времени не менее чем т, те [0, го).
Так как в модели рассматривается стационарный режим функционирования ВС, то Р{£ = 0} = ротк (в точке т = 0, Е(0) имеет разрыв). Учитывая, что все потоки простейшие, то вероятность того, что за время тоткажут к ЭМ:
Ук (т) = . ехр(-МЯт).
к!
Таким образом, имеем одноканальную систему массового обслуживания М/М/1, глубоко исследованную многими авторами [3-6], из которой при ц > МЯ следует, что
Е(т) = 1-^-1 . е~(л—Ш)т . (8)
^ Л + МЯЯ
Рис. 1 иллюстрирует зависимость функции Е(т) от времени т при N = 2.104, Я = 10-4 1/ч, ц = 2.5 1/ч, п = 1, 2, 4. Из рисунка следует, что при п > 2 результаты хорошо согласуются с ранее полученными в табл. 1.
Рис. 1. Зависимость функции Е(т) от времени т:
X = 2 . 10—4 1/ч; ^ = 2.5 1/ч
Эффективность функции Е(т) в рамках предложенной модели не только в простоте вычислений, но и в параметрах п и л, позволяющих оценить не только качественную, но и дать количественную оценку функционирования ВС живучих и со структурной избыточностью, избегая при этом громоздких, хотя и, может быть, более точных формул, значение которых, скорее всего, находится численными методами. На-
пример, если задать р = р(Х), то есть расширить возможности восстанавливающей системы, то можно показать, насколько существенно уменьшается время выхода ВС из состояния низкой производительности.
В самом деле, вернемся к формуле (8). При увеличении п вероятность входа ВС в состояние низкой производительности уменьшается. С другой стороны, если она в него вошла, то время выхода ВС из этого состояния будет зависеть от величины /л — МЯ и не зависеть от п, то есть в этом случае модель бессильна.
Попробуем извлечь пользу из второго сомножителя правой части формулы (6). Пусть А - событие, состоящее в том, что ВС вошла в состояние низкой производительности, тогда Р{А} = ротк. Рассмотрим условную вероятность Р{£ > т / А}. По определению
р{ / а}=РИШт
1 ] Р{А}
Но Р{А I (£ > т)} = Е (т), тогда
Р{ >т/ А} = ехр(—(л — МЯ)т). (9)
Пусть А = л — МЯ, Д > 0. Из формулы (4) следует, что для повышения эффективности функционирования ВС следует увеличить п. Из (7) и (8) следует, что при фиксированном п и больших А вероятность выхода ВС из состояния низкой производительности велика при малом т. Если п фиксировано и А мало, то из (8) следует, что необходимо увеличить значение А, то есть увеличить производительность ВУ.
То же самое справедливо и для А = /л — МЯ < 0, а именно: как только наметилась устойчивая тенденция к уменьшению числа ЭМ структурной избыточности, так сразу необходимо для ее сохранения изменить знак значения А, то есть опять за счет увеличения значения л .
Заключение
Подобные математические модели обычно не рассматриваются в классической теории массового обслуживания, поскольку они не полны, однако они не противоречивы и в состоянии описать в некотором смысле более широкий класс систем. Авторы работы постарались построить такую математическую модель, чтобы решения находились в аналитическом виде и соответствовали ее формулировке. В работе получено решение системы дифференциальных уравнений для вероятностей состояний структурной избыточности. Найдена зависимость числа машин резерва от вероятности невыхода системы на максимальный уровень производительности. Предложены формулы для оценки вероятности нахождения ВС в состоянии низкой производительности в течение времени. Решения найдены в аналитическом виде. Формулы могут быть использованы при экспресс-анализе функционирования распределенных вычислительных систем.
Список литературы
1. Евреинов, Э.В. Однородные вычислительные системы / Э.В. Евреинов, В.Г. Хорошевский. - Новосибирск: Наука, 1978. - 318 с.
2. Хорошевский, В.Г. Архитектура вычислительных систем / В.Г. Хорошевский. - М.: МГТУ им. Баумана, 2008. -
520 с.
3. Гнеденко, Б.В. Введение в теорию массового обслуживания / Б.В. Гнеденко, И.Н. Коваленко. - М.: Эдиториал УРСС, 2005. - 400 с.
4. Клейнрок, Л. Вычислительные системы с очередями / Л. Клейнрок. - М.: Мир, 1979. - 600 с.
5. Саати, Т. Л. Элементы теории массового обслуживания и ее приложения / Т. Л. Саати. - М.: Книжный дом «ЛИБ-РОКОМ», 2010. - 520 с.
6. Кокс, Д.Р. Теория восстановления / Д.Р. Кокс, В.Л. Смит; под ред. Ю.К. Беляева. - М.: Сов. радио, 1967. - 312 с.
ФГБОУ ВПО «Кемеровский технологический институт
пищевой промышленности», 650056, Россия, г. Кемерово, б-р Строителей, 47.
Тел./факс: (3842) 73-40-40 е-mail: [email protected]
ФГБУН Институт физики полупроводников им. А.В. Ржанова СО РАН, 630090, Россия, г. Новосибирск, пр. Ак. Лаврентьева, 13.
Тел./факс: (384) 269-82-75 е-mail: [email protected]
SUMMARY
V.A. Pavsky, K.V. Pavsky
PROBABILISTIC MODEL OF EVALUATION OF THE OPERATOR FACTORS OF THE HIGH RELIABLE COMPUTER SYSTEMS WITH RESERVE
The mathematical model of functioning computer systems (CS) with reserve is constructed. Factors to efficiency, allowing value of effective functioning CS, are calculated, both at moment of time, and on gap.
Distributed computer systems, structural redundancy, reliability.
Kemerovo Institute of Food Science and Technology 47, Boulevard Stroiteley, Kemerovo, 650056, Russia Phone/Fax: +7(3842) 73-40-40 е-mail: [email protected]
Institute of Semiconductor Physics Siberian Branch of the Russian Academy of Sciences 13, acad. Lavrentjeva prospect, Novosibirsk, 630090, Russia
Phone/Fax: (384) 269-82-75 е-mail: [email protected]
- -