Разработка системы моделирования высокопроизводительных вычислительных систем на основе мэйнфреймов компьютеров

Машечкин И.В.; Попов И.С.

РАЗРАБОТКА СИСТЕМЫ МОДЕЛИРОВАНИЯ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ НА ОСНОВЕ МЭЙНФРЕЙМОВ КОМПЬЮТЕРОВ

(Работа выполнена при поддержке РФФИ, проект № 02-01-00261)

И.В. Машечкин, И.С. Попов

Вычислительные системы на основе мэйнфреймов [1] ориентированы на способность поддержки одновременной работы тысяч и более пользователей, оставаясь одними из наиболее мощных вычислительных систем общего назначения, которые обеспечивают непрерывный режим эксплуатации. Пример классического использования мэйнфрейма - это хорошо управляемая и безопасная среда вычислений предприятия, построенная на базе такой машины с подключенными к ней терминалами.

Нужно заметить, что быстрый рост производительности персональных компьютеров, рабочих станций и серверов создал тенденцию перехода с мэйнфреймов на компьютеры менее дорогих классов, в частности, на решения, основанные на архитектуре клиент-сервер.

Однако в последнее время этот процесс перехода несколько замедлился. К основным причинам возрождения интереса к мэйнфреймам нужно отнести:

• невыгодность отказа от наработанного за десятилетия программного обеспечения для мэйнфреймов;

• переход к распределенной архитектуре связан с рядом проблем, затраты на преодоление которых могут быть неоправданны;

• распределенная среда не всегда обладает достаточной надежностью для наиболее ответственных приложений, которой обладают мэйнфреймы.

Таким образом, сейчас сохраняется актуальность применения мэйнфреймов в качестве средств централизованной обработки информации в крупных организациях. Основной проблемой при этом является необходимость в предварительной оценке возможностей проектируемой или существующей вычислительной системы в зависимости от решаемых ею задач.

Данная статья направлена на решение подобных проблем. В ней рассматриваются аспекты исследования и разработки экспериментальной системы моделирования, предназначенной для анализа эффективности конфигурации подобных вычислительных комплексов.

В архитектурном плане мэйнфрейм представляет собой многопроцессорную систему, предназначенную для работы с большими объемами данных. Несколько мэйнфреймов могут объ-

единяться в сисплекс [1] - многомашинный кластер, представляющийся пользователю единым компьютером.

Значительное число мэйнфреймов в мире представлено машинами фирмы IBM, работающими под управлением операционной системы MVS [2] и ее клонов. Поэтому далее рассматривается данная платформа как наиболее распространенная и популярная.

Основным режимом выполнения пользовательских задач в OC MVS является пакетный режим [1,3]. Существует множество программных средств планирования пакетных задач: от встроенных в ОС компонент с фиксированными стратегиями выбора задач до достаточно сложных, динамически настраиваемых подсистем планирования.

Различные планировщики, как правило, работают одновременно на одной вычислительной системе, и потому разные задачи могут обслуживаться разными планировщиками, что увеличивает гибкость системы, но усложняет выбор наиболее эффективной схемы настройки планировщиков.

Изменения в настройках планировщиков осуществляются администратором системы, например, на основании статистики по обработанным задачам или в связи с изменением аппаратной конфигурации вычислительной системы.

В состав операционных систем семейства MVS, как правило, входят следующие средства планирования:

Job entry subsystem - базовое средство планирования, основанное на системе приоритетов и классов и использующее Resource affinity subsystem - систему управления разделяемыми ресурсами [4];

Workload manager - планировщик, позволяющий отделиться от уровня непосредственного управления ресурсами и использовать так называемые цели выполнения задачи - Service goals [5].

Очевидно, что эффективность функционирования подобной вычислительной системы в конкретном случае зависит от конфигурации аппаратной части системы, состава и настроек планировщиков операционной системы и в некоторой степени от характеристик задач, обслуживаемых системой.

Поэтому возникающая проблема формулируется как проблема выбора и оценки эффективности настройки подсистем планирования в зависимости от конфигурации вычислительной системы и характеристик входного потока задач. Таким образом, возникает необходимость априорной оценки эффективности применения вычислительной системы конкретной конфигурации для решения заданного класса задач. Этим обусловлены типичные затруднения, с которыми сталкивается администратор комплекса при настройке системы: эксплуатация подобных вычислительных систем достаточно затратная из-за высокой стоимости аппаратной платформы и соответствующего программного обеспечения, поэтому эксперименты по оценке эффективности на реальной системе довольно накладны; кроме того, существует необходимость предварительной оценки эффективности еще проектируемого вычислительного комплекса.

Для решения обозначенных проблем были применены методы дискретно-событийного имитационного моделирования [6]. Это вызвано тем, что построение эффективной математической модели исследуемой вычислительной системы оказалось достаточно проблематичным из-за общей сложности описания всех настроек системы и присутствия в системе взаимосвязанных случайных процессов (например, активность пользователей), которые не могут быть описаны адекватно. Естественное решение подобных проблем - это использование алгоритмов имитационного моделирования.

Идея дискретно-событийного имитационного моделирования формулируется следующим образом.

Исследователь описывает события, которые могут изменять состояния системы, и определяет логические взаимосвязи между ними. Имитация происходит путем выбора из списка будущих событий ближайшего по времени его выполнения. Выполнение события приводит к изменению состояния системы и генерации будущих событий, логически связанных с выполняемым. Эти события заносятся в список будущих событий и упорядочиваются в нем по времени наступления. Имитационное время продвигается от события к событию, и между событиями состояние модели не меняется.

Постановка конкретной задачи выглядит следующим образом: разработка эффективной системы моделирования средств планирования -Job entry subsystem и Workload manager, контролируемых подсистемой управления ресурсами Resource affinity subsystem.

Процесс разработки разделился на два этапа.

1. Разработка имитационной модели, реализация desktop-системы моделирования, позволяющей оценить производительность и загрузку вы-

числительной системы в зависимости от физической конфигурации, настроек планировщиков и характеристик входного потока задач.

2. Реализация web-системы моделирования, необходимость в которой была вызвана проблемами, возникшими в процессе работ над desktop-системой.

Средства разработок для имитационного моделирования делятся на две группы.

Языки моделирования: Simula, Sim++, C++Sim и другие. Их достоинства - удобство, быстрота программирования и концептуальная выразительность. В настоящее время насчитывается около 700 таких языков [7,8], однако они обеспечивают меньше возможностей по сравнению с универсальными языками программирования.

Проблемно-ориентированные средства и системы имитационного моделирования: ПОДСИМ, Ithink, PowerSim, АСИМПТОТА и др. [7,8]. Имитационная модель генерируется самой системой в процессе диалога с пользователем. Такие системы не требуют от пользователя знания программирования, но позволяют моделировать лишь относительно узкие и специализированные классы сложных систем.

Предварительный анализ существующих средств выявил ряд неудобств, возникающих из-за специфики характеристик разрабатываемого продукта. В частности, при использовании языков моделирования это недостаточная производительность получаемой системы моделирования и, как правило, платформенная зависимость построенных систем. При использовании существующих систем моделирования довольно трудно адекватно настроить систему, то есть описать все процессы и алгоритмы, происходящие в моделируемой вычислительной системе.

Поэтому ядро разработанной системы было реализовано на языке программирования C++.

Разработка desktop--системы моделиров ания

Desktop-версия системы моделирования получила название Sysplex ThruPut Simulator.

Основным назначением системы является априорная оценка характеристик MVS сисплекса. При этом моделируется прибытие, обработка и выполнение потоков пакетных задач в вычислительной системе, управляемой базовым планировщиком JES и стандартной подсистемой управления ресурсами. Система дополнительно может контролироваться планировщиком задач WLM.

Основные возможности при настройке системы:

• визуальное задание конфигурации сисплекса;

• моделирование прихода, конвертирования, анализа и исполнения задачи;

• реализация алгоритмов планировщика JES и его подсистемы исполнения;

• поддержка планировщика WLM и его подсистемы исполнения;

• поддержка подсистемы управления ресурсами RAS;

• визуальное задание параметров потока задач (характеристики задач, требуемые ресурсы, распределение времени прихода, конвертирования, анализа и выполнения);

• импорт параметров входного потока задач из информационных файлов реальной системы;

• имитация действий "оператора/администратора" (динамическое изменение состояний системных ресурсов, процессорной мощности и состояний программных компонент);

• графическое и текстуальное отображение различных характеристик и собранной во время моделирования статистики;

• экспортирование результатов моделирования в базы данных MS Access и Lotus Approach;

• генерация отчетов в форматах MS Office и Lotus Notes;

• сохранение параметров моделирования и конфигураций всех объектов в формате XML [9].

Система функционирует на платформе операционных систем семейства Windows.

Разработка web-системы моделирования

В процессе тестирования и экспериментального использования desktop-системы моделирования выявились следующие неудобства и проблемы:

- пользователь должен обладать определенными навыками, чтобы правильно инсталлировать, настраивать (и использовать) систему моделирования;

- с увеличением степени детализации имитационной модели и с увеличением сложности самой модели вычислительной системы компьютер пользователя должен удовлетворять все более высоким требованиям по производительности, для того чтобы обеспечить приемлемую скорость процесса моделирования для заданной модели;

- появилась проблема платформозависимости: некоторые пользователи оказались неспособны использовать систему ввиду ее ориентированности на платформу Windows.

Для решения этих проблем была разработана web-система моделирования, которая, унаследовав большинство возможностей desktop-версии, приобрела дополнительные свойства:

- возросшую производительность системы моделирования (связана с переносом ядра web-системы под платформу Linux);

- минимальные требования по квалификации пользователя;

- минимальные требования по ресурсам компьютера клиента: достаточно наличие web-броу-

зера, а вся вычислительная нагрузка ложится на web-сервер;

- естественное исчезновение проблемы плат-формозависимости;

- невидимую для пользователя эволюцию программного обеспечения системы моделирования;

- взаимодействие пользователей web-системы моделирования между собой.

Анализ результатов работы системы моделирования

Априорная оценка определенных характеристик исследуемой вычислительной системы достигается путем анализа результатов, полученных в ходе моделирования.

К ним относится следующее.

• Широкий спектр статистик, показывающих состояния программных и физических компонент на протяжении всего процесса моделирования (или каких-то его ключевых этапов). К примеру, статистики о загруженности того или иного физического процессора, использования разделяемых ресурсов, состояния очередей задач на каждом из этапов их обработки. Для удобства пользователя состояния нужных статистик могут отображаться визуально в виде динамически меняющихся графиков.

• Информационные файлы, созданные системой моделирования, отображающие последовательность событий, генерируемых моделью, и последовательность состояний модели во времени соответственно.

По окончании процесса моделирования на основании полученных информационных файлов система может осуществить конвертирование ключевых данных в формат баз данных Access и Approach для их последующего более подробного и тщательного анализа. Это вызвано тем, что число задач, проходящих через систему моделирования, может составлять десятки и сотни тысяч.

В результате проведенных исследований и разработок была предложена имитационная модель, адекватно представляющая структуру рассматриваемой вычислительной системы; на ее основе были разработаны desktop- и web-системы моделирования базовых средств планирования, позволяющие получать различные качественные оценки эффективности вычислительной системы. Система обладает широкими возможностями визуальной настройки, развитыми средствами отображения процесса и результатов моделирования.

Таким образом, разработанное программное средство позволяет оценить, какая из схем планирования и при каких настройках наиболее эффективна на данном мэйнфрейме для заданного класса задач, а также предоставляет возможность предварительно подобрать конфигурацию мэйн-

фрейма, оптимально подходящую для определенного класса задач.

В настоящее время ведутся работы по унификации и параметризации свойств аппаратных и программных моделей с целью расширения применимости разработанного средства для более широкого класса вычислительных систем.

Список литературы

1. Jim Hoskins, Goerge Coleman. Exploring IBM S/390 Computers. 6-th edition. Máximum Press, 1999.

2. MVS/ESA Version 5. System Management Facilities. IBM, 1995.

3. Дейтел Г. Введение в операционные системы. - М.: Мир, 1987. - Т. 2.

4. MVS/ESA Version 5. Planning: Workload Management. IBM, 1995.

5. MVS/ESA Version 5. WLM: Resource Affinity Scheduling. IBM, 1997.

6. Moshe A. Pollatschek. Programming Discrete Simulation. Prentice Hall, 1995.

7. Емельянов В.В., Ясиновский С.И. Введение в интеллектуальное имитационные моделирование сложных дискретных систем и процессов. - М.: АНВИК, 1998.

8. Методологические основы и математические методы. -М.: Мир, 1981.

9. David Lewis, Matthew Fuchs. Designing XML Internet Application. Prentice Hall, 1998.

ИССЛЕДОВАНИЕ КОМПЬЮТЕРНЫХ МЕТОДОВ ПОСТРОЕНИЯ МОДЕЛЕЙ СЛОЖНЫХ ОБЪЕКТОВ

А.А. Усков, Д.В. Санатин

Методы идентификации сложных объектов имеют важное значение при создании систем поддержки принятия управленческих решений, используемых в самых различных предметных областях. Большинство методов, используемых при решении задач идентификации, включают в себя алгоритмы построения моделей статических объектов, которые во многом и определяют эффективность данных методов.

К числу наиболее известных методов идентификации статических объектов можно отнести: модели, основанные на методе наименьших квадратов (МНК); непараметрические (локально-ап-проксимационные) и нейросетевые модели.

В настоящей статье приводятся результаты экспериментального исследования указанных методов, касающиеся точности получаемых моделей, а также вычислительных затрат, требуемых для их построения и тестирования.

Пусть имеется статический объект, имеющий

п входов (векторный вход X) и один выход у. Входы и выход данного объекта связаны некоторой нелинейной зависимостью:

У = П(Х) + (1)

где п( X) - функция неизвестного вида, \ - случайная аддитивная помеха, отражающая действие неучитываемых факторов, с нулевым математическим ожиданием и неизвестным распределением.

Необходимо построить модели данного статического объекта (оценки функций п( X)) на основе набора точек (обучающие данные)

<Х ',у'>, 1=1, 2, .., N (2)

с использованием различных методов и определить затраты машинного времени на создание и тестирование моделей.

Экспериментальное исследование методов идентификации статических объектов при решении поставленной задачи предполагает построение моделей множества самых различных объектов, описываемых формулой (1), с использованием различных алгоритмов и сравнение свойств полученных моделей. В связи с ограниченным объемом статьи приведем результаты построения и исследования свойств моделей одного объекта, имеющего ярко выраженный нелинейный характер при нормальном законе распределения аддитивной помехи описываемым формулой (1), при

П(Х) = 3 • (1 - XI)2 ехр(-х2 - (Х2 +1)2) -

(ь

expC-x^ - x^)-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- 3 exp(-(xj +1)2 - x2) + 2(x2 + x2), x1 e [-3,3],x2 e [-3,3]

(3)

Вид зависимости (3) на области определения входных сигналов объекта представлен на рисунке 1.

В качестве алгоритмов построения моделей объекта были использованы следующие:

1) метод аппроксимации искомой зависимости полиномом к-го порядка, определение коэффициентов полинома осуществляется по методу наименьших квадратов (Рк) [1] (получаемые с использованием данного метода модели аналогичны моделям на основе нейронных 2-П сетей [2]);

2) локальная аппроксимация с линейными локальными функциями и числом ближайших узлов для нахождения параметров функции, равным М (метод М ближайших узлов - ЬЛ М) [3];

3) нейронная сеть с радиальными базисными функциями, имеющая линейный выходной слой (ЯБРК) [2], для построения которой используется

3

5

x

1

2

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Машечкин И. В., Попов И. С.

Текст научной работы на тему «Разработка системы моделирования высокопроизводительных вычислительных систем на основе мэйнфреймов компьютеров»