Научная статья на тему 'Некоторые вопросы оптимизации информационных технологий распределенной обработки данных в больших информационных системах'

Некоторые вопросы оптимизации информационных технологий распределенной обработки данных в больших информационных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
180
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Балыбердин В. А., Иванов В. В., Степанов О. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Некоторые вопросы оптимизации информационных технологий распределенной обработки данных в больших информационных системах»

3. Предоставление персоналу ТК по результатам оценки состояний объектов рекомендаций по их корректировке с учетом особенностей объектов (процессов), в рамках нормативных документов, с использованием опыта персонала.

4. Компьютерная поддержка принятия решений персоналом ТК на основе результатов оценок состояний объектов (процессов) с учетом имеющихся рекомендаций, нормативных ограничений и практического опыта.

5. Оптимизация диспетчеризации работы участков и технико-экономического управления.

6. Оптимизация количественных и качественных показателей работы техногенных комплексов.

7. Рефлексия - анализ осуществленной деятельности, направленной на выявление причин затруднений и коррекцию способа деятельности.

Благодаря компьютеризации повышается интеллектуальный уровень функционирования техногенных комплексов, т.к. не только качественно улучшается информационное обеспечение, но и увеличивается степень профессионализма и рационализма деятельности людей. В совокупности это оказывает определяющее влияние на эффективность функционирования техногенных комплексов и общества в целом.

ЛИТЕРАТУРА

1. Апокин И.А., Майстеров Л.Е. Развитие вычислительных машин.- М.: Наука, 1974. 399 с.: ил.

2. Сорокин С.A. Intel - начало всех начал // СТА. - М, 1999. № 1. С.52-61.

3. Джермейн К. Программирование на IBM/360. Пер. с анг л. под ред. B.C. Штаркмана. -М.: Мир, 1973.870 с.: ил.

4. Ленк X. Размышления о современной технике: Учебник для вузов / Ин-т "Открытое общество"; Пер. с нем. под ред. Степина B.C.- М.: Аспект Пресс, 1996. 183 с.

5. Шафрин Ю.А. Информационные технологии. - М.: Лаборатория Базовых Знаний, 1998. 700 с.

6. Потапова Т.Б. Структурный анализ системы управления непрерывным замкнутым производством // Приборы и системы управления. - М, 1999. № 12. С. 16-24.

7. Пьяеченко О.Н., Клевцов С И. Организация распределенных микрокомпьютерных систем контроля и управления сложными промышленными комплексами // Наука производству. - М, 2000. № 9 (34). С.22-25.

УДК 681.142

В.А.Балыбердин, В.В.Иванов, О.А.Степанов

НЕКОТОРЫЕ ВОПРОСЫ ОПТИМИЗАЦИИ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ РАСПРЕДЕЛЕННОЙ ОБРАБОТКИ ДАННЫХ В БОЛЬШИХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

В работе излагается методологический подход к оптимизации информационных технологий распределенной обработки данных, основанный на реализации

принципа локализации вычислений и некоторых других общих положений и позволяющий достаточно компактно отображать особенности протекания информационных процессов в системах с распределенной обработкой данных.

Быстрое развитие средств передачи и обработки данных обусловило появление новых форм реализации автоматизированных систем (АС), новых информационных технологий организации их функционирования.

К числу наиболее известных и широко используемых следует отнести технологии распределенной обработки данных (РОД), позволяющие достаточно гибко обеспечивать требования по оперативности, надежности, живучести и т.п. АС и являющиеся в силу этого идеальным средством реализации различного рода специализированных АС, в которых выполнение подобного рода требований жестко определено.

Вместе с тем, для успешного внедрения технологий РОД необходимо решение ряда сложных научно-технических проблем. Важное место среди них занимает проблема обеспечения функциональной эффективности технологии. Последнее объясняется тем, что характеристики функционирования системы на базе РОД (СРОД) в целом определяются не только характеристиками составляющих ее элементов, но и, в значительной степени, организацией информационного взаимодействия элементов в процессе работы СРОД, т.е. совокупностью приемов и методов использования вычислительных средств, что и составляет существо информационной технологии. Имеющийся опыт свидетельствует о том. что во многих ситуациях за счет оптимизации технологии РОД производительность системы может быть повышена на порядок и более.

Однако для того, чтобы это стало возможным, необходимо иметь формальный аппарат и соответствующую методологию, которые бы позволяли получать рекомендации по оптимизации технологий РОД в практических ситуациях. В настоящей работе, на базе обобщения и развития имеющихся результатов, предлагается методологический подход, обеспечивающий возможности оптимизации технологий РОД для достаточно широкого круга практических применений.

В самом общем виде функционирование любой автоматизированной системы с распределенной обработкой данных (СРОД) может быть представлено в виде совокупности взаимодействий пользователей (должностных лиц) с системой. С формальной точки зрения любое такое взаимодействие можно отобразить в виде последовательности этапов обработки и передачи информации. Передача информации осуществляется по каналам передачи данных, связывающим отдельные узлы СРОД, а также по каналам обмена данными ЭВМ, размещаемых в узлах системы. Обработка информации осуществляется процессорами в узлах СРОД.

Определение. Будем называть последовательность этапов передачи и обработки информации на средствах СРОД, инициируемую при реализации заявки пользователя на выполнение запрашиваемых от СРОД информационно-вычислительных работ (ИВР), информационным процессом (ИП).

Как видно, данное определение опирается на самые общие свойства СРОД и не накладывает реальных ограничений на состав и структуру СРОД либо на характер информационного обслуживания пользователей (характер выполняемых

ИВР).

Количественные характеристики ИП могут быть получены на основе характеристик составляющих его этапов. Поскольку в любой СРОД число видов ИВР, число обслуживаемых должностных лиц и количество ресурсов ограничены, то все возможные ИП могут быть перенумерованы. Множество таких ИП М]={1}

- конечно. Обозначив М2=Ш - множество ресурсов системы, получим следующую символику для идентификации отдельного этапа ИП: Ау; 1=1,1; ]=1,}.

При этом полагаем, что каждый этап связан лишь с одним ресурсом - критическим ресурсом, т.е. таким, учет которого является существенным при совместной реализации ИП. Влияние некритических ресурсов будем учитывать косвенно, например путем задания предельного числа одновременно реализуемых на критическом ресурсе ИП.

Каждый этап Ау определяется временем использования ^го ресурса В,„ характеризуемым функцией распределения Ву(0 и набором вероятностей обращения к другим ресурсам системы после завершения текущего.

Каждый ИП связывается с определенным должностным лицом его инициирующим, и характеризуется множеством наборов этапов, в котором определяются начальный и конечный этапы, причем конечных этапов может быть несколько.

Отдельные ИП могут иметь достаточно сложную структуру, что затрудняет исследование соответствующих совокупностей ИП. В интересах упрощения такого исследования целесообразно провести декомпозицию ИП по уровням их представления с выделением уровней:

системы (сети);

вычислительного комплекса (узла);

устройства вычислительного комплекса.

Здесь под вычислительным комплексом (ВК) будем понимать в широком смысле совокупность технических и программных средств, образующих узел СРОД. Это может быть рабочая станция на базе ПЭВМ, сервер, также на базе ПЭВМ или большой ЭВМ либо несколько ЭВМ, локально объединенных в вычислительную систему.

Основой для подобной декомпозиции является частота переходов между этапами, которая для выделенных уровней различается на 1 - 2 порядка и более, что вполне достаточно для осуществления декомпозиции ИП.

Любая АС предназначена для выполнения некоторого множества ИВР и имеет вполне определенные цели и задачи. В этом свете качество информационной технологии РОД, на базе которой функционирует данная АС, должно оцениваться с помощью показателей эффективности, т.е. характеристик, определяющих степень приспособленности АС к решению возложенных на нее задач.

Можно показать, что показатели эффективности информационных технологий РОД, в конечном счете, определяются характеристиками ИП и их совокупностей. Последние же зависят от множества принятых решений по построению информационных технологий. Отсюда следует, что оценку указанных решений и поиск наиболее рациональных из них можно осуществлять на основе рассмотрения соответствующих совокупностей ИП.

Рассмотрим основные факторы, влияющие на эффективность информационных технологий РОД.

В информатике, как и в любой другой области знаний, существуют некоторые фундаментальные положения, знание которых необходимо для правильного принятия основополагающих технических и организационных решений. Одним из таких положений является принцип локализации вычислений, который неявно присутствовал на протяжении всей истории развития ЭВМ. Поясним это на примере.

Для современных ЭВМ характерна иерархическая структура памяти (запоминающих устройств - ЗУ):

- сверхоперативное ЗУ (СОЗУ);

- оперативное ЗУ (ОЗУ);

- внешнее ЗУ (ВЗУ).

В СОЗУ хранятся наиболее часто используемые не некотором этапе работы ЭВМ данные, которые участвуют в выполнении нескольких смежных операций. В ОЗУ - программы и данные, необходимые для текущего этапа вычислений. Все остальное находится в ВЗУ. Такое распределение информации осуществляется автоматически, при этом характерно соблюдение следующих соотношений для вероятностей обращения за элементом информации: Рсозу>Розу>Рвзу> т.е. обращения к более быстродействующим устройствам происходят чаще. Тем самым повышается общее быстродействие ЭВМ, а следовательно снижаются затраты ресурсов для выполнения заданного объема ИВР. Таким образом, прослеживается тенденция - если то, что чаще используется, хранить «под рукой», то Затраты на выполнение работы снижаются. Это характерно и для СРОД в целом.

Теперь можно сформулировать два постулата, составляющих существо принципа локализации вычислений.

Постулат 1. Система работает эффективно, если она выполняет требуемые функции в заданных условиях без излишних затрат ресурсов.

Постулат 2. Общие затраты ресурсов на выполнение требуемых функций можно сократить, если часто выполняемые действия будут потреблять минимум ресурсов.

Здесь понятие ресурса трактуется достаточно широко: это всё то, что необходимо для выполнения требуемых функций - процессор, память, канал обмена данными и т.д.

Основываясь на формальном описании функционирования СРОД, с помощью совокупностей протекающих в них ИП и с учетом принципа локализации вычислений можно выделить основные группы факторов, определяющих эффективность информационных технологий РОД.

На уровне сети продолжительность ИП определяется затратами на передачу информации между узлами, так что продолжительность ИП тем больше, чем больше объем передачи информации, осуществляемой в процессе реализации ИП, и чем больше промежуточных коммутаций информации при её передаче в сети.

На уровне ВК продолжительность ИП зависит от затрат на обмен информацией с ВЗУ. Последние же определяются тем, в какой памяти хранятся данные

и программы, необходимые для выполнения соответствующих ИВР.

Для уровня устройства ВК продолжительность ИП определяется, в основном, затратами на поиск информации. Сокращение этих затрат за счет рационального распределения информации в ЗУ способствует значительному уменьшению продолжительности ИП.

Таким образом, продолжительность ИП на каждом из уровней их представления связана с затратами на передачу и обмен информацией и на её поиск. Чем выше затраты, тем выше, в среднем, продолжительность ИП. Величина этих затрат является переменной и зависит от принятых решений по построению и организации конкретной информационной технологии РОД.

Другим важным фактором, определяющим качество информационной технологии РОД, является управление совместной реализацией ИП. Существо этого управления заключается в предоставлении в конфликтных ситуациях приоритета в использовании ресурсов системы, определенных ИП за счет других ИП. При этом приоритет ИП связывается либо с их относительной важностью, либо с величиной запроса на ресурс. В первом случае приоритет предоставляется более важным ИП, так что время их реализации сокращается. В данной ситуации, естественно, увеличивается время реализации менее важных задач. Однако это не имеет существенного значения в силу того, что связанные с этим потери существенно меньше соответствующих потерь для важных задач. Во втором случае предоставление приоритета ИП с малым запросом на ресурс позволяет запараллелить выполнение ИП и, тем самым, увеличить пропускную способность системы в целом.

Выше было показано, что величина затрат на передачу и обмен информацией и на её поиск определяет характеристики ИП в СРОД и зависит от принятых решений по построению и организации информационных технологий РОД. Отсюда следует, что эти технологии нужно строить таким образом, чтобы указанные затраты были минимальными. Таким образом, возникает группа оптимизационных задач, связанных с распределением информации для хранения и обработки в СРОД. Подобные задачи решаются в процессе проектирования и начальной настройки системы, т.е. в условиях, которые можно полагать статическими, и поэтому называются задачами статической оптимизации ИП.

Задачи такого рода могут быть сформулированы в терминах математического программирования. Общая их формулировка может быть записана следую-

щим образом:

\У(х;) тт ; а(Х|) < А , \ = 1Д;

Ь(х,) < В , 1 = Я + 1, М,

где \У(Х|) определяет затраты на реализацию совокупности ИП, выражаемые объемом «накладных расходов» на организацию и выполнение обмена и передачи информации и на её поиск; а(х;) - выражения функциональных требований к системе; Ь(х;) - выражения, обеспечивающие учет реальных условий функционирования системы и её элементов (ограничения по памяти, по быстродействию и т.п.).

Переменные величины (х,) являются дискретными (булевыми) и могут определять не только собственно распределение информации по узлам сети, но и, в общем случае, состав и структуру системы.

Другая группа оптимизационных задач связана с фактором управления реализацией ИП в динамике их протекания. Такие задачи будем называть задачами динамической оптимизации ИП. Общая формулировка подобных задач может быть записана следующим образом.

Из множества и допустимых управлений реализацией совокупности ИП выбрать такое управление и , которое бы обеспечивало минимум целевой функции \У(и):

\У(и) = ттпп \У(и),

где \^(и) характеризует оценку временных затрат для реализации заданной совокупности ИП.

Конкретные выражения для \У(и) следует строить с учетом режимов функционирования СРОД. При этом учет различного рода 01раничений осуществляется алгоритмически.

В процессе поиска оптимальных решений по построению и организации информационных технологий РОД указанные группы оптимизационных задач решаются на основе итеративной трехуровневой схемы расчетов. Одной из основных проблем при формировании рассмотренных оптимизационных задач является правильное определение целевой функции как основного показателя эффективности. Рассмотрим некоторые общие соображения в этом плане. Обратимся вначале к задачам статической оптимизации.

Пусть мы решаем на ЭВМ некоторую задачу. Допустим, что все исходные данные, промежуточные и конечные результаты размещаются в оперативной памяти, а задача характеризуется некоторым объёмом вычислений, измеряемым количеством операций процессора. Соответствующий решению такой задачи ИП будет одноэтапным. Если же задача будет решаться при условии, что необходимая для решения информация размещается во внешней памяти, то соответствующий ИП будет многоэтапным. При этом продолжительность ИП увеличивается как за счет увеличения объёма вычислений, что связано с дополнительными затратами процессорного времени на организацию внешних обменов, так и за счет периодов выполнения операций обмена.

Таким образом, в данном случае появляются дополнительные или «накладные» затраты ресурсов ЭВМ, связанные с работой процессоров, каналов обмена данными, внешних устройств. Величина этих затрат зависит от организации вычислений и определяется структурой и продолжительностью ИП, т.е. определяется суммарным объемом обмена информацией и типом обменных взаимодействий.

Допустим теперь, что часть данных, необходимых для решения задачи, хранится в другом узле СРОД. Для реализации требуемой передачи информации необходимо выполнить ряд процедур, определяемых соответствующими протоколами. В результате количество этапов и продолжительность ИП значительно увеличиваются. Следовательно, в данном случае также возникают дополнительные затраты ресурсов. Величина этих затрат зависит от объёма передаваемой ин-

формации и организации взаимодействия между узлами.

Таким образом, при различных вариантах распределения программ и данных в системе выполнение заданного объёма ИВР будет требовать разных затрат ресурсов. А поскольку эти затраты имеют стоимостное выражение, то следует выбирать тот вариант, который связан с минимальными затратами. Мерой таких затрат может служить объём взаимообмена информацией в системе (с учетом типа взаимообмена), поскольку эта величина характеризует дополнительные затраты в сравнении с неким идеальным вариантом, осуществляемым в отсутствии взаимообмена.

Для оценки затрат при решении задач динамической оптимизации ИП целесообразно использовать средние по совокупности значения времени реализации ИП. Это связано с тем, что при управлении ИП качество такого управления оценивается в целом для системы.

Если существо управления ИП заключается в преимущественном предоставлении ресурсов системы более срочным заявкам, то качество принятого управления естественно оценивать с учетом относительной «ценности» заявок разного приоритета (по срочности).

Эффект от предоставления преимущества в обслуживании коротким заявкам в режиме пакетной обработки информации в целях повышения пропускной способности системы целесообразно оценивать по времени реализации некоторого заданного набора задач (ЗНЗ). При этом оценка той или иной стратегии управления ИП может быть осуществлена сравнением среднего времени решения ЗНЗ в однопрограммном и многопрограммном режимах с применением рассматриваемой стратегии. А в качестве показателя эффективности удобно принять величину относительную - коэффициент сокращения среднего времени решения ЗНЗ.

Как показал имеющийся опыт использования рассмотренного подхода к оптимизации информационных технологий РОД, в ряде ситуаций удается получить существенный выигрыш в плане улучшения основных характеристик функционирования исследуемой системы. В целом можно заметить, что реализация рациональной информационной технологии РОД позволяет достичь заданного эффекта при значительно меньших затратах.

УДК.62.001.6(075.5)

М.А.Дедюлина

ЗАПАДНОЕВРОПЕЙСКИЕ ФИЛОСОФСКИЕ ОСНОВЫ ВИРТУАЛЬНОЙ РЕАЛЬНОСТИ

Виртуалистика не является наукой, а есть подход, который может быть использован в любой научной дисциплине, в данном случае философии. Категория виртуальности активно разрабатывалась в схоластике, и необходима она была для разрешения ключевых проблем схоластической философии, в том числе: возможности сосуществования реальностей разного уровня, энергетического обеспече-

i Надоели баннеры? Вы всегда можете отключить рекламу.