Математические методы моделирования, управления и анализа данных
УДК 004.89
С. Н. Ефимов
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск
СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ПРОЕКТИРОВАНИЯ РАСПРЕДЕЛЕННЫХ СИСТЕМ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В РЕЖИМЕ РЕАЛЬНОГО ВРЕМЕНИ
Описываются модели оценки эффективности распределенных вычислительных систем - МВС, ЛВС, грид, и постановка задачи выбора их эффективных вариантов, а также алгоритмы автоматического проектирования интеллектуальных технологий анализа данных, являющихся ядром СППР.
Системы интеллектуального анализа данных в режиме реального времени (ИАД РВ) незаменимы при решении важнейших организационных и научно-технических задач, среди которых прогнозирование и оценка развития природных и антропогенных катастроф, принятие решений системами безопасности, управление безэкипажными боевыми машинами и сложными технологическими процессами, обработка данных активных экспериментов, управление сложными технологическими процессами и др.
Массовое использование технологий ИАД РВ сдерживается трудностями их разработки под конкретную задачу и проблемами выбора требующихся вычислительных средств, что во многом объясняется отсутствием математического аппарата моделирования функционирования специализированных распределенных вычислительных систем (РВС) и алгоритмических средств решения сложных задач оптимизации. Кроме того, ИАД РВ предъявляет чрезвычайно высокие требования к квалификации разработчиков и пользователей, так как требует экспертных знаний в области информационных технологий.
Интеллектуальный анализ данных и сам по себе является трудоемкой процедурой, а ИАД РВ требует значительных вычислительных ресурсов, что делает критически важными быстродействие и надежность используемых вычислительных средств, а также приводит к необходимости разработки специализированных многопроцессорных вычислительных систем (МВС). Однако, в виду высокой стоимости разработки МВС трудно представить себе, что такая система будет создаваться каждый раз под конкретную решаемую задачу (за исключением военных и космических систем). Использование МВС, не являющейся проблемно ориентированной, влечет ее затратное и неэффективное применение, когда значительный объем ресурсов не задействуется. В этой связи представляется оправданным подход, связанный с использованием распределенных вычислительных систем (РВС) на базе локальных вычислительный сетей, получивших широкое распространение, и грид-технологий, активно развивающихся в настоящее время. Такой подход позволит формировать требуемую распределенную вычислительную сеть под решаемую задачу, а не использовать дорогостоящую универсальную МВС. Более того, в этом случае проще решается проблема реконфигурирования вычислительной системы в ходе решения задачи, что часто является необходи-
мостью при решении задач реального времени, характеризующихся высокой динамичностью и неопределенностью. Реконфигурирование может давать удобные гибридные вычислительные системы, сочетающие различные типы РВС на различных этапах решения задачи ИАД РВ. Таким образом, применение РВС может быть более предпочтительным для массового пользователя, если удастся автоматизировать процесс формирования структуры таких систем.
Проблема недостатка квалифицированных специалистов может быть в значительной степени ослаблена с помощью автоматизации процесса разработки систем интеллектуального анализа данных для конкретных приложений. В этом случае основные алгоритмы ИАД будут генерироваться автоматически и адаптивно настраиваться на решаемую задачу. Основную роль буду играть специалисты в прикладной области (конечные пользователи), а не разработчики информационных систем. Тем самым разработка систем интеллектуального анализа данных значительно ускорится, а затраты на ее разработку снизятся.
После того, как будут автоматически сгенерированы алгоритмы ИАД, выбраны макрооперации для аппаратной реализации, спроектированы реализующие их спецпроцессоры и установлены их характеристики, необходимо выбрать эффективную (реконфигурируе-мую) структуру МВС ИАД РВ. Если же использование специализированной МВС будет признано нецелесообразным, то необходимо осуществить выбор РВС на базе локальных сетей или грид-технологий с учетом имеющихся у пользователя ресурсов. Выбор эффективной структуры МВС или РВС представляет собой сложную задачу оптимизации, которая характеризуется большим количеством разношкальных параметров, нелинейностью, многоэкстремальностью, многокритериальностью, алгоритмическим или табличным заданием целевых функций и ограничений. Решение задачи такой сложности потребует применения мощных процедур стохастической оптимизации, которые, в свою очередь, требуют высокой квалификации оптимизатора и тонкой настройки параметров и привлечения высокопроизводительных вычислительных систем. Так как трудно ожидать такой квалификации от специалистов предметной области, очевидно, что процесс решения сложных оптимизационных задач тоже должен быть автоматизирован, что требует разработки самонастраивающихся алгоритмов оптимизации.
Решетневскце чтения
Активно ведущиеся в нашей стране и за рубежом исследования в области разработки систем интеллектуального анализа данных и высокопроизводительных вычислительных систем порождают большое число подходов и методов, но не предоставляют возможности прямого применения конечными пользователями, так как требуют от них экспертных знаний за пределами их области компетентности, а также редко рассматривают проблемы в интегральном виде - технологии ИАД разрабатываются с ориентацией на существующие вычислительные системы, а высокопроизводительные вычислительные системы разрабатываются, в основном, в универсальном виде в расчете на использование во всех областях науки и техники.
Для системной автоматизации проектирования специализированных распределенных вычисли-
тельных систем интеллектуального анализа данных в режиме реального времени необходимо решение комплекса взаимосвязанных фундаментальных проблем разработки самонастраивающихся процедур генерирования интеллектуальных информационных технологий, создания адаптивных самонастраивающихся алгоритмов решения сложных задач оптимизации, создания формального аппарата для моделирования процессов функционирования специализированных МВС и РВС, построения и разработки модельного и алгоритмического обеспечения выбора эффективных конфигураций РВС ИАД РВ. На настоящий момент все эти проблемы разрешены, что позволяет разработать эффективную СППР при проектировании распределенных систем ИАД РВ.
S. N. Efmov
Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk
DECISION SUPPORT SYSTEM FOR DESIGN OF DISTRIBUTED SYSTEMS FOR REAL TIME DATA MINING
Effectiveness evaluation models of distributed computing systems (clusters, LCS, grid) are described, the choice of their effective variants problem statement is given and algorithms for automated design of real time data mining are discussed which are core of DSS.
© Ефимов С. Н., 2011
УДК 612.8+004.4+519.6
В. Б. Звонков
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск
ПРЕДСКАЗАНИЕ ОТКАЗОВ ОБОРУДОВАНИЯ ГИДРОТУРБИНЫ С ИСПОЛЬЗОВАНИЕМ КОМБИНАЦИИ ЭВОЛЮЦИОННЫХ И НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ
После детального изучения предметных областей исследований и выполнения программной реализации искусственных нейронных сетей и классических методов их обучения автором работы предлагаются эволюционные процедуры, адаптированные для оптимизации весовых коэффициентов искусственных нейронных сетей в процессе решения задачи. В работе были решены тестовые задачи аппроксимации функций многих вещественных переменных, а также задача предсказания возможных отказов оборудования гидротурбины. Проведенный сравнительный статистический анализ классических и разработанных методов доказал более высокую эффективность эволюционных методов обучения.
Искусственные нейронные сети являются перспективным направлением исследований в областях, связанных с проектированием систем искусственного интеллекта и применяются при решении широкого спектра практических задач: моделирование, восстановление зависимостей, прогнозирование (например, курсы ценных бумаг на валютных биржах), распознавание образов (рукописных букв, машинных шрифтов и т. д.), классификации (наибольший сигнал на определенном выходе сети соответствует номеру класса), идентификации и т. д. Существуют несколько способов извлечения скрытых знаний и закономерностей посредством нейронных сетей, настройки и использования конкретных архитектур, адаптации архитектур к постановке решаемой задачи, что
относится к такому перспективному направлению исследований как Data Mining. Эволюционные алгоритмы достаточно эффективны при решении сложных оптимизационных задач (при условии выбора параметров, соответствующих необходимому типу сходимости), к которым относится задача настройки параметров искусственной нейронной сети в силу высокой размерности вектора настраиваемых параметров и многоэкстремальности целевой функции ошибки.
В рамках данной работы автором была программно реализована искусственная нейронная сеть в общем виде многослойного персептрона Розенблатта с настраиваемыми параметрами на языке С/С++ без использования библиотек и стандартных функций. Разработанная автором данной работы программная