Методология проектирования нейросетей для поддержки принятия управленческих решений

Виноградова Екатерина Юрьевна

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ЭКОНОМИКЕ

УДК 004.9 Е.Ю. ВИНОГРАДОВА

ББК 32.973-018.2 кандидат экономических наук, доцент

Уральского государственного экономического университета,

г. Екатеринбург e-mail: katerina@usue.ru

МЕТОДОЛОГИЯ ПРОЕКТИРОВАНИЯ НЕЙРОСЕТЕЙ ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ*

Рассматриваются принципы проектирования программного обеспечения для информационных систем, базирующихся на интеллектуальных информационных технологиях. Результаты данной работы могут быть использованы при моделировании и разработке программного обеспечения для решения соответствующих задач управления промышленным предприятием любой отрасли.

Ключевые слова: интеллектуальные информационные технологии, разработка программного обеспечения, аналитические методы обработки информации.

E.YU. VINOGRADOVA

PhD in Economics, Associate Professor, Ural State University of Economics, Yekaterinburg

e-mail: katerina@usue.ru

NEURAL NETWORK DESIGN METHODOLOGY FOR MANAGEMENT DECISION-MAKING SUPPORT

The article considers the principles of software engineering for information systems that are based on intellectual information technologies. The results of this work can be used in software modeling and engineering for solving relevant management problems of industrial enterprises of any branch.

Keywords: intellectual information technologies, software engineering, analytical methods of information processing.

В условиях современной экономики особую актуальность приобретают интеллектуальные информационные технологии, используемые для выбора оптимальных решений поставленных проблем. Информация позволяет принимать обоснованные и эффективные решения, управлять и планировать. Но и сама информация нуждается в грамотном и корректном управлении — управлении процессом ее получения и использования. Если в организации задумываются о том, где и как они получают информацию о своем производстве, целях, конкурентах, требованиях государственных структур и подобных вещах,

* Работа выполнена при финансовой поддержке № 09-03-83306а/У).

то это первый шаг к получению конкурентного преимущества. Деятельность руководства связана с необходимостью ежедневно принимать решения различной сложности. Поэтому в современных условиях, при сложившейся экономической ситуации, одним из наиболее важных факторов повышения эффективности и нормального функционирования предприятия является рациональная организация процессов управления и планирования. Это позволяет усовершенствовать управление и повысить качество принимаемых управленческих решений, а также обеспечивает информационную базу для проведения

Российского гуманитарного научного фонда (грант

перспективного анализа ситуаций. Основное требование к информационной системе, отвечающей современным реалиям, — наличие инструментов для ввода, хранения и анализа данных.

Одной из главных проблем при создании информационной среды является выбор модели представления знаний [6]. Именно модель представления знаний определяет архитектуру, возможности и свойства системы, а также методы приобретения знаний интеллектуальной системой. В настоящее время известен ряд базовых моделей представления знаний и их модификаций — это представление с помощью фактов и правил, исчисления предикатов, а также нейронные, семантические сети, фреймы. Каждая из моделей позволяет получить интеллектуальную систему с некоторыми преимуществами, делая ее более эффективной в конкретных условиях, облегчая ее понимание и требуемые модификации. Таким образом, почти всегда перед разработчиком системы возникает задача, на базе какой модели представления знаний строить данную интеллектуальную систему применительно к конкретной задаче.

С учетом данных, встречающихся в различных источниках, можно предложить следующий перечень критериев оценки моделей представления знаний: уровень сложности (абстрактности) элемента знаний, с которыми работает модель; универсальность представления знаний — возможность описания знаний из различных предметных областей; естественность и наглядность представления знаний при использовании; способность модели к обучению и формированию новых, непротиворечивых знаний; размерность модели по объему памяти, необходимому для хранения элемента модели; удобство разработки системы на основе модели.

Далее можно определить сферу применения информационных систем, проектируемых на базе нейротехнологий.

Классификация. Отметим, что задачи классификации очень плохо алгоритмизуют-ся. Если в случае распознавания букв верный ответ очевиден для нас заранее, то в более сложных практических задачах обученная нейросеть выступает как эксперт, обладающий большим опытом и способный дать ответ на трудный вопрос.

Примером такой задачи служит диагностика, где сеть может учитывать большое количество числовых параметров. Конечно, «мнение» сети в этом случае нельзя считать окончательным.

Классификация предприятий по степени их перспективности — это уже более эффективный способ применения нейросетей. При этом сеть также использует множество экономических показателей, сложным образом связанных между собой.

Нейросетевой подход особенно эффективен при решении задач экспертной оценки по той причине, что он сочетает в себе способность компьютера к обработке чисел и способность мозга к обобщению и распознаванию. Нейросеть позволяет обрабатывать огромное количество факторов (до нескольких тысяч) независимо от их наглядности.

Кластеризация и поиск зависимостей. Помимо задач классификации, нейросети широко используются для поиска зависимостей в данных и кластеризации.

Например, нейросеть на основе методики МГУА (метод группового учета аргументов) позволяет с использованием обучающей выборки построить зависимость одного параметра от других в виде полинома. Такая сеть может не только мгновенно выучить таблицу умножения, но и найти сложные скрытые зависимости в данных (например, финансовых), которые не обнаруживаются стандартными статистическими методами [1-5; 7].

Кластеризация — это разбиение набора примеров на несколько компактных областей (кластеров), причем число кластеров заранее неизвестно. Кластеризация позволяет представить неоднородные данные в более наглядном виде и использовать далее для исследования каждого кластера различные методы. Например, таким образом можно быстро выявить сфальсифицированные страховые случаи или недобросовестные предприятия.

Прогнозирование. Задачи прогнозирования особенно важны для практики, в частности для управленческих приложений, поэтому поясним способы построения нейросетей в этой области более подробно.

Рассмотрим генетические алгоритмы. Пусть дана некоторая сложная функция (целевая функция), зависящая от нескольких переменных, и требуется найти такие значения

переменных, при которых значение функции максимально. Задачи такого рода называются задачами оптимизации и встречаются на практике очень часто.

Генетический алгоритм — это простая модель эволюции в природе, реализованная в виде компьютерной программы. В нем используется как аналог механизма генетического наследования, так и аналог естественного отбора. При этом сохраняется биологическая терминология в упрощенном виде.

Генетическое наследование моделируется следующим образом:

- хромосома-вектор (последовательность) из нулей и единиц;

- каждая позиция (бит), называемая геном.

Индивид = генетический код. Набор хромосом = вариант решения задачи. Кроссовер — операция, при которой две хромосомы обмениваются своими частями. Мутация — случайное изменение одной или нескольких позиций в хромосоме.

Чтобы смоделировать эволюционный процесс, сгенерируем вначале случайную популяцию — несколько индивидов со случайным набором хромосом (числовых векторов). Генетический алгоритм имитирует эволюцию этой популяции как циклический процесс скрещивания индивидов и смены поколений.

Жизненный цикл популяции — это несколько случайных скрещиваний (посредством кроссовера) и мутаций, в результате которых к популяции добавляется какое-то количество новых индивидов. Отбор в генетическом алгоритме — это процесс формирования новой популяции из старой, после чего старая популяция погибает. После отбора к новой популяции опять применяются операции кроссовера и мутации, затем вновь происходит отбор, и т.д.

Отбор в генетическом алгоритме тесно связан с принципами естественного отбора в природе следующим образом: приспособленность индивида — значение целевой функции на этом индивиде — выживание наиболее приспособленных. Популяция следующего поколения формируется в соответствии с целевой функцией. Чем приспособленнее индивид, тем больше вероятность его участия в кроссовере, т.е. размножении.

Итак, модель отбора определяет, каким образом следует строить популяцию следу-

ющего поколения. Как правило, вероятность участия индивида в скрещивании берется пропорциональной его приспособленности. Часто используется так называемая стратегия элитизма, при которой несколько лучших индивидов переходят в следующее поколение без изменений, не участвуя в кроссовере и отборе. В любом случае каждое следующее поколение будет в среднем лучше предыдущего. Когда приспособленность индивидов перестает заметно увеличиваться, процесс останавливают и в качестве решения задачи оптимизации берут наилучшего из найденных индивидов.

Генетический алгоритм — новейший, но не единственно возможный способ решения задач оптимизации. С давних пор известно два основных пути решения таких задач — переборный и локально-градиентный. У этих методов свои достоинства и недостатки, и в каждом конкретном случае следует подумать, какой из них выбрать.

Рассмотрим достоинства и недостатки стандартных и генетических методов на примере классической задачи коммивояжера (TSP — Travelling Salesman Problem). Суть задачи состоит в том, чтобы найти кратчайший замкнутый путь обхода нескольких городов с заданными координатами. Оказывается, что уже для 30 городов поиск оптимального пути представляет собой сложную задачу. Это побудило развитие различных новых методов (в том числе нейросетей и генетических алгоритмов).

Каждый вариант решения (для 30 городов) — это числовая строка, где на j-м месте стоит номер j-го по порядку обхода города. Таким образом, в этой задаче 30 параметров, причем не все комбинации значений допустимы. Естественно, первой идеей является полный перебор всех вариантов обхода.

Переборный метод наиболее прост по своей сути и тривиален в программировании. Для поиска оптимального решения (точки максимума целевой функции) требуется последовательно вычислить значения целевой функции во всех возможных точках, запоминая максимальное из них. Недостатком этого метода является большая вычислительная стоимость. В частности, в задаче коммивояжера потребуется просчитать длины более 1 030 вариантов путей, что совершенно нереально. Однако если

перебор всех вариантов за разумное время возможен, то можно быть абсолютно уверенным в том, что найденное решение действительно оптимально.

Второй популярный способ основан на методе градиентного спуска. При этом вначале выбираются некоторые случайные значения параметров, а затем эти значения постепенно изменяют, добиваясь наибольшей скорости роста целевой функции. Достигнув локального максимума, такой алгоритм останавливается, поэтому для поиска глобального оптимума потребуются дополнительные усилия.

Градиентные методы работают очень быстро, но не гарантируют оптимальности найденного решения. Они идеальны для применения в так называемых унимодальных задачах, где целевая функция имеет единственный локальный максимум (он же — глобальный). Легко видеть, что задача коммивояжера унимодальной не является.

Типичная практическая задача, как правило, мультимодальна и многомерна, т.е. содержит много параметров. Для таких задач не существует ни одного универсального метода, который позволял бы достаточно быстро найти абсолютно точное решение. Однако, комбинируя переборный и градиентный методы, можно надеяться получить хотя бы приближенное решение задачи, точность которого будет возрастать при увеличении времени расчета. Генетический алгоритм представляет собой именно такой комбинированный метод. Механизмы скрещивания и мутации в каком-то смысле реализуют переборную часть метода, а отбор лучших решений — градиентный спуск.

Итак, если на некотором множестве задана сложная функция от нескольких переменных, то генетический алгоритм — это программа, которая за разумное время находит точку, где значение функции достаточно близко к максимально возможному. Выбирая приемлемое время расчета, мы получим лучшее из решений, которые вообще возможно получить за это время.

На сегодняшний день задача оптимального управления производственным процессом по-прежнему остается открытой: как правильно составить производственный план-график, как распределить ресурсы так, чтобы получить максимальную загрузку, как

сделать производственный процесс оптимальнее. И таких вопросов множество. Ни одна из существующих в настоящее время систем управления производством не может дать полного ответа на каждый из этих вопросов. Большинство систем (ERP, MRP) выполняет лишь задачи управления ресурсами предприятия, не касаясь управления производственными процессами в реальном времени, что накладывает ряд ограничений на их использование в производстве.

Для того чтобы получить полноценный инструментарий обработки данных на базе использования вышеописанных технологий, необходимо реализовать механизмы обработки данных, удовлетворяющие концепции OLAP-OLTP:

- системы оперативной аналитической обработки (Online Analytical Processing, OLAP);

- системы оперативной обработки транзакций (Online Transaction Processing, OLTP).

OLAP — системы аналитической обработки, также известные как системы поддержки принятия решения (Decision Support System, DSS), ориентированы на предоставление пользователям мощных механизмов для быстрого и многостороннего анализа данных. В современных условиях корпорациям нужно быстро получить информацию о наиболее перспективных направлениях торговли или производства, которая обеспечит максимальную отдачу от вложенных средств.

OLTP — системы оперативной обработки транзакций — характеризуются большим количеством изменений, одновременным обращением множества пользователей к одним и тем же данным для выполнения разнообразных операций — чтения, записи, удаления или модификации данных. Для нормальной работы множества пользователей применяются блокировки и транзакции. Эффективная обработка транзакций и поддержка блокировок входят в число важнейших требований к системам оперативной обработки транзакций.

Каждое из этих направлений обладает своими особенностями. Для эффективной работы каждой из систем требуется персональная настройка базы данных, специфика системы должна быть учтена на момент проектирования приложения. Хотя многие приложения обладают одновременно свойс-

твами и OLAP, и OLTP, в действительности это две различные системы, объединенные в одно приложение, и именно в этом случае приложение будет эффективным в работе. Также, в случае обработки персональных данных, все входящие в систему управления подсистемы, модули и справочники, а также механизмы обработки информации и формирования всей отчетности должны быть спроектированы с учетом соблюдения требований, предъявляемых следующими нормативными документами РФ: законом «О персональных данных» (от 27 июля 2006 г. № 152-ФЗ), Положением об обеспечении безопасности персональных данных при их обработке в

ИС (согласно постановлению Правительства РФ от 17 ноября 2007 г. № 781 и приказу ФСТЭК России, ФСБ России и Мининформсвязи РФ от 13 февраля 2008 г. № 55/86/20 «Об утверждении Порядка проведения классификации информационных систем персональных данных» и письму ФСТЭК от 8 апреля 2008 г. № 240/2/1072).

В заключение следует отметить, что соблюдение данных требований и четкая постановка функциональных задач в описании требований к проектируемой информационной системе позволят получить практически совершенный инструмент управления предприятием.

Список использованной литературы

1. Виноградова Е.Ю. Динамическая оптимизация управления новыми технологиями на предприятии // Информационно-математические технологии в экономике, технике и образовании: сб. материалов 3-й между-нар. науч. конф. Екатеринбург, 2009. Вып. 5: Прикладные аспекты информационно-аналитического моделирования и обработки информации. С. 120-131.

2. Виноградова Е.Ю. Проблема управления планированием на предприятии и пути ее решения // Сборник трудов Всероссийской конференции молодых ученых по институциональной экономике. Екатеринбург, 2004. С. 12-14.

3. Виноградова Е.Ю. Программное обеспечение для управления производством на базе нейротехнологий // Информационная Евразия: виртуализация мира и гуманизация экономики: материалы междунар. мо-лодеж. конф., Екатеринбург, 28 июня 2010 г. Екатеринбург, 2010. С. 44-46.

4. Виноградова Е.Ю., Шориков А.Ф. Динамическая оптимизация управления предприятием // Альтернативы экономического роста: инновационное и эволюционное развитие российской экономики: материалы 3-х науч. чтений профессоров-экономистов и докторантов, Екатеринбург, 2-4 февр. 2010 г.: в 2 ч. Екатеринбург, 2010. Ч. 1. С. 63-69.

5. Вудс У.А. Основные проблемы представления знаний // ТИИЭР. 1986. Т. 74, № 10. С. 32-47.

6. Лотов А.В. Введение в экономико-математическое моделирование. М., 1984.

7. Царегородцев В.Г. Взгляд на архитектуру и требования к нейроимитатору для решения современных индустриальных задач // Материалы 11-го Всероссийского семинара «Нейроинформатика и ее приложения». Красноярск, 2003. С. 171-175.

Bibliography (transliterated)

1. Vinogradova E.Yu. Dinamicheskaya optimizatsiya upravleniya novymi tekhnologiyami na predpriyatii // Informatsionno-matematicheskie tekhnologii v ekonomike, tekhnike i obrazovanii: sb. materialov 3-i mezhdunar. nauch. konf. Ekaterinburg, 2009. Vyp. 5: Prikladnye aspekty informatsionno-analiticheskogo modelirovaniya i obrabotki informatsii. S. 120—131.

2. Vinogradova E.Yu. Problema upravleniya planirovaniem na predpriyatii i puti ee resheniya // Sbornik trudov Vserossiiskoi konferentsii molodykh uchenykh po institutsional'noi ekonomike. Ekaterinburg, 2004. S. 12—14.

3. Vinogradova E.Yu. Programmnoe obespechenie dlya upravleniya proizvodstvom na baze neirotekhnolo-gii // Informatsionnaya Evraziya: virtualizatsiya mira i gumanizatsiya ekonomiki: materialy mezhdunar. molodezh. konf., Ekaterinburg, 28 iyunya 2010 g. Ekaterinburg, 2010. S. 44—46.

4. Vinogradova E.Yu., Shorikov A.F. Dinamicheskaya optimizatsiya upravleniya predpriyatiem // Al'ternativy ekonomicheskogo rosta: innovatsionnoe i evolyutsionnoe razvitie rossiiskoi ekonomiki: materialy 3-kh nauch. chtenii professorov-ekonomistov i doktorantov, Ekaterinburg, 2—4 fevr. 2010 g.: v 2 ch. Ekaterinburg, 2010. Ch. 1. S. 63-69.

5. Vuds U.A. Osnovnye problemy predstavleniya znanii // TIIER. 1986. T. 74, № 10. S. 32-47.

6. Lotov A.V. Vvedenie v ekonomiko-matematicheskoe modelirovanie. M., 1984.

7. Tsaregorodtsev V.G. Vzglyad na arkhitekturu i trebovaniya k neiroimitatoru dlya resheniya sovremennykh industrial'nykh zadach // Materialy 11-go Vserossiiskogo seminara «Neiroinformatika i ee prilozheniya». Krasnoyarsk, 2003. S. 171-175.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Виноградова Екатерина Юрьевна

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Виноградова Екатерина Юрьевна

Текст научной работы на тему «Методология проектирования нейросетей для поддержки принятия управленческих решений»