^ виноградовА Екатерина Юрьевна
Доктор экономических наук, профессор кафедры статистики, эконометрики и информатики
Уральский государственный экономический университет 620144, рФ, г. Екатеринбург, ул. 8 Марта/народной воли, 62/45 Тел.: (343) 257-71-47 E-mail: katerina@usue.ru
Представление знаний в интеллектуальных системах управления субъектом хозяйствования
Аннотация
В статье приводятся принципы формирования данных, необходимых для функционирования интеллектуальной информационной системы управления предприятием, способы и технологии представления знаний и параметры формирования технологических цепочек. Классифицируются области знаний в контексте применения нейронных сетей, приводятся примеры моделей знаний и моделей обучения нейронных сетей, критерии эффективности обучения нейронных сетей. Также в рамках статьи выделены общие правила представления знаний в нейронной сети, затронуты вопросы внедрения априорной информации в структуру различных нейронных сетей и рассмотрены возможные структуры представления и построения нейронных сетей. Рассмотрена диаграмма системы, использующей пространство инвариантных признаков. Приведены примеры практического применения и использования технологий нейронных сетей для решения задач с применением искусственного интеллекта.
^ Андреева Светлана Леонидовна
Старший преподаватель кафедры бизнес-информатики
Уральский государственный экономический университет 620144, рФ, г. Екатеринбург, ул. 8 Марта/народной воли, 62/45 Тел.: (343) 257-71-47 E-mail: svetlana@usue.ru
Ключевые слова
интеллектуальные информационные технологии
информационная система управление предприятием
JEL classification
C81
ВВЕДЕНИЕ
В последние десятилетия в мире бурно развивается новая прикладная область экономической науки, специализирующаяся на искусственных нейронных сетях. Актуальность исследований в этом направлении подтверждается массой различных применений нейронных сетей. Это и автоматизация процессов распознавания образов, и адаптивное управление, и аппроксимация функционалов, а также прогнозирование, создание экспертных систем управления предприятиями, организация ассоциативной памяти и многое другое. С помощью нейронных сетей можно, например, предсказывать показатели биржевого рынка, выполнять распознавание оптических или звуковых сигналов, создавать самообучающиеся системы, способные управлять автомашиной при парковке или синтезировать речь по тексту, проектировать модели управления субъектами хозяйствования. В то время как на западе применение нейронных сетей уже достаточно обширно, в нашей стране это еще в некоторой степени экзотика - российские фирмы, использующие нейросети в практических целях, можно пересчитать вручную. Широкий круг задач, решаемых при помощи нейронных сетей, не позволяет в настоящее время создавать универсальные, мощные сети, вынуждая разрабатывать специализированные нейронный сети, функционирующие по различным алгоритмам.
Нейронные сети являются нелинейными динамическими системами с коллективными свойствами. Для исследо-
вания таких сложных моделей нужна большая вычислительная мощность. Активизация интереса к искусственным нейронным сетям обусловлена не только новым математическим подходом, но и существенным прогрессом вычислительной техники.
ПРЕДСТАВЛЕНИЕ ЗНАНИЙ В НЕЙРОННОЙ СЕТИ
Решение конкретных задач предваряется подготовкой данных для нейронной сети. На практике именно предобработка данных может стать наиболее трудоемким элементом нейросете-вого анализа. Причем использование и проектирование основных принципов и приемов предобработки данных не менее, а может быть, даже более важно, чем разработка собственно нейро-сетевых алгоритмов. Процесс решения прикладных задач, в том числе подготовка данных, целиком ложится на плечи разработчика.
Технологическая цепочка представления знаний выглядит следующим образом:
• кодирование входов-выходов -нейросети могут работать только с числами;
• нормировка данных - результаты нейроанализа не должны зависеть от выбора единиц измерения;
• предобработка данных - удаление очевидных регулярностей из данных облегчает нейросети выявление нетривиальных закономерностей;
• обучение нескольких нейросетей с различной архитектурой - результат
Knowledge Representation
in the Intellectual Systems of Business Unit
Management
■o я
h
a m Я
Abstract
The article states the formation principles of the data necessary for the functioning of the intellectual information system of enterprise management, and discusses the methods and technologies of knowledge representation and parameters of technological chains formation. The knowledge areas are classified in the context of neural networks. The authors provide the examples of the knowledge models and the models of neural network training, establish the criteria for assessing effectiveness of neural networks training. The paper also emphasizes the general rules of knowledge representation in a neural network, debates the issues of practical implementation of a priori information in the structure of various neural networks and considers possible structures of representation and construction of neural networks. The diagram of the system using the space of invariant indicators is analyzed. The examples of practical application and use of neural network technology for solving problems with the help of artificial intelligence are given.
► Yekaterina Yu. VINOGRADOVA
Dr. Sc. (Econ.), Professor of Statistics, Econometrics and Information Science Dept.
Ural State University of Economics 620144, RF, Yekaterinburg, 8 Marta/Narodnoy Voli St., 62/45 Phone: (343) 257-71-47 E-mail: katerina@usue.ru
обучения зависит как от размеров сети, так и от ее начальной конфигурации;
• отбор оптимальных сетей - тех, которые дадут наименьшую ошибку предсказания на неизвестных пока данных;
• оценка значимости предсказаний -оценка ошибки предсказаний не менее важна, чем само предсказанное значение.
Под знаниями понимается хранимая информация или модели, используемые человеком или машиной для интерпретации, предсказания или реакции на внешние события [6].
К вопросам представления знаний относятся, в частности, следующие: какую информацию необходимо хранить и как эту информацию представить физически для ее последующего использования. Таким образом, исходя из самой природы знаний, способ их представления определяется поставленной целью. Относительно реальных приложений «интеллектуальных» систем можно утверждать, что успех решения зависит от хорошего представления знаний. Это касается и нейронных сетей как отдельного класса интеллектуальных систем. Форма представления входных сигналов может быть самой разной. Это приводит к тому, что разработка приемлемых нейросетевых решений становится творческим процессом [2; 4; 8; 9].
Основной задачей нейронной сети является наилучшее обучение модели окружающего пространства. Знания о мире включают два типа информации:
• известное состояние окружающего мира, представленное имеющимися в наличии достоверными фактами. Такая информация называется априорной;
• наблюдения за окружающим миром (измерения), полученные с помощью сенсоров, адаптированных для конкретных условий, в которых должна функционировать данная нейронная сеть. Обычно такие измерения в значительной степени зашумлены, что потенциально может стать источником ошибок. В любом случае измерения, полученные таким способом, формируют множество информации, примеры из которого используются для обучения нейронной сети.
Примеры могут быть маркированными и немаркированными. В маркированных примерах входному сигналу соответствует желаемый отклик. Немаркированные примеры состоят из нескольких различных реализаций одного входного сигнала. В любом случае набор примеров, как маркированных, так и нет, представляет собой знания об интересующей предметной области, на основании которых и проводится обучение нейронной сети.
Множество пар сигналов вход-выход, каждая из которых состоит из входного сигнала и соответствующего ему желаемого выхода, называют обучающими данными или обучающей выборкой нейронной сети. Набор данных, используемый для обучения нейронной сети, должен содержать как положительные, так и отрицательные примеры.
Для наглядности рассмотрим задачу распознавания цифр. В этой задаче входной сигнал (изображение) представляет собой матрицу, состоящую из черных и белых точек. Каждое изображение представляет одну из десяти руко-
► Svetlana L. ANDREEVA
Sr. Lecturer of Business Informatics Dept.
Ural State University of Economics 620144, RF, Yekaterinburg, 8 Marta/Narodnoy Voli St., 62/45 Phone: (343) 257-71-47 E-mail: svetlana@usue.ru
Keywords
intellectual information technology information system enterprise management
JEL classification
C81
писных цифр на белом фоне. Желаемым
8 откликом нейронной сети является кон-
3 кретная цифра, изображение которой
| подается в качестве входного сигнала.
и Обычно обучающая выборка состоит из
ш большого числа рукописных цифр, что
3 отражает ситуацию, которая может воз-й,
никнуть в реальном мире. При наличии такого набора примеров нейронная сеть создается следующим образом.
Во-первых, выбирается соответствующая архитектура будущей нейронной сети, в которой размер входного слоя соответствует количеству пикселей на рисунке, а в выходном слое содержится десять нейронов, соответствующих цифрам. После этого выполняется настройка весовых коэффициентов нейронной сети на основе обучающего множества. Этот режим работы сети называется обучением.
Во-вторых, эффективность обучения нейронной сети проверяется (тестируется) на множестве примеров, отличных от использованных при обучении. При этом на вход сети подается изображение, для которого известен целевой выход сети. Эффективность обучения сети проверяется путем сравнения результатов распознавания с реальными цифрами. Этот этап работы нейронной сети называют обобщением (данный термин взят из психологии).
Здесь и кроется фундаментальное различие между созданием нейронной сети и разработкой классических методов обработки информации для задач классификации. В последнем случае мы в первую очередь формулируем математическую модель исследуемой среды, верифицируем ее на реальных данных, а затем разрабатываем классификатор на основе этой модели. Создание нейронной сети основывается непосредственно на реальных данных, которые говорят сами за себя. Таким образом, нейронные сети не только реализуют полноценную модель среды, но и обеспечивают обработку данных.
ПРАВИЛА ПРЕДСТАВЛЕНИЯ ЗНАНИЙ В НЕЙРОННОЙ СЕТИ
В нейронной сети заданной архитектуры знания об окружающей среде представляются множеством свободных параметров (синаптических весов и порогов) сети. Такая форма представления знаний соответствует самой природе нейронных сетей. Именно в ней кроется ключ эффективности нейросетевых моделей.
Вопрос представления знаний в нейронной сети является очень сложным.
Тем не менее можно выделить четыре общих правила [6].
Правило 1. Сходные входные сигналы от схожих классов должны формировать единое представление в нейронной сети. Исходя из этого они должны быть классифицированы как принадлежащие к одной категории. Существует множество подходов к определению степени сходства входных сигналов. Обычно степень подобия определяется на основе Евклидова расстояния.
Правило 2. Элементы, отнесенные к различным классам, должны иметь в нейронной сети как можно более отличные представления. Это правило прямо противоположно первому.
Правило 3. Если некоторое свойство имеет важное значение, то для его представления в нейронной сети необходимо использовать большое количество нейронов.
Правило 4. В структуру нейронной сети должны быть встроены априорная информация и инварианты, что упрощает архитектуру сети и процесс ее обучения. Это правило играет особую роль, поскольку правильная конфигурация сети обеспечивает ее специализацию, что очень важно по следующим причинам [1]:
• биологические сети, обеспечивающие обработку зрительной и слуховой информации, сильно специализированы;
• нейронная сеть со специализированной структурой обычно включает значительно меньшее количество свободных параметров, которые нужно настраивать, чем полносвязная сеть. Из этого следует, что для обучения специализированной сети требуется меньше данных. При этом на обучение затрачивается меньше времени, и такая сеть обладает лучшей обобщающей способностью;
• специализированные нейронные сети обладают большей пропускной способностью;
• стоимость создания специализированных нейронных сетей сокращается, поскольку их размер существенно меньше размера полносвязных сетей.
Одной из важнейших задач является внедрение априорной информации в структуру нейронной сети. Для выполнения правила 4 необходимо понять, как разработать специализированную структуру, в которую встроена априорная информация. К сожалению, в настоящее время четкого решения этой задачи не существует. Однако можно предложить некоторые специальные процедуры, которые, как показывает практика, приво-
дят к хорошим результатам. В частности, можно использовать комбинацию двух следующих приемов [1]:
• ограничение сетевой архитектуры с помощью локальных связей, называемых рецепторными полями;
• ограничение выбора синаптиче-ских весов за счет совместного использования весов (weight-sharing).
Эти два приема, особенно последний, обеспечивают одно важное преимущество - значительно сокращают количество свободных параметров сети.
Для примера рассмотрим неполно-связную сеть прямого распространения, показанную на рис. 1. Эта сеть имеет ограниченную архитектуру. Первые шесть узлов источника образуют рецеп-торное поле скрытого нейрона с номером 1, и т.д. для всех остальных скрытых нейронов сети.
Совместное использование весов (все четыре скрытых нейрона для реализации синаптических связей совместно используют одно и то же множество весов) состоит в применении одинакового набора синаптических весов для каждого из нейронов скрытого слоя сети. Учитывая, что каждый из четырех скрытых нейронов имеет по шесть локальных связей (см. рис. 1), индуцированное локальное поле скрытого нейрона j можно описать следующим выражением:
6
Vj = Xw,x,j -v J =1,2 ЗА
i=1
где [Wj }6=1 определяет один и тот же набор весов, совместно используемых всеми четырьмя скрытыми нейронами, а xk является сигналом, получаемым из узла источника с номером k = i + j - 1. Данное выражение записано в форме суммы свертки. Именно по этой причине сеть прямого распространения с локальными связями и совместно используемыми весами называют сетью свертки.
Первая часть правила 4 определяет необходимость встраивания априорной информации в структуру нейронной сети, а вторая часть этого правила касается вопроса инвариантов [3; 13].
Метод создания инвариантного ней-росетевого классификатора показан на рис. 2. Он основывается на предположении, что из входного сигнала можно выделить информативные признаки, которые описывают самую существенную информацию, содержащуюся в наборе данных, и при этом инвариантны к трансформациям входного сигнала [5; 7; 10-12].
> У
** У2
Рис. 1 Пример сети с рецепторными полями и совместным использованием весов
Входной сигнал
Рис. 2. Диаграмма системы, использующей пространство инвариантных признаков
Вопрос представления знаний в нейронной сети непосредственно связан с сетевой архитектурой. К сожалению, в настоящее время не существует какой-либо формализованной теории оптимизации структуры нейронных сетей или оценки влияния архитектуры сети на представление знаний в ней. Ответы на эти вопросы обычно получают экспериментальным путем. При этом сам разработчик нейронной сети становится важным элементом цикла структурного обучения.
ЗАКЛЮЧЕНИЕ
Независимо от того, как выбирается архитектура сети, знания о предметной области выделяются нейронной сетью в процессе обучения. Эти знания представляются в компактно распределенном виде весов синаптических связей сети. Такая форма представления знаний позволяет нейронной сети адаптироваться и выполнять обобщение, однако не обеспечивает полноценного описания вычислительного процесса, используемого для принятия решения
или формирования выходного сигнала. Это может накладывать серьезные ограничения на использование нейро-сетевого подхода, особенно в тех областях, где решающим является принцип безопасности, например в области диспетчеризации движения самолетов или в медицинской диагностике. В таких приложениях не только желательно, но и жизненно необходимо обеспечить возможность объяснения (explanation capability). Одним из способов обеспечения такой возможности является интеграция нейронных сетей и моделей искусственного интеллекта в единую гибридную систему.
В настоящее время высокие технологии доступны подавляющему большинству средних фирм и организаций. Исторически такие системы в первую очередь реализовывали потребности в операционной обработке данных -они обслуживали информационные архивы, телефонные сети, системы резервирования билетов, сбора метеоданных и др. Мощные средства вычислительной техники позволили накапливать большие объемы информации: документы, сведения о банковских операциях, клиентах, предоставленных услугах. Использование описанных в статье принципов и правил структурирования и формирования знаний позволит реализовать производительную и легко-обучаемую нейронную сеть, лежащую в основе инструментария экспертной системы управления хозяйствующим субъектом, значительно повысить эффективность и качество такого управления. ■
■о я
h
a m Я
x
x
x
x
x
x
x
x
x
8 Прикладной менеджмент
Источники
1. Барский А.Б. Нейронные сети: распознавание, управление, принятие решений. М.: Финансы и статистика, 2004.
2. Бэстенс Д.Э., Ван ден Берг В.М., Вуд Д. Нейронные сети и финансовые рынки. Принятие решений в торговых операциях. М.: ТВП Научное издательство, 1997.
3. Виноградова Е.Ю. Управление внедрением информационной системы планирования на предприятии // Современные проблемы прикладной информатики: сб. науч. тр. Междунар. науч.-практ. конф. (27-28 мая 2008 г.). СПб.: Изд-во Политехн. ун-та, 2008. С. 54-58.
4. Ежов А.А., Шумовский С.А. Нейрокомпьютинг и его применения в экономике и бизнесе. М.: Финансы и статистика, 2004.
5. Кобелев Н.Б. Основы имитационного моделирования сложных экономических систем. М.: Дело, 2003.
6. Методы нейроинформатики: сб. науч. тр. / под ред. А.Н. Горбаня. Красноярск: КГТУ, 1998.
7. Нейроинформатика / А.Н. Горбань, ВЛ. Дунин-Барковский, А.Н. Кир-дин и др. Новосибирск: Наука. Сибирское предприятие РАН, 1998.
8. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия-Телеком, 2006.
9. Хайкин С. Нейронные сети. Полный курс. М.: Вильямс, 2006.
10. Царегородцев В.Г. Взгляд на архитектуру и требования к нейро-имитатору для решения современных индустриальных задач // Материалы XI Всерос. семинара «Нейроинформатика и ее приложения». Красноярск, 2003. С. 171-175.
11. Царегородцев В.Г. К определению информативности независимых переменных для нейронной сети // Материалы XI Всерос. семинара «Нейроинформатика и ее приложения». Красноярск, 2003. С. 176-177.
12. Царегородцев В.Г. Оптимизация предобработки данных для обучаемой нейросети: критерии оптимальности предобработки // Материалы XIV Междунар. конф. по нейрокибернетике. Ростов-н/Д., 2005. Т. 2. С. 64-67.
13. Vinogradova E.Yu. Experience of design of information system for complex operation of enterprise // Высокие технологии, фундаментальные и прикладные исследования, образование. Т. 11: сб. тр. Четвертой Междунар. науч.-практ. конф. «Исследование, разработка и применение высоких технологий в промышленности» (Санкт-Петербург, 2-5 октября 2007 г.). СПб.: Изд-во Политехн. ун-та, 2007. С. 25-26.
References
1. Barskiy A.B. Neyronnye seti: raspoznavanie, upravlenie, prinyatie reshe-niy [Neural networks: recognition, management, decision-making]. Moscw, Finansy i statistika Publ., 2004.
2. Bestens D.E., van den Berg V.M., Wood D. Neyronnye seti i finansovye rynki. Prinyatie resheniy v torgovykh operatsiyakh [Neural networks and the financial markets. Decision-making in commercial transactions]. Mosvow, TVP Nauchnoe izdatel'stvo Publ., 1997.
3. Vinogradova Ye.Yu. Upravlenie vnedreniem informatsionnoy si-stemy planirovaniya na predpriyatii [Managing the implementation of the information system of planning at the enterprise]. Covremennye problemy prikladnoy informatiki: sb. nauch. tr. Mezhdunar. nauch.-prakt. konf. (27-28 maya 2008 g.) [Modern Problems of Applied Mathematics: collection of research papers of Int. sci.-pract. conf. May 27-28, 2008)]. St Petersburg, Izd-vo Politekhn. un-ta Publ., 2008. Pp. 54-58.
4. Yezhov A.A., Shumovskiy S.A. Neyrokomp'yuting i ego primeneniya veko-nomikeibiznese [Neurocomputing and its application in economics and business]. Moscow, Finansy i statistika Publ., 2004.
5. Kobelev N.B. Osnovy imitatsionnogo modelirovaniya slozhnykh ekonomi-cheskikh system [The basics of simulation of complex economic systems]. Moscow, Delo Publ., 2003.
6. Gorban A.N. (ed.) Metody neyroinformatiki: sb. nauch. tr. [Methods of neuroinformatics. Collection of research papers]. Krasnoyarsk, KGTU Publ., 1998.
7. Gorban' A.N., Dunin-Barkovskiy V.L., Kirdin A.N. et al. Neyroinformatika [Neuroinformatics]. Novosibirsk, Nauka. Sibirskoe predpriyatie RAN Publ., 1998.
8. Rutkovskaya D., Pilin'skiy M., Rutkovskiy L. Neyronnye seti, geneticheskie algoritmy i nechetkie sistemy [Neural networks, genetic algorithms and fuzzy systems]. Moscow, Goryachaya liniya-Telekom Publ., 2006.
9. Khaykin S. Neyronnye seti. Polnyy kurs [Neural networks. Full course]. Moscow, Vil'yams Publ., 2006.
10. Tsaregorodtsev V.G. Vzglyad na arkhitekturu i trebovaniya k neyroimi-tatoru dlya resheniya sovremennykh industrial'nykh zadach [A look at the organization and requirements for neuro-simulator to solve modern industrial problems]. Materialy XI Vseros. seminara «Neyroinformatika i ee prilozheniya» [Proc. of XI All-Russia seminar "Neuroinformatics and its applications"]. Krasnoyarsk, 2003. Pp. 171-175.
11. Tsaregorodtsev V.G. K opredeleniyu informativnosti nezavisimykh peremennykh dlya neyronnoy seti [On the definition of informative value of the independent variables for the neural network]. Materialy XI Vseros. seminara «Neyroinformatika i ee prilozheniya» [Proc. of XI All-Russia seminar "Neuroinformatics and its applications"]. Krasnoyarsk, 2003. Pp. 176-177.
12. Tsaregorodtsev V.G. Optimizatsiya predobrabotki dannykh dlya obu-chaemoy neyroseti: kriterii optimal'nosti predobrabotki [Optimization of data preprocessing for neural network learning: preprocessing optimality criteria]. MaterialyXIVMezhdunar. konf.poneyrokibernetike [Proc. of XIV Int. conf. on neural engineering]. Rostov-on-Don, 2005. Vol. 2. Pp. 64-67.
13. Vinogradova Ye.Yu. [Experience of design of information system for complex operation of enterprise]. Vysokie tekhnologii, fundamental'nye i prikladnye issledovaniya, obrazovanie. T. 11: Sb. tr. Chetvertoy mezhdunar. nauch.-prakt. konf. «Issledovanie, razrabotka i primenenie vysokikh tekhnologiy v promyshlennosti» (Sankt-Peterburg, 02-05.10.2007) [High technologies, fundamental and applied research, education. Vol. 11: Collection of papers of 4th Int. sci.-pract. conf. "Research, development and application of high technologies in industry"]. St Petersburg, Izd-vo Politekhn. un-ta Publ., 2007. Pp. 25-26.