УДК 330.43
ПРИМЕНЕНИЕ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА В УПРАВЛЕНЧЕСКОЙ ДЕЯТЕЛЬНОСТИ АГРОПРЕДПРИЯТИЯ
В.А. Шишкина, ст. преподаватель; А.Н. Козлов, канд. техн. наук, доцент,
ФГБОУ ВПО Пермская ГСХА,
ул. Сибирская, 4, г. Пермь, Россия, 614000,
E-mail: [email protected]
Аннотация. Обоснована актуальность и возможность применения методов интеллектуального анализа данных для прогнозирования процессов с целью повышения эффективности управления. В основе интеллектуального анализа данных лежит технология Knowledge Discovery in Databases (KDD), которая на русский язык переводится как «извлечение знаний из баз данных». Для применения на предприятии методов интеллектуального анализа данных сначала необходимо решить важную задачу - консолидировать все данные в одном месте в рамках единого программного решения, то есть организовать хранилище данных.
Приведен пример анализа данных - расхода дизельного топлива агропредприятия и получения прогноза с помощью аналитической платформы Deductor. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы: создание хранилища данных, автоматизированный подбор моделей для анализа и визуализации полученных результатов анализа. Было обработано более 3,5 тыс. транзакций (чеков) на отпуск дизельного топлива за период с января 2010 года по апрель 2012 года. С помощью аналитической платформы разработан сценарий обработки данных, получена математическая модель и осуществлено прогнозирование на предстоящие периоды. Проведена оценка погрешности прогноза: на один месяц вперед погрешность прогноза составила - 2,5%, а на три месяца погрешность прогноза составила +4,9%. Увеличение погрешности обусловлено тем, что для данного периода исходных данных (01.01.2010 - 01.04.2012) прогноз можно составить только на 1-2 месяца вперед. Таким образом, на основании прогноза можно обоснованно и более точно спрогнозировать потребность в дизельном топливе на предстоящие периоды (без серьезных излишек и нехватки), тем самым повысить эффективность управленческих решений и финансовых затрат. Указанные методы можно применять и для других объектов анализа, опираясь на объективный и обширный прошлый опыт, а не на субъективный опыт отдельных специалистов.
Ключевые слова: интеллектуальный анализ данных, DataMining, прогнозирование, нейронная сеть, управление агропредприятием.
Введение. В современном мире на каждом предприятии, будь то частное небольшое предприятие или огромная холдинговая компания, необходимо постоянно принимать управленческие решения. От их качества, которое зависит от компетенции менеджмента предприятия, зависит эффективность и успешность предприятия. Для этого необходимо опираться на знания сегодняшней ситу-
ации на рынке, однако, всегда полезно использовать ранее накопленный опыт и знания. Источником такого опыта (успешного и неуспешного) и знаний является управленческий персонал. Однако подобные знания могут находиться и в другом источнике - в базах данных различных информационных систем предприятия. За последнее десятилетие на предприятиях накоплены гигантские объемы
различных данных, начиная от истории продаж (услуг, операций) и данных о клиентах, заканчивая курсом валют и сводок погоды. Проблема заключается в извлечении знаний из этих данных [1-12].
В настоящее время интенсивно разрабатываются программные методы автоматического извлечения знаний из накопленных фактов, хранящихся в различных базах данных. В их основе лежит технология анализа данных KnowledgeDiscoveryinDatabases (KDD), которая на русский язык переводится как «извлечение знаний из баз данных». В отечественной литературе применяется термин «Интеллектуальный анализ данных» (ИАД).
В последние годы интеллектуальная составляющая бизнеса стала возрастать, и для распространения технологии KDD были созданы все необходимые и достаточные условия [1]:
1. Развитие технологий автоматизированной обработки информации создало основу для учета сколько угодно большого количества факторов и хранения достаточно большого объема данных.
2. Потребовались технологии обработки анализа, доступные для специалистов любого профиля за счет применения методов визуализации и самообучающихся алгоритмов.
3. На рынке появились программные продукты, поддерживающие технологии KDD -аналитические платформы. С их помощью можно создавать полноценные аналитические решения и быстро получать первые результаты.
Метод и инструментарий исследования. Для применения на предприятии методов интеллектуального анализа данных сначала необходимо решить важную задачу - консолидировать все данные в одном месте в рамках единого программного решения. Таким программным решением является организация хранилища данных [1]. После создания хранилища данных можно будет применять различные методы ИАД, так называемые методы
DataMining. DataMining - это процесс обнаружения в "сырых" данных, ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений. Data Mining является одним из шагов Knowledge Discovery in Databases.
Одним из известных программных продуктов для ИАД является аналитическая платформа Deductor, разработчиком которой является отечественная компания
BaseGroupLabs (г. Рязань) [2]. Аналитическая платформа Deductor является основой для создания законченных прикладных решений. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы: от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов.
Результаты исследования. В качестве примера был проанализирован расход дизельного топлива на одном из сельхозпредприятий Пермского края. Было обработано более 3,5 тыс. транзакций (чеков) на отпуск топлива (в литрах) за период с января 2010 года по апрель 2012 года. Разработанный сценарий обработки представлен на рис. 1 (а).
На рис.2(а) показан результат аппроксимации зависимости расхода с помощью нейронной сети, а также результаты прогноза затрат на один месяц вперед (рис. 2.б) и на третий месяц вперед (рис. 2.в). Результаты прогноза не нарушают общую тенденцию сезонности расхода топлива.
Реальные расходы на один месяц прогноза (май 2012 г.) составили 93616 литров (погрешность прогноза составила 2,5%), а на третий месяц прогноза (июль 2012 г.) составили 77883 литра (погрешность прогноза составила +4,9%). Увеличение погрешности обусловлено тем, что для данного периода (01.01.2010 -
01.04.2012) наиболее точный прогноз можно составить на 1-2 месяца вперед [1-5].
Рис.1. Рабочее окно аналитической платформы Deductor: а) - сценарий обработки; б) - динамика реального расхода по месяцам; в) - «сглаженная» динамика расхода
Рис.2. Результаты прогноза расхода топлива: а) - модель зависимости; б) - прогноз на месяц вперед; в) - прогноз на третий месяц вперед
Выводы. На основании прогноза можно более обоснованно и точно определить объем запасов топлива на предстоящие периоды (без серьезных излишек и нехватки), тем самым повысить эффективность принимаемых решений. Указанные методы можно применять и для других объектов анализа, например, расхода запчастей или финансовых затрат, то
есть полученные знания (модели) можно тиражировать.
Таким образом, применение методов интеллектуального анализа данных позволит менеджменту предприятий и фирм более эффективно и качественно принимать управленческие решения, опираясь на объективный и обширный прошлый опыт, а не на субъективный опыт отдельных специалистов.
Литература
1. Паклин Н.Б., Орешков В.И. Бизнес аналитика: от данных к знаниям (+CD): учеб. пособие / Н.Б. Паклин, В.И. Орешков. 2-еизд., перераб. и доп. СПб.: Питер, 2010. 704 с.
2. Elchan Ch. The Foundations of Cost-Sensitive Learning // In Proc. of the 17th International Joint Conference on Artificial Intelligence, 2001. P. 973-978.
3. Garcia S., Herrera F. Evolutionary Undersampling for Classification with Imbalanced Datasets: Proposals and Taxonomy // Evolutionary Computation 17(3), 2009. P. 275-306.
4. Chawla N., Bowyer, K., Hall, L., Kegelmeyer, W. SMOTE: Synthetic Minority Over-sampling Technique // Journal of Artificial Intelligence Research, 2002, 16. P. 341-378.
5. He H., Garcia A. Learning from Imbalanced Data // IEEE transactions on knowledge and data engineering, vol. 21, no. 9, September 2009. P. 1263-1284.
6. Барсегян и др. Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP - СПб. :БХВ-Петербург, 2007.
7. Демин И. С. Кластеризация как инструмент интеллектуального анализа данных //Новые информационные технологии в образовании. Часть 1, — М.: 1 С-Паблишинг, 2011. C. 98-103.
8. Демин И. С. Кластеризация равномерно распределенных множеств методами нейронных сетей // Модели экономических систем и информационные технологии. М.: Финансовая академия, 2007. С. 34-38.
9. Комашинский В.И., Смирнов Д.А. Нейронные сети и их применение в системах управления и связи. - М.: Горячая линия-Телеком, 2003. 93 с.
10. Орешков В.И. Интеллектуальный анализ данных как важнейший инструмент формирования интеллектуального капитала организаций // Креативная экономика. 2011. No.12. С. 84-89.
11. Орешков В.И. Интеллектуальный анализ данных как современный инструмент поддержки принятия решений в экономике и бизнесе // European Social Science Jomal. 2012. No.9 (том 2) С. 482-490.
12. Е.П. Васильев, В.И. Орешков. Моделирование урожайности на основе данных агрохимического обследования почв с помощью метода ассоциативного анализа.// Вестник РГАТУ. 2012 No. 4(16) С. 8-13.
APPLICATION OF SMART ANALYSIS IN MANAGEMENT ACTIVITIES OF AN AGRO-ENTERPRISE
V.A. Shishkina, Senior Teacher
Perm State Agricultural Academy, Perm, Russia
A.N. Kozlov, Cand. Eng. Sci., Professor
Perm State Agricultural Academy
E-mail: [email protected]
ABSTRACT
Topicality and ability to apply the smart data analysis methods for forecasting processes with the aim to enhance management effectiveness have been founded in the paper. Knowledge Discovery in Databases (KDD) technology lies in the ground of smart analysis. Before applying smart data analysis methods in enterprises, an important problem ought to be solved; all data ought to be consolidated in
one location in the frame of unified programming decision, this is - to arrange data repository. The example of data analysis - diesel fuel consumption in an agro-enterprise - and the example of forecasting using the analytical platform Deductor have been given. Technologies implemented in Deduc-tor enable going through all stages of constructing analytical system: creating data warehouse, computer-aided model selection for analysis and visualization of received analysis results. More than 3.5 thousand diesel fuel sell transactions (receipts) were processed for the period January 2010 - April 2012. The data processing scenario was developed, mathematical model was gained, and forecasting for forthcoming periods was done by means of analytical platform. Error estimation was conducted; for one forthcoming month it amounted -2.5%, and for three months the forecast error arranged +4.9%. Increase of error is determined by the fact that for the period of initial data (01.01.2010 -
01.04.2012) the forecast can be composed only for 1-2 forthcoming months. So based on the forecast it is possible to found the need for diesel fuel for forthcoming periods more precisely avoiding serious excess or lack. Therefore, the effectiveness of management decisions and financial expenditure increases. The methods can be applied for other analysis objects as well, basing on impartial and wide past experience, not on subjective experience of particular specialists.
Key words: smart data analysis, Data Mining, forecasting, neural network, agro-enterprise management.
References
1. Paklin N.B., Oreshkov V.I. Biznes analitika: ot dannykh k znaniyam (+CD): ucheb. posobie (Business analytics: from data to knowledge: tutorial), N.B. Paklin, V.I. Oreshkov. 2-eizd., pererab. i dop., SPb.: Piter, 2010, 704 p.
2. Elchan Ch. The Foundations of Cost-Sensitive Learning, In Proc. of the 17th International Joint Conference on Artificial Intelligence, 2001, P. 973-978.
3. Garcia S., Herrera F. Evolutionary Undersampling for Classification with Imbalanced Datasets: Proposals and Taxonomy, Evolutionary Computation 17(3), 2009, P. 275-306.
4. Chawla N., Bowyer, K., Hall, L., Kegelmeyer, W. SMOTE: Synthetic Minority Over-sampling Technique, Journal of Artificial Intelligence Research, 2002, 16, P. 341-378.
5. He H., Garcia A. Learning from Imbalanced Data, IEEE transactions on knowledge and data engineering, Vol. 21, N. 9, September 2009, P. 1263-1284.
6. Barsegyan i dr. Tekhnologii analiza dannykh (Data analysis technologies), Data Mining, Visual Mining, Text Mining, OLAP - SPb. :BKhV-Peterburg, 2007.
7. Demin I. S. Klasterizatsiya kak instrument intellektual'nogo analiza dannykh (Clusterization as a tool of data intellectual analysis), Novye informatsionnye tekhnologii v obrazovanii, Chast' 1, — M.: 1 S-Pablishing, 2011, P. 98-103.
8. Demin I. S. Klasterizatsiya ravnomerno raspredelennykh mnozhestv metodami neironnykh setei (Clusterization of uniformly distributed sets by methods of neural networks), Modeli ekonomicheskikh sistem i informatsionnye tekhnologii. M.: Finansovaya akademiya, 2007, P. 34-38.
9. Komashinskii V.I., Smirnov D.A. Neironnye seti i ikh primenenie v sistemakh upravleniya i svyazi (Neural networks and their application in control and communication systems), M.: Goryachaya liniya-Telekom, 2003, 93 p.
10. Oreshkov V.I. Intellektual'nyi analiz dannykh kak vazhneishii instrument formirovaniya intellektual'nogo kapitala organizatsii (Smart analysis of data as a tool for forming smart capital of an organization), Kreativnaya ekonomika, 2011, No. 12, P. 84-89.
11. Oreshkov V.I. Intellektual'nyi analiz dannykh kak sovremennyi instrument podderzhki prinyatiya reshenii v ekonomike i biznese (Smart analysis of data as a modern tool for decision making support in economy and business), European Social Science Jornal, 2012, No. 9 (Vol. 2), P. 482-490.
12. E.P. Vasil'ev, V.I. Oreshkov. Modelirovanie urozhainosti na osnove dannykh agrokhimicheskogo obsledovaniya pochv s pomoshch'yu metoda assotsiativnogo analiza (Modeling yield on the basis of agro-chemical investigation of soils by means of associative analiysis), Vestnik RGATU, 2012, No. 4(16), P. 8-13.