Научная статья на тему 'ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ КЛАССИФИКАЦИИ ПРОЕКТОВ НА ПЛАТФОРМЕ "1С"'

ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ КЛАССИФИКАЦИИ ПРОЕКТОВ НА ПЛАТФОРМЕ "1С" Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
11
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНСАЛТИНГ / УПРАВЛЕНИЕ ПРОЕКТАМИ / КЛАСТЕРНЫЙ АНАЛИЗ / КЛАССИФИКАЦИЯ ПРОЕКТОВ / DATA MINING / CONSULTING / PROJECT MANAGEMENT / CLUSTER ANALYSIS / PROJECT CLASSIFICATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Комова Е. В.

Актуальность исследуемой проблемы обусловлена тем, что создание проектов внедрения отраслевых и специализированных программных продуктов на платформе «1С» является одним из самых сложных и трудоемких направлений консалтинга в сфере информационных продуктов и услуг. Статья направлена на изучение математического и программного инструментария классификации проектов на платформе «1С». Ведущим подходом к исследованию данной проблемы являются методы кластерного анализа, позволяющие сформировать наиболее точные подмножества проектов, получив их описательные характеристики. Материалы статьи могут быть полезными для фирм-партнеров компании «1С» в процессе управления проектами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INSTRUMENTAL METHODS OF PROJECT CLASSIFICATION ON "1C" PLATFORM

The urgency of the investigated problem is due to the fact that the creation of projects for the implementation of industry-specific and specialized software products on the 1C platform is one of the most complex and labor-intensive areas of consulting in the field of information products and services. The article is aimed at studying the mathematical and software tools for classifying projects on the 1C platform. The leading approach to the study of this problem are the methods of cluster analysis, allowing to form the most accurate subsets of projects, having received their descriptive characteristics. The article materials may be useful for 1C partner companies in the process of project management.

Текст научной работы на тему «ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ КЛАССИФИКАЦИИ ПРОЕКТОВ НА ПЛАТФОРМЕ "1С"»

УДК 658.5

ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ КЛАССИФИКАЦИИ ПРОЕКТОВ НА ПЛАТФОРМЕ «1С»

Комова Е.В., магистрант, направление подготовки 38.04.05 Бизнес-информатика, Оренбургский государственный университет, Оренбург e-mail: elvcom7@gmail.com

Научный руководитель: Жук М.А., доктор экономических наук, доцент, заведующий кафедрой прикладной информатики в экономике и управлении, Оренбургский государственный университет, Оренбург e-mail: eng_m@inbox.ru

Аннотация. Актуальность исследуемой проблемы обусловлена тем, что создание проектов внедрения отраслевых и специализированных программных продуктов на платформе «1С» является одним из самых сложных и трудоемких направлений консалтинга в сфере информационных продуктов и услуг. Статья направлена на изучение математического и программного инструментария классификации проектов на платформе «1С». Ведущим подходом к исследованию данной проблемы являются методы кластерного анализа, позволяющие сформировать наиболее точные подмножества проектов, получив их описательные характеристики. Материалы статьи могут быть полезными для фирм-партнеров компании «1С» в процессе управления проектами.

Ключевые слова: консалтинг, управление проектами, кластерный анализ, классификация проектов, Data Mining.

INSTRUMENTAL METHODS OF PROJECT CLASSIFICATION ON «1C» PLATFORM

Komova E.V., master student, training direction: 38.04.05 Business Informatics, Orenburg State University, Orenburg

e-mail: elvcom7@gmail.com

Scientific adviser: Zhuk M.A., Doctor of Economic Sciences, Assistant professor, Head of the Department of Applied Informatics in Economics and Management, Orenburg State University, Orenburg e-mail: eng_m@inbox.ru

Abstract. The urgency of the investigated problem is due to the fact that the creation ofprojects for the implementation of industry-specific and specialized software products on the 1С platform is one of the most complex and labor-intensive areas of consulting in the field of information products and services. The article is aimed at studying the mathematical and software tools for classifying projects on the 1С platform. The leading approach to the study of this problem are the methods of cluster analysis, allowing to form the most accurate subsets ofprojects, having received their descriptive characteristics. The article materials may be useful for 1С partner companies in the process of project management.

Keywords: consulting, project management, cluster analysis, project classification, Data Mining.

На сегодняшний день практически не существует систем, позволяющих автоматизировать консалтинг в сфере информационных продуктов и услуг. Возможности базовых конфигураций программных средств не могут полностью автоматизировать данный вид консалтинга, поэтому практически все работы с клиентами осуществляются специалистами на основании собственного опыта.

При этом процесс консалтинга в сфере информационных продуктов и услуг сопровождается рядом недостатков:

- потери времени на поиск информации;

- низкая оперативность формирования отчетов в связи с большим количеством неструктурированной информации;

- ошибки при оказании услуг;

- сложность принятия управленческих решений [1].

Проекты на платформе «1С: Предприятие 8.3» характеризуются множеством показателей таких, как направление деятельности, отрасль деятельности, количество рабочих мест, сроки внедрения и многими другими. При этом нельзя точно ответить, какой из перечисленных факторов, является наиболее важным в процессе принятия решения руководством при оценке стоимости внедрения. Зачастую необходимо своевременное получение информации о ранее внедренных подобных проектах, для более оперативного и качественного принятия решений. Этими фактами обусловлена

ЭКОНОМИЧЕСКИЕ НАУКИ

актуальность и сложность данного исследования.

Для классификации проектов на платформе «1С» было выбрано одно из популярных направлений интеллектуального анализа данных - Data Mining. Методы этого направления основаны на статистических и математических приемах исследования. Data Mining позволяет обнаружить в «сырых» данных ранее неизвестные, нетривиальные, практически полезные знания, необходимые для принятия решений в различных сферах человеческой деятельности» [2].

Одни из самых распростространенных методов в Data Mining - методы кластеризации, т. е. объединение по определенным признакам объектов в группы. На сегодняшний день кластерный анализ является первой ступенью анализа данных.

Главной целью кластеризации является разбиение множества схожих объектов на непересекающиеся подмножества, обладающие общими свойствами внутри группы и несовпадающими со свойствами других групп. Кластерный анализ необходим для обнаружения закономерностей в наборах данных.

Самые популярные среди методов кластерного анализа - это алгоритмы иерархической кластеризации. Принято выделять два основных типа: нисходящие и восходящие алгоритмы. Нисходящие алгоритмы построены на принципе «сверху-вниз»: на первом шаге все объекты собираются в один кластер, разбивающийся, впоследствии, на более мелкие кластеры. Наиболее распространенными являются восходящие алгоритмы, которые определяют каждый объект сначала в отдельный кластер, а потом происходит объединение всех объектов в более крупные кластеры, пока не останется один. Графически результаты работы таких методов представляют в виде дендрограммы - дерева, наглядно позволяющего оценить количество и размер кластеров.

Задачу кластеризации в общем виде можно представить как построение оптимального разбиения объектов на подмножества. В этом случае используются еще одни методы кластерного анализа - алгоритмы квадратичной ошибки. Оптимальность разбиения с помощью этих методов определяется как достижение минимизации среднеквадра-тической ошибки разбиения:

*2(X,L) = £¿| x(j - j \

j=i

где

c. - «центр масс» кластера j (точка, содержащая средние значения характеристик для указанного кластера).

Представленные алгоритмы квадратичной ошибки принято относить к плоским алгоритмам. Наиболее популярным в этой категории является алгоритм ^-средних. Суть метода заключается в по-

строении заданного числа кластеров, расположенных на максимальном расстоянии друг от друга.

В качестве критерия остановки работы алгоритма, как правило, применяется минимальное изменение среднеквадратической ошибки [3].

Еще одними популярными методами кластерного анализа являются нечеткие алгоритмы.

Широко используется алгоритм с-средних (с-теаш), представляющий собой модификацию метода ^-средних.

Однако, если заранее точно неизвестно число кластеров, то этот алгоритм может не подойти, либо требуется однозначно отнести каждый объект к определенному кластеру.

Алгоритмы, основанные на теории графов, характеризуются тем, что представляют собой выборку объектов в виде графа О = (V Е). Объекты являются в этом случае вершинами, а «расстояние» между объектами иллюстрируют ребра, иными словами назначается вес. Графовые алгоритмы кластерного анализа обладают такими достоинствами, как наглядность, возможность реализации всевозможных усовершенствований и относительная простота выполнения. Типовыми методами являются алгоритм послойной кластеризации, алгоритм выделения связных компонент, алгоритм построения минимального покрывающего (остовного) дерева.

При реализации алгоритма выделения связных компонент указывается входной параметр R, затем удаляются все ребра в графе, «расстояния» которых больше Я. Только самые близкие пары объектов остаются соединенными. Основная идея алгоритма в том, чтобы определить некое, содержащееся в диапазоне всех «расстояний», значение Я, при котором граф разделится на некоторое количество связных компонент - кластеров.

Суть алгоритма минимального покрывающего дерева заключается в том, что сначала строится минимальное покрывающее дерево на графе. Далее последовательно удаляются ребра с наибольшим весом.

Метод послойной кластеризации базируется на выделении на некотором уровне расстояний между вершинами графа связных компонент.

В результате работы алгоритм послойной кластеризации формируется последовательность подчиненных подграфов графа О, иллюстрирующих иерархические связи между группами объектов:

О0 с О1 с... с От,

где

01 = (V, Е1) - граф на уровне С, Е = (е; е Е : р < с},

с' - /-й порог расстояния,

m - количество уровней иерархии, G0 = (V o), o - пустое множество ребер графа, получаемое при t0 = 1,

Gm = G, то есть граф объектов без ограничений на расстояние, поскольку ttm = 1.

Посредством изменения порогов расстояния {с0, ..., ст}, где

0 = с0 < с1 < ... < ст = 1, можно регулировать вложенность получаемых кластеров. Таким образом, метод послойной кластеризации используется как при плоском разбиении данных, так и при иерархическом [4].

Для формирования подмножеств проектов на платформе «1С: Предприятие 8.3» был выбран иерархический алгоритм кластеризации и для его более детального обоснования метод «^-средних». Преимущество иерархической кластеризации - это ее наглядность и возможность получить детальное представление о структуре данных, метод подходит для небольшой выборки данных (в рассматриваемом случае 40 проектов). Неиерархический метод кластеризации «^-средних» является более точным, сокращает различия между объектами одного кластера и представляет больше описательных характеристик.

Для реализации кластеризации проектов на платформе «1С:Предприятие 8.3» был выбран пакет «STATISTICA», разработанный американской компанией «StatSoft».

Программное средство «STATISTICA» представляет пользователям следующие возможности:

- широкий выбор аналитических процедур и функций;

- обработка больших объемов данных;

- высокий уровень производительности и большое количество опций и настроек.

Основными преимуществами пакета <^ТАТШ-Т1СА» являются:

- большой набор графиков для иллюстрации полученных результатов;

- возможность использования статистической классификации;

- возможность написания собственных макросов для выполнения алгоритмов, не предусмотренных в программе;

- реализация алгоритмов интеллектуального анализа данных.

Выбору программного пакета <^ТАТШТГСА» поспособствовали реализованные в нем методы иерархической кластеризации, ^-средних и двухвхо-дового объединения. Так же представлены различные метрики расстояний [5].

Сформированные подмножества проектов послужат основанием для разработки информационной системы консалтинга в сфере информационных продуктов и услуг, для оперативного поиска в ней информации о выполненных раннее проектах, стоимостных и трудовых затратах на их исполнение. Полученные данные позволят принять эффективное управленческое решение, избежать ошибок при создании и выполнении проектов, сократить издержки и повысить эффективность деятельности предприятия в целом.

Литература

1. Муруева Э. К. О применении современных информационных и коммуникационных технологий в области аудита и консалтинга // Вестник Бурятского государственного университета. - 2014. - № 2. -С. 140-143.

2. Елманова Н. И. Введение в Data Mining [Электронный ресурс]. - Режим доступа: https://compress. ru/article.aspx?id=11616 (дата обращения: 13.12.2018).

3. Егоров А. В., Куприянова Н. И. Особенности методов кластеризации данных // Известия Южного федерального университета. Технические науки. - 2011. - № 1. - С. 174-178.

4. Бирюков А. С., Рязанов В. В., Шмако А. С. Решение задач кластерного анализа коллективами алгоритмов // Журнал вычислительной математики и математической физики. - 2008. - № 1 (48). - С. 176-192.

5. Цыпин А. П., Сорокин А. С. Статистические пакеты программ в социально-экономических исследованиях // Азимут научных исследований: экономика и управление. - 2016. - № 4 (17). - С. 379-384.

i Надоели баннеры? Вы всегда можете отключить рекламу.