Научная статья на тему 'РЕАЛИЗАЦИЯ МЕТОДА «АНАЛИЗ СРЕДЫ ФУНКЦИОНИРОВАНИЯ» В ВИДЕ РАСШИРЕНИЯ СУБД POSTGRESQL'

РЕАЛИЗАЦИЯ МЕТОДА «АНАЛИЗ СРЕДЫ ФУНКЦИОНИРОВАНИЯ» В ВИДЕ РАСШИРЕНИЯ СУБД POSTGRESQL Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
116
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
эффективность систем / Анализ Среды Функционирования / АСФ / базы данных / репозиторий / PostgreSQL / efficiency of systems / Data Envelopment Analysis / DEA / databases / repository / PostgreSQL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Моргунов Евгений Павлович, Моргунова Ольга Николаевна, Постойко Анастасия Юрьевна

Предложены усовершенствования технологии интеграции метода «Анализ Среды Функционирования» (Data Envelopment Analysis), предназначенного для оценки эффективности систем, в среду системы управления базами данных PostgreSQL, имеющей открытый исходный код. Показаны преимущества использования концепции репозитория и идеи многовариантных (мультиверсионных) вычислений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IMPLEMENTATION OF DATA ENVELOPMENT ANALYSIS METHOD AS EXTENSION OF POSTGRESQL DATABASE MANAGEMENT SYSTEM

Enhancements of technology of integration of Data Envelopment Analysis (DEA) method into open source PostgreSQL database management system are suggested. DEA method is widely used for assessing of efficiency of systems. The advantages of using the concept of data repository and the ideas of multiversion calculations are demonstrated.

Текст научной работы на тему «РЕАЛИЗАЦИЯ МЕТОДА «АНАЛИЗ СРЕДЫ ФУНКЦИОНИРОВАНИЯ» В ВИДЕ РАСШИРЕНИЯ СУБД POSTGRESQL»

7. Lösch U., Bloehdorn S., Rettinger A. Graph kernels for RDF data // Simperl E., Cimiano P., Polleres A., Corcho O., Presutti V. (eds.). ESWC. Vol. 7295 of Lecture Notes in Computer Science., Springer, 2012. P. 134-148.

8. Sleimi A., Gardent C. Generating paraphrases from DBPedia using Deep Learning // Proceedings of the 2nd International Workshop on Natural Language Generation and the Semantic Web, 2016. P. 54-57. DOI: 10.18653/v1/W16-3511.

9. Ristoski P., Rosati J., Di Noia T., De Leone R., Paulheim H. RDF2Vec: RDF graph embeddings and their applications // Semantic Web. 2018. Vol. 10. P. 1-32. DOI: 10.3233/SW-180317.

УДК 519.8 : 004.65 doi:10.18720/SPBPU/2/id20-207

Моргунов Евгений Павлович1,

канд. техн. наук, доцент, доцент кафедры информатики и вычислительной техники;

Моргунова Ольга Николаевна , канд. техн. наук, доцент, доцент кафедры информатики и вычислительной техники;

Постойко Анастасия Юрьевна ,

студент

РЕАЛИЗАЦИЯ МЕТОДА «АНАЛИЗ СРЕДЫ ФУНКЦИОНИРОВАНИЯ» В ВИДЕ РАСШИРЕНИЯ СУБД POSTGRESQL

12 3

' ' Сибирский государственный университет науки

и технологий имени академика М. Ф. Решетнева, Красноярск, Россия,

1 2

emorgunov@mail.ru, olgamorgunova@mail.ru,

3

postoiko.anastasya@yandex.ru

Аннотация. Предложены усовершенствования технологии интеграции метода «Анализ Среды Функционирования» (Data Envelopment Analysis), предназначенного для оценки эффективности систем, в среду системы управления базами данных PostgreSQL, имеющей открытый исходный код. Показаны преимущества использования концепции репозитория и идеи многовариантных (мультиверсионных) вычислений.

Ключевые слова: эффективность систем, Анализ Среды Функционирования, АСФ, базы данных, репозиторий, PostgreSQL.

Evgeny P. Morgunov\

Candidate of Technical Sciences, Associate Professor, Associate Professor at Computer Science Department;

Olga N. Morgunova , Candidate of Technical Sciences, Associate Professor, Associate Professor at Computer Science Department;

Postoyko Anastasia Yurievna ,

Student

IMPLEMENTATION OF DATA ENVELOPMENT ANALYSIS

METHOD AS EXTENSION OF POSTGRESQL DATABASE MANAGEMENT SYSTEM

12 3

' ' Reshetnev Siberian State University of Science and Technology,

Krasnoyarsk, Russia,

1 2

emorgunov@mail.ru, olgamorgunova@mail.ru, 3 postoiko.anastasya@yandex.ru

Abstract. Enhancements of technology of integration of Data Envelopment Analysis (DEA) method into open source PostgreSQL database management system are suggested. DEA method is widely used for assessing of efficiency of systems. The advantages of using the concept of data repository and the ideas of multiversion calculations are demonstrated.

Keywords: efficiency of systems, Data Envelopment Analysis, DEA, databases, repository, PostgreSQL.

Введение

Одним из видов системных исследований является оценка эффективности систем. Для ее выполнения используются различные методы, в том числе и метод Data Envelopment Analysis (DEA) [5]. Он был предложен в 1978 г. американскими учеными A. Charnes, W.W. Cooper, E. Rhodes [4]. В России используется такое наименование метода - Анализ Среды Функционирования (АСФ) [1].

Поскольку проведение исследований эффективности систем требует обработки больших массивов данных и сложных вычислений, то невозможно обойтись без специального программного обеспечения (ПО). Такое ПО, реализующее метод АСФ (DEA), существует [2].

Авторами настоящей статьи ранее уже был разработан прототип реализации данного метода в среде системы управления базами данных (СУБД) PostgreSQL [3, 7]. Этот прототип имеет ряд существенных отличий от известных разработок других авторов.

В статье речь пойдет о дальнейшем развитии этой разработки.

1. Метод исследования

Метод АСФ не предполагает использования какой-либо формулы, связывающей исходные показатели, и не требует использования весовых коэффициентов, что снижает степень субъективности полученных оце-

нок эффективности систем. Однако он требует разделения показателей на входные и выходные. Входные показатели - это ресурсы, использованные для производства результатов, описываемых выходными показателями. Показатели выбираются с учетом специфики предметной области и заданной цели исследования.

Метод АСФ (DEA) основан на построении так называемой границы эффективности в многомерном пространстве входных и выходных переменных, описывающих объекты, эффективность которых требуется определить. Граница эффективности представляет собой гиперповерхность, огибающую (охватывающую) точки, соответствующие оцениваемым объектам. Степень эффективности конкретного объекта зависит от расстояния между ним и границей эффективности: чем дальше объект находится от границы, тем его эффективность ниже. Объекты, находящиеся на границе эффективности, считаются эффективными.

Представим формализованное описание метода на примере модели BCC, ориентированной на выход (ее название образовано из первых букв фамилий ее авторов: Banker, Chames и Cooper) [5, с. 93]. Пусть требуется определить показатель эффективности каждого из n объектов. Такими объектами могут быть, например, предприятия, организации, университеты, банки и т. д.

Для описания каждого объекта o, j = 1, n, служит пара векторов (xj, y,). При этом вектор x■ = (x,1,...,x, ...,xjm)T содержит входные показатели (входы) для объекта o,, а вектор y■ = (y,1,..., y,r ..., y,s )T содержит

выходные показатели (выходы) для объекта o,. Тогда матрица X = (x,), имеющая размерность m х n, содержит вектор-столбцы с входными данными для всех n объектов, а матрица Y = (y,), имеющая размерность s х n, содержит вектор-столбцы с выходными данными для всех n объектов.

В основе метода АСФ (DEA) лежит метод линейного программирования, поэтому модель формулируется в таком виде:

max Фд (фХ

XI < x0,

ФУ о - YX < 0, (1)

eX = 1, X > 0.

Здесь e - это единичный вектор-строка. В данном случае показатель эффективности - скаляр ф е [1; да). Если ф = 1, то объект будет считаться эффективным по сравнению с остальными объектами исследуемой совокупности, если ф > 1, то неэффективным. На практике значение показа-

теля эффективности зачастую переводится в диапазон (0; 1] с помощью преобразования 1 / ф. Объекты, имеющие значение показателя ф = 1, считаются эффективными и находятся, как принято говорить, на границе эффективности. Аналогичная задача решается для каждого объекта, т. е. n раз. Таким образом, граница эффективности формируется путем многократного решения задачи линейного программирования.

2. Предлагаемый подход к программной реализации метода АСФ (DEA)

Авторами статьи было предложено реализовать метод АСФ (DEA) в виде расширения СУБД PostgreSQL [3]. Расширение СУБД (extension) -это набор пользовательских функций и других объектов, которые встраиваются в сервер баз данных и могут использоваться так же, как и встроенные функции, предоставляемые пользователям СУБД изначально [7].

В результате выполнения интеграции метода АСФ (DEA) в среду PostgreSQL доступ к алгоритмам метода осуществляется путем выполнения обычной SQL-команды SELECT, в которой будет вызываться функция, реализующая метод:

SELECT dea();

Авторами реализована первая версия расширения СУБД PostgreSQL. В качестве механизма для решения задачи линейного программирования используется свободно-распространяемый пакет lp_solve [6]. Интерфейс пользователя создан на основе web-технологий, реализовано построение графиков непосредственно в браузере. Эти графики показывают границу эффективности для двухмерного и трехмерного случаев. Результаты вычислений сохраняются в базе данных и могут быть представлены пользователю в трех вариантах:

- в виде единого отчета в текстовой форме (в случае создания в интернете общедоступного сервиса для исследования эффективности систем такой отчет можно переслать пользователю по электронной почте);

- в наглядной форме - в виде таблиц и графиков в окне браузера;

- в форме SQL-команд, вводимых в интерактивном режиме взаимодействия с СУБД (при этом можно использовать как стандартные средства языка SQL, так и специально написанные функции, формирующие отчетную информацию по отдельным аспектам исследования, например, функция для выборки целевых значений показателей, которых должны достигнуть неэффективные объекты).

В настоящее время авторами ведется дальнейшая разработка этого инструментария, предложено использовать концепцию репозитория данных. Его применение позволит организовать работу с данными, применяемыми для исследования эффективности объектов, более удобно.

В репозитории хранятся не только данные, но также описания исследуемых объектов и используемых переменных (показателей). Организация и использование репозитория имеет ряд особенностей.

1. Данные помещаются в репозиторий в виде так называемых наборов данных (dataset). Для каждого набора данных делается описание с указанием временного периода, к которому эти данные относятся. Поэтому о каждом элементе данных можно будет сказать, откуда он происходит. Это повысит уровень достоверности результатов, полученных в процессе исследования эффективности объектов.

2. Данные из репозитория копируются в рабочие таблицы базы данных, входящие в состав расширения и предназначенные для проведения непосредственных вычислений показателей эффективности. Для копирования данных служат специальные сервисные функции, которые также входят в состав расширения СУБД и снимают с прикладного программиста значительную часть рутинной работы.

3. Объекты и переменные в репозитории можно объединять в группы по какому-то признаку, например, по принадлежности одной и той же организации. Наличие групп упрощает получение данных из репозитория.

4. После копирования исходных данных из репозитория в рабочие таблицы базы данных можно эти данные предварительно обработать, например, выявить так называемые «выбросы». При этом исходные (raw) данные в репозитории остаются неизмененными, что позволяет использовать их в дальнейшем и, возможно, выполнять предварительную обработку какого-то другого вида.

5. Репозиторий организован таким образом, что если исследование сложной иерархической системы состоит из ряда этапов, то они объединяются в единую иерархическую структуру.

Для выполнения различных действий, связанных с обслуживанием репозитория и получением данных из него для непосредственного выполнения исследований, предусмотрены специальные сервисные функции. Эти функции реализуются на языке PL/pgSQL, интегрированы в СУБД, поэтому их использование не потребует от программиста, разрабатывающего прикладные программные системы, больших усилий.

При проведении исследований эффективности может оказаться целесообразным выполнить расчеты по одной и той же методике, но с использованием различных наборов переменных (показателей). Такой подход может помочь установить устойчивые закономерности относительной эффективности различных объектов системы, проявляющиеся независимо от выбора того или иного набора показателей, использованных для описания объектов.

Предлагаемая концепция репозитория облегчает реализацию описанного подхода проведения многовариантных (мультиверсионных) вычислений и позволяет возложить процедуру сравнения полученных результатов на СУБД. Для этого служат специальные функции, также входящие в состав разрабатываемого расширения СУБД. В результате программный код прикладной системы, использующей эти процедуры, значительно упрощается. Для их вызова надо лишь воспользоваться командой SELECT. Программное обеспечение, известное авторам настоящей статьи, не позволяет удобным способом организовать многовариантные вычисления и сравнение полученных результатов.

Результаты вычислений будут также помещены в базу данных. Показать их пользователю можно, например, в окне браузера, обработав выборку полученного готового результата средствами языка программирования, на котором разрабатывается прикладная система.

Важно отметить, что реализуемая разработка осуществляется на принципах свободного программного обеспечения.

Заключение

Таким образом, разрабатываемое расширение СУБД PostgreSQL может служить основой для создания систем поддержки принятия решений, предназначенных для исследования эффективности систем. При этом интерфейс пользователя такой СППР может быть создан с применением различных технологий (традиционное настольное приложение, web-интерфейс).

Список литературы

1. Кривоножко В.Е., Лычев А.В. Анализ деятельности сложных социально-экономических систем. М.: Изд. отдел ф-та ВМиК МГУ; МАКС Пресс, 2010. 208 с.

2. Моргунов Е.П., Моргунова О.Н. Обзор программного обеспечения, реализующего метод Data Envelopment Analysis [Электронный ресурс] // XXII Междунар. науч.-практ. конф. «Решетневские чтения», 12-16 ноября 2018 г. : материалы : в 2 ч. Красноярск: СибГУ им. М. Ф. Решетнева, 2018. Ч. 2. С. 359-360. URL: https://reshetnev.sibsau.ru/page/materialy-konferentsii (дата обращения: 04.06.2020).

3. Моргунов Е.П., Моргунова О.Н., Постойко А.Ю. Интеграция метода «Анализ Среды Функционирования» в СУБД PostgreSQL // Сборник науч. трудов XXIII Междунар. науч.-практ. конф. «Системный анализ в проектировании и управлении», 1011 июня 2019 г., Санкт-Петербургский политехн. ун-т Петра Великого: в 3 ч. СПб. : Политех-Пресс, 2019. Ч. 3. С. 178-184. URL: https://elib.spbstu.ru/dl/2/k19-141.pdf/view (дата обращения: 04.06.2020).

4. Charnes A., Cooper W.W., Rhodes E. Measuring the efficiency of decision making units // European Journal of Operational Research. 1978. Vol. 2. P. 429-444.

5. Cooper W.W., Seiford L.M., Tone K. Data Envelopment Analysis: A comprehensive text with models, applications, references, and DEA-Solver software. 2nd ed. New York: Springer, 2007. xxxviii, 490 p.

6. lp_solve: a Mixed Integer Linear Programming (MILP) solver. [Электронный ресурс]. URL: http://lpsolve.sourceforge.net/5.5/ (дата обращения: 04.06.2020).

7. PostgreSQL [Электронный ресурс] // The PostgreSQL Global Development Group: официальный сайт. URL: http://www.postgresql.org (дата обращения: 04.06.2020).

УДК 330.1

ао1:10.18720/8РБРШМ20-208

Виноградов Андрей Николаевич1,

канд. физ.-мат. наук, и.о. руководителя ИЦИИ;

2

Куршев Евгений Петрович ,

канд. техн. наук, ведущ. науч. сотр.

ПРИМЕНЕНИЕ ТЕХНОЛОГИИ СОЗДАНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ ДИНАМИЧЕСКИХ СИСТЕМ В ЗАДАЧАХ СТРАТЕГИЧЕСКОГО ПЛАНИРОВАНИЯ

1 2

' Институт программных систем им. А.К. Айламазяна РАН,

Ярославская обл., Россия, 12 andrew@andrew.botik.ru, epk@epk.botik.ru

Аннотация. В статье рассмотрены результаты исследования применения технологии создания интеллектуальных динамических систем на основе логико-лингвистического моделирования сложных систем с учетом прошлого опыта по имеющимся статистическим данным для системы стратегического планирования. В статье раскрывается потенциал использования семантического, логико-лингвистического и лингво-комбинаторное моделирования поведения сложных систем с учетом прошлого опыта; с помощью технологии интеллектуальных динамических систем ИПС им. Айламазяна визуализируются пути оценки последствий принятых управленческих решений по всем путям сетевого графика для минимизации причинённого ущерба. Целью исследования является повышение эффективности системы управления и планирования. Результатом работы являетсяобоснование применения интеллектуальные системы для решения круга задач в системе стратегического планирования и оценки последствий принятых решений, интеграции логико-лингвистического моделирования в систему планирования промышленного предприятия для решения ситуационных задач управления.

Ключевые слова: системный анализ, коммуникации, интеллектуальные динамические системы, стратегическое планирование, стратегическое управление, информационное общество.

i Надоели баннеры? Вы всегда можете отключить рекламу.