Научная статья на тему 'Принципы и инструментальные программные средства визуализации и анализа данных исполнения государственных контрактов в научно-технической сфере'

Принципы и инструментальные программные средства визуализации и анализа данных исполнения государственных контрактов в научно-технической сфере Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
115
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горюнов И. Г., Пономарев С. А., Петров А. Н., Стрелец А. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Принципы и инструментальные программные средства визуализации и анализа данных исполнения государственных контрактов в научно-технической сфере»

Литература

1. Aida-zade K.R., Rahimov A.B., Journ. of Autom. and Inform. Sc., 2010, Vol. 42, Iss. 7, pp. 54-64.

2. Кучеров Д.П., Василенко А.В., Иванов Б.П. Алгоритм адаптивного терминального управления динамической системой с элементами дифференцирования // Автоматика. Автоматизация. Электротехнические комплексы и системы. 2009. № 23.C. 166-171.

3. Трушкова Е.А. Синтез управления в окрестности приближенного решения задачи с частично закрепленным правым концом // Программные системы: теория и приложения. 2011, № 2 (6). C. 31-35.

4. Зубер И.Б. Терминальное управление по выходу для нелинейных нестационарных систем // Дифференциальные уравнения и процессы управления. 2004. № 2. C. 36-42.

5. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.: Физматлит, 2005. 384 с.

6. Ryzhikov I.S., Semenkin E.S., Proc. Intern. Conf. «ICINCO», 2012, Vol. 1, pp. 333-337.

7. Schwefel H.-P. Evolution and Optimum Seeking: New York, Wiley & Sons., 1995, 456 p.

References

1. Aida-zade K.R., Rahimov A.B., Journ. of Autom. and Inform. Sc., 2010, Vol. 42, Iss. 7, pp. 54-64.

2. Kucherov D.P., Vasilenko A.V., Ivanov B.P., Avtomatika. Avtomatizatsiya. Elektrotekhnicheskie kompleksy i sistemy, 2009, no. 23, pp. 166-171.

3. Trushkova E.A., Programmnye sistemy: teoriya i prilozhe-niya, 2011, no. 2(6), pp. 31-35.

4. Zuber I.B., Differentsialnye uravneniya i protsessy upravleniya, 2004, no. 2, pp. 36-42.

5. Alekseev V.M., Tikhomirov V.M., Fomin S.V., Opti-malnoe upravlenie [Optimal Management], Moscow, Fizmatlit, 2005.

6. Ryzhikov I.S., Semenkin E.S., Proc. Intern. Conf. «ICINCO», 2012, Vol. 1, pp. 333-337.

7. Schwefel H.-P., Evolution and Optimum Seeking, NY, Wiley & Sons., 1995, 456 c.

УДК 004.021

ПРИНЦИПЫ И ИНСТРУМЕНТАЛЬНЫЕ ПРОГРАММНЫЕ СРЕДСТВА ВИЗУАЛИЗАЦИИ И АНАЛИЗА ДАННЫХ ИСПОЛНЕНИЯ ГОСУДАРСТВЕННЫХ КОНТРАКТОВ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ

(Работа выполняется в рамках НИР «Исследование и разработка методов и алгоритмов анализа связанности сложно-структурированных данных, характеризующих процессы формирования, размещения и исполнения

государственных заказов в научно-технической сфере» (ГК№ 14.514.11.4023), проводимой в ходе реализации ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы»)

И.Г. Горюнов, к.т.н., с.н.с.; С.А. Пономарев, м.н.с. (Компания «Комплексные системы»,

ул. Скворцова-Степанова, 83, г. Тверь, 170021, Россия, info@complexsys.ru); А.Н. Петров, к.х.н., генеральный директор; А.В. Стрелец, к.т.н., руководитель отдела

(Дирекция научно-технических программ, пер. Обуха, 3, г. Москва, 105064, Россия, directюn@fcntp.ru)

В статье описаны выбранный принцип анализа накопленной информации о реализации мероприятий федеральных целевых программ в научно-технической сфере с целью выявления и статистической обработки фактов логической связанности информационных объектов, характеризующих исполнение государственных контрактов, а также основные функциональные возможности разрабатываемых программных средств Информационной системы анализа связанности сложно-структурированных данных государственных контрактов. Предложен вариант использования двунаправленных графов в качестве средств визуализации и визуального анализа данных государственных контрактов, перечислены используемые алгоритмы теории графов и вспомогательные программные средства (библиотеки) для построения, визуализации и анализа графа. Даны описания разработанных экранных форм настроек системы, примеры визуализации и аналитические выводы по графам тестовых данных государственных контрактов.

Ключевые слова: сложно-структурированные текстовые данные, инструментальные средства визуализации, двунаправленные графы, алгоритмы теории графов, федеральная целевая программа, государственный заказ, государственный контракт.

PRINCIPLES AND SOFTWARE TOOLS FOR VISUALIZATION AND ANALYSIS PUBLIC CONTRACTS DATA IN SCIENCE AND TECHNOLOGY

(This work is a part of research «Methods and algorithms research and development to analyze connectivity complex-structured data, which describes the processes of formation, placement and execution of public contracts in the science and technology» (state contract № 14.514.11.4023), carried out during the implementation of the federal program «Research and development on priority directions of scientific-technological complex of Russia for 2007-2013») Goryunov I.G., Ph.D., Senior Researcher; Ponomarev S.A., Junior Researcher (Complex Systems, LLC, 83, Skvortsova-Stepanova St., Tver, 170021, Russia, info@complexsys.ru);

Petrov A.N., Ph.D., Director General; Strelets A V., Ph.D., Head of Department (Directorate of State Scientific and Technical Programmes, 3, Obukha lane, Moscow, 105064, Russia, direction@fcntp.ru)

Abstract. This article tells us about chosen principle for analysis accumulated information about implementation of the activities of the federal programs in science and technology in order to identify and statistically processes «coherence» logical facts of public contracts information objects. The article describes the basic functionality of the developed information system for analysis coherence of public contracts complexity-structured data. A description of bidirectional graphs using is shown for visualization and visual analysis state orders data. Used algorithms of graph theory and auxiliary software (libraries) for the construction, visualization and analysis of graph lists. Examples of the system settings screen forms, examples of visualization and analysis test data of government contracts on the graph are shown.

Keywords: complex-structured text data, visualization tools, bidirectional graphs, graph theory algorithms, federal program, state order, state contract.

Подразделения Минобрнауки России - государственного заказчика-координатора ряда федеральных целевых программ (ФЦП), а также организации, осуществляющие функции текущего управления реализацией этих программ (Дирекции), находятся в условиях постоянного увеличения массива накапливаемой и обрабатываемой информации по исполняемым государственным контрактам (ГК) [1]. По этой причине все более актуальным становится решение следующих задач:

— выбор принципов анализа накопленной информации о реализации мероприятий ФЦП в научно-технической сфере с целью выявления фактов логической связанности информационных объектов, имеющих место при реализации ФЦП, а также их статистического анализа;

— разработка программных средств автоматизации информационно-аналитической поддержки прогнозирования мероприятий ФЦП в научно-технической сфере.

В ходе проводимого исследования авторы ведут работы по проектированию и разработке экспериментального образца Информационной системы анализа связанности сложно-структурированных данных (ИС АССД) ГК в научно-технической сфере.

Рассматриваемые в рамках работ сложно-структурированные данные, характеризующие процесс исполнения ГК (структурная схема процесса приведена на рисунке 1), содержат информацию о следующих информационных объектах: федеральная целевая программа, предложение (заявка на формирование тематики), лот, заявка, контракт, этап контракта, организация (участник размещения заказа), персона (руководитель организации-исполнителя, руководитель работ по контракту от организации-исполнителя, ответственный сотрудник профильного подразделения заказчика и др.).

В результате анализа подходов к решению вышеописанных задач были сформулиро-

ваны требования к ИС АССД по обеспечению поддержки выполнения следующих задач пользователей:

— самостоятельное проведение сотрудниками подразделений государственных заказчиков-координаторов и Дирекций статистического анализа данных о выбранных информационных объектах по различным параметрам/фильтрам при подготовке отчетов;

— выявление фактов связанности однотипных и разнотипных объектов, оценка степени их связанности, анализ статистики связанности по накладываемым фильтрам в разных аспектах и т.д.;

— визуализация результатов анализа связанности в виде двунаправленных графов.

Предполагается, что конкретный вариант использования функциональных возможностей ИС АССД и конечная смысловая интерпретация результатов статистического анализа данных должны оставаться за специалистом (однако набор предустановленных вариантов использования фильтров также будет подготовлен в ходе разработки).

В качестве средств визуализации результатов анализа данных об информационных объектах, имеющих место при реализации ФЦП, были вы-

Подготовка

Проект предложения Предложение

предложения Р 1 - Публикование

конкурсного извещения

Контракт

Заявка 1

Заявка 2

Заявка .

Подача заявок

Ч-

Лот 1

Лот 2

Лот

Заявка M

Лот N

Исполнение контракта

Этап 1

Этап 2

Этап

Этап L

Рис. 1. Структурная схема процесса исполнения ГК

браны двунаправленные графы (ориентированные и неориентированные), являющиеся естественным и эффективным средством визуального анализа ситуаций и состояний исследуемых объектов на интуитивном уровне.

Графы, отображающие связи информационных объектов, по своей природе не являются ориентированными, но при необходимости ориентацию графов можно ввести искусственно (например, в случае наличия логической связи между организациями, являющимися головным исполнителем и соисполнителем ГК).

Для достижения вышеописанных целей в составе функциональных возможностей ИС АССД были реализованы следующие алгоритмы теории графов:

— алгоритм поиска в графе обособленных подграфов;

— алгоритм проверки связанности двух произвольных объектов из совокупности данных (то есть достижимости одной вершины из другой);

— алгоритм поиска замкнутых циклов между объектами в графе;

— алгоритм поиска набора объектов, обладающих максимальной связанностью с другими объектами, и построение кратчайших путей их достижимости (возможно использование Лувен-ского метода, метода поиска k-ядра (k-core));

— алгоритм выявления объектов, находящихся от исходного объекта в радиусе, не более заданного расстояния (возможно использование алгоритма «поиска в ширину» или матрицы достижимостей).

Представление в виде графа (построение графа в оперативной памяти), а также алгоритмы анализа графа реализуются с использованием библиотеки NetworkX (распространяется как свободное ПО по BSD-лицензии, реализована на языке Python) [2]. Визуализация графа реализуется с использованием библиотеки NetworkX и D3 [3].

Интерфейсные средства ИС АССД обеспечивают настройку процедуры построения графа и параметров визуализации графа (включая настройки фильтрации и укладки графа), а также визуализацию графа.

Интерфейсные средства ИС АССД обеспечивают настройку следующих базовых параметров построения графа связанных объектов:

— тип графа - однородный/разнородный; в однородном графе все вершины одного типа (например организации или контракты), разнородный граф предполагает наличие вершин разного типа (например, для построения связей между лотами и организациями, подавшими заявки);

— тип (типы) объектов ГК, которые будут представлены на графе вершинами (реализуется в виде матрицы связанных объектов, позволяющей выбрать желаемый набор типов объектов, пере-

численных как наименования строк и столбцов матрицы, а также отметить признак появления связи между ними, см. пример фрагмента матрицы на рисунке 2);

Организация Контракты

0 Организация □ Контракт (исполнитель -соисполнитель) © 0 Контракт (соисполнитель -соисполнитель) © 0 Персона (директор) □ Лот (контракты) © □ Лот (предложения) © □ Лот (заявки) ©

0 Контракты □ Прямая связь (исполнитель) © 0 Соисполнитель © □ Лот О 0 Организация © □ Персона (ответственный сотрудник дирекции) □ Персона (руководитель) □ Персона (зам. руководителя) □ Персона (менеджер от монитора) □ Персона (менеджер от Роснауки)

Рис. 2. Пример фрагмента матрицы связанных объектов ГК для выбора интересующих типов объектов ГК и логики установления связи между ними

- параметры представления вершин графа (то есть указание атрибутов объекта ГК, которыми интерпретируются атрибуты вершины графа); в состав настраиваемых параметров вершин должны входить (пример для вершин типа «Организация» приведен на рисунке 3):

а) диаметр вершины (например, диаметр вершины-организации может зависеть от количества контрактов, выполненных организацией);

б) цвет вершины (может характеризовать географическую принадлежность организации, тип организации, тематическую принадлежность контракта и т.д.);

в) текстовая или числовая подпись к вершине (наименование организации, число выполненных контрактов, номер приоритетного направления и т.д.);

- параметры представления связей на графе:

а) толщина связи (например, может определяться количеством общих контрактов между связанными организациями-соисполнителями);

б) тип линии связи (сплошная или прерывистая);

в) учет направленности связи;

г) текстовая или числовая подпись связи (число общих контрактов между связанными организациями, описание распределения общих контрактов по группам программных мероприятий и т.д.).

- возможность применения специализированных алгоритмов автоматической укладки графов на плоскости (например гамма-алгоритм, алгоритм GIOTTO, Sorted Grid).

Классификация возможных параметров фильтрации:

- по временному периоду;

- по типам информационных объектов;

- по областям исследований и отраслевым предназначениям конкурсов и контрактов;

- по территориальному признаку (федеральный округ, регион, город);

- по типу организации;

- по программному мероприятию ФЦП;

- по приоритетному направлению развития науки, технологий и техники в Российской Федерации;

- по критическим технологиям Российской Федерации;

- по году заключения ГК;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- по направлению модернизации;

- по виду работы (например научно-исследовательская);

- по состоянию (исполняется, выполнено и

др).

Пример составных фильтров:

- сведения об участии вузов в рамках одной и/или нескольких ФЦП (сводные данные об участии вуза, группы вузов с детализацией по регионам);

- география реализации ФЦП (активность и характеристики участия федеральных округов и регионов в реализации научно-технических проектов в рамках одной или нескольких ФЦП по определенной тематике).

Интерфейсные средства ИС АССД для анализа графа обеспечивают выбор и настройку параметров следующих алгоритмов:

- поиск в графе обособленных подграфов (группы объектов, взаимодействующие друг с другом в замкнутом процессе, например группы организаций, работающих в рамках одного или нескольких контрактов);

- проверка связанности двух произвольных объектов из совокупности данных (среди предварительно заданных объектов);

- поиск замкнутых циклов между объектами в графе; данный алгоритм позволит выделить группы объектов, связанные друг с другом не более чем минимальным числом прямых и косвенных связей, и в результате выделить группы объектов, тесно взаимодействующие друг с другом (но не обособленные группы), например, группы организаций, работающих в рамках одного или нескольких научных направлений, группы тематических контрактов;

- поиск набора объектов, обладающих максимальной связанностью с другими объектами, и

Федеральный округ Регион

Выбрать

Выбрать

Ву3 П Да П Нет П Не определено

Научная организация □ Да П Нет П Не определено

ГНЦ □ Да П Нет □ Не определено

Малый бизнес □ Да П Нет □ Не определено

Находится в перечне □ Да □ Нет □ Не определено

стратегических

предприятий

Организация вклю- □ Да □ Нет □ Не определено чена в реестр недобросовестных поставщиков

Национальный ^ ПДа ПНет □ Не определено исследовательский

университет

федеральный □ Да ЩНет ШНе определено

университет

Организация реального ЦДа ПНет □ Не определено сектора экономики

Наименование

□ Да □ Нет □ Не определено

Рис. 3. Пример настройки параметров отображения и фильтрации вершин типа «Организация»

Смысловое содержание графа определяется вышеописанными настройками параметров построения графа. Примеры базовых вариантов построения графов:

— граф «Организации-соисполнители», отражающий взаимодействие организаций в рамках общих контрактов;

— граф «Организации-соисполнители-Контракты» - расширенный вариант, позволяющий проанализировать характеристики связанности непосредственно в разрезе каждого общего контракта;

— граф «Организации-участники размещения-Лоты», отражающий характеристики связанности между организациями, подающими заявки на определенные лоты.

Интерфейсные средства ИС АССД для настройки параметров визуализации графа обеспечивают:

— возможность создания пользовательских фильтров отображения информации на графе с указанием состава параметров фильтрации и их значений, а также применение одного или нескольких (логически не противоречащих друг другу) фильтров;

• »

. - / и

Организация: МГТУ им. Н.Э. Баумана

Контракт: 02.516.12.6010 Разработка перспективных научно-тематических решений по интенсификации горения за счет акустических воздействий

Т7Т7\

/ / л- * • • 4 • *

V

ч

Рис. 4. Пример визуализации графа организаций-соисполнителей в рамках выполнения работ по ГК

построение кратчайших путей их достижимости; это позволит выделить наиболее значимые объекты для ведения ФЦП, которые оказывают наибольшее влияние на ход ее выполнения.

Интерфейсные средства ИС АССД для визуализации графа обеспечивают:

- отображение и масштабирование графа с установленными настройками в требуемом разрезе;

- укладку элементов графа с использованием выбранного алгоритма укладки, включая последовательное применение нескольких алгоритмов укладки;

- фильтрацию отображаемых на экране элементов графа в зависимости от выставленных параметров фильтрации;

- обновление результатов визуализации в соответствии с регламентом на экране пользователя (в случае наличия изменяющихся результатов аналитической обработки в оперативном режиме);

- специализированное отображение объектов по указанным пользователями признакам: минимальное/максимальное значение указанного атрибута элемента графа (диаметр, толщина связи, степень связности и др.).

Визуализация графа организаций-соисполнителей в рамках выполнения работ по ГК (рис. 4) позволяет:

— визуально выявить организации с наибольшим перечнем соисполнителей в рамках всех контрактов;

— выявить преобладающее приоритетное направление (по выполненным контрактам);

— определить случаи с наибольшим числом общих контрактов между соисполнителями;

— выявить тот факт, что соисполнителями в большинстве случаев становятся организации, изначально ориентированные на контракты одинакового приоритетного направления ФЦП;

— выявить факты кооперации двух и более организаций для выполнения общих контрактов.

Помимо подразделений государственных заказчиков и специализированных Дирекций, разрабатываемое программное решение может быть использовано участниками проектов в научно-технической сфере для получения информационно-справочной поддержки, консультаций; научным сообществом для установления межличностного взаимодействия при подготовке и реализации проектов в научно-технической сфере; представителями инвестиционных организаций в качестве информационного обеспечения выбора направлений инвестиций в научно-технической сфере.

Анализ полученных промежуточных результатов работ по созданию экспериментального образца ИС АССД позволил сделать вывод о перспективности данного инструмента в качестве средства исследования накапливаемой в БД информации о реализации ФЦП при подготовке типовых сводок, отчетов, докладов, при обработке запросов об участниках ФЦП и ходе ее реализации по отдельным проектам и группам проектов, о показателях финансирования и эффективности реализации ФЦП. Дальнейшие работы направлены на расширение возможностей системы в части применения алгоритмов теории графов, а также функциональных возможностей по настройке визуализации и интерактивности графов.

Литература

1. Горюнов И.Г., Корецкий М.В., Пономарев С.А., Сыт-ник Д.А. Анализ связанности сложно-структурированных текстовых данных, характеризующих процессы формирования, размещения и исполнения государственных заказов в научно-технической сфере // Программные продукты и системы. 2012. № 4.

2. NetworkX. URL: http://networkx.github.com/ (дата обращения: 28.12.2012).

3. D3. URL: http://d3js.org/ (дата обращения: 28.12.2012).

References

1. Goryunov I.G., Koretskiy M.V., Ponomarev S.A., Sytnik D.A., Programmnye produkty i sistemy, 2012, no. 4.

2. NetworkX, Available at: http://networkx.github.com/ (accessed 28 Dec. 2012).

3. D3, Available at: http://d3js.org/ (accessed 28 Dec. 2012).

i Надоели баннеры? Вы всегда можете отключить рекламу.