Научная статья на тему 'СЕТЬ ПРОБЛЕМ КАК ВХОД В АРХИВ ДОКУМЕНТОВ'

СЕТЬ ПРОБЛЕМ КАК ВХОД В АРХИВ ДОКУМЕНТОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
68
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОБЛЕМА / СЕТЬ ПРОБЛЕМ / ИННОВАЦИОННЫЙ ЦИКЛ / ОБЪЕКТНЫЙ ПОИСК / АРХИВ ДОКУМЕНТОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гагарин Андрей Петрович, Филимонов Илья Андреевич

Доклад направлен на разработку технологий доступа к хранилищам документов особого вида, так называемым, «персонализированным архивам». Такие архивы собираются владельцем, который обычно является и пользователям, в соответствии со своими профессиональными интересами. Архивы размещаются на персональных компьютерах; в настоящее время наблюдается тенденция к превращению их во вторичный кэш для «больших данных». Доступ к персонализированным архивам имеет свои особенности, отличающие его от доступа к базам данных и Интернету. Пользователь может обращаться к архиву за мгновенной справкой, не готовый точно назвать идентификатор или указать местоположения нужного информационного элемента, но готовый опознать его среди других в некотором пространстве. Если такой доступ рассматривать как поиск, то это поиск объектный. Если архивированы научно-технические публикации, то понимание пользователем, к решению какой проблемы причастна искомая публикация, часто оказывается ведущим при её распознавании. Это наблюдение подводит к идее использовать сеть проблем как остов, вблизи которого располагаются образы документов в пространстве распознавания. Такая сеть рассматривается в контексте инновационных циклов как отображение исследовательской и инженерной активности в интересующей пользователя области техники. Сеть проблем включает в себя процессы инновационного цикла, соответствующие технические артефакты, сами проблемы, их решения и элементы процесса решения. Предложены приёмы для реализации моделей сетей проблем в редакторе графов Gephi. Получаемое визуальное представление может применяться для когнитивного анализа и обзора научно-технических документов в конкретной научно-технической области.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гагарин Андрей Петрович, Филимонов Илья Андреевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROBLEM NETWORK AS ACCESS GATE INTO A DOCUMENT REPOSITORY

This issue contributes to development of access technologies to a special kind of document repository that may be called “personalized archive”. The archives are collected by their owners being usually at the same time their users in correspondence to their professional interests. The archives are installed in personal computers and recently tend to be a kind of secondary caches of "big data". Access to the personalized archives has some peculiarity that distinguishes it from access to data bases or the Internet. The user may address to the archive for an instant enquiry being not ready to express precisely identifiers or location of the needed information item but ready to recognize it among other items located in some space. If one tries to regard such access as a search it may be called the “entity search”. If scientific or engineering issues are archived, the understanding of the problem the requested issue is dedicated to frequently appears to be leading by recognition of the issue. This observation implies the idea to depict the images of documents in proximity of nodes in the network of corresponding problems. The network of problems is considered in context of innovation cycles as a map of R&D activity in some technological area of interest. Such a network includes: processes of innovation cycles. Technological artefacts involved, problems themselves, their solutions and elements of solution process. Patterns are proposed for implementing models of problem networks in the Gephi - editor of graphs. Resulting visual representation of the model enables managing of access to underlying repository of documents. The implemented visualization of the model can be used for cognitive analysis and review of scientific and technical documents in a specific scientific and technical field.

Текст научной работы на тему «СЕТЬ ПРОБЛЕМ КАК ВХОД В АРХИВ ДОКУМЕНТОВ»

БОЛЬШИЕ ДАННЫЕ И ПРИЛОЖЕНИЯ / BIG DATA AND APPLICATIONS

УДК 004.514.62 ЕД|

DOI: 10.25559^ШТО.16.202003.582-597

Сеть проблем как вход в архив документов

А. П. Гагарин*, И. А. Филимонов

ФГБОУ ВО «Московский авиационный институт (национальный исследовательский университет)», г. Москва, Российская Федерация

125993, Российская Федерация, г. Москва, Волоколамское шоссе, д. 4 * gagarin_ay@outlook.com

Аннотация

Доклад направлен на разработку технологий доступа к хранилищам документов особого вида, так называемым, «персонализированным архивам». Такие архивы собираются владельцем, который обычно является и пользователям, в соответствии со своими профессиональными интересами. Архивы размещаются на персональных компьютерах; в настоящее время наблюдается тенденция к превращению их во вторичный кэш для «больших данных». Доступ к персонализированным архивам имеет свои особенности, отличающие его от доступа к базам данных и Интернету. Пользователь может обращаться к архиву за мгновенной справкой, не готовый точно назвать идентификатор или указать местоположения нужного информационного элемента, но готовый опознать его среди других в некотором пространстве. Если такой доступ рассматривать как поиск, то это поиск объектный. Если архивированы научно-технические публикации, то понимание пользователем, к решению какой проблемы причастна искомая публикация, часто оказывается ведущим при её распознавании. Это наблюдение подводит к идее использовать сеть проблем как остов, вблизи которого располагаются образы документов в пространстве распознавания. Такая сеть рассматривается в контексте инновационных циклов как отображение исследовательской и инженерной активности в интересующей пользователя области техники. Сеть проблем включает в себя процессы инновационного цикла, соответствующие технические артефакты, сами проблемы, их решения и элементы процесса решения. Предложены приёмы для реализации моделей сетей проблем в редакторе графов Gephi. Получаемое визуальное представление может применяться для когнитивного анализа и обзора научно-технических документов в конкретной научно-технической области.

Ключевые слова: проблема, сеть проблем, инновационный цикл, объектный поиск, архив документов.

Авторы заявляют об отсутствии конфликта интересов.

Для цитирования: Гагарин, А. П. Сеть проблем как вход в архив документов / А. П. Гагарин, И. А. Филимонов. — DOI 10.25559^ГПТО.16.202003.582-597 // Современные информационные технологии и ИТ-образование. — 2020. — Т. 16, № 3. — С. 582-597.

G ®

Контент доступен под лицензией Creative Commons Attribution 4.0 License. The content is available under Creative Commons Attribution 4.0 License.

Современные информационные технологии и ИТ-образование

Том 16, № 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

BIG DATA AND APPLICATIONS

Problem Network as Access Gate into a Document Repository

A. P. Gagarin*, I. A. Filimonov

Moscow Aviation Institute (National Research University), Moscow, Russian Federation 4 Volokolamskoe shosse, Moscow 125993, Russian Federation * gagarin_ay@outlook.com

Abstract

This issue contributes to development of access technologies to a special kind of document repository that may be called "personalized archive". The archives are collected by their owners being usually at the same time their users in correspondence to their professional interests. The archives are installed in personal computers and recently tend to be a kind of secondary caches of "big data". Access to the personalized archives has some peculiarity that distinguishes it from access to data bases or the Internet. The user may address to the archive for an instant enquiry being not ready to express precisely identifiers or location of the needed information item but ready to recognize it among other items located in some space. If one tries to regard such access as a search it may be called the "entity search". If scientific or engineering issues are archived, the understanding of the problem the requested issue is dedicated to frequently appears to be leading by recognition of the issue. This observation implies the idea to depict the images of documents in proximity of nodes in the network of corresponding problems. The network of problems is considered in context of innovation cycles as a map of R&D activity in some technological area of interest. Such a network includes: processes of innovation cycles. technological artefacts involved, problems themselves, their solutions and elements of solution process. Patterns are proposed for implementing models of problem networks in the Gephi — editor of graphs. Resulting visual representation of the model enables managing of access to underlying repository of documents. The implemented visualization of the model can be used for cognitive analysis and review of scientific and technical documents in a specific scientific and technical field.

Keywords: document repository, entity search, problem, problem network, innovation cycle. The authors declare no conflict of interest.

For citation: Gagarin A.P., Filimonov I.A. Problem Network as Access Gate into a Document Repository. Sovremennye informacionnye tehnologii i IT-obrazovanie = Modern Information Technologies and IT-Education. 2020; 16(3):582-597. DOI: https://doi.org/10.25559/SITITO.16.202003.582-597

Vol. 16, No. 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

Введение

Продолжительная научная и инженерная работа по конкретной тематике приводит к накоплению у исследователя/инженера архива документов, включающего в себя отобранные в холе работы публикации, ссылки на источники, собственные заметки и другие рабочие материалы. Численность этих материалов легко выходит за пределы сотни и может насчитывать не одну тысячу единиц хранения. Начиная с некоторого момента, для владельца-пользователя возникает проблема ориентации в таком архиве. Поиск как отдельная операция становится неизбежным, однако его владелец существенно заинтересован, чтобы обращение к архиву протекало в реальном времени его мыслительных процессов, и поисковые операции не требовали специального внимания. Состав и организация архивов рассматриваемого вида зависят от интересов и предпочтений владельца и далее в докладе они будут называться персонализированными. Классическими, идущими из глубины веков формами организации персонализированных архивов являются картотека и таблица-каталог на бумажном, а ныне — на машинном носителе. В обоих случаях операция поиска включает перебор. В случае машинного носителя перебор и операция опознавания искомого элемента хранения могут быть автоматизированы, но это не упрощает поиск для работника, поскольку доступные в настоящее время средства поиска базируются на словарных поисковых признаках, в то время как для пользователя персонализированного архива характерен поисковый образ преимущественно объектный [1,2]: он смотрит на элемент хранения и решает «то или не то» по совокупности не всегда чётко осознаваемых признаков. Он «имеет право» не помнить названия документов, фамилии авторов, хотя, встретив их в тексте, - узнает. Достаточно добавить, что рабочие материалы (черновики, рукописи, графика) могут не иметь запоминающихся фиксированных наименований. Можно заключить, что персонализированные архивы нуждаются в поддержке визуального объектного поиска [3,4,5], а современные офисные системы эту нужду не удовлетворяют.

В докладе предлагается набор концептуальных и программно-технических решений, позволяющий реализовать в рядовой офисной компьютерной системе оболочку персонализированного архива с визуальным объектным доступом [6,7] к элементам хранения (далее— авуарам архива). Центральное место в этом наборе занимает визуальная модель сети [8] научно-технических проблем, решаемых по тематике архива. Утверждается, что представление о причастности искомого документа к решению той или иной проблемы может быть и часто является ведущим элементом ментального поискового образа у пользователя архива. Сеть [9,10] эксплицирует связи между проблемами, этапами их решения и релевантными авуарами архива, подсказывая кратчайшие маршруты доступа к ним. Следующим компонентом набора предлагаемых решений является Система управления репозитарием архива, обеспечивающая депонирование архивированных документов. Модель сети научно-технических проблем функционирует в среде редактора графов, обеспечивающий визуализацию сети, снабжённый репозитарием для хранения конфигураций сети и механизмом скриптов, который позволяет программировать

операции с моделью и обеспечивать оперативную связь между редактором графов и Системой управления репозитарием. Далее эти решения рассматриваются в деталях.

Моделирование сетей проблем

В докладе «проблема» понимается как научно-техническая в соответствии с определением «...Научно— техническая проблема— совокупность теоретических и/или практических задач, для решения которых необходимо провести целенаправленные исследования и разработки, обеспечивающие получение знаний для практической реализации качественно новых научных идей и создания образцов конкурентоспособной техники, технологий и материалов...» [11,12]. В персонализированных архивах [13] учитываются и в докладе рассматриваются проблемы, которые могут быть обнаружены в научно-технических публикациях и исследовательских материалах владельца архива.

Проблема остаётся открытой от момента постановки до момента решения. В материалах архива (далее — «авуарах») об-наружимы такие элементы решения, как:

• выбор подхода (Approach), при котором консолидируются эвристики, рассматриваемые в рамках попытки решения проблемы;

• предложение (Proposition) — принципиальное решение по реализации эвристики;

• попытка (Attempt) — макетная (модельная) реализация предшествующего решения;

• оценка (Evaluation) предпринятой реализации;

• мотивированное решение (Resolution) о прекращении попыток решить проблему, продолжить попытки с определением подпроблемы или считать проблему решённой;

• инициирование производной проблемы («подпробле-мы») — частный случай решаемой проблемы.

Эти элементы связаны отношением порождения и в общем случае образуют ветвящиеся цепочки, ветви которых потенциально сливаются в случае решения всех порождённых под-проблем.

Ввиду специфики конкретных проблем эти цепочки могут редуцироваться. Подход может считаться предложением, а предложение — совпадать с попыткой решения. В последнем случае оценка производится по содержанию предложения. Когда формулировка Resolution не актуальна, результат решения проблемы или текущей подпроблемы представляется переходом к OKR или следующей подпроблеме.

Проблемы разделяются на первичные и производные [14]. Производные, как было отмечено, возникают при декомпозиции проблемы (первичной или производной) на «подпро-блемы». Первичные проблемы ставятся в процессах инновационного цикла технических изделий, далее в докладе — артефактов [15]. Первичной может также считаться проблема, возникшая при декомпозиции некоторой проблемы, но так, что возникшую проблему затруднительно расценивать как частный случай исходной проблемы.

Первичные проблемы ставятся, главным образом, в процессах оценки артефактов [16] по результатам их эксплуатации, а также в процессе выполнения научно-исследовательских ра-

Современные информационные технологии и ИТ-образование

Том 16, № 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

бот, направленных на совершенствование артефактов. Поэтому в модель сети проблем «на правах» подмодели вовлекается модель инновационных циклов релевантных артефактов. В этой связи данный доклад развивает подход к моделированию инновационных циклов, изложенные в [17, 18]. Инновационные циклы состоят из процессов, количество и названия которых у разных авторов могут варьировать [19]. В целом концептуальная модель [20] сети проблем, рассматриваемая в данном докладе, состоит из следующих классов узлов:

— артефакт,

— узлы инновационного цикла

• НИР (Research),

• ОКР (Development),

• производство (Production)

• эксплуатация (Consum),

• оценка (Assessment),

— проблема (Problem)

— узлы элементов решения проблем

• подход (approach),

• предложение (Proposition),

• попытка (Attempt),

• оценка (Evaluation),

• решение (Resolution).

— авуар архива (Avoir).

Как уже было отмечено, Артефакт — это научно-техническое изделие или техническая система, инновационный цикл которого отображается в модели. Узлы инновационного цикла представляют процессы, содержание которых понятно из названия. Процесс оценки [21] реализуется пользователями артефакта, заинтересованной научно-технической общественностью и публикуется, главным образом, в материалах рекламного характера, докладах научно-практических конференций, всевозможных экспертных заключениях. Все узлы, кроме авуаров, образуют остов модели. В конкретной реализации остов образует относительно стабильную часть модели. Авуары «прикрепляются» к узлам остова по мере вхождения в архив новых документов. Но ели в новом документе обнаруживаются сведения о новых артефактах, проблемах или элементах решения проблем, остов соответствующим образом достраивается [22,23]. Узлы связаны отношениями:

• следования,

• порождения,

• обобщения/конкретизации,

• принадлежности.

Отношения следования наблюдаются между процессами жизненного цикла, порождения — между проблемами и элементами их решения, принадлежности — между авуаром и узлами остова. Отношение обобщения/конкретизации может связывать узлы одного класса, входящие в остов. В сети локально преобладают конфигурации узлов и связей типа «центрированный цикл», «дерево», «гамак». Гамак образуется, когда один авуар принадлежит более чем одному узлу

остова, и когда элемент решения оказывается общим для нескольких цепочек элементов решения одной проблемы.

Реализация концептуальной модели сети проблем

В качестве среды реализации выбран свободный программный продукт редактор графов Gephi [24], в целом удовлетворяющий требованиям, сформулированным во введении1. Этот редактор функционирует в операционной среде Java 8 [25]. Из специальных требований к оборудованию компьютера следует отметить разрешение экрана не менее 1024x768 точек на дюйм и поддержку видеоадаптером технологии OpenGL версии не ниже 2.0. Если показываемый на экране модели содержит более тысячи узлов и рёбер, требуется соответствующее масштабирование производительности видеокарты. Графы депонируются в файлах с расширением gexf в соответствии со спецификацией Graph Exchange XML Format (GEFX) [26,27].

Редактор открывает окно (главное), в котором узлы графа показываются точками (кружками), а рёбра — отрезками прямых. Предусмотрен набор окон, в которых редактор может показать сопутствующую графу информацию (параметры узлов и рёбер, параметры операций, матрицу смежности узлов в табличной форме, любые текстовые файлы, сопоставленные узлам). Пользовательский интерфейс редактора включает в себя набор команд, обеспечивающий в том числе селекцию [28] и фильтрацию узлов и рёбер показываемого в главном окне графа, изменение масштаба показа, открытие и закрытие окон, экспорт и импорт графов. Команды могут вызываться по отдельности через клавиатуру или в составе скриптов, автоматизирующих действия пользователя. С помощью команд и действий манипулятором (мышью или тачпадом) пользователь может добавлять, удалять и перемещать узлы, удалять рёбра или связывать ими существующие узлы. Модель сети проблем [29] представляется в редакторе Gephi в виде набора объектов. Класс объектов-узлов содержит следующие атрибуты:

• Дескриптор,

• Спецификация,

• Паспорт публикации,

• Цвет — color (в нотации RGB от 0 до 255),

• Координаты (x,y) — местоположение узла на поле

графа, числа в формате с плавающей запятой,

• Размер size — размер узла по отношению к другим

узлам в поле графа по шкале от 0 до 20.

Дескриптор — это имя класса, к которому относится узел (артефакт, проблема и другие). Спецификация— краткий текст, отличающий узел в контексте модели, например: фирменное наименование изделия, надёжность ниже 99% (у изделия), глубокое резервирование (как подход к решению проблемы). Если узел представляет авуар-публикацию [30], то атрибут имеет составную структуру:

• URL-ссылка на документ публикации,

• тема публикации — строка,

• ключевые слова— строка,

1 Gephi — The Open Graph Viz Platform [Электронный ресурс] // Gephi. 2020. URL: https://gephi.org (дата обращения: 06.09.2020).

Vol. 16, No. 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

• год публикации — целое число.

Класс объектов-рёбер содержит следующие атрибуты:

• цвет (RGB):

• имя ребра— строка (описание характера связи между узлами);

• вес ребра — актуальность связи между узлами по отношению к другим рёбрам в поле графа по шкале от 0 до 20.

Значения атрибутов доступны пользователю при выделении узла или ребра в главном окне в виде таблицы, как показано на Рис. 1.

Appearance Редактирование х

Проблемы - Свойства

Размер 10.0

Позиции (х) 25.110382

Позиция [у] 138.39S32

Позиция (z) 0.0

Цвет ■ [0.0.0] Q

Label Size 1.0

Label Color null P

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Label Visible 0

Проблемы - Атрибуты

Id Проблемы

Label Проблемы

Interval -«нулевое значение:»

Дескриптор «¡нулевое значение:»

Спецификация «¡нулевое значение>

Авуар «¡нулевое значение:»

Р и с. 1. Служебное окно ввода и показа параметров узла F i g. 1. Command window for entering and displaying node parameters

Графический пользовательский интерфейс (GUI) модели сети проблем

В основу этого интерфейса положены следующие соглашения:

1. Узлы модели показываются узлами графа (кружками различного размера).

2. Отношения модели показываются рёбрами графа.

3. Артефакты, процессы инновационного цикла и рёбра между ними окрашены [31] в белый цвет.

4. Цвет проблем — красный (255,0,0), здесь и далее в нотации RGB.

5. Цвет решений — зелёный (0,255,0).

6. Цвет элементов решения проблем и рёбер между ними — оттенки от коричневого до светло-жёлтого по мере приближения к решению.

7. Цвет авуара и ребра, ведущего от авуара к узлу остова — синий (0,0,255).

Дескриптор и спецификация предусмотрены как атрибуты

любого узла, но могут быть пустыми по содержанию. Авуаров

может временно не быть. Наименование авуара может выступать как дескриптор или спецификация. Моделью используются окна:

• модели, окно показывает остов модели, предназначается, в основном, для навигации по модели,

• дескриптора (миниокно),

• спецификации («миди»-окно),

• авуара — окно показывает селектированную публикацию

• служебные окна— для ввода и показа параметров операций.

Узлы остова образуют в пространстве визуализации устойчивые узнаваемые конфигурации, например: спирали процессов жизненного цикла, «гамаки» элементов решения проблем. Рёбра показываются факультативно.

Обеспечивается масштабирование конфигураций в пространстве окна и варьирование яркости или цветовой интенсивности узлов.

Пользователю предоставляются следующие операции:

1. Селекция связного (как граф) фрагмента остова в окрестности указанного узла, выделение сохраняется до отмены операцией Deselect. При селекции сохраняется расположение узлов, установленное в конфигурации. Select (узел, тип отношения, глубина и направленность, ..., тип отношения, глубина и направленность), где:

• узел — узел остова, окрестность которого селектируется, дескриптор этого узла указывается в специальном окне, или кликается в тексте спецификации или авуара, или узел кликается в окне модели; по умолчанию селектируется вся модель.

• тип отношения — принадлежность, следование процессов в жизненном цикле, сводимость между проблемами, следование между элементами решения проблемы, генерализация/ специализация (как выше).

• глубина и направленность — целое число указывает, сколько селектируется последовательных узлов с соединяющими их рёбрами указанного типа отношения, знак числа указывает направление развёртывания отношений; значение по умолчанию — +1.

Пример селекции показан на Рис. 2 и 3.

2. Отмена селекции. Предполагается, что в состоянии селекции может находиться только один фрагмент. Иначе нужно вводить текущую идентификацию фрагментов. Deselect()

3. Управление фрагментом: масштабирование, изменение яркости и цвета узлов, гашение рёбер, полное гашение, перенос в центр окна, подтягивание узлов из-за границы окна, перенос остального содержимого окна в фон (более глубокий слой).

Manage( ... ) спецификация параметров уточняется в дальнейшем.

Современные информационные технологии и ИТ-образование

Том 16, № 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Показ дескриптора. Появляется окно с текстом дескриптора. Можно ввести режимы управления дескриптором, например, автоматического гашения через некоторое время. ShowDescriptor(узел). Пример показан на Рис. 4 и 5.

Показ спецификации. Появляется окно с текстом спецификации. Можно ввести режимы управления спецификацией, например, автоматического гашения через некоторое время. ShowSpecification(узел)

I'Bflt и

Р и с. 2. Процесс выделения подграфа модели F i g. 2. Model subgraph selection process

Р и с. 3. Результат выделения подграфа модели с измененем «яркости» узлов F i g. 3. The result of selecting a subgraph of the model with a change in the nodes' "brightness"

Vol. 16, No. 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

588

БОЛЬШИЕ ДАННЫЕ И ПРИЛОЖЕНИЯ ,ЛП- Гагарин,

И. А. Филимонов

Показ публикаций. Open(узел). Показ и редактирование спецификации подобно показу и вызову дескриптора.

Сохранение вида. Сохраняется текущий вид главного окна, ему присваивается указанный идентификатор. SaveView(идентификатор)

8. Восстановление вида. RestoreView(идентификатор) Предусмотрены режимы:

• показ остова в главном окне без текстовой информации (дескрипторов и спецификаций),

• показ остова с дескрипторами и/или спецификациями для всех узлов остова.

о«-* ечм*-*

mi-1.** 4|'Ч»1Йгг» |jf Пр* нч

Г I.I1IT I

1 ■ 1-г ■■ г ■ [кл 'th

LKHl ^ . pj.il

II 9

Г Г* 1441

Ж4ГШ

I + ■

ад»-

--/

5 V:

Р и с. 4. Вызов миниокна дескриптора F i g. 4. Calling the descriptor mini-window

. т . — *-i* « —-m% * | ц *—"

__ _■ • -- -_g

Р и с. 5. Результат вызова дескриптора, дескриптор может быть отредактирован F i g. 5. The result of calling the descriptor, the descriptor can be edited

Современные информационные технологии и ИТ-образование

Том 16, № 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Маршруты доступа к персонализированному архиву

Средствам GUI данной реализации модели сетей проблем обеспечиваются следующие маршруты (use case), поддерживающие основные случаи использования (use case) персонализированных архивов документов;

Обзорно-ознакомительный. В окне модели пользователь видит всю модель. Первичными ориентирами являются инновационные циклы, распознаваемые как пятиугольники. На Рис. 6 представлен мелкомасштабный вид фрагмента модели. В верхней части рисунка расположены инновационные циклы

артефактов IRS (Informational Retrival System— система поиска информации) и базовый инновационный цикл артефакта «программная система» в целом (самый верхний пятиугольник). От нижних узлов инновационных циклов исходит наибольшее количество рёбер-связей к узлам-проблемам, поскольку нижний узел каждого инновационного цикла являет собой узел с дескриптором «Research» (НИР). От остальных узлов жизненных циклов также исходят рёбра-связи, но уже лишь к узлам-авуарам, обозначенным синим цветом, поскольку остальные элементы жизненного цикла, такие как ОКР, Внедрение, Потребление и Оценка не образуют сеть научных проблем, а являются «прикладными».

Р и с. 6. Мелкомасштабный вид фрагмента модели F i g. 6. Small-scale view of a model fragment

В модели также отражены визуальные конфигурации решения некоторых проблем, на поле графа они представляют собой комбинации из разноцветных узлов и рёбер. Цветовая палитра выбрана таким образом, чтобы показать пользователю переход от проблеме к решению, поэтому была выбрана расширенная светофорная цветовая палитра, в которой помимо классического перехода «красный-жёлтый-зелёный», была выбрана последовательность цветов: розовый (переход от проблеме к подроблеме)-оранжевый(переход от подпроблеме к предложению)-жёлтый(переход от предложению к попыт-ке)-зелёный(переход от попытки к резолюции). Из узлов-ре-

золюций конфигураций решения проблем могут вытекать новые артефакты, образующие новые жизненные циклы. По мере наполнения модели новыми узлами-проблемами и конфигурациями решений проблем, происходит масштабирование модели. На рис. 6 такими новыми жизненными циклами, образованными в результате предложений, попыток и резолюций решения проблем, являются жизненные циклы артефактов «Google» (слева вверху), «OpenSemanticSearch» (справа вверху), «Yandex» (слева внизу) и «ПоискУМ» (справа внизу). К каждому промежуточному узлу конфигурации прикреплены узлы-авуары, обозначенные синими узлами, содержащие

Vol. 16, No. 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

публикации, поскольку каждый узел модели вставляется на основании документа-авуара, описывающего этап решения проблемы. Преимущество визуализации модели и работы с ней состоит в том, что научно-техническому сотруднику, для накопления и анализа публикаций на столе в его индивидуальных целях, в том числе, для расширения его кругозора, поиска партнёров, отслеживания деятельности конкурентов, оценки перспективности и выбора конкретных направлений личной инженерной и научной практики, не нужно прибегать к «формальному» текстовому поиску с использованием поисковых запросов по ключевым словам, которые не всегда могут быть сформулированы корректно и полно, а достаточно лишь визуально охватить взором узнаваемую графическую конфигурацию на «звёздном небе» модели, чтобы понять, что именно этот участок содержит наиболе высокую активность работы над проблемами. Кликая мышью на центральный узел жизненного цикла, пользователь может получить в окне дескриптора информацию о моделируемом артефакте. Конфигурация сети проблем, связанных в модели с этим артефактом, сообщает об интенсивности процессов развития и совершенствования артефакта. Длина цепочек проблем указывает на трудность их решения. Количество авуаров (документов), связанных с проблемами указывает, насколько широко развёрнут процесс публичного обсуждения решений. Если модель це-

ликом помещается в окне модели только в мелком масштабе, пользователь может увеличить масштаб представления модели и сдвинуть интересующую его часть модели в центр окна. Начальное состояние окна модели, характерное для начала обзорного маршрута, показано на Рис. 6.

От документа к проблеме. Если пользователь знает точные реквизиты документа, то может через поиск архиве вызвать установку фокуса на соответствующий узел-авуар и получить полную информацию о проблеме, которая обсуждается в данном документе, в частности, какую позицию занимает выбранный авуар (например, статья) в контексте научного развития отрасли. Этот случай показан на Рис. 7.

От представления о документе к документу. Если пользователь имеет неполные сведения о документе, но знает о каком артефакте в нём идёт речь и какие проблемы обсуждаются, то пользователь находит в модели артефакт, затем, если нужно, увеличив масштаб модели, визуализирует дескрипторы и находит по ним проблему, а по ней — искомый документ. Этот случай показан на Рис. 8, 9 и 10.

Ввод узла. Для ввода узла пользователь должен знать артефакт и отношение вводимого узла к узлам, уже входящим в модель. Удаление узла. Узел удаляется вместе с рёбрами. Эта возможность предусмотрена на случай ошибочного ввода узла. В норме архив только пополняется.

»> mySubGiaph = g.filter(Specification = "Network cache"}

>» visible = wySuiiGraph

»>

ApfM^MtcE Редок тириваюс К

s -Свойства

размер

Позч»ла (х)

П(Кт*(Я (V) пазика (z) UiiT

15-D os.a

а.о

Ш [s«до;

иеайге IM№ Leb-JVirfjIs - - Атрибуты 1«

Ijtd

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Hsnj

Онегин*

Spedfctfar

Avor

Prtysw

1.0 r.J

0

45

RrttJtm Nstwykmhe Н&.НягЬлфЛрви .MB... Q пустое лягнете

Р и с. 7. Вызов узла-проблемы по спецификации с помощью команд F i g. 7. Calling Problem Node by BOM Using Commands

Современные информационные технологии и ИТ-образование

Том 16, № 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

An Introduction to Data Mining

Datft Mining

A Survey on Data Quality; Classifying Poor Data Poor data quality

I Dialing Utip dat-di&cts

/ flustering of huge ^ataseH using Machine Intelligence Techniques

Device and a data dBtenminatiofl' method \

Data deMJrminatiorData analysis

/ Qualitative data analysis

A Formal Rramework for Complex Evanl Proc-eMiti® _

CEP (compte* «wont processing) I

The S » man tie Compte* Event Process in a Based on Metagr iph Approach

, Predictive complex «vera processing based/on evolving взудо am networks Issues m compicA evenfproiessin^: status ffocTpr^p-eits m Int Big ü. i*a его P4CEP* Towards In-Network Compte* Event Processing

SuItalbJeJoT Usage Jfi IRSNCBI-nr»etaJa£5£^ The imgbi BioCoVIections DMnba^i

Database control system

ManagmgTtenh of data NCBI's conserved domain database

dbSNP; the NCBI database of genetic variation

Р и с. 8. Выбор проблемы по Рис. 6. F i g. 8. Problem selection according to Fig. 6.

Навигация по фрагменту модели, показанному на Рис. 8, осуществляется следующими шагами.

1. От узла «Research» (НИР) жизненного цикла IRS (нижний узел в пятиугольнике) пользователь визуально на «звёздном небе» графа находит узнаваемую конфигурацию (палитру цветов) и графический расклад стрелок связей и масштабирует (увеличивает) участок графа, концентрируя взор на основной проблеме «Data mining» (верхний красный узел подграфа). Данная проблема оказалась добавленной на поле графа, потому что был проанализирован документ-авуар «Introfuction to Data mining», раскрывающий и ставящий проблему «добычи данных»;

2. Перемещаясь по розовым стрелкам, означающим переход от проблемы к подроблемам, пользователь видит подпро-блемы проблемы, такие как «Poor data quality» (низкое качество данных) и «Dealing huge datasets» (работа с большими наборами данных) и авуары, присущие каждому узлу подграфа; Декомпозиция основной проблемы «Data mining» на данные две подпроблемы осуществлеы на основе анализа соотвествующих им узлов-авуаров «A Survey on Data Quality: Classifying Poor Data» и «Clustering of huge datasets using Machine Intelligence Techniques» соответственно. В данных статьях раскрываются принципы кластеризации больших данных с использованием механизмов искусственного интеллекта и классификации «бедных данных» с использованием механизмов нейронных сетей;

3. Нажимая на оранжевые узлы (предложения), пользователь видит спецификацию предложения и авуар, свя-

занный с ней. Предложениями к решению подпроблемы низкого качества данных являются определение данных и анализ данных. Предложением к решению проблемы работы с большими наборами данных является предложение по управлению банком данных; Предложение по определению данных раскрывается в статье «Device and a data determination method». В этом документе предлагается метод определения данных на основе блокчейна и смарт-контракта, которые используются для решения проблемы. Предложение по анализу данных раскрывает статья «Qualitative data analysis». В статье раскрывается «рамочный метод» — систематический и гибкий подход к анализу качественных данных;

4. Жёлтые стрелки, означающие более «прогрессивный» переход от предложения к попытке, являют пользователю практическую попытку реализации предложения, и, как следствие, попытку решения проблемы. На таких узлах, как правило, находится наибольшее количество публикаций; Подходом к предложению анализа данных является база данных NCBl-nr. Например, один из документов, раскрывающих данных подход, описывает создание настраиваемых суб-баз данных из базы данных NCBI-nr для быстрого аннотирования огромных наборов метагеномных данных с использованием комбинированного подхода; Подходом к предложению определения данных является CEP (сложная обработка событий). Одна из публикаций по подходу CEP описывает вычисление индикаторов качества данных потоков больших данных, используя эту технологию;

Vol. 16, No. 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

Узел резолюции, зелёный узел, отражает заключение возможности использования реализации подхода, представленного в авуарах узов попытки. Узел резолюции переходит непосредственно к узлу «оценка» жизненного цикла IRS, или одного из жизненных циклов конкретных реализаций IRS, например, ПоискУМ или OpenSemanticSearch. Резолюция отражает практическое решение проблемы, которое порождает появление нового артефакта или «встраивается» в один из элементов жизненного цикла артефакта. Полученная оценка может использоваться для составления плана валидации программ-

ного продукта, и дальнейшего включения практической реализации решения проблемы в функциональные требования к программному продукту, подлежащие реализации. Следует отметить, что конфигурация модели в окрестности авуара или проблемы, складываясь случайным образом или выстраиваемая пользователем (который может двигать узлы), может приобрести выразительный, узнаваемый характер, что позволит пользователю находит нужный узел (авуар или проблему) не путешествуя по модели от артефактов, а сразу, охватив модель взглядом.

Р и с. 9. Открытие документа, найденного по маршруту, показанному на Рис. 6 и 8 F i g. 9. Opening a document found along the route shown in Fig. 6 and 8.

Р и с. 10. Увеличение масштаба модели с выборочной визуализацией спецификаций проблем F i g. 10. Model upscaling with selective visualization of problem specifications

Современные информационные технологии и ИТ-образование

Том 16, № 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

A Б С D E F

1 Research OKP Introduction Consum Asses em ent

2 Research 1

3 OKP 1

4 Introduction 1

5 Cons um 1

û Assesement 1

Р и с. 11. Начальная матрица смежности базового инновационного цикла графа модели, составленная в редакторе таблиц F i g. 11. Initial adjacency matrix of the base innovation cycle of the model graph, compiled in the table editor

Инициирование модели. Для того, чтобы начать обработку (редактирование) графовой модели [32] расширенного жизненного цикла, необходимо произвести начальную инициализацию графа. В соответствии с требованиями, процессы жизненного цикла и решения проблем образуют «остов» модели. Чтобы отобразить (нарисовать, создать) граф на «звёздном небе» редактора для последующего его редактирования и изменения параметров, необходимо сначала подать на вход (импортировать) редактору матрицу смежности стартового участка графа или описать граф текстовым образом на языке XML в соответствии со спецификацией Graph Exchange XML Format (GEXF). Она может быть написана в стороннем редакторе таблиц, таком как Microsoft Excel или LibreOffice Calc и должна иметь формат .xls или .csv. На Рис. 11 представлена начальная матрица смежности базового инновационного цикла графа [33] модели [34], нарисованная в редакторе таблиц и сохранённая как файл .csv.

Заключение

В предложенной и апробированной оболочке персонализированного архива научно-технической документации обеспечена возможность поиска по объектным поисковым образам, складывающимся из неполных и, может быть, неточных сведений об искомом документе. Навигация по модели обеспечивается когнитивными приёмами, которые состоят в использовании метафор фигур: <цикла>, <гамака>, и метафоры цвета: от красного к зелёному через жёлтый. Вряд ли стоит сомневаться, что эти метафоры понятны потенциальным пользователям архивов научно-технической документации. Сверх того, пользователю предоставляется возможность конфигурировать модель, организуя понятные пользователю условные знаки, обеспечивающие практически мгновенный доступ к искомым объектам.

Список использованных источников

[1] Balog, K. Entity-Oriented Search / K. Balog.— DOI 10.1007/978-3-319-93935-3 // The Information Retrieval Series. — Vol. 39. — Springer, Cham, 2018. — URL: https:// link.springer.com/book/10.1007%2F978-3-319-93935-3 (дата обращения: 06.09.2020).

[2] Ma, D. Leveraging Fine-Grained Wikipedia Categories for Entity Search / D. Ma, Y. Chen, K.C.-C. Chang, X. Du, Ch. Xu, Y. Chang.— DOI 10.1145/3178876.3186074 //

Proceedings of the 2018 World Wide Web Conference (WWW '18).— International World Wide Web Conferences Steering Committee, Republic and Canton of Geneva, CHE, 2018.— Pp. 1623-1632.— URL: https://dl.acm. org/doi/10.1145/3178876.3186074 (дата обращения: 06.09.2020).

[3] Torres-Tramon, P. A Diffusion-Based Method for Entity Search / P. Torres-Tramon, M. Timilsina, C. Hayes. — DOI 10.1109/IC0SC.2019.8665601 // 2019 IEEE 13th International Conference on Semantic Computing (ICSC).— Newport Beach, CA, USA, 2019.— Pp. 16-23.— URL: https://ieeexplore.ieee.org/document/8665601 (дата обращения: 06.09.2020).

[4] Shen, J. Entity Set Search of Scientific Literature: An Unsupervised Ranking Approach / J. Shen, J. Xiao, X. He, J. Shang, S. Sinha, J. Han. — DOI 10.1145/3209978.3210055 // The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval (SIGIR '18).— Association for Computing Machinery, New York, NY, USA, 2018.— Pp. 565-574.— URL: https://dl.acm. org/doi/10.1145/3209978.3210055 (дата обращения: 06.09.2020).

[5] Ivanisenko, T. V. ANDDigest: a new web-based module of ANDSystem for the search of knowledge in the scientific literature / T. V. Ivanisenko, O. V. Saik, P. S. Demenkov, N. V. Ivanisenko, A. N. Savostianov, V. A. Ivanisenko. — DOI 10.1186/s12859-020-03557-8 // BMC Bioinformatics.— 2020. — Vol. 21, Suppl. 11. — Article 228. — URL: https:// bmcbioinformatics.biomedcentral.com/articles/10.1186/ s12859-020-03557-8 (дата обращения: 06.09.2020).

[6] Nguyen, D. Q. A Capsule Network-based Embedding Model for Knowledge Graph Completion and Search Personalization / D. Q. Nguyen, T. Vu, T. D. Nguyen, Dt. Q. Nguyen, D. Phung.— DOI 10.18653/v1/N19-1226 // Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. — Association for Computational Linguistics, Minneapolis, Minnesota.— 2019. — Vol. 1.— Pp. 2180-2189.— URL: https://www.aclweb.org/anthology/ N19-1226 (дата обращения: 06.09.2020).

[7] Hasibi, F. Nordlys: A Toolkit for Entity-Oriented and Semantic Search / F. Hasibi, K. Balog, D. Garigliotti, S. Zhang. — DOI 10.1145/3077136.3084149 // Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR

Vol. 16, No. 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

'17). — Association for Computing Machinery, New York, NY, USA, 2017.— Pp. 1289-1292.— URL: https://dl.acm. org/doi/10.1145/3077136.3084149 (дата обращения: [16] 06.09.2020).

[8] Tushkanova, O. Knowledge Net: Model and System for Accumulation, Representation, and Use of Knowledge / O. Tushkanova, V. Samoylov.— DOI 10.1016/j.ifacol.2019.11.351 // IFAC-PapersOnLine. — 2019. — Vol. 52, issue 13. — Pp. 1150-1155.— URL: https://www.sciencedirect.com/sci-ence/article/pii/S2405896319313291 (дата обращения: 06.09.2020). [17]

[9] Velickovic, P. Graph Attention Networks / P. Velickovic, A. Casanova, P. Lio, G. Cucurull, A. Romero, Y. Bengio.— DOI 10.17863/CAM.48429 // 6th International Conference on Learning Representations, ICLR 2018— Conference Track Proceedings. — Vancouver Convention Center, Vancouver, Canada, 2018. — URL: https://openreview.net/pdf?id=rJX- [18] MpikCZ (дата обращения: 06.09.2020).

[10] Siew, C. S. Q. Cognitive Network Science: A Review of Research on Cognition through the Lens of Network Representations, Processes, and Dynamics / C. S. Q. Siew, D. U. Wulff, N. M. Beckage, Y. N. Kenett. — DOI 10.1155/2019/2108423

// Complexity. — 2019. — Vol. 2019. — Article 2108423. — [19] URL: https://www.hindawi.com/journals/complexi-

ty/2019/2108423 (дата обращения: 06.09.2020).

[11] Yang, C. Query-Specific Knowledge Summarization with Entity Evolutionary Networks / C. Yang, L. Gan, Z. Wang,

J. Shen, J. Xiao, J. Han. — DOI 10.1145/3357384.3358068 [20] // Proceedings of the 28th ACM International Conference on Information and Knowledge Management (CIKM '19). — Association for Computing Machinery, New York, NY, USA, 2019.— Pp. 2121-2124.— URL: https://dl.acm. org/doi/10.1145/3357384.3358068 (дата обращения: 06.09.2020).

[12] Novikov, A. M. Research Methodology: From Philosophy of Science to Research Design / A. M. Novikov, D. A. Novikov. — [21] DOI 10.1201/b14562. — CRC Press, London, 2013.

[13] Миронов, В. В. Ситуационно-ориентированные базы данных: формирование персонализированных графических документов для поддержки учебного проектирования / В. А. Миронов, А. С. Гусаренко, Г. А. Ту-гузбаев.— DOI 10.26102/2310-6018/2020.29.2.013 // [22] Моделирование, оптимизация и информационные технологии. — 2020. — Т. 8, № 2(29). — С. 19-20. — URL: https://www.elibrary.ru/item.asp?id=44086563 (дата обращения: 06.09.2020). — Рез. англ.

[14] Song, T. Expert vs. novice: Problem decomposition/recomposition in engineering design / T. Song, K. Becker.— DOI 10.1109/ICL.2014.7017768 // 2014 International Conference on Interactive Collaborative Learning (ICL).— Dubai, United Arab Emirates, 2014.— Pp. 181-190.— URL: [23] https://ieeexplore.ieee.org/document/7017768 (дата обращения: 06.09.2020).

[15] Баринова, В. А. Инновационный цикл как базовая модель динамики и организации инновационной деятельности / В. А. Баринова, С. П. Земцов // Вестник Института экономики Российской академии наук.— [24] 2016.— № 1.— С. 117-127.— URL: https://www.

elibrary.ru/item.asp?id=25463313 (дата обращения: 06.09.2020). — Рез. англ.

Schindler, D. An annotation scheme for references to research artefacts in scientific publications / D. Schindler, K. Yordanova, F. Krüger.— DOI 10.1109/PER-C0MW.2019.8730730 // 2019 IEEE International Conference on Pervasive Computing and Communications Workshops (PerCom Workshops). — Kyoto, Japan, 2019. — Pp. 52-57.— URL: https://ieeexplore.ieee.org/docu-ment/8730730 (дата обращения: 06.09.2020). Гагарин, А. П. Гипертекстовая технология моделирования сетей научно-технических проблем / А. П. Гагарин // Успехи современной радиоэлектроники.— 2011.— № 1.— С. 72-76.— URL: https://www.elibrary.ru/item. asp?id=16335721 (дата обращения: 06.09.2020).— Рез. англ.

Гагарин, А. П. Динамика инновационных процессов в области информационных технологий и подходы к их моделированию / А. П. Гагарин, Т. В. Березняк // Наукоёмкие технологии. — 2014. — Т. 15, № 1. — С. 107-116. — URL: https://www.elibrary.ru/item.asp?id=21153987 (дата обращения: 06.09.2020). — Рез. англ. Хайруллин, Р. А. Этапы инновационного процесса / Р. А. Хайруллин // Фундаментальные исследования. — 2011.— № 12-4.— С. 809-813.— URL: https://www. elibrary.ru/item.asp?id=17567285 (дата обращения: 06.09.2020). — Рез. англ.

Fernandes, J. A Conceptual Model for Systems-of-lnforma-tion Systems / J. Fernandes, F. Ferreira, F. Cordeiro, V. V. Graciano Neto, R. P. dos Santos. — DOI 10.1109/1R1.2019.00063 // 2019 IEEE 20th International Conference on Information Reuse and Integration for Data Science (1R1). — Los Angeles, CA, USA, 2019.— Pp. 364-371.— URL: https://iee-explore.ieee.org/document/8843472 (дата обращения: 06.09.2020).

Aksnes, D. W. A Criteria-based Assessment of the Coverage of Scopus and Web of Science / D. W. Aksnes, G. Sivert-sen.— DOI 10.2478/jdis-2019-0001 // Journal of Data and Information Science.— 2019.— Vol. 4, no. 1.— Pp. 1-21.— URL: https://sciendo.com/article/10.2478/jdis-2019-0001 (дата обращения: 06.09.2020). An Analytics Tool for Exploring Scientific Software and Related Publications / A. Hoppe, J. Hagen, H. Holzmann, G. Kniesel, R. Ewerth. — DOI 10.1007/978-3-030-00066-0_27 // Digital Libraries for Open Knowledge. TPDL 2018. Lecture Notes in Computer Science; E. Méndez, F. Crestani, C. Ribeiro, G. David, J. Lopes (ed.). Springer, Cham. — 2018. — Vol. 11057.— Pp. 299-303.— URL: https://link.spring-er.com/chapter/10.1007/978-3-030-00066-0_27 (дата обращения: 06.09.2020).

Nazar, N. Summarizing Software Artifacts: A Literature Review / N. Nazar, Y. Hu, H. Jiang. — DOI 10.1007/s11390-016-1671-1 // Journal of Computer Science and Technology. — 2016.— Vol. 31, issue 5.— Pp. 883-909.— URL: https://link.springer.com/article/10.1007/s11390-016-1671-1 (дата обращения: 06.09.2020). Bastian, M. Gephi: An Open Source Software for Exploring and Manipulating Networks / M. Bastian, S. Heymann, M. Ja-

Современные информационные технологии и ИТ-образование

Том 16, № 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

comy || Proceedings of the International AAAI Conference on Web and Social Media. — 2009.— Vol. 3, no. 1.— Pp. 361-362.— URL: https:||ojs.aaai.org|index.php|ICWSM| article/view/13937 (дата обращения: 06.09.2020).

[25] Aryani, A. Visualising Research Graph using Neo4j and Gephi | A. Aryani, J. Wang, H. Zhang, A. Xiang, Z. Zhou, K. Wang. — DOI l0.4225|03|58c8e8cc8alec || Monash University. Preprint, 2017.

[26] An Algorithm of Conversion Between Relational Data and Graph Schema | Z. Ait El Mouden, A. Jakimi, M. Hajar. — DOI 10.1007|978-3-030-03577-8_65 || Information Systems and Technologies to Support Learning. EMENA-ISTL 2018. Smart Innovation, Systems and Technologies; Á. Rocha, M. Serrhini (ed.). Springer, Cham. — 2019.— Vol. 111.— Pp. 594-602.— URL: https://link.springer.com/chap-ter|l0.l007|978-3-030-03577-8_65 (дата обращения: 06.09.2020).

[27] Graph Markup Language (GraphML) | U. Brandes, M. Eigl-sperger, J. Lerner, C. Pich. — DOI l0.l20l|bl5385-l9 || Handbook of Graph Drawing and Visualization; R. Tamassia (ed.).— CRC Press, Taylor & Francis Group, 2013.— Pp. 517-541.

[28] Zhang, H. Distributed subgraph counting: a general approach | H. Zhang, J. X. Yu, Y. Zhang, K. Zhao, H. Cheng. — DOI 10.14778/3407790.3407840 || Proceedings of the VLDB Endowment. — 2020.— Vol. 13, no. 12.— Pp. 2493-2507.— URL: https:||dl.acm.org|doi|l0.l4778|3407790.3407840 (дата обращения: 06.09.2020).

[29] Case, D. M. Fuzzy Cognitive Map to model project management problems | D. M. Case, C. D. Stylios. — DOI 10.1109/ NAFIPS.2016.7851612 || 2016 Annual Conference of the North American Fuzzy Information Processing Society (NAFIPS).— El Paso, TX, USA, 2016.— Pp. 1-6.— URL: https:||ieeexplore.ieee.org|document|785l6l2 (дата обращения: 06.09.2020).

[30] Structural Scaffolds for Citation Intent Classification in Scientific Publications | A. Cohan, W. Ammar, M. van Zuylen, F. Cady. — DOI l0.l8653|vl|Nl9-l36l || Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. — Association for Computational Linguistics, Minneapolis, Minnesota. — 2019.— Vol. 1.— Pp. 35863596.— URL: https:||www.aclweb.org|anthology|Nl9-1361 (дата обращения: 06.09.2020).

[31] Yuan, L. Effective and efficient dynamic graph coloring | L. Yuan, L. Qin, X. Lin, L. Chang, W. Zhang. — DOI 10.14778/3157794.3157802 || Proceedings of the VLDB Endowment. — 2017.— Vol. 11, no. 3.— Pp. 338-351.— URL: https:||dl.acm.org|doi|l0.l4778|3l57794.3l57802 (дата обращения: 06.09.2020).

[32] Пилюгин, В. В. Обзор подходов к геометризации исходных многомерных данных при их анализе методом компьютерной визуализации | В. В. Пилюгин, А. А. Пасько, И. Е. Мильман || Научная визуализация.— 2015.— Т. 7, № 2.— С. 21-37.— URL: https://www.elibrary.ru/item. asp?id=238l7700 (дата обращения: 06.09.2020).— Рез. англ.

[33] Целых, А. А. Методы и средства визуализации массивов

научно-технических показателей в виде графов / А. А. Целых, А. Н. Целых, Д. А. Матвеев // Современные проблемы науки и образования. — 2013. — № 3. — С. 69. — URL: https://www.elibrary.ru/item.asp?id=20909040 (дата обращения: 06.09.2020). — Рез. англ.

[34] Апанович, З. В. Гибкая подсистема визуализации онтологии и информационного наполнения порталов знаний на протяжении их жизненного цикла / З. В. Апанович, П. С. Винокуров, Т. А. Кислицина // Электронные библиотеки: перспективные методы и технологии, электронные коллекции. Труды Двенадцатой Всероссийской научной конференции RCDL'2010.— Казань: КФУ 2010. — С. 265-272. — URL: https://elibrary.ru/item. asp?id=21506199 — Рез. англ.

Поступила 06.09.2020; одобрена после рецензирования 22.10.2020; принята к публикации 20.11.2020.

|об авторах:|

Гагарин Андрей Петрович, профессор кафедры 304 "Вычислительные машины, системы и сети", Институт № 3 "Системы управления, информатика и электроэнергетика", ФГБОУ ВО «Московский авиационный институт (национальный исследовательский университет)» (125993, Российская Федерация, г. Москва, Волоколамское шоссе, д. 4), кандидат технических наук, профессор, ORCID: http://orcid.org/0000-0002-0929-2834, gagarin_ay@outlook.com

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Филимонов Илья Андреевич, аспирант по кафедре 304 «Вычислительные машины, системы и сети», Институт № 3 «Системы управления, информатика и электроэнергетика», ФГ-БОУ ВО «Московский авиационный институт (национальный исследовательский университет)» (125993, Российская Федерация, г. Москва, Волоколамское шоссе, д. 4), ORCID: http:// orcid.org/0000-0002-2307-0453, ilja199@bk.ru

Все авторы прочитали и одобрили окончательный вариант рукописи.

References

[1] Balog K. Entity-Oriented Search. The Information Retrieval Series. 2018; 39. Springer, Cham. (In Eng.) DOI: https://doi. org/10.1007/978-3-319-93935-3

[2] Ma D., Chen Y., Chang K.C.-C., Du X., Xu Ch., Chang Y. Leveraging Fine-Grained Wikipedia Categories for Entity Search. In: Proceedings of the 2018 World Wide Web Conference (WWW '18). International World Wide Web Conferences Steering Committee, Republic and Canton of Geneva, CHE; 2018. p. 1623-1632. (In Eng.) DOI: https://doi. org/10.1145/3178876.3186074

[3] Torres-Tramon P., Timilsina M., Hayes C. A Diffusion-Based Method for Entity Search. In: 2019 IEEE 13th International Conference on Semantic Computing (ICSC). Newport Beach, CA, USA; 2019. p. 16-23. (In Eng.) DOI: https://doi. org/10.1109/ICOSC.2019.8665601

[4] Shen J., Xiao J., He X., Shang J., Sinha S., Han J. Entity Set Search of Scientific Literature: An Unsupervised Ranking Approach. In: The 41st International ACM SIGIR Confer-

Vol. 16, No. 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

ence on Research & Development in Information Retrieval (SIGIR '18). Association for Computing Machinery, New York, NY, USA; 2018. p. 565-574. (In Eng.) DOI: https://doi. org/10.1145/3209978.3210055 [15]

[5] Ivanisenko T.V., Saik O.V., Demenkov P.S., Ivanisenko N.V., Savostianov A.N., Ivanisenko V.A. ANDDigest: a new web-based module of ANDSystem for the search of knowledge in the scientific literature. BMC Bioinformatics. 2020; 21(Suppl 11):228. (In Eng.) DOI: https://doi.org/10.1186/ s12859-020-03557-8

[6] Nguyen D.Q., Vu T., Nguyen T.D., Nguyen Dt.Q., Phung D. A [16] Capsule Network-based Embedding Model for Knowledge Graph Completion and Search Personalization. In: Proceedings of the 2019 Conference of the North American Chapter of

the Association for Computational Linguistics: Human Language Technologies. Association for Computational Linguistics, Minneapolis, Minnesota. 2019; 1:2180-2189. (In Eng.) [17] DOI: https://doi.org/10.18653/v1/N19-1226

[7] Hasibi F., Balog K., Garigliotti D., Zhang S. Nordlys: A Toolkit for Entity-Oriented and Semantic Search. In: Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR

'17). Association for Computing Machinery, New York, [18] NY, USA; 2017. p. 1289-1292. (In Eng.) DOI: https://doi. org/10.1145/3077136.3084149

[8] Tushkanova O., Samoylov V. Knowledge Net: Model and System for Accumulation, Representation, and Use of Knowledge. IFAC-PapersOnLine. 2019; 52(13):1150-1155. (In

Eng.) DOI: https://doi.org/10.1016/j.ifacol.2019.11.351 [19]

[9] Velickovic P., Casanova A., Lio P., Cucurull G., Romero A., Bengio Y. Graph Attention Networks. In: 6th International Conference on Learning Representations, ICLR 2018— Conference Track Proceedings. Vancouver Convention Center, Vancouver, Canada; 2018. (In Eng.) DOI: https://doi. [20] org/10.17863/CAM.48429

[10] Siew, C.S.Q., Wulff D.U., Beckage N.M., Kenett Y.N. Cognitive Network Science: A Review of Research on Cognition through the Lens of Network Representations, Processes, and Dynamics. Complexity. 2019; 2019:2108423. 24 p. (In

Eng.) DOI: https://doi.org/10.1155/2019/2108423 [21]

[11] Yang C., Gan L., Wang Z., Shen J., Xiao J., Han J. Query-Specific Knowledge Summarization with Entity Evolutionary Networks. In: Proceedings of the 28th ACM International Conference on Information and Knowledge Management [22] (CIKM '19). Association for Computing Machinery, New York, NY, USA; 2019. p. 2121-2124. (In Eng.) DOI: https:// doi.org/10.1145/3357384.3358068

[12] Novikov A.M., Novikov D.A. Research Methodology: From Philosophy of Science to Research Design. CRC Press, London; 2013. (In Eng.) DOI: https://doi.org/10.1201/b14562

[13] Mironov V.V., Gusarenco A.S., Tuguzbaev G.A. Situa- [23] tion-Oriented Databases: The Formation of Personalized Graphic Documents for Educational Design Support. Modeling, Optimization and Information Technology. 2020; 8(2):19-20. (In Russ., abstract in Eng.) DOI: https://doi. [24] org/10.26102/2310-6018/2020.29.2.013

[14] Song T., Becker K. Expert vs. novice: Problem decomposition/recomposition in engineering design. In: 2014 Inter-

national Conference on Interactive Collaborative Learning (ICL). Dubai, United Arab Emirates; 2014. p. 181-190. (In Eng.) DOI: https://doi.org/10.1109/ICL.2014.7017768 Barinova V.A., Zemtsov S.P. Innovation Cycle as a Basic Model of the Dynamics and Organization of Innovative Activity. Vestnik Instituta Ekonomiki Rossiyskoy akademii nauk = The Bulletin of the Institute of Economics of the Russian Academy of Sciences. 2016; (1):117-127. Available at: https://www.elibrary.ru/item.asp?id=25463313 (accessed 06.09.2020). (In Russ., abstract in Eng.) Schindler D., Yordanova K., Krüger F. An annotation scheme for references to research artefacts in scientific publications. In: 2019 IEEE International Conference on Pervasive Computing and Communications Workshops (PerCom Workshops). Kyoto, Japan; 2019. p. 52-57. (In Eng.) DOI: https:// doi.org/10.1109/PERC0MW.2019.8730730 Gagarin A.P. Hypertext Technology for Simulating Networks of Scientific and Engineering Problems. Uspekhi sovre-mennoi radioelektroniki = Achievements of Modern Radi-oelectronics. 2011; (1):72-76. Available at: https://www. elibrary.ru/item.asp?id=16335721 (accessed 06.09.2020). (In Russ., abstract in Eng.)

Gagarin A.P., Bereznyak T.V. Dynamics of Innovative Processes in the Area of Information Technologies and Approaches to their Simulation. Naukoemkie tekhnologii = Science Intensive Technologies. 2014; 15(1):107-116. Available at: https://www.elibrary.ru/item.asp?id=21153987 (accessed 06.09.2020). (In Russ., abstract in Eng.) Khayrullin R.A. Stages of Innovative Process. Fundamen-tal'nye issledovanija = Fundamental research. 2011; (12-4):809-813. Available at: https://www.elibrary.ru/item.as-p?id=17567285 (accessed 06.09.2020). (In Russ., abstract in Eng.)

Fernandes J., Ferreira F., Cordeiro F., Graciano Neto V.V., dos Santos R.P. A Conceptual Model for Systems-of-Information Systems. In: 2019 IEEE 20th International Conference on Information Reuse and Integration for Data Science (IRI). Los Angeles, CA, USA; 2019. p. 364-371. (In Eng.) DOI: https:// doi.org/10.1109/IRI.2019.00063

Aksnes D.W., Sivertsen G. A Criteria-based Assessment of the Coverage of Scopus and Web of Science. Journal of Data and Information Science. 2019; 4(1):1-21. (In Eng.) DOI: https://doi.org/10.2478/jdis-2019-0001 Hoppe A., Hagen J., Holzmann H., Kniesel G., Ewerth R. An Analytics Tool for Exploring Scientific Software and Related Publications. In: Méndez E., Crestani F., Ribeiro C., David G., Lopes J. (ed.) Digital Libraries for Open Knowledge. TPDL 2018. Lecture Notes in Computer Science. 2018; 11057:299-303. Springer, Cham. (In Eng.) DOI: https://doi. org/10.1007/978-3-030-00066-0_27 Nazar N., Hu Y., Jiang H. Summarizing Software Artifacts: A Literature Review. Journal of Computer Science and Technology. 2016; 31(5):883-909. (In Eng.) DOI: https://doi. org/10.1007/s11390-016-1671-1

Bastian M., Heymann S., Jacomy M. Gephi: An Open Source Software for Exploring and Manipulating Networks. Proceedings of the International AAAI Conference on Web and Social Media. 2009; 3(1):361-362. Available at: https://ojs.

Современные информационные технологии и ИТ-образование

Том 16, № 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

aaai.org/index.php/ICWSM/article/view/13937 (accessed 06.09.2020). (In Eng.)

[25] Aryani A., Wang J., Zhang H., Xiang A., Zhou Z., Wang K. Visualising Research Graph using Neo4j and Gephi. Monash University. Preprint. 2017. (In Eng.) DOI: https://doi. org/10.4225/03/58c8e8cc8a1ec

[26] Ait El Mouden Z., Jakimi A., Hajar M. An Algorithm of Conversion Between Relational Data and Graph Schema. In: Rocha Ä., Serrhini M. (ed.) Information Systems and Technologies to Support Learning. EMENA-ISTL 2018. Smart Innovation, Systems and Technologies. 2019; 111:594-602. Springer, Cham. (In Eng.) DOI: https://doi.org/10.1007/978-3-030-03577-8_65

[27] Brandes U., Eiglsperger M., Lerner J., Pich C. Graph Markup Language (GraphML). In: Tamassia R. (ed.) Handbook of Graph Drawing and Visualization. CRC Press, Taylor & Francis Group; 2013. p. 517-541. (In Eng.) DOI: https://doi. org/10.1201/b15385-19

[28] Zhang H., Yu J.X., Zhang Y., Zhao K., Cheng H. Distributed subgraph counting: a general approach. Proceedings of the VLDB Endowment. 2020; 13(12):2493-2507. (In Eng.) DOI: https://doi.org/10.14778/3407790.3407840

[29] Case D.M., Stylios C.D. Fuzzy Cognitive Map to model project management problems. In: 2016 Annual Conference of the North American Fuzzy Information Processing Society (NAFIPS). El Paso, TX, USA; 2016. p. 1-6. (In Eng.) DOI: https://doi.org/10.1109/NAFIPS.2016.7851612

[30] Cohan A., Ammar W., van Zuylen M., Cady F. Structural Scaffolds for Citation Intent Classification in Scientific Publications. In: Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Association for Computational Linguistics, Minneapolis, Minnesota. 2019; 1:3586-3596. (In Eng.) DOI: https://doi.org/10.18653/v1/N19-1361

[31] Yuan L., Qin L., Lin X., Chang L., Zhang W. Effective and efficient dynamic graph coloring. Proceedings of the VLDB Endowment. 2017; 11(3):338-351. (In Eng.) DOI: https://doi. org/10.14778/3157794.3157802

[32] Pilyugin V.V., Pasko A.A., Milman I.E. Survey of Approaches to Multidimensional Data Geometrization in the Analysis Using Computer Visualization. Scientific Visualization. 2015; 7(2):21-37. Available at: https://www.elibrary.ru/ item.asp?id=23817700 (accessed 06.09.2020). (In Russ., abstract in Eng.)

[33] Tselykh A.A., Tselykh A.N., Matveev D.A. Methods and Techniques for Visualizing Arrays of Scientific and Technical Indicators Using Graphs. Modern problems of science and education. 2013; (3):69. Available at: https://www.elibrary.ru/ item.asp?id=20909040 (accessed 06.09.2020). (In Russ., abstract in Eng.)

[34] Apanovich Z.V., Vinokurov P.S., Kislicina T.A. A flexible subsystem of ontology and content of knowledge portals visualization throughout their life cycle. In: Selected Papers of the XII All-Russian Scientific Conference "Digital Libraries: Advanced Methods and Technologies" (RCDL'2010). KFU, Kazan; 2010. p. 265-272. Available at: URL: https://elibrary. ru/item.asp?id=21506199 (accessed 06.09.2020). (In Russ., abstract in Eng.)

Submitted 06.09.2020; approved after reviewing 22.10.2020; accepted for publication 20.11.2020.

Aboutt^^am^mKKtM

Andrey P. Gagarin, Professor of the Department "Computers, Systems and Networks" (No. 304), Institute of Control Systems and Computer Science in Engineering, Moscow Aviation Institute (National Research University) (4 Volokolamskoe shosse, Moscow 125993, Russian Federation), Ph.D. (Engineering), Professor, ORCID: http://orcid.org/0000-0002-0929-2834, gagarin_ay@out-look.com

Ilja A. Filimonov, Postgraduate Student of the Department "Computers, Systems and Networks" (No. 304), Institute of Control Systems and Computer Science in Engineering, Moscow Aviation Institute (National Research University) (4 Volokolamskoe shosse, Moscow 125993, Russian Federation), ORCID: http://orcid.org/0000-0002-2307-0453, ilja199@bk.ru

All authors have read and approved the final manuscript.

Vol. 16, No. 3. 2020 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

i Надоели баннеры? Вы всегда можете отключить рекламу.