Научная статья на тему 'ПРИМЕНЕНИЕ ДИСТРИБУТИВНОЙ СЕМАНТИКИ ПРИ ВЫДЕЛЕНИИ ЗНАЧИМЫХ СОЧЕТАНИЙ ЗАГОЛОВКОВ НЕСКОЛЬКИХ КОЛЛЕКЦИЙ ТЕКСТОВ ПРИ ФОРМАЛИЗАЦИИ ЛИНГВИСТИЧЕСКОЙ ЭКСПЕРТНОЙ ИНФОРМАЦИИ'

ПРИМЕНЕНИЕ ДИСТРИБУТИВНОЙ СЕМАНТИКИ ПРИ ВЫДЕЛЕНИИ ЗНАЧИМЫХ СОЧЕТАНИЙ ЗАГОЛОВКОВ НЕСКОЛЬКИХ КОЛЛЕКЦИЙ ТЕКСТОВ ПРИ ФОРМАЛИЗАЦИИ ЛИНГВИСТИЧЕСКОЙ ЭКСПЕРТНОЙ ИНФОРМАЦИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
50
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОДЫ ГЛОБАЛЬНОЙ ОПТИМИЗАЦИИ / СИСТЕМЫ УПРАВЛЕНИЯ ОБУЧЕНИЕМ / ОНТОЛОГИЯ / ПРЕДМЕТНАЯ ОБЛАСТЬ СИСТЕМ ЭЛЕКТРОННОГО ОБУЧЕНИЯ / ПРОГРАММА "PROTEGE" / ФОРМАЛИЗАЦИЯ ЛЭИ / ДИСТРИБУТИВНАЯ СЕМАНТИКА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Данильченко Владислав Иванович, Курейчик Виктор Михайлович

Рассматриваются методы формирования специальных моделей представления различных наборов знаний в различных информационных системах. Работа посвящена применению дистрибутивной семантики при выделении значимых сочетаний в одной предметной области (ПрО) в рамках формализации лингвистической экспертной информации (ЛЭИ). В работе применяется подход к формализации ЛЭИ на основе набора аналитических методов, где в качестве моделей используется линейная алгебра. Такой подход дает возможность инициализировать процедуру автоматического формирования иерархических архитектур ЛЭИ или дендрограмм при выделении значимых сочетаний заголовков нескольких коллекций текстов. Научная новизна заключается в предложенном аналитическом подходе с применением дистрибутивной семантики при выделении значимых сочетаний заголовков нескольких коллекций текстов, который позволяет проводить анализ и обработку лингвистической экспертной информации. Отличительной характеристикой предложенного подхода является возможность формализовать ПрО «Методы глобальной оптимизации» на основе синтеза различных уже существующих иерархий рассматриваемой ПрО. В работе преследуется задача создать условия для формализации ЛЭИ путем применения дистрибутивной семантики при выделении значимых сочетаний заголовков нескольких коллекций. Практическая ценность работы заключается в разработке нового подхода в формализации ЛЭИ с учетом дистрибутивной семантики при выделении значимых сочетаний заголовков нескольких коллекций текстов. Так же в работе построена онтология в owl формате «Методы глобальной оптимизации» в программе «Protege». Онтология построена на основе связанных данных ПрО. Построенная в данной работе онтология, дополняет структуру поиска в рамках рассматриваемой ПрО и может быть дополнена и развита в дальнейшем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Данильченко Владислав Иванович, Курейчик Виктор Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE USE OF DISTRIBUTIVE SEMANTICS IN THE IDENTIFICATION OF SIGNIFICANT COMBINATIONS OF TITLES OF SEVERAL TEXT COLLECTIONS IN THE FORMALIZATION OF LINGUISTIC EXPERT INFORMATION

The paper discusses methods of forming special models for the representation of various sets of knowledge in various information systems. The work is devoted to the application of distributive semantics in the identification of significant combinations in one subject area (PRO) within the framework of the formalization of linguistic expert information (LEI). The paper applies an approach to the formalization of LEI based on a set of analytical methods, where linear algebra is used as models. This approach makes it possible to initialize the procedure for the automatic formation of hierarchical architectures of LEI or dendrograms when identifying significant combinations of titles of several collections of texts. The scientific novelty lies in the proposed analytical approach using distributive semantics in identifying significant combinations of titles of several collections of texts, which allows for the analysis and processing of linguistic expert information. A distinctive characteristic of the proposed approach is the ability to formalize the ABM "Global Optimization Methods" based on the synthesis of various already existing hierarchies of the ABM under consideration. The paper aims to create conditions for the formalization of the LEI by applying distributive semantics when identifying significant combinations of titles of several collections. The practical value of the work lies in the development of a new approach to the formalization of LEI, taking into account distributive semantics when identifying significant combinations of titles of several collections of texts. The ontology in owl format "Methods of global optimization" in the program "Protege" is also built in the work. The ontology is built on the basis of related data about. The ontology constructed in this work complements the search structure within the framework of the considered PRO and can be supplemented and developed in the future.

Текст научной работы на тему «ПРИМЕНЕНИЕ ДИСТРИБУТИВНОЙ СЕМАНТИКИ ПРИ ВЫДЕЛЕНИИ ЗНАЧИМЫХ СОЧЕТАНИЙ ЗАГОЛОВКОВ НЕСКОЛЬКИХ КОЛЛЕКЦИЙ ТЕКСТОВ ПРИ ФОРМАЛИЗАЦИИ ЛИНГВИСТИЧЕСКОЙ ЭКСПЕРТНОЙ ИНФОРМАЦИИ»

21. Potapov V., Gushanskiy S., Guzik, V., Polenov M. The Computational Structure of the Quantum Computer Simulator and Its Performance Evaluation, In: Software Engineering Perspectives and Application in Intelligent Systems. Advances in Intelligent Systems and Computing. Springer, 2019, Vol. 763, pp. 198-207.

22. Bennett С.H., Shor P.W., Smolin J.A., Thapliyal A.V. Entanglement-assisted Capacity of a Quantum Channel and the Reverse Shannon Theorem, IEEE Transactions on Information Theory, 2002, Vol. 48, 2637.

23. Milner R.G. A Short History of Spin, In: Contribution to the XVInternational Workshop on Polarized Sources, Targets, and Polarimetry. Charlottesville, Virginia, USA, September 9-13, 2013. arXiv:1311.5016. 2013.

24. Hallgren H.S. An improved quantum Fourier transform algorithm and applications, In: Proceedings of the 41st Annual Symposium on Foundations of Computer Science, Redondo Beach, CA. IEEE, 2000, pp. 515.

25. Boneh D., Zhandry M. Quantum-secure message authentication codes, In: Proceedings of Eurocrypt, 2013, pp. 592-608

26. Potapov V., Gushansky S., Guzik V., Polenov M. Architecture and Software Imple-mentation of a Quantum Computer Model, In: Advances in Intelligent Systems and Computing. Springer, 2016, Vol. 465, pp. 59-68.

Статью рекомендовал к опубликованию д.ф.-м.н. Г.В. Куповых.

Гушанский Сергей Михайлович - Южный федеральный университет; e-mail: smgushanskiy@sfedu.ru; г. Таганрог, Россия; тел.: 88634371656; кафедра вычислительной техники; к.т.н.; доцент.

Потапов Виктор Сергеевич - e-mail: vpotapov@sfedu.ru; кафедра вычислительной техники; ассистент.

Божич Владимир Иванович - Ростовский государственный экономический университет; e-mail: vladimir.bozhich@gmail.com; г. Таганрог, Россия; тел.: 88634375501; кафедра естествознания и безопасности жизнедеятельности; к.т.н.; профессор.

Gushanskiy Sergey Mikhailovich - Southern Federal University; е-mail: smgushanskiy@sfedu.ru; Taganrog, Russia; phone: +78634371656; the department of computer engineering; cand. of eng. sc.; associate professor.

Potapov Viktor Sergeevich - е-mail: vpotapov@sfedu.ru; the department of computer engineering; assistant.

Bozhich Vladimir Ivanovich - Rostov State Economic University; e-mail: vladi-mir.bozhich@gmail.com; Taganrog, Russia; phone: +78634375501; the department of natural science and life safety;cand. of eng. sc,; professor.

УДК 004.82 DOI 10.18522/2311-3103-2022-3-139-147

В.И. Данильченко, В.М. Курейчик

ПРИМЕНЕНИЕ ДИСТРИБУТИВНОЙ СЕМАНТИКИ ПРИ ВЫДЕЛЕНИИ ЗНАЧИМЫХ СОЧЕТАНИЙ ЗАГОЛОВКОВ НЕСКОЛЬКИХ КОЛЛЕКЦИЙ ТЕКСТОВ ПРИ ФОРМАЛИЗАЦИИ ЛИНГВИСТИЧЕСКОЙ ЭКСПЕРТНОЙ

ИНФОРМАЦИИ

Рассматриваются методы формирования специальных моделей представления различных наборов знаний в различных информационных системах. Работа посвящена применению дистрибутивной семантики при выделении значимых сочетаний в одной предметной области (ПрО) в рамках формализации лингвистической экспертной информации (ЛЭИ). В работе применяется подход к формализации ЛЭИ на основе набора аналитических методов, где в качестве моделей используется линейная алгебра. Такой подход дает

возможность инициализировать процедуру автоматического формирования иерархических архитектур ЛЭИ или дендрограмм при выделении значимых сочетаний заголовков нескольких коллекций текстов. Научная новизна заключается в предложенном аналитическом подходе с применением дистрибутивной семантики при выделении значимых сочетаний заголовков нескольких коллекций текстов, который позволяет проводить анализ и обработку лингвистической экспертной информации. Отличительной характеристикой предложенного подхода является возможность формализовать ПрО «Методы глобальной оптимизации» на основе синтеза различных уже существующих иерархий рассматриваемой ПрО. В работе преследуется задача создать условия для формализации ЛЭИ путем применения дистрибутивной семантики при выделении значимых сочетаний заголовков нескольких коллекций. Практическая ценность работы заключается в разработке нового подхода в формализации ЛЭИ с учетом дистрибутивной семантики при выделении значимых сочетаний заголовков нескольких коллекций текстов. Так же в работе построена онтология в owl формате «Методы глобальной оптимизации» в программе «Protege». Онтология построена на основе связанных данных ПрО. Построенная в данной работе онтология, дополняет структуру поиска в рамках рассматриваемой ПрО и может быть дополнена и развита в дальнейшем.

Методы глобальной оптимизации; системы управления обучением; онтология; предметная область систем электронного обучения; программа «Protege»; формализация ЛЭИ; дистрибутивная семантика.

V.I. Danilchenko, V.M. Kureichik

THE USE OF DISTRIBUTIVE SEMANTICS IN THE IDENTIFICATION OF SIGNIFICANT COMBINATIONS OF TITLES OF SEVERAL TEXT COLLECTIONS IN THE FORMALIZATION OF LINGUISTIC EXPERT

INFORMATION

The paper discusses methods offorming special models for the representation of various sets of knowledge in various information systems. The work is devoted to the application of distributive semantics in the identification of significant combinations in one subject area (PRO) within the framework of the formalization of linguistic expert information (LEI). The paper applies an approach to the formalization of LEI based on a set of analytical methods, where linear algebra is used as models. This approach makes it possible to initialize the procedure for the automatic formation of hierarchical architectures of LEI or dendrograms when identifying significant combinations of titles of several collections of texts. The scientific novelty lies in the proposed analytical approach using distributive semantics in identifying significant combinations of titles of several collections of texts, which allows for the analysis and processing of linguistic expert information. A distinctive characteristic of the proposed approach is the ability to formalize the ABM "Global Optimization Methods" based on the synthesis of various already existing hierarchies of the ABM under consideration. The paper aims to create conditions for the formalization of the LEI by applying distributive semantics when identifying significant combinations of titles of several collections. The practical value of the work lies in the development of a new approach to the formalization of LEI, taking into account distributive semantics when identifying significant combinations of titles of several collections of texts. The ontology in owl format "Methods of global optimization" in the program "Protege" is also built in the work. The ontology is built on the basis of related data about. The ontology constructed in this work complements the search structure within the framework of the considered PRO and can be supplemented and developed in the future.

Methods of global optimization; learning management systems; ontology; subject area of e-learning systems; Protege program; LEIformalization; distributive semantics.

Введение. На данный момент, определение дистрибуции является одной из основных частей комбинаторной лингвистики, которая работает с синтагматическими отношениями различных моделей в языке и речи и их производные. Дистрибуция как понятие находится в одной группе с семантикой, сочетаемостью валентностью и контекстом [1-3].

Дистрибутивная семантика или векторная модель слов, представляет собой направление научных исследований, где изучается степени семантической близости в области языковых единиц в больших массивах лингвистических информации [2-4]. Такие модели все больше набирают популярность как в теоретических исследованиях, так и в практическом применении, так как, позволяют решить разнообразный спектр задач.

Рассматривая работы [2-8], можно представить архитектуру комбинаторной лингвистики, которая представлена на рис. 1. Все входящие понятия находятся в связанности и взаимозависимости. Задача комбинаторной лингвистики складывается из двух основных аспектов: уровень языковой, на основе валентности и уровень речевой на основе сочетаемости. Стоит отметить, что термин «дистрибуция» в литературе встречается в разных значениях. Первое значение - совокупность всех приближенных понятий данной ПрО. Второе значение - совокупность всех языковых сочетаний исследуемой ПрО.

Синтагматика

Рис. 1. Архитектура комбинаторной лингвистики

В случае, когда дистрибуция принимается как совокупность всех контекстов ПрО, рассматриваемые значения считаются не дифференцируемыми. Дистрибутивная семантика разделяется по параметрам: тип текста и размер текста; значение частоты встречаемости языковой единицы в исходном тексте; значение расстояния между векторами языковых единиц; значение размерности матрицы;

Концепция семантических векторных пространств (СВП) представлена в работе [7]. Основная идея такого подхода заключается в представлении каждой языковой единицы в исходном тексте в виде точки в пространстве, иными словами сумма векторов в одном векторном поле. Соседние точки в пространстве принимаются как схожие по тематике. Поисковый запрос тоже принимается за точку в этом же пространстве и инициализируется системой как документ. Сортировка документов происходит порядке уменьшения семантической близости от запроса, иными словами, в порядке возрастания расстояния от точки до точки поискового запроса. Такая система показала перспективные результаты на современных задачах. В настоящее время эта система активно используется и модернизируется, в частности, ведутся проекты по исследованию унификации модели СВП для эффективного выявления семантических связей из коллекций текстов [7-9]. Модернизация известных методов инициализации СВП происходит посредствам применения значимых словосочетаний (ЗС), а не отдельных языковых единиц. Рассматриваемые ЗС или лексические векторы, имеют свойство взаимной повторяемости.

Интерес к современным моделям СВП ростом количества источников информации, развитее разных по структуре типов хранения данных, наличие разнородных данных в больших массивах приводит к необходимости улучшения существующих методов их сортировки и последующей обработки. Описанная проблема подтверждает актуальность настоящей работы.

Подход к формализации ЛЭИ. В предложенном подходе используются принципы линейной алгебры в качестве способа инициализации модели ЛЭИ. Информационный комплекс взаимосвязанных функций лингвистических единиц рассматривается как набор векторов. В такой модели, семантическая близость лингвистических единиц рассматривается как расстояние между векторами. Полученный набор векторов формирует исходную матрицу, где вектор должен соответствовать рассматриваемому контексту.

Расстояние между векторами может быть определенно различными методами. В работе используется наиболее распространённый метод косинусной меры [8]:

_ Т?=1Х1У1

\х\\у\

(1)

В работе используется статистические меры: ассоциации и ассоциативной связанности. Такие механизмы позволяют определить связность между связанными векторами [9]. Так же в работе применяется мера, рассмотренная в работе [10], которая сравнивает частоты связанных векторов с независимыми векторами. Если такое значение больше заданного значение, то связка векторов рассматривается как константа. Такая мера обозначается М I и определяется следующим образом [10]:

f(n,c)■N

Mi = log2-

(2)

где п - первое слово вектора, с - второе слово вектора, / (п, с) - частота двух зависимых вектора, / (п) и / (с) - абсолютные частоты каждого вектора, N - общее число векторов.

В данной работе так же используется мера , которая определяет вероятность сходства двух или более векторов [11]:

Ms =

fin,с)

/(п)-/(с)

N

fin,С)

(3)

И мера , которая отражает логарифмическую функцию правдоподобия, та кая мера рассматривалась в работе [12]:

f(n,c)■N

MZ = 2X?=1/(n,c)-log2-

(4)

■ /(п)-/( с)

В данной работе применен метод «мешок термов» [13], рассмотрим более подробно представление искомого документ di в виде вектор-столбца. Длина вектор-столбца определена длиной Nw, где и у - элемент терма Wj в данном векторе. Матрица D ij - двумерный массив документов ЛЭИ, где и i j - элементы данного массива.

DU =

I¿д

^Wwi

4Nd

UjND

UNWND.

,dim(Dl;) = Nw ■ Nd

(5)

где ] = 1 , Лш а - номер строки, щ,- порядковый номер каждого терма; ] = 1 , N а -номер столбца.

Множество документов D представляется известным, при этом каждый документ - случайная независимая выборка термов, которая создана подмножеством Т. Условное распределение термов в документах р (ш | С) можно найти по частотам термов [13]. Получим матрицу распределения тем по документам О = (вк0 [11-14]:

О ki =

рО/сЮ

p{pNT Hi)

р(АЮ P(tk\di)

pOiKd) p(h\dND)

p(t¡vrK)

(6)

где dim(O) = NT ■ ND; к = 1 , iVr - номер строки; i = 1 , iVr - номер столбца; p( tk | d¿) -вероятность нахождения -го терма в i-м разделе tk; О1-вектор столбец раздела tk.

Полученная матрица тем с применением словаря терминов ПрО, переносится в пространство (вектор) понятий.

Отметим, что в реальных приложениях такого рода матрицы будут очень большими - порядка миллионов столбцов (строк). Однако благодаря тому, что подавляющее большинство элементов будет заполнено нулями, реально хранимая информация будет вполне обозримой. Для нахождения ассоциативных связей, которые могут войти в ассоциативный портрет, необходимо выбрать из этой матрицы пары терминов с самыми большими коэффициентами семантической близости (косинусной меры).

Построение онтологической модели. Рассмотрим пример построение онтологии методов глобальной оптимизации, используя описанные в данной работе подходы.

Согласно рассмотренных работ [15-18], можно выделить смысловые группы. Первая группа «Эвристические и метоэвристические подходы» включает эволюционные, поисковые, роевые и миметические методы, где эволюционные разделяются: дифференциальная эволюция; эволюционное программирование; эволюционные стратегии; генетические алгоритмы. Методы роевого интеллекта разделяются: стволовых клеток, колонии белых кротов, колонии пчел, колонии муравьев и рой частиц. Вторая группа «Детерминированные подходы» включает методы: алгебраической геометрии, ветвей и границ. Третья группа «стохастические и термодинамические подходы» включает непрерывные, стохастическое моделирование, Монте-Карло, имитация отжига. Отметим, что возможны переходы из одной группы в другую [19].

Онтологическая модель предметной области «Методы глобальной оптимизации» в программе Protege, представленной на рис. 2. Далее представлен ее онтограф (рис. 3).

| Class íi¡erareíiy: owl:Thing ШШВШЁ]!

tí ::.][K Asserted »

► Методы_глобальной_оптимизации Т ф Оврнс1ин<?скне_и_ме1<1^врис1и1есгие_иудходы

▼ # Эволюционные dJiiopiiiuu

Ф Лифференциапьнзя^попюция

# Эволн>ционное_про1р<1миров<1ние 9 Эпопюционныо стратегии

ф Генепиеские_алгоригмы

# Поиск с офаниченинми

▼ Ф Роевой_интеп*>кт ф Меюд_с1в0Л0вых_к11е10к Ф Метод колонии Ьелих кротон

# Метод_колонии_пчел

# Мсюд_колонии_мур<1вьев Ф Метод роя ЧЙСГИЦ

ф МиУ41ические_сЛ11ори1чы

▼ Ф Детерминированные подходы

Ф Метод_апге0роич<м"кой_г#омйгрии

ф Меюд_ве1веи_и_1р-1ниц

▼ Ф Сшасгачсон и термоиначичош'ис лодходы

# Дру|ие

Ф Непрерывные меюды \.....в Стохастическое_моделирование

# Монте-Карло L.....в Имитация_отжнга

Рис. 2. Онтологическая модель предметной области «Методы глобальной

оптимизации»

Онтограф (рис. 3), рассмотренной предметной области «Методы глобальной оптимизации», более наглядно отражает деление классов и индивидуальные объекты.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 3. Онтологическая модель предметной области «Методы глобальной оптимизации»

Проведя комплексный статистический анализ предметной области «Методы глобальной оптимизации», была построена онтологическая модель по способу группировки в виде коллекции [19, 20].

Заключение. В ходе работы была создана простая онтология (таксономия) по предметной области «Методы глобальной оптимизации», имеющей вид ориентированного графа, вершинами которого являются классы, дугами - свойства, представляющие направленные отношения или связи между ними. Построенная онтология является, по сути, каркасом, представлением предметной области «Методы глобальной оптимизации»». Онтологию можно расширять, путем автоматической интеграции таксономических структур, согласно предложенному в работе методу, добавлять новые связи между объектами и увеличивать количество характеристик каждого экземпляра. Разработанная онтология позволяет оперативно проводить информационный поиск в базе знаний, определять взаимосвязь между онтологическими понятиями, использоваться для проведения контент-анализа.

Перспективой дальнейшей разработки темы является разработка метода согласования выходных данных, представленных матричной структурой иерархических связей понятий, с форматом типа связанные данные, что обеспечит автоматизацию представления онтологии в owl формате.

Поддержка. Исследование выполнено за счет гранта Российского научного фонда № 22-21-00316, https://rscf.ru/project/22-21-00316/ в Южном федеральном университете.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Данильченко В.И., Курейчик В.М. Генетический алгоритм планирования размещения СБИС // Известие ЮФУ. Технические науки. - 2019. -№ 2. - С. 75-79.

2. Данильченко В.И., Данильченко Е.В. Курейчик В.М., Классификация и анализ методов решения задачи размещения СБИС // Информатика, вычислительная техника и инженерное образование. - 2018. - Вып. 1.

3. Danilchenko V.I., Danilchenko Y.V., Kureichik V.M. Bio-inspired Approach to Microwave Circuit Design // IEEE East-West Design & Test Symposium (EWDTS). - 2020.

- P. 362-366. - DIO: 10.1109/EWDTS 50664.2020.9224737.

4. Семенова А.В. Разработка лингвистической онтологии узкой предметной области // Проблемы автоматизации. Региональное управление. Связь и автоматика. - ПАРУСА-2015*: Сб. трудов IV Всероссийской научной конференции молодых ученых, аспирантов и студентов, г. Геленджик, 29-30 октября 2015 г. - Ростов-на-Дону: Изд-во ЮФУ, 2015. - Т. 1. - С. 201-209.

5. Запорожец Д.Ю., Кравченко Ю.А., ЛежебоковА.А. Способы интеллектуального анализа данных в сложных системах// Известия Кабардино-Балкарского научного центра РАН.

- 2013. - № 3. - C. 52-54.

6. Semenova A.V., Kureychik V.M. Application of Swarm Intelligence for Domain Ontology Alignment // Proceedings of the First International Scientific Conference «Intelligent Information Technologies for Industry» (IITI'16). - 2016. - P. 1-7.

7. Курейчик В.В., Курейчик В.М., Сороколетов П.В. Анализ и обзор моделей эволюции. // Известия Российской академии наук. Теория и системы управления. - 2007. - № 5.

- C. 114-126.

8. Kalentyev A.A., Garays D.V. and Babak L.I. Genetic-Algorithm-Based Synthesis of Low-Noise Amplifi ers with Automatic Selection of Active Elements and DC Biases // European Microwave Week. 2014, Rome, Italy. - P. 520-523.

9. Bagheri E., Ensan F., Feng Y., Jovanovic J, The State of the Art in Semantic Relatedness: a Framework for Comparison // The Knowledge Engineering Review. - 2017. - Vol. 32. - P. 1-30.

10. Курейчик В.В., Курейчик Вл.Вл. Архитектура гибридного поиска при проектировании // Известия ЮФУ. Технические науки. - 2012. - № 7. - C. 22-27.

11. Кравченко Ю.А. Управление знаниями как одно из направлений развития технологий открытого образования // Открытое образование. - 2015. - № 3. - C. 71-76.

12. Kravchenko Y.A., Bova V.V., Kursitys I.O. Models for Supporting of Problem-Oriented Knowledge Search and Processing // Proceedings of the First International Scientific Conference «Intelligent Information Technologies for Industry». - 2016. - Vol. 1. - P. 287-295.

13. Kravchenko Y.A., Kuliev E.V., Kursitys I.O. Information's Semantic Search, Classification, Structuring and Integration Objectives in the Knowledge Management Context Problems // Conference proceedings. 10th International Conference on Application of Information and Communication Technologies. - 2016. - P. 136-141.

14. Kravchenko Y.A., Kureichik Vl.Vl., Zaporozhets D.Yu., Zaruba D.V. Information and Knowledge Integration Based on Simulation Modeling // 9th IEEE International Conference Application of Information and Communication Technologies. - 2015. - P. 22-24.

15. Kozierkiewicz-Hetmanska A., Pietranik M. The Knowledge Increase Estimation Framework for Ontology Integration on the Concept Level // Journal of Intelligent and Fuzzy Systems.

- 2017. - Vol. 32. - P. 1161-1172.

16. Davidekova M., Gregu M. Software Application Logging: Aspects to Consider by Implementing Knowledege Management // 2nd International Conference on Open and Big Data. - 2016.

- P. 102-107.

17. Kalkowski E., Sick B., Fisch D. Knowledge Fusion for Probabilistic Generative Classifiers with Data Mining Applications // IEEE Transactions on Knowledge and Data Engineering.

- 2014. - Vol. 26. - P. 652-666.

18. Карабач А.Е. Системы интеграции информации на основе семантических технологий // Наука, техника и образование. - 2014. - № 2 (2). - C. 58-62.

19. Hernich A., Lutz C., Papacchini F., Wolter F. Dichotomies in Ontology-Mediated Querying with the Guarded Fragment // 36th Symposium on Principles of Database Systems. - 2017.

- P. 185-199.

20. Semenova A.V., Kureychik V.M. Multi-objective particle swarm optimization for ontology alignment // 10th International Conference on Application of Information and Communication Technologies (AICT). - 2016.

REFERENCES

1. Danil'chenko V.I., Kureychik V.M. Geneticheskiy algoritm planirovaniya razmeshcheniya SBIS [Genetic algorithm of VLSI placement planning],Izvestie YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2019, No. 2, pp. 75-79.

2. Danil'chenko V.I., Danil'chenko E.V. Kureychik V.M., Klassifikatsiya i analiz metodov resheniya zadachi razmeshcheniya SBIS [Classification and analysis of methods for solving the VLSI placement problem], Informatika, vychislitel'naya tekhnika i inzhenernoe obrazovanie [Informatics, computer engineering and engineering education], 2018, Issue 1.

3. Danilchenko V.I., Danilchenko Y.V., Kureichik V.M. Bio-inspired Approach to Microwave Circuit Design, IEEE East-West Design & Test Symposium (EWDTS), 2020, pp. 362-366. DIO: 10.1109/EWDTS 50664.2020.9224737.

4. Semenova A. V. Razrabotka lingvisticheskoy ontologii uzkoy predmetnoy oblasti [Development of linguistic ontology of a narrow subject area], Problemy avtomatizatsii. Regional'noe upravlenie. Svyaz' i avtomatika. - PARUSA-2015*: Sb. trudov IV Vserossiyskoy nauchnoy konferentsii molodykh uchenykh, aspirantov i studentov, g. Gelendzhik, 29-30 oktyabrya 2015 g.[ Automation problems. Regional management. Communication and automation. - SAILS-2015*: Proceedings of the IV All-Russian Scientific Conference of Young Scientists, postgraduates and students, Gelendzhik, October 29-30, 2015]. Rostov-on-Don: Izd-vo YuFU, 2015, Vol. 1, pp. 201-209.

5. Zaporozhets D.Yu., Kravchenko Yu.A., Lezhebokov A.A. Sposoby intellektual'nogo analiza dannykh v slozhnykh sistemakh [Methods of data mining in complex systemsy, Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN [Izvestiya Kabardino-Balkarian Scientific Center of the Russian Academy of Sciences], 2013, No. 3, pp. 52-54.

6. Semenova A.V., Kureychik V.M. Application of Swarm Intelligence for Domain Ontology Alignment, Proceedings of the First International Scientific Conference «Intelligent Information Technologies for Industry» (IITI'16), 2016, pp. 1-7.

7. Kureychik V. V., Kureychik V.M., Sorokoletov P. V. Analiz i obzor modeley evolyutsii [Analysis and review of evolution models], Izvestiya Rossiyskoy akademii nauk. Teoriya i sistemy upravleniya [Proceedings of the Russian Academy of Sciences. Theory and control systems], 2007, No. 5, pp. 114-126.

8. Kalentyev A.A., Garays D.V. and Babak L.I. Genetic-Algorithm-Based Synthesis of Low-Noise Amplifi ers with Automatic Selection of Active Elements and DC Biases, European Microwave Week. 2014, Rome, Italy, pp. 520-523.

9. Bagheri E., Ensan F., Feng Y., Jovanovic J, The State of the Art in Semantic Relatedness: a Framework for Comparison, The Knowledge Engineering Review, 2017, Vol. 32, pp. 1-30.

10. Kureychik V.V., Kureychik Vl.Vl. Arkhitektura gibridnogo poiska pri proektirovanii [Architecture of hybrid search in design] Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2012, No. 7, pp. 22-27.

11. Kravchenko Yu.A. Upravlenie znaniyami kak odno iz napravleniy razvitiya tekhnologiy otkrytogo obrazovaniya [Knowledge management as one of the directions of development of open education technologies], Otkrytoe obrazovanie [Open education], 2015, No. 3, pp. 71-76.

12. Kravchenko Y.A., Bova V.V., Kursitys I.O. Models for Supporting of Problem-Oriented Knowledge Search and Processing, Proceedings of the First International Scientific Conference «Intelligent Information Technologies for Industry», 2016, Vol. 1, pp. 287-295.

13. Kravchenko Y.A., Kuliev E.V., Kursitys I.O. Information's Semantic Search, Classification, Structuring and Integration Objectives in the Knowledge Management Context Problems, Conference proceedings. 10th International Conference on Application of Information and Communication Technologies, 2016, pp. 136-141.

14. Kravchenko Y.A., Kureichik Vl.Vl., Zaporozhets D.Yu., Zaruba D.V. Information and Knowledge Integration Based on Simulation Modeling, 9th IEEE International Conference Application of Information and Communication Technologies, 2015, pp. 22-24.

15. Kozierkiewicz-Hetmanska A., Pietranik M. The Knowledge Increase Estimation Framework for Ontology Integration on the Concept Level, Journal of Intelligent and Fuzzy Systems, 2017, Vol. 32, pp. 1161-1172.

16. Davidekova M., Gregu M. Software Application Logging: Aspects to Consider by Implementing Knowledege Management, 2nd International Conference on Open and Big Data. 2016, pp. 102-107.

17. Kalkowski E., Sick B., Fisch D. Knowledge Fusion for Probabilistic Generative Classifiers with Data Mining Applications, IEEE Transactions on Knowledge and Data Engineering, 2014, Vol. 26, pp. 652-666.

18. Karabach A.E. Sistemy integratsii informatsii na osnove semanticheskikh tekhnologiy [Information integration systems based on semantic technologies], Nauka, tekhnika i obrazovanie [Science, technology and education], 2014, No. 2 (2), pp. 58-62.

19. Hernich A., Lutz C., Papacchini F., Wolter F. Dichotomies in Ontology-Mediated Querying with the Guarded Fragment, 36th Symposium on Principles of Database Systems, 2017, pp. 185-199.

20. Semenova A.V., Kureychik V.M. Multi-objective particle swarm optimization for ontology alignment, 10th International Conference on Application of Information and Communication Technologies (AICT), 2016.

Статью рекомендовал к опубликованию к.т.н., доцент Ю.П. Волощенко.

Данильченко Владислав Иванович - Южный федеральный университет; e-mail: vdanilchenko@sfedu.ru; г. Таганрог, Россия; тел.: +79526088561; кафедра САПР.

Курейчик Виктор Михайлович - e-mail: vmkureychik@sfedu.ru; тел.: 88634311487; кафедра САПР; д.т.н.; профессор.

Danilchenko Vladislav Ivanovich - Southern Federal University; e-mail: vdanilchenko@sfedu.ru; Taganrog, Russia; phone: +79526088561; the department of computer-aided design; postgraduate.

Kureichik Viktor Mikhailovich - e-mail: vmkureychik@sfedu.ru; phone: +78634311487; the department of computer-aided design; dr. of eng. sc. professor.

УДК 004.272 DOI 10.18522/2311-3103-2022-3-147-158

Д.Ю. Кравченко, Ю.А. Кравченко, Э.В. Кулиев, А.Э. Саак

ЦЕНТРАЛЬНО-КОЛЬЦЕВОЙ ПОЛИНОМИАЛЬНЫЙ АЛГОРИТМ РАСПРЕДЕЛЕНИЯ ВЫЧИСЛИТЕЛЬНО-ВРЕМЕННЫХ РЕСУРСОВ

В ГРИД-СИСТЕМАХ*

Статья посвящена решению задачи распределения вычислительно-временных ресурсов в грид-системах на основе адаптации используемых полиномиальных алгоритмов к квадратичным типам заявок пользователей. Актуальность задачи обоснована значительным ростом востребованности парадигмы распределенных вычислений в условиях информационного переполнения и неопределенности. В статье рассмотрены проблемы диспетчирования гетерогенных вычислительных ресурсов при решении сложных профессиональных и научных задач, поступающих в различные моменты времени, на основе классификации по значимым признакам соответствия и готовности ресурса. Проведен сравнительный обзор существующих аналогов. Сформулирована постановка решаемой задачи в контексте выбранной тематики исследования. Обоснована проблема диспетчирования грид-систем с централизованной архитектурой, которая использует технологию мульти-сайтного выполнения задач. Применение данной архитектуры требует разработки эвристических алгоритмов распределения вычислительных ресурсов с функцией учета свойств массивов заявок пользователей и оценки соответствия расписания. Исключение возникновения ошибок диспетчирования требует разработки формального аппарата, который будет выявлять закономерности множества заявок, введет их типизацию и построит эвристические алгоритмы с оценкой качества, адаптированные под соответствующие типы. Разработка такого формального аппарата несомненно является актуальной задачей. Не менее важной задачей в рамках создания данного аппарата является построение модели паритетности ресурсов и моделей взаимодействия пользователей и вычислительной

*

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 20-01-00148.

i Надоели баннеры? Вы всегда можете отключить рекламу.