Научная статья на тему 'AUTOMATED SYSTEM-COGNITIVE ANALYSIS OF THE FREQUENCY DISTRIBUTION OF THE AUTHOR'S PUBLICATIONS ON SCIENTIFIC SPECIALTIES OF THE HIGHER ATTESTATION COMMISSION OF THE RUSSIAN FEDERATION OF THE NEW NOMENCLATURE'

AUTOMATED SYSTEM-COGNITIVE ANALYSIS OF THE FREQUENCY DISTRIBUTION OF THE AUTHOR'S PUBLICATIONS ON SCIENTIFIC SPECIALTIES OF THE HIGHER ATTESTATION COMMISSION OF THE RUSSIAN FEDERATION OF THE NEW NOMENCLATURE Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
48
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
AUTOMATED SYSTEM-COGNITIVE ANALYSIS / ASC-ANALYSIS / INTELLIGENT SYSTEM "EIDOS" / SPECIALTIES OF THE HAC RF OF NEW NOMENCLATURE / CLASSIFICATION / SCIENTIFIC PAPERS / PUBLICATIONS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Lutsenko Evgeny Veniaminovich

The purpose of the article is to develop an intelligent system of automated classification of publications on scientific specialties of the HAC RF of a new nomenclature. To achieve this goal, a well-known artificial intelligence method has been applied: automated system-cognitive analysis and its software tools - the intelligent system called "Eidos". As a result of the work, an intelligent cloud-based Eidos application has been created, placed in full open free access, which can be successfully used by everyone to achieve their goal with their texts. The work provides a detailed numerical example of achieving this goal, based on the author's real publications in the Scientific Journal KubSAU for 20 years of his work: from 2003 to 2023. The relevance of the work is due to the fact that for the new nomenclature of scientific specialties of the HAC RF, an intelligent classification system of publications, which is in full open free access, was created for the first time

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «AUTOMATED SYSTEM-COGNITIVE ANALYSIS OF THE FREQUENCY DISTRIBUTION OF THE AUTHOR'S PUBLICATIONS ON SCIENTIFIC SPECIALTIES OF THE HIGHER ATTESTATION COMMISSION OF THE RUSSIAN FEDERATION OF THE NEW NOMENCLATURE»

UDC 004.8

УДК 004.8

5.2.2. Математические, статистические и инструментальные методы экономики (физико-математические науки, экономические науки)

АВТОМАТИЗИРОВАННЫЙ СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ ЧАСТОТНОГО РАСПРЕДЕЛЕНИЯ ПУБЛИКАЦИЙ АВТОРА ПО НАУЧНЫМ СПЕЦИАЛЬНОСТЯМ ВАК РФ НОВОЙ НОМЕНКЛАТУРЫ

Луценко Евгений Вениаминович

д.э.н., к.т.н., профессор

Web of Science ResearcherID S-8667-2018

Scopus Author ID: 57188763047

РИНЦ SPIN-код: 9523-7101

prof. lutsenko@gmail.com

http://lc.kubagro.ru

https://www.researchgate.net/profile/Eugene Lutsen ko

Кубанский Государственный Аграрный университет имени И. Т. Трубилина, Краснодар, Россия

Цель работы состоит в разработке интеллектуальной системы автоматизированной классификации публикаций по научным специальностями ВАК РФ новой номенклатуры. Для достижения этой цели применен известный метод искусственного интеллекта: автоматизированный системно-когнитивный анализ и его программный инструментарий -интеллектуальная система «Эйдос». В результате работы создано интеллектуальное облачное Эйдос - приложение, размещенное в полном открытом бесплатном доступе, которое может быть с успехом применено всеми желающими для достижения поставленной цели со своими текстами. В работе приводится подробный численный пример достижения поставленной цели, основанный на реальных публикациях автора в Научном журнале КубГАУ за 20 лет его работы: с 2003 по 2023 годы. Актуальность работы обусловлена тем, что для новой номенклатуры научных специальностей ВАК РФ интеллектуальная система классификации публикаций, находящаяся в полном открытом бесплатном доступе, создана впервые

Ключевые слова: АВТОМАТИЗИРОВАННЫЙ СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ, АСК-АНАЛИЗ, ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА «ЭЙДОС», СПЕЦИАЛЬНОСТИ ВАК РФ НОВОЙ НОМЕНКЛАТУРЫ, КЛАССИФИКАЦИЯ, НАУЧНЫЕ РАБОТЫ, ПУБЛИКАЦИИ

5.2.2. Mathematical, statistical and instrumental methods of economics (physical and mathematical sciences, economic sciences)

AUTOMATED SYSTEM-COGNITIVE ANALYSIS OF THE FREQUENCY DISTRIBUTION OF THE AUTHOR'S PUBLICATIONS ON SCIENTIFIC SPECIALTIES OF THE HIGHER ATTESTATION COMMISSION OF THE RUSSIAN FEDERATION OF THE NEW NOMENCLATURE

Lutsenko Evgeny Veniaminovich

Doctor of Economics, Candidate of Technical Sciences,

Professor

Web of Science ResearcherID S-8667-2018 Scopus Author ID: 57188763047 RSCI SPIN code: 9523-7101 prof.lutsenko@gmail.com http://lc.kubagro.ru https://www.researchgate.net/profile/Eugene Lutsenko

Kuban State Agrarian University named after I. T. Trubilin, Krasnodar, Russia

The purpose of the article is to develop an intelligent system of automated classification of publications on scientific specialties of the HAC RF of a new nomenclature. To achieve this goal, a well-known artificial intelligence method has been applied: automated system-cognitive analysis and its software tools - the intelligent system called "Eidos". As a result of the work, an intelligent cloud-based Eidos application has been created, placed in full open free access, which can be successfully used by everyone to achieve their goal with their texts. The work provides a detailed numerical example of achieving this goal, based on the author's real publications in the Scientific Journal KubSAU for 20 years of his work: from 2003 to 2023. The relevance of the work is due to the fact that for the new nomenclature of scientific specialties of the HAC RF, an intelligent classification system of publications, which is in full open free access, was created for the first time

Keywords: AUTOMATED SYSTEM-COGNITIVE ANALYSIS, ASC-ANALYSIS, INTELLIGENT SYSTEM "EIDOS", SPECIALTIES OF THE HAC RF OF NEW NOMENCLATURE, CLASSIFICATION, SCIENTIFIC PAPERS, PUBLICATIONS

http://dx.doi.org/10.21515/1990-4665-190-007

CONTENT

1. INTRODUCTION............................................................................................................................................2

2. GOALS, OBJECTIVES AND METHODS.............................................................................................................3

3. RESULTS.......................................................................................................................................................3

Task-1. Cognitive structuring of the subject area...........................................................................3

Task-2. Formalization of the subject area..........................................................................................3

Task-3. Synthesis of statistical and system-cognitive models........................................................5

Task-4. Model Verification.....................................................................................................................5

Task-5. Choosing the Most Reliable Model.........................................................................................6

Task-6. Solution of the problem of identification (classification).................................................6

4. DISCUSSION................................................................................................................................................19

5. CONCLUSION, CONCLUSIONS AND RECOMMENDATIONS...........................................................................19

BIBLIOGRAPHY...............................................................................................................................................20

1. Introduction

The formation of an academic and scientific school in a certain scientific specialty of the Higher Attestation Commission of the Russian Federation (HAC RF) of the new nomenclature involves the creation of an effective system of scientific publications in this field of science. In addition, when scientists are included in dissertation councils, editorial councils of scientific journals, as well as when they are involved as experts and reviewers, the question arises whether these scientists have publications in the relevant fields of science in which they are supposed to work.

Therefore, it is of interest to form the frequency distribution of articles, monographs and textbooks of a certain specific author in the specialties of the HAC RF of the new nomenclature. This paper provides a numerical example of achieving the set goal, based on real publications of the author of this work in the Scientific Journal of KubSAU for 20 years of his work: from 2003 to 2023 and several other publications. This issue is considered in more detail in the works [13, 14] of the source [1].

Traditionally, the answer to this question is given by experts who do it in a non-formalized way based on their intuition, experience, and professional competence.

The disadvantages of the traditional hike are:

- a certain subjectivity and incomparability of expert assessments;

- high costs of labor and time of experts, the high cost of their work;

- the danger of insufficient consideration of scientific specialties that are little known to experts (systemic problems);

- difficulties in finding and attracting experts to work due to their small number and very high workload.

Another option for solving this problem is to refer to the corresponding RSCI: https://elibrary.ru/author_profile.asp?id=123162 (picture 1):

Drawing1- Distribution of publications by subject in the RSCI

However, the RSCI software solves this problem not by analyzing the texts of publications and comparing them with the passports of scientific specialties of the HAC RF of the new nomenclature, but on the basis of information about the publication belonging to one or another scientific direction provided by the author of this publication himself. In fact, this is no different from the method of expert assessments, if the author of the publication is considered an expert. This means that the shortcomings of the method of expert assessments listed above also occur in this case, which cannot suit us.

The problem and purpose of this article are formulated in the works [13, 14] of the source [1].

2. Goals, objectives and methods

The goals and objectives of the methods used in the article are formulated in the works [13, 14] of the source [1].

3. Results

Task-1. Cognitive structuring of the subject area

The results of solving Task 1 are described in detail in [13, 14] of the source [1].

Task-2. Formalization of the subject area

The results of solving Task 2 are described in detail in [13, 14] of the source [1].

Applied API-2.3.2.1 (Figure 2), (Table 1) which provides data entry into

he Eidos system from text files.

Drawing2- Screen control form API-2.3.2.1 of the Eidos system with parameters for

formalizing the subject area

Table1- Classification scales and gradations of scientific specialties of the HAC RF

Code Name of the scientific specialty of the HAC RF

1 CLASS-1.1.1. Real, complex and functional analysis

2 CLASS-1.1.10. Biomechanics and bioengineering

3 CLASS-1.1.2. Differential Equations and Mathematical Physics

7 CLASS-1.1.6 Computational Mathematics

8 CLASS-1.1.7 Theoretical mechanics, machine dynamics

9 CLASS-1.1.8 Solid Mechanics

10 CLASS-1.1.9 Mechanics of liquid, gas and plasma

eleven CLASS-1.2.1 Artificial intelligence and machine learning

12 CLASS-1.2.2 Mathematical modeling, numerical methods and software packages

13 CLASS-1.2.3 Theoretical computer science, cybernetics

14 CLASS-1.2.4 cyber security

15 CLASS-1.3.1 Space physics, astronomy (branch of science - technical)

16 CLASS-1.3.1 Space physics, astronomy (branch of science - physical and mathematical)

17 CLASS-1.3.10. Physics of low temperatures (branch of science - technical)

18 CLASS-1.3.10. Physics of low temperatures (branch of science - physical and mathematical)

19 CLASS-1.3.11. Physics of semiconductors (branch of science - physical and mathematical)

20 CLASS-1.3.12. Physics of magnetic phenomena (branch of science - technical)

21 CLASS-1.3.12. Physics of magnetic phenomena (branch of science - physical and mathematical)

22 CLASS-1.3.13. Electrophysics, electrophysical installations (branch of science - technical)

23 CLASS-1.3.13. Electrophysics, electrophysical installations (branch of science - physical and mathematical)

24 CLASS-1.3.14. Thermal physics and theoretical heat engineering (branch of science - technical)

25 CLASS-1.3.14. Thermal physics and theoretical heat engineering (branch of science - physical and mathematical)

Task-3. Synthesis of statistical and system-cognitive models

The results of solving problem 3 are described in detail in [13, 14] of the source [1].

Synthesis and verification of models in the Eidos system is carried out in mode 3.5 (Figure 3).

f*) 3.5. Синтез и верификация моделей

—Задайте модели для синтеза и верификации-

Статистические базы:

W 1. ABS - частный критерий: количество встреч сочетаний: "класс-признак" у объектов обуч.выборки Задайте источник данным для расчета модели ABS:

f? Обучающая выборка Г Abs Г Ргс1 Г Ргс2 Г Infi Г Inf2 Г Inf3 Г Inf4 С Inf5 Г Inf6 Г Inf7 Задайте значение Фона в матрице абсолютным частот: | 0,0000000 Помощь

W 2. PRC1 - частный критерий: усл. вероятность ¡-го признака среди признаков объектов j-го класса W 3. PRC2 - частный критерий: условная вероятность i-го признака у объектов j-го класса Систем но-когнитивные модели (базы знаний):

4. INF1 - частный критерий: количество знаний по А.Харкевичу; вероятности из PRC1

W 5 R 6 W 7 R 8

W э

INF2 - частный критерий: количество знаний по А.Харкевичу; вероятности из PRC2

INF3 - частный критерий: Хи-квадрат, разности между Фактическими и ожидаемыми абс.частотами

INF4 - частный критерий: ROI (Return Gn Investment); вероятности из PR CI

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

INF5 - частный критерий: ROI (Return Gn Investment); вероятности из PRC2

INF6 - частный критерий: разн.усл.и безусл. вероятностей; вероятности из PRC1

W 10.INF7 - частный критерий: разн.усл.и безусл.вероятностей; вероятности из PRC2

—Текущая модель

Г 2. PRC1 Г 3. PRC2

Г 4

Г 5

а 6

Г 7 Г 8 Г Э

INF1 INF2 INF3 INF4 INF5 INF6

П араметры копирования обучающей выборки в распознаваемую (бутстрепный подход): —Какие объекты обуч.выборки копировать: — Пояснение по алгоритму верификации |

(• Копировать всю обучающую выборку С Копировать только текущий объект С Копировать каждый N-й объект С Копировать N случайных объектов С Копировать объекты от N1 до N2 (fastest) С Вообще не менять распознаваемую выборку

—Удалять из обуч.выборки скопированные объекты: С* Не удалять С Удалять

Подробнее

Измеряется внутренняя достоверн. модели

Для каждой заданной модели выполнить: (* Синтез и верификацию С Только верификацию С Только синтез

Задайте процессор-

Г CPU Г? jGPUj

—Отображать процесс?— (*" Без визуализации: С Визуализация 3 с.

—Использование только наиболее достоверных результатов распознавания: Паар.сН^ и целесобразность применения бутстрепного подхода Расчетный размер БД результатов распознавания Разр.сН^ равен 6516244 байт, т.е.: 0.3034363 % от МАХ-возможного, (от 2Гб) Задайте, сколько X от исходной БД Разр.с1Ы ОСТАВИТЬ, удаляя наименее достоверные результаты распознавания: | 1 г 0000000 В примении бутстрепного подхода нет необходимости. Синтез и верификация моделей будут выполнены на основе всей выборки.

J

J

Drawing3- Screen form of the mode of synthesis and verification of models

Task-4. Model Verification

Model verification, i.e. assessment of their reliability, carried out by classifying the passports of scientific specialties for these specialties. Figure 4 shows that decisions about not belonging to a class are always true, and decisions about belonging are both true and false, and it is clear which decisions with what level of similarity it makes sense to pay attention to (these are decisions with a similarity level above 70%), and which ones it would be correct to ignore as most likely unreliable (Figure 4) [1].

Drawing4- Frequency distributions of the number of positive and negative true and false solutions depending on the level of similarity of training sample objects with classes

in the Inf3 model

Task-5. Choosing the Most Reliable Model

As the current model for solving the problem of identification (classification) in mode 5.6, we set the model Inf3 [1].

Task-6. Solution of the problem of identification (classification)

Information source about the scientific articles of the author published in the Scientific Journal of KubSAU for 20 years of his work from 2003 to 2023 is the journal itself: http://ei.kubagro.ru/a/viewaut.asp?id=n, as well as RSCI: https://elibrary.ru/author_items.asp?authorid=123162 and the author's website: http://lc.kubagro.ru/aidos/_Aidos-X.htm.

However, downloading articles from these sources for manual analysis one by one is extremely inconvenient and time consuming, especially if there are a lot of them. Therefore, in the intellectual system "Eidos", which is currently a software tool for ASC-analysis, in mode 1.1, the ability to download the full texts of all the author's publications from the Scientific Journal of KubSAU (Figure 5) is implemented:

О [с] Авторизация в системе ЭЙД0С-Х+ н

X

Задайте имя и пароль:

IB-

Login : Password:

F

Advantage Database Server (ADS) - OFF

Особенности работы в системе:

1. Если система в данной папке запускается впервые, то будет произведена ЛОКАЛИЗАЦИЯ системы, т.е. будут удалены все приложения и пользователи и заново прописаны пути на все базы данных

по Фактическому расположению системы.

2. Новое окно главного меню можно открывать только после закрытия всех предыдущих.

Главное, что делает система:

1. Альберт Эйнштейн писал, что научные законы это лишь высказывания о повторениях в наблюдаемых явлениях. Конечно наверное он имел в виду не сами законы природы, а лишь Формулировки этих

законов. В системе "Эйдос"эти наблюдения повторений называются событиями или Фактами.

2. Например, Фактом является наблюдение определенного значения какого-либо свойства у объектов некоторой обобщенной категории (класса), или наблюдение определенного значения Фактора при переходе объекта в будущее состояние, соответствующее к классу.

3. Система "Эйдос" выявляет эмпирические закономерности в Фактах и тем самым преобразует исходные данные в информацию, а ее в знания и решает на основе этих знаний задачи идентификации, прогнозирования, принятия решений и исследования моделируемой предметной области путем исследования ее модели.

4. Кроме того система 'Эйдос" выводит информацию об обнаруженных закономерностях в большом количестве разнообразных и оригинальных текстовых, табличных и графических выходных Форм.

Работы автора системы 'Эйдос" проФ.Е.В.Луценко.С* по АСК-анализу и системе 'Эйдос":

Кратко об АСК-анализе

Подборки публикаций по АСК-анализу

Скачать все публикации проф.Е.В.Луценко из Научного журнала КубГАУ (> 2 Гб)

СЕРТИФИКАТ об освоении системы "Эйдос" от проф.Е.В.Луценко. ПОДДЕРЖКА

Ok

Cancel

Drawing5- The first screen form of the "Eidos" system (1 of 4 options) with a button for downloading the full texts of all the author's publications from the Scientific Journal of

KubSAU

After downloading the publications for input into the Eidos system, they were supplemented with some monographs and tutorials (resulting in 313 files of scientific papers), and then converted from doc (x) format to DOS-TXT format using a small written1in Python converter, the source code of which is given below. This conversion process took several minutes.

Author

import os

from docx import Document import win32com.client

def convert_doc_to_txt(doc_path, txt_path):

word_app = win32com.client.Dispatch("Word.Application")

word_app.Visible = False

doc = word_app.Documents.Open(doc_path)

doc.SaveAs(txt_path, FileFormat=7)

doc.Close()

word_app.Quit()

def batch_convert_to_txt(doc_directory, txt_directory):

doc_files = [f for f in os.listdir(doc_directory) if f.endswith('.doc') or f.endswith('.docx')] total_files = len(doc_files) processed_files = 0

for file_name in doc_files:

doc_path = os.path.join(doc_directory, file_name)

txt_path = os.path.join(txt_directory, os.path.splitext(file_name)[0] + '.txt') try:

if file_name.endswith('.docx'): doc = Document(doc_path)

text = ' '.join([paragraph.text for paragraph in doc.paragraphs]) with open(txt_path, 'w', encoding='utf-8') as txt_file: txt_file.write(text) elif file_name.endswith('.doc'):

convert_doc_to_txt(doc_path, txt_path)

processed_files += 1

print(f'Преобразование файла {processed_files}/{total_files}: {file_name}') except Exception as e:

print(f'Произошла ошибка при преобразовании файла {file_name}: {str(e)}')

printOПреобразование завершено. ')

# Укажите путь к директории с файлами .doc и .docx doc_directory = 'C:/4/'

# Укажите путь к директории, куда сохранить текстовые файлы txt_directory = 'C:/4/'

batch_convert_to_txt(doc_directory, txt_directory)

DOS-TXT publication files were recoded to OEM866 encoding in an offline converter: https://anton-pribora.ru/recoder/, and then entered into the Eidos system in the automated programming interface API-2.3.2.1 (Figure 6).

The process of entering 313 publications of the author into the Eidos system took about 4 hours in total (Figure 7).

2.3.2.1. Импо рт да н н ых из тексто в ых ф а й л о е

X

У к а ж ит е Ф о р м ат т е к ст о б ь i :■: ф а й л об : ГГХТ! С D □ С

Укажите кодировку исходны:-: Файлов: Г" ANSI (Windows] ASCII-ÜEMS66 (DOS)

Перекодировщик TXT -файлов

В качестве признаков рассматривать:

Слова Р Мемы (сочетания слов) Кол-во симв.в словак >:

| П р о б од ит ь л е м м ат и з а ц и ю ?

—Задайте режим:

Г" Формирование классификационных и описательных шкал и градаций и обуч.выборки

Формирование рас п. выборки с имеющимися шкалами и градациями после реж.2.3.2.1 Г" Формирование расп.выборки с имеющимися шкалами и градациями после реж.2.3.2.2

Исходные файлы брать из папки распознаваемой выборки: с:^ь^05-Х,,'АЮ_ОАТА\1 пр_гагрЧ | Формировать БД 1пр_с1а*а.с1Ы стандарта 2.3.2.2 для создания моделей продолжения Фраз?

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

—В каком стандарте закодированы имена исходных Ф-айлов:

Г" В 1-м стандарте "Эйдос": "id1.......idri.. Имя класса" брать из имени Ф-айла

■С*" Во 2-м стандарте "Э йд ос": 11И м я к л а с са- ft ft ft ft ft it ft ft ft. t xt" б p ат ь из имени файла Г" В стандарте "http://kaggle.com/": "id. Class name" брать из текста Файла

Ok

Cancel

CÜ Помощь по режиму: 2,3.2.1. Импорт данных из текстовых файлов. (С) Система "ЗЙДОС-Х+ +

Режим: "2.3.2.1. ИМПОРТ ДАННЫХ ИЗ ТЕКСТОВЫХ ФАЙЛОВ", предназначен для автоматизации ввода ОПРЕДЕЛЕНИИ [т.е. онтологий) объектов обучающей выборки, т.е. для описания конкретных объектов предметной области путем указания более общих категорий, к которым они относятся (принадлежность к классам), а также указания признаков, отличающих одни объекты от других. На основе ряда определений конкретных объектов, рассматриваемых как примеры конкретных реализаций обобщенных классов [Эйдосов), система "Эйдос" автоматически Формирует определения этих обобщенных классов.

Имена классов Формируются либо из имени Файла (два стандарта 'Эйдос"), либо из самого текста Файла (стандарт Kaggle). В 1 -м стандарте "Эйдос" для описания объектов используются текстовые Файлы, наименования и элементы наименований которых, отделенные друг от друга и от расширения Файла запятой, рассматриваются как классы. Во 2-м стандарте "Эйдос" если в конце имени Файла есть девяти разрядное число перед которым стоит тире, то весь текст до этого тире рассмаривается как имя класса: "Имя класса-ttttfttttttt ft tttt.txt". Если же тире и числа за ним в имени Файла нет, то как имя класса рассматривается все имя Файла. Как признаки всегда рассматриваются слова и сочетания нескольким подряд идущим слов (мемы) в самих Файлах (см. Ричард Броуди, "Психические вирусы", http://www.twirpx.com/file/2699B7/).

Файлы могут быть различных Форматов TXT, DO С, HTMLc соответствующими расширениями(последние 2 в разработке) и различной кодировки: ANSI [Windows] или AS CI 1-0 ЕМ 8ЕБ (DOS). В текущей версии системы "Эйдос" реализована только обработка txt-файлов кодировки OEM8G6.

Файлы помещаются в папку: ../AID_DATA/Inp_data/. Система анализирует эти Файлы и создает новое приложение с наименованием: "2.3.2.1. АСК-анализ мемов и атрибуция текстов", т.е. Формирует классификационные и описательные шкалы и градации, а затем и обучающую выборку, описывающую эти Файлы или объекты реальной области, описанные этими Файлами. Этого вполне достаточно для синтеза и верификации модели, например в режиме 3.5.

Если задана опция: "Проводить лемматизацию", то слова заменяются их леммами, т.е. исходными словами, из которых они образованы, в форме существительных единственного числа в именительном падеже. Это позволяет существенно сократить размерность модели. Если при Формализации предметной области проводилась лемматизация, то ее НАДО обязательно проводить и при вводе распознаваемой выборки. Если же при Формализации предметной области лемматизация не использовалась, то и при вводе распознаваемой выборки ее проводить не нужно.

База леммаггизации дана Дмитрием Тумайкиным в статье: https://habrahabr.ru/company/realweb/blog/265375/, за что огромная ему благодарность. Автор лишь незначительно модифицировал ее [программно), представив в виде одной таблицы DBF-Формата: адрес для скачивания: http://lc.kubagro.ru/Lemma.rar. В основу этой базы положена база, созданная Зализняком Андреем Анатольевичем, дополненная современными словоформами. База лемматизации "Lemma.dbf" содержит более 2 млн.слов. Она может быть сброшена или скорректирована в режиме 5.13. Если ее сбросить, то фактически лемматизация не проводится, т.к. все слова будут рассматриваться как новые. Новые слова отмечаются как <NEW> и их леммы должны быть введены в режиме 5.13 вручную.

Если задана опция: "Формировать БД lnp_data.dbf и т.д.", то создается база для программного интерфейса 2.3.2.2, в которой в качестве класса выступают последующие слова, а в качестве признаков - предшествующие слова (одно или несколько, сколько задано). Это позволяет строить модели, отражающие взаимосвязи слов в предложениях, позволяющие прогнозировать какое слово будет следующим, если известны одно или несколько предыдущих слов.

Кроме того данный режим позволяет сформировать распознаваемую выборку на уже имеющихся классификационных и описательных шкалах и градациях, созданных в режимах 2.3.2.1 и 2.3.2.2, на основе текстовых Файлов в папке: ,./AID_DATA/lnp_data/ или ,./AID_DATA/lnp_rasp/.

Имена исходных Файлов могут быть закодированы в режиме 2.3.2.1 в трех стандартах: В 1-м стандарте "Эйдос": "id1 ,...,idn, Имя класса" брать из имени Файла Во 2-м стандарте "Эйдос": "Имя класса-ftftfttt ft ttttftft.txt" брать из имени Файла В стандарте "http://kaggle.com/": "id. Class name" брать из текста Файла.

Drawing6- Screen forms API-2.3.2.1 of the Eidos system

ClV АР 1-2.3.2.1. Импорт данных из текстовых файлов

X

I

Создание распознаваемой выборки для приложения: "АСК-анализ мемов и атрибуция текстов в модели 2.3.2.1 " путем импорта данных из текстовых Файлов завершено успешно! Теперь в режиме 4.1.2 необходимо провести классификацию (атрибуцию) текстов в наиболее достоверной модели, заданной текущей в режиме 5.6.

Ok

Статистика

X

Статистика:

Страниц И 598

Слов 3 395 177

Знаков (без пробелов) 20 137 1В6

Знаков (с пробелами) 26 5 20 354

Абзацев 626 261

Строк 804 237

Учитывать надписи и сноски

| Закрыть ;

Drawing7- Screen forms API-2.3.2.1 of the Eidos system

It would seem that the process of encoding the source data lasted quite a long time. But it must be taken into account that the total volume of source text files in the DOS-TXT format is very large and amounted to about 27 MB, which is 24150 pages in 16th Times New Roman font, 3395177 words, 26520364 characters, which approximately corresponds to the volume of 40 monographs of 600 sheets each. These input data parameters were set using the ALLTXT.TXT file, which was obtained by combining all 313 DOS-TXT input files into one file with the command: "COPY *.TXT ALLTXT.TXT".

As a result, we get a recognizable sample (Figures 8).

The results of solving problem 1 are described in detail in [13, 14] of the source [1].

To compare 313 publications with passports of scientific specialties of the HAC RF of the new nomenclature according to their texts, we will first launch mode 5.6 to set the system-cognitive model in which we will do this (Inf3 SC-model) (Figure 9), and then mode 4.1.2 ( figure 10).

It should be noted that a quantitative comparison of each of the 313 articles published in the Scientific Journal of KubSAU over 20 years of its work with 361 classes corresponding to the scientific specialties of the HAC RF of the new nomenclature, according to 15101 signs (words) was carried out by the Eidos system on a graphic processor (GPU ) ASUS GeForce GTX770 graphics cards with NVIDIA GK104 graphics processor with 1536 shader processors in 1

minute 43 seconds. According to the author, this is a good result, because obtaining it required

313 * 361 * 15101= 1706307293 summation of products and calculation of 11 output forms based on the results of recognition, moreover, the output forms were calculated on the central processor (CPU i7) and 99.9% of the time was spent on calculating the output forms.

О 4,1.1, Ручной ввод-корректировка распознаваемой выборки [режим сисадмина). Текущая модель: "INF1"

Кщ объекта Дата Время

304 BigData52.tKt 18.05.2В23 11:23:30

305 BigData53.M 18.05.2В23 11:28:38

306 BigData64.M 18.05.2В23 11:35:05

307 BigData65.M 18.05.2В23 11:41:42

308 BigData66.M 18.05.2В23 11:48:30

309 BigDala7.lxl 1В.05.2В23 11:48:48

310 BigData91.txt 1B.05.2D23 11:50:33

311 BigDala92.txt 1B.05.2D23 11:58: 10

312 BigData93.txt 1В.05.2В23 12:01:25

313 BigDaIa39.tKt 18.05.2023 12:01:45

h iT

К ед о&ъекта Класс 1 Класс 2 Класс 3 Класс 4 * Код о&ьекта | Признак! | Признак 2 Признак 3 Признак 4 | Признак 5 | Признак 6 | Признак 7 —

313 0 D D 0 313 137G7 5732 ЕВ37 382 1460 14509 13670

313 4457 3310 ЕВЕ1 2437 11033 БЭОО 6353

313 12226 14510 11В43 8764 1457 14502 4457

313 3310 6795 1460 6968 10409 14508 13670

313 3714 8436 7154 4231 4284 2648 2645

313 5143 8534 6В60 10214 8739 14578 8652 —

313 6953 10751 6353 12607 2648 15060 8630

313 383 14505 13671 8338 10385 12875 3738

313 14436 10385 3730 5782 6137 7473 2648

313 126В5 6137 8778 3383 817В 3370 8130

313 1080 10388 385 2645 1357В 6124 14505

• 717 17С71 71 70 оосо 1 ОО it с 1 .1077 □ 77 i -rj-r.

Скопировать распвыб.в обуч.

Добавить объект

Добавить признаки

Удалить классы

Удалить признаки

Drawing8- Screen forms of the recognizable sample (fragment)

О 5.6. Выбрать модель и сделать ее текущей

X

Задайте текущую стат. модель или модель знаний Статистические базы:

С П. ABS - частный критерий: количество встреч сочетаний: "класс-признак" у объектов обуч.выборки С 2. PRC1 - частный критерий: усл. вероятность i-ro признака среди признаков объектов ¡-го класса С 3. PRC2 - частный критерий: условная вероятность i-ro признака у объектов ¡-го класса Системно-когнитивные модели (Базы знаний):

С 4. IHF1 - частный критерий: количество знаний по А.Харкевичу; вероятности из PRC1

С 5. INF2 - частный критерий: количество знаний по А.Харкевичу; вероятности из PRC2

(*" G. INF3 - частный критерий: Хи-квадраг, разности между Фактическими и ожидаемыми абс.частотами

С 7. INF4 - частный критерий: RGI [Return On Investment); вероятности из PRC1

С 8. INF5 - частный критерий: RGI [Return On Investment); вероятности из PRC2

Г Э. INF6 - частный критерий: разн.усл.и безус л. вероятностей; вероятности из PRC1

Г 10.INF7 - частный критерий: разн.усл.и безусл.вероятностей; вероятности из PRC2

Как задавать параметры синтеза моделей В качестве текущей можно задать любую из ранее расчиганных в режимах 3.1, 3.2, 3.3 или 3.4 стат. моделей и моделей знаний, но до исследования достоверности моделей в режиме 3.5 рекомендуется выбрать в качестве текущей базу знаний INF1. Смысл моделей знаний, применяемых в системе 'Эйдос-Х++" раскрыт в публикациях, размещенных по адресам: http://lc.kubagro.ru/aidos/index.htm, http://www.twirpx.corn/file/793311 /

□ к

Cancel

Ö 5,6. Выбрать модель и сделать ее текущей

X

Стадии исполнения процесса

ОПЕРАЦИЯ: ПРИСВОЕНИЕ МОДЕЛИ "№3" СТАТУСАТЕКЫЩЕИ МОДЕЛИ:

1/7 2/7 3/7 4/7 5/7 В/7 7/7

Копирование в массивы итоговых строк и столбцов текущей модели- Готово Перенос информации из текущей модели в базы классов: Classes и Gr_CISc- Готово Перенос информации из текущей модели в базы признаков: Attributes и Gr_OpSc- Готово Расчет значимости класс.и опис.шкал-Сброс сумматоров - Готово Расчет значимости класс.и опис.шкал-Накопление данных- Готово Расчет значимости класс.и опис.шкал-Дорасчет - Готово Запись информации о текущей модели- Готово

Выбор модели знаний "1^3" в качестве текущей прошел успешно!!!

Прогноз времени исполнения

Начало: 22:04:17

Окончание: 22:17:23

100%

Ok

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Прошло: 0:13:12

Осталось: 0:00:00

Drawing9- Screen forms of mode 5.6 of the Eidos system

C_J 4.1.2. Пакетное распознавание в текущей и... — □ X

На каком процессоре выполнять распознавание:

(" На центральном процессоре (CPU) (* На графическом процессоре (GPU)

Отображать стадию процесса исполнения ?

(• |Без визуализации:: С Визуализация 3 с.

Модель для распознавания задается в режиме 5.6

Учитывать только наиболее достоверные результаты распознавания: с МОДУЛЕМ интегрального критерия "Резонанс знаний" не менее: | 0,0000000 £

_Qk_| Cancel

О 4.1.2. Пакетное распознавание, Текущая модель: "INF3" — □ X

—Стадии исполнения процесса

ОПЕРАЦИЯ: ПАКЕТНОЕ РАСПОЗНАВАНИЕ В ТЕКУЩЕЙ МОДЕЛИ "INF3":

1/11: GPU-Распознавание (идентификация) 313 объектов распознаваемой выборки- Готово

2/11: Расчет распределений уровней сходства верно и ошиб.идент.объектов: 100.0000000%- Готово

3/11: Создание сжатых полных форм результатов распозн.по двум интегр.крит.: 100.0000000%- Готово

4/11: Создание подр.нагл.формы: "Объект-классы". Инт.крит.-корреляция: 100.0000000%- Готово

5/11: Создание подр.нагл.формы: "Объект-классы". Инт.крит.-сумма инф.: 100.0000000%-Готово

Б/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит.-корреляция: 100.0000000%- Готово

7/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит.-сумма инф.: 100.0000000%- Готово

8/11: Создание подробной наглядной формы: "Класс-объекты". Инт.крит.-корреляция: 100.0000000%- Готово

9/11: Создание подробной наглядной формы: "Класснобъекты". Инт.крит.-сумма инф.: 100.0000000%- Готово

10/11: Создание итоговой наглядной формы: "Класс-объекты". Инт.крит.-корреляция: 100.0000000%- Готово

11/11: Создание итоговой наглядной формы: "Класс-объекты". Инт.крит.-сумма инф : 100.0000000%- Готово

ПАКЕТНОЕ РАСПОЗНАВАНИЕ ОБЪЕКТОВ РАСПОЗНАВАЕМОЙ ВЫБОРКИ ЗАВЕРШЕНО УСПЕШНО !

-Прогноз времени исполнения

Начало: 12:53:50 Окончание: 12:55:33

100% Ok |

Прошло: 0:01:43 Осталось: 0:00:00

Drawing10- Screen forms of mode 4.1.2 of the Eidos system

Some classification results are shown in figures 11, 12 and tables 2 and 3.

Both output forms in the upper right window show the results when using the integral criterion "Knowledge Resonance", and in the lower window - the integral criterion: "sum of knowledge".

Now let's consider the distribution of the author's publications according to the scientific specialties of the HAC RF of the new nomenclature. To obtain this distribution, let's switch to mode 4.1.3.14. Figures 12 show screen forms of this mode. First, a screen form for setting the operation parameters of this mode is shown, then a form that displays the stage of the execution process, the forecast of its completion time. Instead of describing this mode, its help is given, where everything is explained. At the end, there are two screen forms with the

results of the calculation of the distribution of publications of this author by scientific specialties of the HAC RF, obtained by actually comparing the texts of publications with the texts of passports of scientific specialties.

(l) 4.1.3.1. Визуализация результатов распознавания в отношении: "Объект-классы". Текущая модель: "INF3"

Распознаваемые объекты

191 Article270.txt

192 Arlicle271.txt

193 Arfcle272.txt

194 Article28.txt

195 Article29.txt

196 Article3.M

197 Article30.tnt

198 Article31.txt

199 Arlicle32.M

200 Article33.M

201 Article34.lKh

202 Arlicle35 lyt

203 Arlicle36.M

204 Article37.M

205 Arfcle30.M

206 Article39.tyt

207 Arlicle4.txt

208 Arlicle40.lxt

209 Article41.lxt

210 Article42.lKh

211 Arlicle43 lyt

212 Article44.tyt

213 Article45.tyt

<l I >\

Интегральный критерий сходсте:а "Семантический резонанс знаний"

Наименование класса Сходство Ф... Сходство

I 130 КЛАСС-2.3.1. Системный анализ, управление и обработка инф... 8,808...

132 КЛАСС-2.3.3. Автоматизация и управление технологическими... 8,808...

133 КЛАСС-2.3.4. Управление в организационных системах 8,808...

134 КЛАСС-2.3.5. Математическое и программное обеспечение вы... 8,808...

137 КЛАСС-2.3.8. Информатика и информационные процессы 8,808... _

203 КЛАСС-2.Э.4. Управление процессами перевозок 8,808...

207 КЛАСС-2.Э.8. Интеллектуальные транспортные системы 8,808...

260 КЛАСС-3.3.9. Медицинская информатика 8.808...

1 КЛАСС-1.1.1. Вещественный, комплексный и Функциональный... 8,808...

2 КЛАСС-1.1.10. Биомеханика и биоинженерия 8,808...

<1 I jJ^

Интегральный критерий сходства: "Сумма знаний" I

I Кш Наименование класса Сувдство Ф Сходство А

I 137 КЛАСС-2.3.8. Информатика и информационные процессы 32.89

130 КЛАСС-2.3.1. Системный анализ, управление и обработка инф... 29,49...

305 КЛАСС-5.2.6. Менеджмент 23,87...

11 КЛАСС-1.2.1. Искусственный интеллект и машинное обучение 19,64...

135 КЛАСС-2.3.6. Методы и системы защиты информации, инфор.. 19.51 _

132 КЛАСС-2.3.3. Автоматизация и управление технологическими... 19,70... liiiiiliiiilliiiii

162 КЛАСС-2.5.22. Управление качеством продукции. Стандартиза... 13,46...

207 КЛАСС-2.9.8. Интеллектуальные транспортные системы 13,36...

306 КЛАСС-5.2.7. Госдаарственное и муниципальное управление 17,92...

122 КЛАСС-2.2.16. Радиолокация и радионавигация 17.19...

<1 I м

Помощь

9 классов Классы с МахМт УрСх Э классов с МакМт УрСк ВСЕ классы ВКЛ. Фильтр по класс.шкале В ЫКЛ. Фильтр по класс.шкале ГраФ.диаграммы

Drawing11- Examples of screen forms with detailed results (The results of solving problem 1 are described in detail in [13, 14] of the source [1])

С) 4,1.3,14.Распред£лениеуровней сходства 112993 фактов наблюдений по классам

X

Стадии исполнения процесса

Расчет распределения уровней сходства наблюдений по классам- Готово

Расчет распределения уровней сходства 112993 наблюдений по классам успешно завершен !!!

Прогноз времени исполнения

Начало: 13:44:19

Окончание: 13:47:12

100%

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ok

Прошло: 0:02:52

Осталось: 0:00:00

t) 4.1.3.14.Распределение уровней сходства 112993 фактов наблюдений по классам

X

В этом режиме 4.1.3.14 рассчитывается распределение суммарного сходства фактов наблюдений, (объектов распознаваемой выборки) по классам. Это распределение формируется на основе результатов распознавания (режим: 4.1.3.1, файл: "Rsp1 i.dbf"). Вывод в форме таблицы, в которой кроме суммарного сходства объектов с классами выводится какой процент от суммарного сходства приходится на каждый класс, а также этот % расчитывается кумулятивно, т.е. нарастающим итогом.

Строки с кумулятивным % числа набюдений по классам <= 25% отображаются зеленом фоне. Строки с кумулятивным % числа набюдений по классам <= 50% отображаются голубом фоне. Строки без набюдений по классам отображаются желтом фоне.

В режиме возможна сортировка таблицы: C\AIDOS->V\ID_DATAV\000ООО2\SYSTEM\SuniUrSxCls.xls по суммарному сходству наблюдений с классами по убыванию и по коду класса по возрастанию.

Различные диаграммы по таблице частотного распределения наблюдений по классам можно построить средствами MS Excel. Для этого удобно использовать указанный выше файл.

Подробнее о том, что делает данный режим, можно почитать в статье на русском языке: Lutsenko E.V. Automated system-cognitive analysis of the frequency distribution of the author's publications on scientific specialties of the higher attestation commission of the Russian fédération of the new nomenclature// May £023, DOI: 1 0.1 31 40/RG.2.2.1 7726.87369, License CC BY4.0, https://www.re s earch ci ate.n et/pu blication/370961056

Подробнее о том, что делает данный режим, можно почитать в статье на английском языке: Lutsenko E.V. Automated system-cognitive analysis of the frequency distribution of the author's publications on scientific specialties of the higher attestation commission of the russian federation of the new nomenclature (in English)//May 2023, DOI: 1 0.1 31 40/RG.2.2.1 4371.43049, License CC BY 4.0, https://www. re searchaate.net/pub I ication/370961244

t) 4.1.3.14,Распределение уровней сходства 112993 фактов наблюдений по классам

■ Суммарное СХОДСТВО наблюдений с классом И Суммарное СХОДСТВО наблюдений с классом '. кумулятив...

191 КЛАСС—2.8.2. Технология Бурения и освоения скбажин 0 011 9 9.860

233 КЛАСС-3.1.31. Геронтология и гериатрия (отрасль науки - Биологические) 0.010 99.870

71 КЛАСС-1.5.19. Почвоведение 0.010 99.880

172 КЛАСС—2.6.11. Технология и переработка синтетический и природных полимеров и композитов 0.010 99.890

289 КЛАСС—5.10.4. Библиотековедение, БиБлиографоведение и книговедение 0.010 99.899

293 КЛАСС—5 11 2 Историческая теология (по исследовательскому направлению — прабослаВие. ислам. 0 009 99.909

354 КЛАСС-5.9.2. Литературы народов мира 0.009 99.918

91 КЛАСС-1.6.3. Петрология, вулканология 0.009 99.927

45 КЛАСС—1.3.6. Оптика (отрасль науки — физико-математические) 0.009 99.935

234 КЛАСС—3.1.31. Геронтология и гериатрия (отрасль науки — медицинские) 0 008 99.944

270 КЛАСС-4.2.1. Патология животных, морфология, физиология, фармакология и токсикология 0.008 99.952

102 КЛ.4СС-2 112 Архитектура зданий и сооружений. Творческие концепции архитектурной деятельности 0.008 99.960

82 КЛАСС—1.6.10. Геология, поиски и разведка твердых полезных ископаемых, минерагения 0.007 99.967

292 КЛАСС—5.11.2. Историческая теология (по исследовательским направлениям) 0.007 99.973

193 КЛАСС—2.8.4. РазраБотка и эксплуатация нефтяных и газовых месторождений 0 005 99.979

232 КЛАСС-3.1.30. Гастроэнтерология и диетология 0.005 99.983

107 КЛАСС-2.1.2. Основания и фундаменты, подземные сооружения 0.004 99.987

227 КЛАСС—3.1.26. Фтизиатрия 0.003 99.991

345 КЛАСС—5 7 9 Философия религии и религиоведение 0 003 99.993

223 КЛАСС-3.1.22. Инфекционные Болезни 0.002 99.995

217 КЛАСС-3.1.11. Психиатрия и наркология 0.002 99.997

224 КЛАСС—3.1.23. Дерматовенерология 0.001 99.998

272 КЛАСС—4.2.3. Инфекционные Болезни и иммунология животных 0 . 001 99.999

291 КЛАСС—5 11 1 Теоретическая теология (по исследовательскому направлению — прабослаВие. ислам. 0 001 99.999

290 КЛАСС-5.11.1. Теоретическая теология (по исследовательским направлениям) 0.001 100.000

—Сортировка:-

По каду класса

По оумм.скод.набл.о классом

^Задайте интегральный критерий: С Резонанс знаний С* Сумма знаний

—Какие значения интегрального критерия учитывать?— С* Только скадство С Только различие

Пересчет

Drawing12- Screen forms of mode 4.1.3.14 of the Eidos system (fragments)

Table 2 contains the same information as in the last two screen forms of Figure 12, but not fragmentarily, but completely, for all specialties of scientists of the HAC RF of the new nomenclature.

According to table 2, a pie chart is built, shown in Figure 13.

Table2- The results of the classification of texts of articles on scientific specialties of the

HAC C RF in the Inf3 SC-model (the number of articles on specialties, fragment )

Amount of similarity in %, cumulativ ely

No. Class Code Name of the class (scientific specialty of the HAC RF of the new nomenclature) Amount of similarity in %

1 137 CLASS-2.3.8. Informatics and information processes 4.098 4.098

T 130 CLASS-2.3.1. System analysis, information management and processing, statistics 3.158 7.256

3 13S CLASS-2.3.6. Information security methods and systems, information security 2.903 10.158

4 30S CLASS-5.2.6. Management 2.491 12.649

S T60 CLASS-3.3.9. Medical Informatics 2.348 14.997

б eleve n CLASS-1.2.1. Artificial intelligence and machine learning 2.319 17.315

7 11S CLASS-2.2.12. Devices, systems and products for medical purposes 2.078 19.394

S 13 CLASS-1.2.3. Theoretical computer science, cybernetics 1.919 21.313

S 306 CLASS-5.2.7. State and municipal administration 1.886 23.199

10 11S CLASS-2.2.13. Radio engineering, including television systems and devices 1.818 25.017

eleve n 134 CLASS-2.3.5. Mathematical and software support for computing systems, complexes and computer 1.723 26.740

1T 104 CLASS-2.1.14. Life cycle management of construction objects 1.656 28.396

13 TTS CLASS-3.1.28. Hematology and blood transfusion 1.575 29.971

14 T07 CLASS-2.9.8. Intelligent Transport Systems 1.520 31.491

1S 133 CLASS-2.3.4. Management in organizational systems 1.517 33.008

1б TTS CLASS-3.1.24. Neurology 1.469 34.477

17 16T CLASS-2.5.22. Product quality management. Standardization. Organization of production 1.445 35.922

1S 301 CLASS-5.2.2. Mathematical, statistical and instrumental methods in economics 1.294 37.216

1S 1TT CLASS-2.2.16. Radar and radio navigation 1.279 38.495

TO TSS CLASS-5.12.4. Cognitive modeling 1.258 39.753

T1 T03 CLASS-2.9.4. Transportation process management 1.221 40.974

TT 13T CLASS-2.3.3. Automation and control of technological processes and production 1.158 42.132

T3 30T CLASS-5.2.3. Regional and sectoral economy 1.147 43.279

T4 1T1 CLASS-2.2.15. Telecommunication systems, networks and devices 1.141 44.420

TS 1S6 CLASS-2.5.16. Dynamics, ballistics and motion control of aircraft 1.127 45.547

T6 131 CLASS-2.3.2. Computing systems and their elements 0.934 46.481

T7 T0S CLASS-2.9.9. Logistic transport systems 0.881 47.362

TS 3TT CLASS-5.4.7. Sociology of management 0.870 48.232

TS 1T CLASS-1.2.2. Mathematical modeling, numerical methods and software packages 0.864 49.096

thirty 117 CLASS-2.2.11. Information-measuring and control systems 0.862 49.958

31 106 CLASS-2.1.16. Labor protection in construction 0.764 50.722

3T 1SS CLASS-2.5.15. Thermal, electric rocket engines and power plants of aircraft 0.749 51.471

33 14T CLASS-2.4.3. Power industry 0.726 52.197

34 TS6 CLASS-5.12.1. Interdisciplinary research on cognitive processes 0.722 52.919

3S 1T6 CLASS-2.2.5. Navigation devices 0.721 53.640

36 144 CLASS-2.4.5. Energy systems and complexes 0.711 54.351

37 TS7 CLASS-5.12.2. Interdisciplinary Brain Research 0.707 55.057

3S 16 CLASS-1.3.1. Space physics, astronomy (branch of science - physical and mathematical) 0.705 55.763

3S T0T CLASS-2.9.3. Railway rolling stock, train traction and electrification 0.705 56.468

40 11T CLASS-2.1.7. Technology and organization of construction 0.685 57.153

41 136 CLASS-2.3.7. Computer modeling and design automation 0.681 57.834

4T 3TS CLASS-5.5.3. Public administration and sectoral policies 0.677 58.512

43 T1S CLASS-3.1.19. Endocrinology 0.665 59.177

44 1S CLASS-1.3.1. Space physics, astronomy (branch of science - technical) 0.645 59.822

4S 3 CLASS-1.1.2. Differential Equations and Mathematical Physics 0.644 60.466

46 316 CLASS-5.4.1. Theory, methodology and history of sociology 0.639 61.105

........

34S ST CLASS-1.6.10. Geology, prospecting and exploration of solid minerals, minerageny 0.007 99.967

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3S0 TST CLASS-5.11.2. Historical theology (in research areas) 0.007 99.973

3S1 1S3 CLASS-2.8.4. Development and operation of oil and gas fields 0.005 99.979

3ST T3T CLASS-3.1.30. Gastroenterology and Dietetics 0.005 99.983

3S3 107 CLASS-2.1.2. Bases and foundations, underground structures 0.004 99.987

3S4 TT7 CLASS-3.1.26. Phthisiology 0.003 99.991

3SS 34S CLASS-5.7.9. Philosophy of Religion and Religious Studies 0.003 99.993

3S6 TT3 CLASS-3.1.22. infectious diseases 0.002 99.995

3S7 T17 CLASS-3.1.17. Psychiatry and Narcology 0.002 99.997

3SS TT4 CLASS-3.1.23. Dermatovenereology 0.001 99.998

3SS T7T CLASS-4.2.3. Infectious Diseases and Animal Immunology 0.001 99.999

360 TS1 CLASS-5.11.1. Theoretical theology (in the research direction - Orthodoxy, Islam, Judaism) 0.001 99.999

361 TS0 CLASS-5.11.1. Theoretical theology (in research areas) 0.001 100.000

From Figure 13 and Table 2 we see that:

- about a quarter of all articles published in the journal refer to only 9 specialties (they are highlighted in the beginning of Table 2 with a light green background), and half are in 30 specialties (at the beginning of Table 2 they are highlighted in blue).

- for the remaining 331 specialties, all taken together, about half of the total number of articles was published (in table 2 without a background), and for

13 specialties not a single article was published at all (at the end of the table 4 are highlighted in orange).

Суммарное сходство текстов публикаций автора с паспортами научных специальностей ВАК РФ новой

номенклатуры в %

Системный анализ,управление и обработка информации, статистика Методы и системы защиты информации, информационная безопасность

Медицинская информатика Искусственный интеллект и машинное обучение

Теоретическая информатика, кибернетика Государственное и муниципальное управление 5. Радиотехника, в том числе системы и устройства телевидения

I. Управление жизненным циклом объектов строительства 3. Гематология и переливание крови Интеллектуальные транспортные системы Управление в организационныхсистемах I. Неврология

!. Управление качеством продукции. Стандартизация. Организация производства Математические, статистические и инструментальные методы в экономике 5. Радиолокация и радионавигация I. Когнитивное моделирование Управление процессами перевозок

Автоматизация и управление технологическими процессами и производствами Региональная и отраслевая экономика 5. Системы, сети и устройства телекоммуникаций

3. Динамика, баллистика и управление движением летательных аппаратов Вычислительные системы и их элементы Логистические транспортные системы Социология управления

L. Информационно-измерительные и управляющие системы 5. Охра на труда в строительстве

Электроэнергети ка

1. Междисциплинарные исследования когнитивных процессов Приборы навигации Энергетические системы и комплексы !. Междисциплинарные исследования мозга

Подвижной составжелезных дорог, тяга поездов и электрификация Технология и организация строительства

Компьютерное моделирование и автоматизация проектирования Государственное управление и отраслевые политики

Drawing13- Frequency distribution of the author's publications on scientific specialties of the HAC RF of the new nomenclature in the Inf3 SC model

If we compare the distribution of the author's publications by scientific specialties of the HAC RF, shown in the pie chart of Figure 13, with the distribution of publications by subject in the RSCI, shown in Figure 1, then it can be seen that the distribution in Figure 13 is much more detailed, and we add, much better substantiated, than in figure 1.

Such a distribution of articles by scientific specialties has developed because all articles published in issues from 58 to 134 are "Wakov" in all specialties of scientists. During this period, the journal was multidisciplinary.

But since February 12, 2019 (from issue 146), our journal is no longer multidisciplinary, because. entered the List of the HAC RF only in the following 5 specialties: 05.20.01, 06.01.01, 06.01.05, 06.02.02, 06.02.10.

Since February 15, 2023 (from issue 186), the journal is included in the List of the HAC RF in the following specialties:

4.1.1. General farming and crop production;

4.1.2. Breeding, seed production and biotechnology;

4.1.3. Agrochemistry, agrosoil science, plant protection and quarantine;

4.1.4. Horticulture, vegetable growing, viticulture and medicinal

culture;

4.3.1. Technologies, machines and equipment for the agro-industrial complex;

5.2.2. Mathematical, statistical and instrumental methods in economics.

The lists of the HAC RF valid for various periods of the journal are

located at: https://phdru.com/publications/perechenvak/#section1.

4. Discussion

Goal of the work consists in the development of an intelligent system for the automated classification of publications according to the scientific specialties of the HAC RF of the new nomenclature. To achieve this goal, the well-known method of artificial intelligence was applied: automated system-cognitive analysis and its software tools - the intellectual system "Eidos".

As a result of work an intelligent cloud-based Eidos application has been created, placed in full open free access, which can be successfully used by everyone to achieve the goal with their texts. The paper provides a numerical example of achieving the set goal, based on the author's real publications in the Scientific Journal of KubSAU for 20 years of his work: from 2003 to 2023, with the addition of several more myographies and teaching aids. The results obtained are in good agreement with those previously obtained by the author [1] and the works of other authors in the field of intelligent text processing.

The relevance of the work is due to the fact that for the new nomenclature of scientific specialties of the HAC RF, a really working intelligent system for classifying publications, which is in full open free access, was created for the first time.

5. Conclusion, conclusions and recommendations

Thus, based on the results of the research, we can make a reasonable conclusion that the created intelligent cloud-based Eidos application provides the classification of texts of scientific publications: articles, monographs, textbooks, dissertations, etc., according to the scientific specialties of the HAC RF of the new nomenclature.

Practical significance of the conducted research and development is that everyone can use it to solve the problem formulated in the work, achieve the goal and objectives.

This is facilitated by the fact that any Internet user can download from the author's website at the link:http://lc.kubagro.ru/Aidos-X.exeinstallation of the Eidos system, and then in the 1.3 mode download and install this intelligent cloud Eidos application (it has No.389) and study it according to this publication or simply use it to classify your texts according to the scientific specialties of the HAC RF of the new nomenclature.

After installing this application in the folder: c:\Aidos-X\AID_DATA\Inp_data there will be an archive: c:\Aidos-X\AID_DATA\Inp_rasp.rar with files of scientific publications. These files must be unzipped to the folder: c:\Aidos-X\AID_DATA\Inp_rasp.

Prospects We see the continuation of this work in the application of the intelligent cloud Eidos application No. 389,described in this paper and in [2],for the classification of articles in forthcoming issues of various scientific journals, and not just the Scientific Journal of KubSAU, as well as for its application for the classification of texts of monographs, textbooks, dissertations, etc. on

scientific specialties of the HAC RF of the new nomenclature.

It is also planned to analyze the publication activity of the author of other authors using the intellectual cloud Eidos application described in it No. 389. It is clear that any user of the Eidos system can do this independently at any time and according to other authors. At the same time, the works of authors can be in any language. The volume of processed texts is not limited by any artificial quotas and limits on tokens, and is limited only by the computing resources of computers.

The author also plans to develop a new version of the Eidos system in a modern programming language and a wider use of the Eidos system and intelligent applications developed with its use, although there are still a lot of them now: the Eidos system is quite widely used all over the world (Figure 14 ):

Drawing14— Screen form with cartographic visualization of Eidos system launches in the world for the period from 12/09/2016 to 05/23/2023.

Bibliography

1. Lutsenko E.V. A selection of publications by Prof. E.V. Lutsenko on automated system-cognitive analysis of textshttp://lc.kubagro.ru/aidos/Works_on_ASС-analysis_of_texts.htm

i Надоели баннеры? Вы всегда можете отключить рекламу.