Научный журнал КубГАУ, №103(09), 2014 года
1
УДК 303.732.4
ПРИМЕНЕНИЕ АСК-АНАЛИЗА И ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ "ЭЙДОС" ДЛЯ РЕШЕНИЯ В ОБЩЕМ ВИДЕ ЗАДАЧИ ИДЕНТИФИКАЦИИ ЛИТЕРАТУРНЫХ ИСТОЧНИКОВ И АВТОРОВ ПО СТАНДАРТНЫМ, НЕСТАНДАРТНЫМ И НЕКОРРЕКТНЫМ БИБЛИОГРАФИЧЕСКИМ ОПИСАНИЯМ
Луценко Евгений Вениаминович д.э.н., к.т.н., профессор
Кубанский государственный аграрный университет, Россия, 350044, Краснодар, Калинина, 13, prof.lutsenko@gmail. com
Проблемы идентификации авторов и литературных источников по библиографическим описаниям в списках литературы в последнее время приобретает все большее значение научное и практическое значение. Это связано в частности с политикой Министерства образования и науки Российской Федерации в области оценки качества результатов научной деятельности, которая предполагает использование количества ссылок на публикации авторов и индекса Хирша. В России создаются соответствующие аналитические инструменты и сервисы для оценки результатов научной деятельности, функционально аналогичные известным зарубежным библиографическим базам данных Scopus, Web of Science и другим. В настоящее время наиболее известным в России сервисом подобного назначения является Российский индекс научного цитирования (РИНЦ): http://elibrary.ru/. Однако, как показывает опыт, часто ссылки в списках литературы публикаций сделаны с нарушением ГОСТ 7.1—2003, а также с ошибочными выходными данными, например, неверно указанными номерами страниц, наименованием издательства и т. п. На практике это приводит к тому, что программная система библиографической базы не может определить, на какую статью сделана данная ссылка и кто авторы этой статьи. В результате для этих авторов теряется цитирование, что приводит к занижению их индексов Хирша и оценки результатов их научной деятельности руководством. Понятно, что эти отрицательные последствия желательно преодолеть. Данная статья посвящена изложению подхода, который позволяет решить эту проблему путем применения АСК-анализа и интеллектуальной системы «Эйдос», представляющих собой современную инновационную интеллектуальную технологию (готовую к внедрению)
Ключевые слова: АСК-АНАЛИЗ, ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА" ЭЙДОС", РЕШЕНИЕ ЗАДАЧИ ИДЕНТИФИКАЦИИ АВТОРОВ ЛИТЕРАТУРНЫХ ИСТОЧНИКОВ, СТАНДАРТНЫЕ, НЕСТАНДАРТНЫЕ, НЕКОРРЕКТНЫЕ БИБЛИОГРАФИЧЕСКИЕ ОПИСАНИЯ
UDC 303.732.4
THE APPLICATION OF ASC-ANALYSIS AND "AIDOS" INTELLIGENT SYSTEM TO SOLVE, IN GENERAL, THE PROBLEM OF IDENTIFYING THE SOURCES AND AUTHORS OF THE STANDARD, NONSTANDARD AND INCORRECT BIBLIOGRAPHIC DESCRIPTIONS
Lutsenko Eugeny Veniaminovich
Dr.Sci.Econ., Cand.Tech.Sci., professor
Kuban State Agrarian University, Krasnodar, Russia
The problem of identifying authors and literary sources for bibliographic descriptions in the literature in recent years become increasingly important scientific and practical value. This is, in particular, due to the policy of the Ministry of education and science of the Russian Federation in the field of quality assessment of the results of scientific activity, which involves the use of a number of references to publications of authors and the Hirsch index. In Russia, appropriate analytical tools to evaluate the results of scientific activity, functionally similar to the well-known foreign bibliographic databases such as Scopus, Web of Science and other. Currently, the most famous Russian similar service is the Russian science citation index (RSCI): http://elibrary.ru/. However, as experience shows, references in bibliography list of publications are often made with a violation of GOST 7.1-2003 rule, and with the erroneous output, for example, incorrectly specified page numbers, name of publisher, etc., In practice, this leads to the fact that software system of bibliographic database cannot determine what is the right reference for the article and who were the authors of this article. As a result, for these authors we lost the citation, which leads to an underestimation of their Hirsch indexes and evaluation of the results of their research activities and leadership. It is clear that these negative consequences should be overcome. This article is devoted to the presentation of the approach, which allows to solve the problem by applying an ASC-analysis and intelligent system named " Aidos", which is a modern innovative smart technology ready for implementation
Keywords: ASC-ANALYSIS, "AIDOS" INTELLIGENT SYSTEM, SOLVING THE PROBLEM OF IDENTIFICATION OF AUTHORS OF LITERARY SOURCES, STANDARD, NONSTANDARD, INCORRECT BIBLIOGRAPHIC DESCRIPTIONS
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
2
СОДЕРЖАНИЕ
1. ОПИСАНИЕ ПРОБЛЕМЫ И ИДЕЯ ЕЕ РЕШЕНИЯ....................................2
2. ПРЕДЫСТОРИЯ И ЗАДЕЛ ДЛЯ РЕШЕНИЯ ПРОБЛЕМЫ ИДЕНТИФИКАЦИИ ТЕКСТОВ И
АВТОРОВ В АСК-АНАЛИЗЕ И СИСТЕМЕ «ЭЙДОС»...................................5
3. ОПИСАНИЕ ПРЕДЛАГАЕМОГО РЕШЕНИЯ ПРОБЛЕМЫ.................................6
3.1. Этапы АСК-анализа и преобразование исходных данных в информацию, а ее в знания в
системе "ЭЙДОС"..........................................................6
3.2. Скачивание и инсталляция системы «Эйдос»...........................9
3.3. Автоматизированная формализация предметной области путем импорта исходных данных
ИЗ ВНЕШНИХ БАЗ ДАННЫХ В СИСТЕМУ "ЭЙДОС" ................................ 14
3.4. Синтез и верификация статистических и интеллектуальных моделей.....19
3.5. Частные критерии и виды моделей системы «Эйдос»....................20
3.6. Ценность описательных шкал и градаций для решения задач идентификации текстов и
авторов (нормализация текста)...........................................23
3.7. Интегральные критерии системы «Эйдос»..............................24
3.8. Результаты верификации моделей.....................................26
4. РЕШЕНИЕ ЗАДАЧ ИДЕНТИФИКАЦИИ ТЕКСТОВ И ИХ АВТОРОВ В НАИБОЛЕЕ
ДОСТОВЕРНОЙ МОДЕЛИ........................................................27
4.1. Присвоение наиболее достоверной модели статуса текущей и решение в ней задач
идентификации...........................................................27
4.2. Отображение результатов идентификации..............................29
5. ВЫВОДЫ.................................................................40
6. НЕКОТОРЫЕ НЕДОСТАТКИ И ПЕРСПЕКТИВЫ.....................................41
6.1. Повышение быстродействия алгоритмов................................41
6.2. Перспективы применения АСК-анализа и системы «Эйдос» для решения задач
идентификации и прогнозирования на основе анализа Internet-контента.....42
1. Описание проблемы и идея ее решения
Проблемы идентификации авторов и литературных источников по библиографическим описаниям в списках литературы в последнее время приобретает все большее значение научное и практическое значение. Это связано в частности с политикой Министерства образования и науки Российской Федерации в области оценки качества результатов научной деятельности, которая предполагает использование количества ссылок на публикации авторов и индекса Хирша. В России создаются соответствующие аналитические инструменты и сервисы для оценки результатов научной деятельности, функционально аналогичные известным зарубежным библиографическим базам данных Scopus, Web of Science и другим. В настоящее время наиболее известным в России сервисом подобного назначения является Российский индекс научного цитирования (РИНЦ): http://elibrary.ru/. Однако, как показывает опыт, часто ссылки в списках ли-
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
3
тературы публикаций сделаны с нарушением ГОСТ 7.1—2003, а также с ошибочными выходными данными, например, неверно указанными номерами страниц, наименованием издательства и т.п. На практике это приводит к тому, что программная система библиографической базы не может определить на какую статью, из находящихся в ней, сделана данная ссылка и кто авторы этой статьи. В результате для этих авторов теряется цитирование, что приводит к занижению их индексов Хирша и оценки результатов их научной деятельности руководством. Понятно, что эти отрицательные последствия желательно преодолеть.
Традиционно данная проблема решается с помощью алгоритма шинглов1. Данная статья посвящена изложению идеи решения этой проблему путем применения Автоматизированного системно-когнитивного анализа (АСК-анализ) и его программного инструментария - интеллектуальной системы «Эйдос», которые представляют собой современную инновационную интеллектуальную технологию (готовую к внедрению). В ней рассматривается алгоритм, основанный на вычислении количества информации в словах библиографической ссылки о том, что это ссылка на данную статью и данных авторов, а также ценность слов для идентификации статей и авторов (т.е. вариабельность количества информации в словах по статьям и авторам).
Предлагаемый алгоритм имеет ряд отличий от алгоритма шинглов, за счет чего может иметь определенные преимущества перед ним. Рассмотрим эти различия подробнее.
Этапы алгоритма шинглов1, которые проходит текст, подвергшийся сравнению:
- канонизация текста;
- разбиение на шинглы;
- вычисление хэшей шинглов;
- случайная выборка 84 значений контрольных сумм;
- сравнение, определение результата.
Рассмотрим, каким образом реализуются или не реализуются (т.к. в этом нет необходимости) подобные этапы в АСК-анализе и его программном инструментарии - системе «Эйдос» (таблица 1):
1 См., например: Ьйр://ш^ікіребіа.ощ^ікі/Алгоритм шинглов
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
4
Таблица 1 - Сравнение алгоритма шинглов и алгоритма АСК-анализа, реализованного в системе «Эйдос»
Алгоритм шинглов Алгоритм АСК-анализа, реализованный в системе «Эйдос»
Канонизация текста
Канонизация текста приводит оригинальный текст к единой нормальной форме. Текст очищается от предлогов, союзов, знаков препинания, HTML тегов, и прочего ненужного «мусора», который не должен участвовать в сравнении. В большинстве случаев также предлагается удалять из текста прилагательные, так как они не несут смысловой нагрузки. Так как вычисляется количество информации
в словах библиографической ссылки о том, что это ссылка на данную статью и данных авторов, а также ценность слов для идентификации статей и авторов (т.е. вариабельность количества информации в словах по статьям и авторам), то в этапе канонизации текста нет необходимости.
Также на этапе канонизации текста можно приводить существительные к именительному падежу, единственному числу, либо оставлять от них только корни. Лемматизация текста2 на основе морфологического анализа, т.е. приведение слов к их исходной форме. Это целесообразно, но в настоящее время не реализовано.
Разбиение на шинглы
Шинглы (англ. - «чешуйки») - выделенные из статьи подпоследовательности слов. Необходимо из сравниваемых текстов выделить подпоследовательности слов, идущих друг за другом по 10 штук (длина шингла). Выборка происходит внахлест, а не встык. Таким образом, разбивая текст на подпоследовательности, мы получим набор шинглов в количестве равному количеству слов минус длина шингла плюс один. Система «Эйдос» обеспечивает использование в качестве признаков текста последовательностей подряд идущих слов по 2, 3,..., N слов, т.е. шинглов, но это не имеет смысла делать при решении проблемы идентификации текстов и авторов по нестандартным и некорректным библиографическим описаниям, т.к. в них как раз эти последовательности могут быть нарушены, что приведет к понижению достоверности идентификации алгоритма шинглов. Кроме того использование таких подпоследовательностей само требует затрат вычислительных ресурсов, а также резко увеличивает количество признаков текста, размерность моделей и время идентификации.
Вычисление хэшей шинглов
Принцип алгоритма шинглов заключается в сравнении случайной выборки контрольных сумм шинглов (подпоследовательностей) двух текстов между собой. Тексты сравниваются не по случайному подмножеству своих признаков, а по всем признакам, в качестве которых выступают слова. Считается идентифицированными тот источник и те авторы, о которых в словах ссылки содержится максимальное количество информации. Это может обеспечить более высокую достоверность алгоритма.
Проблема быстродействия алгоритма
Проблема алгоритма заключается в количестве сравнений, ведь это напрямую отражается на производительности. Увеличение количества шинглов для сравнения характеризуется экспоненциальным ростом операций, что критически отразится на производительности. Проблема алгоритма заключается в количестве сравнений, ведь это напрямую отражается на производительности. Увеличение количества слов в библиографических ссылках, используемых для сравнения, приводит к линейному росту числа операций сравнения.
2 См., например: http://www.solarix.ru/for developers/api/lemmatization.shtml
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
5
Таким образом, есть надежда, что предлагаемый алгоритм будет иметь более высокую достоверность и быстродействие, чем алгоритм шинглов.
2. Предыстория и задел для решения проблемы идентификации текстов и авторов в АСК-анализе и системе «Эйдос»
Автор на протяжении многих лет периодически возвращался к проблематике атрибуции анонимных и псевдонимных текстов, идентификации текстов и их авторов [1, 2]. С 2006 года на базе системы «Эйдос» проводятся лабораторные работы, в которых изучается применение интеллектуальных технологий для решения этих задач [3] (см. лаб.работы №1 и №6).
В новой версии системы «Эйдос-Х++» этой теме посвящена лабораторная работа 3.02 (рисунок 1):
Рисунок 1. Экранная формы выбора лабораторной работы 3-го типа На рисунке 2 приведен Help этой лабораторной работы:
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
6
Луценко Е.В. Атрибуция анонимных и псевдонимных текстов в системно-когнитивном анализе /Е.В. Луценко // Полигемагический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2004. - №03(005). С. 44 - 43.
- IDA [article ID): 0050403003. - Режим доступа: http: //ei. kubaoro. ru/2004/03/pdf/03. pdf
Луценко Е.В. Атрибуция текстов, как обобщенная задача идентификации и прогнозирования /Е.В. Луценко // Полигемагический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. - №02(002). С. 14Є - 1Є4.
- IDA [article ID): 0020302013. - Режим доступа: http: //ei. kubaoro. ru/2003/02/pdf/13.pdf
Луценко Е.В. АСК-анализ проблематики статей Научного журнала КубГАУ в динамике / Е.В. Луценко, В.И. Лойко // Полигемагический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №06(100). С. 103 -145. - IDA [article ID): 100140Є007. - Режим доступа: http: //ei. kubaoro. ru/2014/06/pdf/07. pdf
Рисунок 2. Экранная формы Help лабораторной работы 3.02
Кроме того есть опыт анализ проблематики научного журнала в динамике с использованием технологии обработки текстов в интеллектуальной системе «Эйдос» [4].
3. Описание предлагаемого решения проблемы
3.1. Этапы АСК-анализа и преобразование исходных данных в информацию, а ее в знания в системе "Эйдос"
АСК-анализ представляет собой современную инновационную (т.е. полностью готовую к внедрению и использованию) широко и успешно апробированную интеллектуальную технологию [5, 6, 7, 8].
АСК-анализ включает следующие этапы:
1. Когнитивная структуризация предметной области (неформализованный этап). На этом этапе решается, что мы хотим прогнозировать и на основе чего. В нашей задаче мы хотим прогнозировать продолжительность жизни пациента после перенесенного им инфаркта на основе анализа эхокардиограммы.
2. Формализация предметной области. На этом этапе разрабатываются классификационные и описательные шкалы и градации, а затем с их использованием исходные данные кодируются и представляются в форме баз событий, между которыми могут быть выявлены причинно-следственные связи.
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
7
3. Синтез и верификация моделей (оценка достоверности, адекватности). Повышение качества модели. Выбор наиболее достоверной модели для решения в ней задач.
4. Решение задач идентификации и прогнозирования.
5. Решение задач принятия решений и управления.
6. Решение задач исследования моделируемой предметной области путем исследования ее модели.
На рисунке 3 приведены автоматизированные в системе «Эйдос» этапы АСК-анализа, которые обеспечивают последовательное повышение степени формализации модели путем преобразования исходных данных в информацию, а далее в знания:
Рисунок 3. Этапы последовательного преобразования данных в информацию, а ее в знания в системе "Эйдос"
Подробно этот процесс описан в работах [9, 10]. Суть этого процесса в следующем:
1. Информация рассматривается как осмысленные исходные данные.
2. Смысл, согласно концепции Шенка-Абельсона [11] считается известным, когда выявлены причинно-следственные связи.
3. Анализ - это операция выявления смысла из исходных данных.
4. Причинно-следственные связи существуют не между элементами исходных данных, а между реальными событиями, которые они отражают
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
8
(моделируют), т.е. причинно-следственные связи - это характеристика реальной области, а не абстрактных моделей. Иначе говоря, анализ самих исходных данных невозможен, а возможен только анализ событий, описанных этими исходными данными.
5. Поэтому перед анализом исходных данных необходимо предварительно преобразовать их в базы событий, т.е. в эвентологические базы.
6. Это преобразование осуществляется с помощью справочников событий, факторов и их значений, т.е. с помощью классификационных и описательных шкал и градаций, которые также необходимо разработать.
7. Формализация предметной области представляет собой разработку справочников классификационных и описательных шкал и градаций и преобразование с их помощью баз исходных данных в базы событий (т.е. обучающую выборку), и является первым автоматизированным в системе «Эйдос» этапом АСК-анализа.
8. Затем следуют остальные перечисленные выше этапы АСК-анализа:
- синтез и верификация моделей и выбор наиболее достоверной из
них;
- решение в ней задач идентификации, прогнозирования, принятия решений и исследования предметной области, т.е. преобразование информации в знания.
Этап синтеза и верификации моделей завершает процесс анализа исходных данных и преобразования их в информацию, а ее в знания.
В АСК-анализе есть несколько режимов, обеспечивающих решение задачи принятия решений для управления или достижения целей, которая представляет собой обратную задачу прогнозирования: это и режим 4.2.1, позволяющий формировать информационные портреты классов, а также режим 4.4.8, поддерживающий количественный автоматизированный SWOT и -PEST анализ, включая построение SWOT и -PEST матриц и диаграмм [12], а также режим 4.4.10, визуализирующий нейросетевую интерпретацию модели знаний системы «Эйдос» [13]. Эти режимы обеспечивают преобразование информации в знания, т.к. знания представляют собой информацию, полезную для достижения целей, т.е. по сути технологию, в частности ноу-хау [5]. Наличие цели является ключевым моментом для преобразования информации в знания. А постановка целей (целеполагание) не мыслима без мотивации, которая в настоящее время является слабо формализованным этапом.
Итак, в процессе анализа исходные данные представляются в форме базы событий, между которыми выявляются причинно-следственные связи, и, таким образом, исходные данные преобразуются в информацию, представляющую собой осмысленные данные (смысл есть знание причинно-следственных связей), а затем информация используется для достижения целей (управления), т.е. преобразуется в знания.
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
9
Формализация предметной области включает разработку классификационных и описательных шкал и градаций и преобразование с их использованием исходных данных (таблица 2) в обучающую выборку. Этот этап полностью автоматизируется программным интерфейсом системы «Эйдос» с внешними табличными базами исходных данных (режим 2.3.2.2).
Но перед выполнением этого этапа АСК-анализа, естественно, необходимо сначала скачать и установить систему «Эйдос».
3.2. Скачивание и инсталляция системы «Эйдос»
Для скачивания и инсталляции системы «Эйдос» необходимо по адресу: http://lc.kubagro.ru/aidos/ Aidos-X.htm открыть и выполнить следую-
3
щую инструкцию :
ИНСТРУКЦИЯ
_______по скачиванию и установке системы «Эйдос» (объем около 50 Мб)__________
Система не требует инсталляции, не меняет никаких системных файлов и содержимого папок операционной системы,
т.е. является портативной (portable) программой. Но чтобы она работала необходимо аккуратно выполнить следующие пункты.
1. Скачать самую новую на текущий момент версию системы «Эйдос-Х++» по ссылке: http://lc.kubagro.ru/a.rar (ссылки для обновления системы даны в режиме 6.2)
2. Разархивировать этот архив в любую папку с правами на запись с коротким латинским именем и путем доступа,
включающим только папки с такими же именами (лучше всего в корневой каталог какого-нибудь диска).
3. Запустить систему. Файл запуска: t5_AIDOS-X.exe *
4. Задать имя: 1 и пароль: 1 (потом их можно поменять в режиме 1.2).
5. Перед тем как запустить новый режим НЕОБХОДИМО ЗАВЕРШИТЬ предыдущий (Help можно
не закрывать). Окна закрываются в порядке, обратном порядку их открытия.______
Разработана программа: «С>_ _START_AIDOS.exe», полностью снимающая с пользователя системы «Эйдос-Х++» заботу о проверке наличия и скачивании обновлений. Эту программу надо просто скачать по ссылке: http://lc.kubagro.ru/Install Aidos-X/ START AIDOS.exe , поместить в папку с исполнимым модулем системы и всегда запускать систему с помощью этого файла.
При запуске программы _START_AIDOS.EXE система Эйдос не должна быть запущена, т.к. она содержится в файле обновлений и при его разархивировании возникнет конфликт, если система будет запущена.
1. Программа 0_START_AIDOS.exe определяет дату системы Эйдос в текущей папке, и дату обновлений на FTP-сервере не скачивая их, и, и если система Эйдос устарела, скачивает обновления. (Если в текущей папке нет исполнимого модуля системы Эйдос, то программа пытается скачать полную инстилляцию системы, но не может этого сделать из-за ограниченной функциональности демо-версии библиотеки Xb2NET.DLL).
2. После этого появляется диалоговое окно с сообщением, что надо сначала разархивировать
систему, заменяя все файлы (опция: «Yes to All» или «OwerWrite All», и только после этого закрыть данное окно. Появление окна архиватора происходит на мгновение позже появления диалогового окна, практически одновременно с ним и поверх него. Поэтому чтобы прочитать окно с этим сообщением нужно сдвинуть окно архиватора._____________________________________
3
Имеется и форум автора системы проф.Е.В.Луценко для пользователей системы: http://proflutsenko.vdforum.ru/
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
10
3. Потом nporpaMMav_START_AIDOS.exe запускает обновления на разархивирование. После окончания разархивирования окно архиватора с отображением стадии процесса исчезает.
4. После закрытия диалогового окна с инструкцией (см. п.2), происходит запуск обновленной версии системы Эйдос на исполнение.
Для работы программы t5_START_AIDOS.exe необходима библиотека: Xb2NET.DLL, которую можно скачать по ссылке: http://lc.kuba.gro.nl/Tnstall Aidos-X/Xb2NET.DLL . Перед первым запуском этой программы данную библиотеку необходимо скачать и поместить либо в папку с этой программой, а значит и исполнимым модулем системы «Эйдос-Х++», либо в любую другую папку, на которую в операционной системе прописаны пути поиска файлов, например в папку: c:\Windows\System32\. Эта библиотека стоит около 500$ и у меня ее нет, поэтому я даю только бесплатную демо-версию, которая выдает сообщение об ограниченной функциональности, но для наших целей ее достаточно.__________________________________________________________
Лицензия:
Автор отказывается от какой бы то ни было ответственности за последствия применения или не применения Вами системы «Эйдос».
Проще говоря, пользуйтесь если понравилось, а если не понравилось - сотрите и забудьте, а лучше вообще не скачивайте.___________________________________________________
По этим ссылкам всегда размещена наиболее полная на момент скачивания незащищенная от несанкционированного копирования портативная (portable) версия системы (не требующая инсталляции) с исходными текстами, находящаяся в полном открытом бесплатном доступе (объем около 50 Мб). Обновление имеет объем около 3 Мб.
Далее запускаем систему "Эйдос" из папки "Aidos-X" файлом _aidos-x.exe. Система попросит ввести логин и пароль (рисунок 9). Необходимо ввести: логин - 1, пароль - 1.
Далее запускаем систему "Эйдос" из папки "Aidos-X" файлом _aidos-x.exe. Система попросит ввести логин и пароль (рисунок 4).
Рисунок 4. Экранная форма авторизации в системе "Эйдос"
Здесь необходимо ввести: логин - 1, пароль - 1. В результате откроется главное окно системы (рисунок 5):
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
11
В последующем имя и пароль можно изменить в режиме 1.2.
В качестве исходных данных для примера решения задачи идентификации текстов и авторов, рассмотренного в данной статье, использована выборка из баз данных Научного журнала КубГАУ [14, 4] за весь период его существования с 2003 года по настоящее время (точнее по 100-й номер). За это время в журнале издано 3949 статей.
Файл выборки организован следующим образом (таблица 2):
Таблица 2 - Исходные данные (фрагмент)
Объект Статья Автор Библиографическая ссылка
10301001 IDA10301001 Кацко_И_А, Креймер_А_С Кацко И. А. Принятие решения о структуре системы автономного энергоснабжения с использованием когнитивного подхода / И. А. Кацко, А. С. Креймер // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. - №01(001) С. 1 - 2. IDA [article ID]: 0010301001 - Режим доступа: http://ej.kubagro.ru/2003/01/01.pdf, 0,063 у.п.л., им-пакт-фактор РИНЦ=0,346
10301002 IDA10301002 Богатырев_Н_И, Креймер_А_С Богатырев Н. И. Имитационное моделирование ветроэнергетической установки / Н. И. Богатырев, А. С. Креймер // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. -№01(001) С. 3 - 8. IDA [article ID]: 0010301002 - Режим доступа: http://ej.kubagro.ru/2003/01/02.pdf, 0,313 у.п.л., импакт-фактор РИНЦ=0,346
10301004 IDA10301004 Хисамов_Ф_Г Хисамов Ф. Г. Методика оптимизации структуры перспективных аппаратных средств криптографической защиты информации в автоматизированных системах управления / Ф. Г. Хисамов // Политематический сете-
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
12
вой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. - №01(001) С. 9 - 15. IDA [article ID]: 0010301004 - Режим доступа: http://ej.kubagro.ru/2003/01/04.pdf, 0,375 у.п.л., им-пакт-фактор РИНЦ=0,346
10301005 IDA10301005 Луценко_Е_В Луценко Е. В. Численный расчет эластичности объектов информационной безопасности на основе системной теории информации / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. -Краснодар: КубГАУ, 2003. - №01(001) С. 16 - 27. IDA [article ID]: 0010301005 - Режим доступа: http://ej.kubagro.ru/2003/01/05.pdf, 0,688 у.п.л., им-пакт-фактор РИНЦ=0,346
10301006 IDA10301006 Федоренко_М_А Федоренко М. А. Исследование порога целесообразности применения самолета АН-2 на работах в аграрном секторе / М. А. Федоренко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. - №01(001) С. 28 - 40. IDA [article ID]: 0010301006 - Режим доступа: http://ej.kubagro.ru/2003/01/06.pdf, 0,75 у.п.л., им-пакт-фактор РИНЦ=0,346
10301007 IDA10301007 Безродный_О_К, Лойко_В_И Безродный О. К. Система инвестиционного управления автодорожной отраслью региона / О. К. Безродный, В. И. Лойко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. -№01(001) С. 41 - 54. IDA [article ID]: 0010301007 - Режим доступа: http://ej.kubagro.ru/2003/01/07.pdf, 0,813 у.п.л., импакт-фактор РИНЦ=0,346
10301008 IDA10301008 Луценко_Е_В, Третьяк_В_Г Луценко Е. В. Анализ профессиональных траекторий специалистов c применением системы «Эйдос» / Е. В. Луценко, В. Г. Третьяк // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. - №01(001) С. 55 - 58. IDA [article ID]: 0010301008 - Режим доступа: http://ej.kubagro.ru/2003/01/08.pdf, 0,188 у.п.л., импакт-фактор РИНЦ=0,346
В данной работе исследовано две выборки статей: полная, включающая 3949 статей, и сокращенная, представляющая собой 100 статей, выбранных из полной случайным образом. Программа, осуществившая выборку 100 статей из полной, приведена ниже (язык xBase++):
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
13
FUNCTION Main()
CLOSE ALL
USE Inp_data EXCLUSIVE NEW;N_Obj = RECCOUNT()
aNumRec := {} // Массив номеров записей, которые останутся в
БД Inp_data.dbf
N_Rec = 100 // Количество записей, которые останутся в БД
Inp_data.dbf
SELECT Inp_data
DELETE ALL
// Сформировать массив кодов случайных объектов обучающей выборки без повторов из N элементов
DO WHILE LEN(aNumRec) < N_Rec // В массиве еще нет
aNumRec элементов?
// Случайный номер записи от 1 до N_Rec
mRndRec = 1+INT(RANDOM()%N_Obj)
IF ASCAN(aNumRec, mRndRec) = 0 еще не разыгрывался? AADD (aNumRec, mRndRec) END IF ENDDO // Номер этого объекта
ASORT(aNumRec)
FOR j=1 TO LEN(aNumRec) DBGOTO(aNumRec[j]) RECALL NEXT
PACK
LB_Warning( aNumRec, ‘Удаление записей из БД "Inp_data.dbf"‘ ) LB_Warning( ‘В базе даннных: "Inp_data.dbf" осталось
‘+ALLTRIM(STR(N_Rec))+‘ случайных записей‘, ‘Удаление записей из БД
"Inp_data.dbf"‘ )
CLOSE ALL RETURN NIL
Далее везде, где это специально не оговорено, рассматривается модель, основанная на 100 статьях.
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
14
3.3. Автоматизированная формализация предметной области путем импорта исходных данных из внешних баз данных в систему "Эйдос"
Для преобразования исходных данных в базы данных системы "Эйдос" необходимо файл MS Excel, который содержит базу исходных данных, скопировать в папку: ..Aidos-X\AID_DATA\Inp_data и присвоить ему имя: «Inp_data.xls». Само преобразование осуществляется в универсальном программном интерфейсе импорта данных из внешних баз данных в систему «Эйдос» (режима 2.3.2.2), Help которого приведен на рисунке 6:
{j) Помощь по режиму 2.12,2 для случая Ехсеі-файлов исходных данных
|Е1|ЫМ
Режим 2.3.2.2: Универсальный программный интерфейс импорта данных из внешней базы данных alnp_data.xlsa в систему "Эйдос-х++" и формализации предметной области.
- Данный программный интерфейс обеспечивает автоматическое Формирование классификационных и описательных шкал и градаций, а также обучающей и распознаваемой выборки, т. е. формализацию предметной области, на основе XLS или XLSX-файла с исходными данными приведенного ниже стандарта.
- Файл исходных данных должен иметь имя: INP_DATA.XLS или INP_DATA.XLSX и может быть получен в Ехсе1-2003(2007-2010), а файл распознаваемой выборки имя: INP_RASP.XLS или INP_RASP.XLSX. Файлы INP_DATA.XLS (INP_DATA.XLSX) и INP_RASP.XLS или INP_RASP. XLSX) должны находиться в папке XAIDOS-XXAID_DATAXInp_dataX и имеют совершенно одинаковую структуру.
- 1-я строка этого Файла должна содержать наименования колонок на любом языке, в т. ч. и русском. Эти наименования должны быть во всех колонках, при этом объединение ячеек и переносы слов не допускаются. Желательно, чтобы эти наименования были не очень длинными, т.к. к мим еще будут добавляться интервальные числовые или текстовые значения.
- Каждая строка этого Файла, начиная со 2-й, содержит данные об одном объекте обучающей выборки. Если Excel-2003, в листе может быть до Є553Є строк и до 256 колонок. В листе Ехсе1-2007(2010) возможно до 1 048 576 строк и 16 384 колонок.
■ Столбцы, начиная со 2-го, являются классификационными и описательными шкалами и могут быть текстового (номинального) или числового типа (с десятичными знаками после запятой).
■ Столбцу присваивается числовой тип, если все значения его ячеек числового типа. Е ели хотя бы одно значение является текстовым (не числом, в т. ч. пробелом), то столбцу присваивается текстовый тип. Это означает, что нули должны быть указаны нулями, а не пробелами.
-1 -й столбец содержит наименование источника данных длиной до 255 символов, но желательно, чтобы эти наименования были не очень длинными.
- Столбцы со 2-го по N-й являются классификационными шкалами (выходными параметрами) и содержат данные о классах (будущих состояниях объекта управления), к которым принадлежат объекты обучающей выборки.
- Столбцы с N+1 по последний являются описательными шкалами (факторами) и содержат данные о признаках (значениях Факторов), характеризующих объекты обучающей выборки.
- В результате работы режима Формируется Файл INP_NAME.TXT стандарта MS DOS (кириллица), в котором наименования классификационных и описательных шкал являются СТРОКАМИ. Система Формирует классификационные и описательные шкалы и градации. Для этого в каждом числовом столбце система находит минимальное и максимальное числовые значения и Формирует заданное количество числовых интервалов, после чего числовые значения заменяются их интервальными значениями. В текстовых столбцах система находит уникальные текстовые значения. Каждое УНИКАЛЬНОЕ интервальное числовое или текстовое значение считается градацией классификационной или описательной шкалы, характеризующей объект. С их использованием генерируется обучающая выборка, каждый объект которой соответствует одной строке файла исходных данных NP_DATA и содержит коды классов, соответствующие фактам совпадения числовых или уникальных текстовых значений классов с градациями классификационных шкал и коды признаков, соответствующие фактам совпадения числовых или уникальных текстовых значений признаков с градациями описательных шкал.
- Распознаваемая выборка Формируется на основе Файла INP_RASP аналогично, за исключением того, что классификационные и описательные шкалы и градации не создаются, а используются ранее созданные в модели, и базы распознаваемой выборки могут не включать коды классов, если столбцы классов в Файле INP_RASP были пустыми. Структура Файла INP_RASP должна быть такая же, как INP_DATA, т.е. они должны ПОЛНОСТЬЮ совпадать по столбцам, но могут иметь разное количество строк.
—Принцип организации таблицы исходных данных:-
Наименование объекта обучающей выборки Наименование 1-й классификационной шкалы Наименование 2-й классификационной шкалы Наименование 1-й описательной шкалы Наименование 2-й описательной шкалы
1-й объект обучающей выборки Значение показателя Значвние показателя Значение показателя Значение показателя
2-й объект обучающей выборки Значение показателя Значение показателя Значение показателя Значение показателя
0ІГ | Cancel |
Рисунок 6. Help режима 2.3.2.2 системы «Эйдос»
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
15
Экранная форма задания параметров режима 2.3.2.2 приведена на дисунке 7:
Рисунок 7 - Экранная форма Универсального программного интерфейса импорта данных в систему "Эйдос" (режим 2.3.2.2.)
В экранной форме, приведенной на рисунке 7, необходимо задать настройки, показанные на рисунке:
- "Задайте тип файла исходных данных Inp_data": "XLS - MS Excel-2003";
- "Задайте диапазон столбцов классификационных шкал": "Начальный столбец классификационных шкал" - 2, "Конечный столбец классификационных шкал" - 3;
- "Задайте диапазон столбцов описательных шкал": "Начальный столбец описательных шкал" - 4, "Конечный столбец описательных шкал"
- 4;
- "Задание параметров формирования сценариев или способа интерпретации текстовых полей": "Применить сценарный метод АСК-анализа и спец.интерпретацию TXT-полей";
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
16
- «Параметры интерпретации текстовых полей Inp_data»: В качестве классов рассматривать элементы значений полей - слова, В качестве признаков рассматривать элементы значений полей - слова.
Затем кликнуть кнопку "ОК". Далее открывается окно, где размещена информация о размерности модели (рисунок 8).
Рисунок 8. Информация о размерности модели системы "Эйдос"
В этом окне необходимо нажать кнопку "Выйти на создание модели".
Далее открывается окно, отображающее стадию процесса импорта данных из внешней БД "Inp_data.xls" в систему "Эйдос" (рисунок 9), а также прогноз времени завершения этого процесса. В том окне необходимо дождаться завершения формализации предметной области и нажать кнопку "ОК".
Рисунок 9. Процесс импорта данных из внешней БД "Inp_data.xls"
в систему "Эйдос"
Для просмотра классификационных шкал и градаций необходимо запустить режим 2.1 (рисунок 10):
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
17
£) 2.1. Классификационные шкалы и градации. Текущая модель: ш Ш]
1
ІИ Код шкалы Наименование классификационной шкалы — HI Код градации Наименование градации классификационной шкалы DEL в
| СТАТЬЯ ... 1 г IDA1001408108 ...
2 АВТОР ... 2 IDA130505013 ...
3 IDA140508003 ...
4 IDA180602011 ... _
5 IDA190603018 ...
Є IDA200604030 ...
7 IDA20302015 ...
8 IDA220606008 ...
9 IDA220608011 ...
10 IDA230607008 ...
11 IDA270703008 ...
12 IDA270703008 ...
13 IDA310707007 ...
14 IDA340710013 ...
15 IDA350801003 ...
1Є IDA370803012 ...
17 IDA420808011 ...
18 IDA430809009 ...
18 IDA50403007 ...
20 IDA510307003 ...
21 IDA520908011 ...
4 221 IDA540910014 ... ▼
л! 1 ► Г 2d 1 ►
Помощь
Доб.шкалу Доб.град.шкалы Копир.шкалу Копир.град.шкалы Копир.шкалу с град. Удал.шкалу с град. Удал.град.шкалы Удаление и перекодирование
I Код шкалы Наименование классификационной шкалы Щ|Кодградации Наименование градации классификационной шкалы del I
11 СТАТЬЯ ...| 1 113 азаренко_Д_Ю ...
2 АВТОР ... 114 азаренко_Л_В ...
115 айденко_И_В ...
118 айкацишвили_Г_3 ...
117 Алексеев_Р_А ...
118 Алиева_Л_Р ...
119 Андреев_С_Ю ...
120 Андрианова_Е_П ...
121 Андросова_Д_ ...
122 Андросова_Ф_С ...
123 арасева_Т_В ...
124 Ариничев_И_В ...
125 Арустамова_И_С ...
128 Аругюнян_М_М ...
127 атаров_В_ ...
128 Бабин_Д_И ...
123 Балакай_ ...
130 Баранников_А_А ...
131 Бареева_ ...
132 Безуглова_0_С ...
1 133 Белых_В_И ...
134 Белых И В ...
jd 1 ► 2d 1 ► 1
Помощь Доб.шкалу Доб.град.шкалы I Копир.шкалу I Копир.град.шкалы I Копир.шкалу с град. Удал.шкалу с град. Удал.град.шкалы! Удаление и перекодирование
Рисунок 10. Классификационные шкалы и градации (фрагменты)
Для просмотра описательных шкал и градаций необходимо запустить режим 2.2 (рисунок 11):
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
18
2.2. Описательные шкалы и градации. Текущая модель: TMF1" ^ ГУ _ —
ill ІДІІ
НИ Код шкалы Наименование описательной шкалы л 1 Код градации Наименование градации описательной шкалы
|| БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА . 724 импакт ...
725 инвестиций ...
72Є инвестиционного ...
727 инновационной ...
728 Инновационные ...
72Э инновационных ...
730 институты ...
731 инструмент ...
732 интенсивности ...
733 интенсификации ...
734 интродукции ...
735 информации ...
738 информационная ...
737 информационной ...
738 Информрегистра ...
738 Исаева ...
740 исляков ...
741 использование ...
742 использованием ...
743 использования ...
■ 744 Исследование ...
1 1 Д I . 745І исследования л Д
<1 1 ► Л 1 ► 1 ЦІ
Помощь Доб.шкалу | Доб. град, шкалы | Копир, шкалу | | Копир.град.шкалы | Копир, шкалу с град. | Удал.шкалу с град. | Удал.град.шкалы | Перекодировать Очистить 1
^ш J
Рисунок 11. Описательные шкалы и градации (фрагмент)
Для просмотра обучающей выборки необходимо запустить режим 2.3.1. (рисунок 12):
Г t) 2.3,1, Ручной нвод-коррезаїїравка обучающей выборки. Текущая модель:
Код объекта Наименование объекта а Врем я Ґ
1 20302015 ...
2 50403007 ...
3 80404017 ...
4 130505019 ...
5 140508009 ...
Є 180802011 ...
7 180803018 ...
8 200604030 ...
Э 220606008 ...
1 п Л ООПСПСТИ 1 I ►
Код объекта Класс' 1 Класс'2 Класс 3 Класс 4 Л ^ИРКод объекта | Признак 1 Приз.нак'2 Признак 3 Признак 4 Признак-5 Признак 8 Признак f 1 п< і i>
I 7 117 0 0 J ■ 7 506 10... 488 12... 10... 10... 713
1 778 527 10... 871 573 757 870
1 883 850 888 12... 827 12... 855
1 10... 488 506 880 11... 13... 858
1 887 12... 831 484 12... 531 687
1 12... 2 10... 10... 12... 274 488
1 4 11... 283 287 483 1 482
1 5 10... 887 481 458 485 482
1 274 18 242 478 188 408 12...
Л [► 1 «I 843 788 724 12... 10... 13... 328 [►
Помощь Скопировать обуч.выб.в расп і. Добавить объект Добавить классы Добавить признаки Удалить объект Удалить классы Удалить признаки Очистить БД
III
Рисунок 12. Обучающая выборка (фрагмент)
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
19
Тем самым создаются все необходимые и достаточные предпосылки для выявления силы и направления причинно-следственных связей между значениями факторов и результатами их совместного системного воздействия (с учетом нелинейности системы [15]).
3.4. Синтез и верификация статистических и интеллектуальных моделей
Далее запускаем режим 3.5, в котором происходит выбор моделей для синтеза и верификации (рисунок 13) и нажмем кнопку "ОК". После успешного завершения, также необходимо нажать кнопку "ОК" (рисунок 14).
Рисунок 13. Выбор моделей для синтеза и верификации
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
20
В данном режиме имеется много различных методов верификации моделей, в том числе и поддерживающие бутстрепный метод. Но мы используем параметры по умолчанию, приведенные на рисунке 13.
В результате выполнения режима 3.5 (рисунок 14) созданы все модели, со всеми частными критериями, перечисленные на рисунке 13, но ниже мы приведем лишь некоторые из них (таблицы 3-5).
Предварительно рассмотрим частные и интегральные критерии,
Рисунок 14. Синтез и верификация статистических моделей
и моделей знаний
Отметим, что синтез и верификация всех 10 моделей на выборке 100 статей заняли около полутора часов (процессор i7).
3.5. Частные критерии и виды моделей системы «Эйдос»
Рассмотрим решение задачи идентификации на примере модели INF1, в которой рассчитано количество информации по А.Харкевичу, которое мы получаем о принадлежности идентифицируемого объекта к каждому из классов, если знаем, что у этого объекта есть некоторый признак. Это так называемые частные критерии сходства, приведенные в таблице 3.
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
21
Таблица 3 - Частные критерии знаний, используемые в настоящее время в АСК-анализе и системе «Эйдос-Х++»
Наименование модели знаний и частный критерий Выражение для частного критерия
через относительные частоты через абсолютные частоты
INF1, частный критерий: количество знаний по А.Харкевичу, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу. Относительная частота того, что если у объекта j-го класса обнаружен признак, то это i-й признак il = Yx Log2 P n,,n Ij =Yx Log 2 1 NN, i J
INF2, частный критерий: количество знаний по А.Харкевичу, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу. Относительная частота того, что если предъявлен объект j-го класса, то у него будет обнаружен i-й признак. Ij = Yx Log2 -pP n,n I, = Yx Log 4 nn,
INF3, частный критерий: Хи-квадрат: разности между фактическими и теоретически ожидаемыми абсолютными частотами --- N1N, I = N.. J " " N
INF4, частный критерий: ROI - Return On Investment, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу h—і II .Аэ (Аэ 1 II •Аз і .Аэ N,,N I, = v 1 i] NlNJ
INF5, частный критерий: ROI - Return On Investment, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу h—і II .Аэ (Аэ I II -Аз і .Аз N.N Iij =-J] 1 1J N N,
INF6, частный критерий: разность условной и безусловной относительных частот, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу 1 и ^■ч II
INF7, частный критерий: разность условной и безусловной относительных частот, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу ОА 1 и ^■ч I = Nl _ Nl , N
Обозначения:
i - значение прошлого параметра; j - значение будущего параметра;
Nij - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра;
M- суммарное число значений всех прошлых параметров;
W - суммарное число значений всех будущих параметров.
N - количество встреч i-м значения прошлого параметра по всей выборке;
Nj - количество встреч j-го значения будущего параметра по всей выборке;
N - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра по всей выборке.
Ij - частный критерий знаний: количество знаний в факте наблюдения i-го значения прошлого параметра о том, что объект перейдет в состояние, соответствующее j-му значению будущего параметра;
¥ - нормировочный коэффициент (Е.В.Луценко, 1979, впервые опубликовано в 1993 году [15]), преобразующий количество информации в формуле А.Харкевича в биты и обеспечивающий для нее соблюдение принципа соответствия с формулой Р.Хартли;
Pt - безусловная относительная частота встречи i-го значения прошлого параметра в обучающей выборке;
Pjj - условная относительная частота встречи i-го значения прошлого параметра при j-м значении будущего параметра.
По сути, частные критерии представляют собой просто формулы для преобразования матрицы абсолютных частот (таблица 4)4 в матрицы ус-
4 Которая является также матрицей сопряженности или корреляционной матрицей.
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
22
ловных и безусловных процентных распределений (таблицы 5 и 6) и матрицы знаний (проф. В.И.Лойко, 2014).
Таблица 4 - Матрица абсолютных частот (модель ABS) (фрагмент)
€> 5.5. Модель: "1, ABS - частый критерий: количество встреч сочетаний: "Класс-признак” у объектов обуч^выборки"
I I и
Кед признака Наименование описательной шкалы и Градации 1. СТАТЬЯ-1... 2. СТАТЬЯ-1... 3: СТАТЬЯ-1... 4,- СТАТЬЯ-1... 5. СТАТЬЯ-1... В: СТАТЬЯ-1... 7. СТАТЬЯ-1... 8. СТАТЬЯ-1..,
1 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-[агМс1е 1 1 1 1 1 1 1 1 '
2 БИБЛИО ГРАФ И Ч Е СКАЯ ССЫ Л КА-[Э лектронный .. 1 1 1 1 1 1 1 і;
3 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0 1 1 1 1 1 і
4 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-002 1
5 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0020302015 1
В БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-005
7 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0050403007
8 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-008
Э БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-8860484817
10 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-81
11 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-813 1
12 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-8130585818 1
13 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-014 1
14 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0140508008 1
15 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-018 1
1Є БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0180802011 1
17 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-018 1
18 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0180803018 1
18 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-02 1 і
20 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-020 1
3
Таблица 5 - Матрица информативностей (модель INF1) в битах (фрагмент)
г 5.5. Молрль: "4.1NF1 - чягтный іфтерий: количество внлний по Д.Хлрктевичи' вероятности иа PRCT I 1=1 1 ®
и Г71
Кед признака Наименование описательной шкалы и Градации T СТАТЬЯ-I... 2. СТАТЬЯ-1... 3. СТАТЬЯ-1.. 4. СТАТЬЯ-1... 5. СТАТЬЯ-1... В. СТАТЬЯ-1... 7. СТАТЬЯ-1... 8: СТАТЬЯ-1... 8 С <\1
1 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-[агМс1е -0,018 -0.066 0.060 0.020 -0.111 0.060 -0.054 0.073 -
2 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-[Электронн... -0.018 -0.066 0.060 0.020 -0.111 0.060 -0.054 0.073
3 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0 0.260 0.337 0.297 0.166 0.337 0.351 —
4 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-002 4.154
5 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0020302015... 4.154
Є БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-005
7 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0050403007... —
8 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-006
Э БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-8860484817...
18 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-81
11 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-813 3.S06 —
12 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-8130585818... 3.B06
13 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-014 3.694
14 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0140508008... 3.594
15 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-018 3.654 —
18 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0180802011 ... 3.654
17 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-018 4.097
18 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0180803018... 4.097
18 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-02 2.138 2.063 - А
20 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-020 3.694
л г ІГ
Помощь MS Excel MS Word
-и
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
23
Таблица 6 - Матрица знаний (модель INF3) (фрагмент)
. I в \Шш1'
€> 5.5. Модель: "б, INF3 - частый критерий: Хи-квадрат, разности между фактическими и ожидаемыми абс,частотами"
Кед признака Наименование описательной шкалы и Градации т СТАТЬЯ-1... 2. СТАТЬЯ-1.. 3. СТАТЬЯ-1.. 4. СТАТЬЯ-1... 5. СТДТЬЯ-1... В. СТАТЬЯ-1... 7. СТАТЬЯ-1... 8: СТАТЬЯ-1... п цэ.
1 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-[агМс1е -0.022 -0,083 0.070 0.024' -0.144 0.070 -0.068 0.085
2 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-[Электронн... -0.022 -0.083 0.070 0.024 -0.144 0.070 -0.068 0.085
3 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0 и. 269 -0.774 0.335 0.302 0.182 0.335 -0.763 0.346
4 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-002 -0.006 -0.007 -0,006 -0.006- -0.007 -0.006 0.993 -0.006
5 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0020302015... -0.006 -0,007 -0.006 -0.006 -0.007 -0.006 0.993 -0.006
В БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-005 -0.009 -0.010 -0.009 -0.009 -0.011 -0,009 -0.010 -0,008
7 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0050403007... -0.009 -0.010 -0.009 -0.009 -0.011 -0.009 -0.010 о о о
8 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-008 -0.009 -0.010 -0.009 -0.009 -0.011 -0.009 -0.010 I -0.008
Э БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-8860484817... -0.009 -0,010 -0.009 -0.009 -0.011 -0.009 -0.010 о о о
10 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-81 -0.060 -0.064 -0.055 -0.057 -0.067 -0,055 -0.063 -0,054
11 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-813 -0.009 0.990 -0.009 -0.009 -0.011 -0.009 -0.010 -0,008
12 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-8130585818... -0.009 0.990 -0.009 -0.009 -0.011 -0.009 -0.010 -0.008
13 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-014 -0.013 -0,013 0.988 -0.012 -0.014 -0.012 -0.013 -0.011
14 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0140508008... -0.013 -0.013 0.988 -0.012 -0.014 -0,012 -0.013 -0,011
15 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-018 -0.013 -0.013 -0.012 0.988 -0.014 -0.012. -0.013 -0,011
1Є БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0180802011 ... -0.013 -0.013 -0,012 0.988 -0.014 -0.012 -0,013 -0.011
17 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-018 -0.006 -0,007 -0.006 -0.006- 0.993 -0.006 -0.007 -0.006
18 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-0180803018... -0.006 -0.007 -0.006 -0.006 0.993 -0,006 -0.007 -0,006
18 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-02 -0.079 -0.084 -0.072 0.924 -0.089 -0.072. 0.917 -0,071
20 БИБЛИОГРАФИЧЕСКАЯ ССЫЛКА-020 -0.013 -0.013 -0,012 -0.012 -0.014 0.988 -0,013 -0.011
^1 г
Помощь
2Г
3.6. Ценность описательных шкал и градаций для решения задач идентификации текстов и авторов (нормализация текста)
Для любой из моделей системой «Эйдос» рассчитывается ценность5 градации описательной шкалы, т.е. признака, для идентификации или прогнозирования. Количественной мерой ценности признака в той или иной модели является вариабельность по классам частного критерия для этого признака (таблица 3) Мер вариабельности может быть много, но наиболее известными является среднее модулей отклонения от среднего, дисперсия и среднеквадратичное отклонение. Последняя мера и используется в АСК-анализе и системе «Эйдос».
В системе «Эйдос» ценность признаков нарастающим итогов выводится в графической форме.
При большом объеме обучающей выборки можно без ущерба для достоверности модели удалить из нее малозначимые признаки (Парето-оптимизация). Для этого в системе «Эйдос «также есть соответствующие инструменты.
Как показывает опыт, в результате такого удаления из текста малозначимых признаков (нормализации текста) из него прежде всего будут
5 Эта ценность в АСК-анализе называется также интегральной информативностью, дифференцирующей или дискриминантной способностью и селективной силой, т.е. эти термины являются синонимами.
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
24
удалены различные предлоги, междометия и слова, состоящие из очень малого числа букв (от 1 до 3), а также отдельно стоящие символы типа наклонной черты (флеш) и т.п.
3.7. Интегральные критерии системы «Эйдос»
Но если нам известно, что объект обладает не одним, а несколькими признаками, то как посчитать их общий вклад в сходство с теми или иными классами? Для этого в системе «Эйдос» используется 2 аддитивных интегральных критерия: «Сумма знаний» и «Семантический резонанс знаний».
Интегральный критерий «Семантический резонанс знаний» представляет собой суммарное количество знаний, содержащееся в системе факторов различной природы, характеризующих сам объект управления, управляющие факторы и окружающую среду, о переходе объекта в будущие целевые или нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию от частных критериев знаний, представленных в help режима 3.3:
I = о?, L).
В выражении круглыми скобками обозначено скалярное произведение. В координатной форме это выражение имеет вид:
M
I = Е j.,
І=1
где: M - количество градаций описательных шкал (признаков);
Ту = {Ту } - вектор состояния j-го класса;
Li = {Li} - вектор состояния распознаваемого объекта, включающий все виды факторов, характеризующих сам объект, управляющие воздействия и окружающую среду (массив-локатор), т.е.:
1, если i — й фактор действует;
Li =
п, где : п > 0, если i — й фактор действует с истинностью п;
0, если i — й фактор не действует.
В текущей версии системы «Эйдос-Х++» значения координат вектора состояния распознаваемого объекта принимались равными либо 0, если признака нет, или n, если он присутствует у объекта с интенсивностью n, т.е. представлен n раз (например, буква «о» в слове «молоко» представлена 3 раза, а буква «м» - один раз).
Интегральный критерий «Семантический резонанс знаний» представляет собой нормированное суммарное количество знаний, содержащееся в системе факторов различной природы, характеризующих сам объ-
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
25
ект управления, управляющие факторы и окружающую среду, о переходе объекта в будущие целевые или нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию от частных критериев знаний, представленных в help режима 3.3 и имеет вид:
J. —
sIsLM^Ti
м . .
Е (h -I )(L - L 1
1
где:
M - количество градаций описательных шкал (признаков);
Ij - средняя информативность по вектору класса;
L - среднее по вектору объекта;
sI - среднеквадратичное отклонение частных критериев знаний вектора класса;
sL - среднеквадратичное отклонение по вектору распознаваемого объекта.
Ту — {Ilj} - вектор состояния j-го класса;
Li = {Li} - вектор состояния распознаваемого объекта, включающий все виды факторов, характеризующих сам объект, управляющие воздействия и окружающую среду (массив-локатор), т.е.:
1, если i - й фактор действует;
Li —
п, где: п > 0, если i - й фактор действует с истинностью п;
0, если i - й фактор не действует.
В текущей версии системы «Эйдос-Х++» значения координат вектора состояния распознаваемого объекта принимались равными либо 0, если признака нет, или n, если он присутствует у объекта с интенсивностью n, т.е. представлен n раз (например, буква «о» в слове «молоко» представлена 3 раза, а буква «м» - один раз).
Приведенное выражение для интегрального критерия «Семантический резонанс знаний» получается непосредственно из выражения для критерия «Сумма знаний» после замены координат перемножаемых векторов их стандартизированными значениями:
L
ij ® ^
L ® L
j ''г
Свое наименование интегральный критерий сходства «Семантический резонанс знаний» получил потому, что по своей математической форме является корреляцией двух векторов: состояния j-го класса и состояния распознаваемого объекта.
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
26
3.8. Результаты верификации моделей
Результаты верификации (оценки достоверности) моделей, отличающихся частными критериями (таблица 3) с двумя приведенными выше интегральными критериями приведены на рисунке 15:
Рисунок 15. Результаты верификации моделей
Наиболее достоверной в данном приложении оказались модели INF4 при интегральном критерии «Резонанс знаний» (на рисунке 15 эта модель выделена красным цветом). Данная модель обеспечивает 100% достоверность идентификации статьи и ее авторов по библиографическому описанию этой статьи (достоверность отнесения объекта к классу, к которому он действительно относится), и 98% достоверность не отнесения статьи и ее авторов к тем классам, к которым они не относятся.
Для оценки достоверности моделей в АСК-анализе и системе «Эй-дос» используется метрика, предложенная автором, сходная с F-критерием6 и дающая те же результаты ранжирования моделей по их качеству (рисунок 16):
6 См., например: http://bazhenov.me/blog/2012/07/21/classification-performance-evaluation.html
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
27
ПОЛОЖИТЕЛЬНЫЙ ПСЕВДОПРОГНОЗ.
Предположим, модель дает такой прогноз: выпадет 1, 2, 3, 4, 5 или 6. В этом случае у нее будет 100% достоверность идентификации, т.е. не будет ни одного объекта, не отнесенного к тому классу, к которому он действительно относится, но при этом будет очень большая ошибка ложной идентификации, т. к. огромное количество объектов будет отнесено к классам, к которым они не относятся (и именно за счет этого у модели и будет очень высокая достоверность идентификации), ясно, что такой прогноз бесполезен, поэтому он и назван мной псевдопрогнозом.
ОТРИЦАТЕЛЬНЫЙ ПСЕВДОПРОГНОЗ.
представим себе, что мы выбрасываем кубик с б гранями, и модель предсказывает, что не выпадет: 1, 2, 3, 4, 5 и б, а что-то из этого естественно выпало, конечно, модель дает ошибку в прогнозе в том плане, что не предсказала, что выпадет, зато она очень хорошо угадала, что не выпадет, но ясно, что выпадет что-то одно, а не все, что предсказано, поэтому такого рода предсказания хорошо оправдываются в том, что не произошло и плохо в том, что произошло, т.е. в этом случае у модели будет 100% достоверность не идентификации, но очень низкая достоверность идентификации.
ИДЕАЛЬНЫЙ ПРОГНОЗ.
Если в случае с кубиком мы прогнозируем, что выпадет, например 1, и соответственно прогнозируем, что не выпадет 2, 3, 4, 5, и б, то это идеальный прогноз, имеющий, если он осуществляется, 100% достоверность идентификации и не идентификации, идеальный прогноз, который полностью снимает неопределенность о будущем состоянии объекта прогнозирования, на практике удается получить крайне редко и обычно мы имеем дело с реальным прогнозом.
РЕАЛЬНЫЙ ПРОГНОЗ.
на практике мы чаще всего сталкиваемся именно с этим видом прогноза. Реальный прогноз уменьшает неопределенность о будущем состоянии объекта прогнозирования, но не полностью, как идеальный прогноз, а оставляет некоторую неопределенность не снятой, например, для игрального кубика делается такой прогноз: выпадет 1 или 2, и, соответственно, не выпадет 3, 4, 5 или б. понятно, что полностью на практике такой прогноз не может осуществиться, т.к. варианты выпадения кубика альтернативны, т.е. не может выпасть одновременно и 1, и 2. Поэтому у реального прогноза всегда будет определенная ошибка идентификации, соответственно, если не осуществится один или несколько из прогнозируемых вариантов, то возникнет и ошибка не идентификации, т. к. это не прогнозировалось моделью.теперь представите себе, что у вас не 1 кубик и прогноз его поведения, а тысячи, тогда можно посчитать средневзвешенные характеристики всех этих видов прогнозов.
Таким образом, если просуммировать проценты верной идентификации и не идентификации и вычесть проценты ложной идентификации и ложной не идентификации, то это и будет критерий качества модели, учитывающий как ее способность верно относить объекты к классам, которым они относятся, так и ее способность верно не относить объекты к тем классам, к которым они не относятся, ясно, что этот критерий очень сходен по смыслу с известным F-критерием и сходные оценки качества моделей.
Рисунок 16. Виды прогнозов и принцип определения достоверности
моделей по авторскому варианту метрики, сходной с F-критерием
Кроме того в системе «Эйдос» используют уточненную F-меру, учитывающую не только сам факт идентификации или не идентификации, но и уровень сходства-различия при этом.
Также обращает на себя внимание, что статистические модели, как правило, дают более низкую средневзвешенную достоверность идентификации и не идентификации, чем модели знаний, и практически никогда -более высокую. Этим и оправдано применение моделей знаний.
4. Решение задач идентификации текстов
и их авторов в наиболее достоверной модели
4.1. Присвоение наиболее достоверной модели статуса текущей и решение в ней задач идентификации
В соответствии со схемой этапов последовательного преобразования данных в информацию, а ее в знания в системе "Эйдос", приведенной на рисунке 3, присвоим статус текущей модели INF4, наиболее достоверной модели по данным верификации (рисунок 15). Для этого в режиме 5.6 системы «Эйдос» зададим эту модель и кликнем по кнопке Ok (рисунок 17):
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
28
Рисунок 17. Экранные формы режима присвоения модели статуса текущей
Затем произведем идентификацию и авторов в текущей модели. Для этого запустим режим 4.1.2 системы «Эйдос» (рисунок 18):
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
29
Рисунок 18. Экранная форма режима идентификации текстов и их авторов
Из рисунка 18 видно, что идентификация 100 статей в наиболее достоверной модели INF4 заняла 8 минут, т.е. 4.8 секунды на одну статью.
4.2. Отображение результатов идентификации
Режим 4.1.3 системы «Эйдос» обеспечивает отображение результатов идентификации в различных формах:
1. Подробно наглядно: "Объект - классы".
2. Подробно наглядно: "Класс - объекты".
3. Итоги наглядно: "Объект - классы".
4. Итоги наглядно: "Класс - объекты".
5. Подробно сжато: "Объект - классы".
6. Обобщенная форма по достоверности моделей при разных интегральных критериях.
7. Обобщенный статистический анализ результатов идентификации по моделям и интегральным критериям.
8. Статистический анализ результатов идентификации по классам, моделям и интегральным критериям.
9. Распознавание уровня сходства при разных моделях и интегральных критериях.
10. Достоверность идентификации классов при разных моделях и интегральных критериях.
Рассмотрим некоторые из них.
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
30
На рисунке 19 приведен пример идентификации статьи и ее авторов
4.1.3.1, Визуализация.распознавания в отношении: "Объект^классы" Текущая модель: "INF4" — . Wu&taadl
| Распознаваемые объекты Интегральный критерий сходства: "Семантический резонанс знаний" J
Код Наим.ббъекта £ Код Наименование класса Сходство К Сходство —1
1 20302015 ... 15 СТАТЬЯ-ЮА350801008 ... 88.24.. V
2 50403007 ... 125 АВТО Р-Арустамова_И_С ... 88,24... V
1 3 Є0404017 ... 12Є АВТО Р-Арупонян_М_М ... 88,24... V
и 4 130505019 ... 182 АВТО Р-Л ипеха_А_В ... 88,24... V
5 140506009 ... 287 АВТО Р-Фурсина_А_Б ... 88,24... V
Є 180Є02011 ... 169 АВТОР-Доценко_С_П ... 58,24... V
7 190803018 ... Г 89 СТАТЬЯ-1 DA941310008 ... -0,755...
8 200804030 ... 135 АВТОР-Белюченко_И_С .. -0,755..
9 220G06008 ... 34 СТАТЬЯ-ЮА851101003 ... -1,288... I
10 220Є06011 ... 4 н - Г
11 230Є07008 ... Интегральный критерий сходства: "Сумма знаний
12 270783086 ... Код Наименование класса Сходство |ф... Сходство —
13 270783088 ... 15 СТАТЬЯ-ЮА350801008 ... 27,82... V IIIIIIIIIIIIIIIIIIIIIIIIIII
14 310707007 ... 125 АВТО Р-Арустамова_И_С ... 27,82... V IIIIIIIIIIIIIIIIIIIIIIIIIII
15 340710019 ... 128 АВТО Р-Аругюнян_М_М ... 27,82.. V IIIIIIIIIIIIIIIIIIIIIIIIIII
I 1G 350801008 ... 192 АВТО Р-Л ипеха_А_В ... 27,62... V IIIIIIIIIIIIIIIIIIIIIIIIIII
17 370803012 ... 287 АВТО Р-Фурсина_Д_Б ... 27,82... V
18 420808011 ... 169 АВТОР-Доценко_С_П ... 14,18... V Illlllllllllll
19 430809009 ... 64 СТАТЬЯ-ЮА851301010 ... 1,315... I
20 510907003 ... 211 АВТО Р-ононенко_С_И ... 1,315... I
21 520908011 ... 17 СТАТЬЯ-1 DA420808011 ... 1,289... I
<\ I ► Г <1 iH ■ jj r
Помощь | 9 классов | Классы с MaxMin УрСх | 9 классов с MaxMin УрСх | ВСЕ классы | ВКЛ. Фильтр по класс.шкале ! | ВЫКЛ.Фильтр по класс.шкале | Граф.диаграмма | |||
І- ^ш J
Рисунок 19. Экранная форма результатов идентификации
статьи и ее авторов
На рисунке 20 приведены результаты идентификации автора данной статьи по библиографическим описаниям его статей._______________
[ 4.1.З.2. Визуализация результатов распознавания в отношении: "Класс-объекты". Текущая модель: "1NF4" _
1 Классы | Интегральный критерий сходства: "Семантический резонанс знаний"
1 к. 1 Наим, класра в ■1 Код Наименование объекта Сходство К Сходство
| 187 АВТОР-Исаева_Т_А ... 370803012 ... 64,94... V 1 —
1 188 АВТОР-исляков_П_А ... 3 80404017 ... 42,27... V llllllllllllllllllllllll Illlllllllllll ..
* 189 АВТО Р-Л ебедев_Е_А ... 20 510907003 ... 40,15... V ..
190 АВТО Р-Л ебедева_ ... 2 50403007 ... -3,587...
191 АВТО Р-Л евченко_0_Ю ... 38 711107012 ... -3,850...
192 АВТО Р-Л ипеха_А_В ... 6G 871303053 ... -4,523... 1111 ...
193 АВТО Р-Л ойко_В_И ... 19 43О80Э00Э ... -4,615... 1111 ...
194 АВТО Р-Л укьянец_А_Г ... 48 771203093 ... -5,352... Illll ...
195 АВТО Р-Л уценко_Е_В ... 22 540910014 ... -5,450... inn ... Ж
198 АВТО Р-Л ысенко_Ю_А ... Л I.- д Г
197 АВТОР-ЛюФи_ ... Интегральный критерий сходства: "Сумма знаний"
198 АВТОР-лючка_Е_П ... ■I Наименование объекта Сходство К Сходство
189 АВТОР-Малышевич_Б_ ... 370803012 ... 27,16... V IIIIIIIIIIIIIIIIIIIIIIIIIII ... —
280 АВТОР-Матченко_Е_А ... 20 510607003 ... 17,22... V Illllllllllllllll ...
201 АВТОР-Махмуцов_А_Р .. 3 80404017 ... 18,80... V Illlllllllllllll -
202 АВТОР-Москалёва_ ... 38 711107012 ... 1,285...
203 АВТО Р-М ышкин_В_Ф ... 2 50403007 ... 1,082...
204 АВТО Р-оваленко_А_В ... 19 430809009 ... 1,017...
205 АВТОР-овиков_А_А ... 86 871303053 ... 0,790...
206 АВТОР-овиков_П_С ... 48 771203093 ... 0,469...
207 АВТОР-озловский_Б_Л ... -г 21 520908011 ... 0,489... ж
II і I 1 Г 1 Л г— г
|| Помощь і Поиск объекта В начало БД В конец БД Предыдущая Следующая 9 записей Все записи Печать XL5 Печать TXT Печать ALL
Ш J
Рисунок 20. Результаты идентификации автора данной статьи по библиографическим описаниям его статей
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
31
Результаты решения проблемы, поставленной в статье, приведенные на рисунках 19 и 20 можно признать очень хорошими.
Однако возникает закономерный вопрос о том, а будет ли вообще работать предлагаемый алгоритм и инструментарий на больших базах данных и о том, как он будет работать. Для ответа на этот вопрос был проведен численный эксперимент на выборке 3949 статьи. Результат идентификации статей приведен на рисунках 21.
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
32
e> 413.1. Визуализация результатов распознания а отношении: Ufa»™,- Текущая .одел»: Wl" 1
1 Распознаваемые объекты Интегральный критерий сходства "Семантический резонанс знаний"
НВ СТАТЬЯ-IDA581004004 9495
1 2 410807003 11 СТАТЬЯ-IDA581004005 47.74
1 з 540910015 641010007 11 СТАТЬЯ-IDA601006035 32.03 1
! « 16 СТАТЬЯ-IDA711107042 28.96
| 5 11 СТАТЬЯ-IDA591005018 . 25.15.
6 701106034 11 СТАТЬЯ-IDA581004024 21.82 у
7 801206019 11 СТАТЬЯ-IDA581004006 20.80
8 981404056 11 СТАТЬЯ-IDA581004023 . 11 СТАТЬЯ-IDA581004010 . 19.33 Ції 1
981404104 Н I пг
Интегральный критерий сксоства Сумма знани
^■П СТАТЬЯ-IDA581004004 .
11 СТАТЬЯ-IDA581004005 28.36
11 СТАТЬЯ-IDA601006035 21.16
16 СТАТЬЯ-IDA711107042 . 17.33 ІІІІШІШІШІІ
11 СТАТЬЯ-IDA591005018 . 16.91
11 СТАТЬЯ-IDA581004010 13.19 у
11 СТАТЬЯ-IDA581004024 13.14
11 СТАТЬЯ-IDA581004031 . 12.81 ІІУІІУІІІІ
11 СТАТЬЯ-IDA581004008 . 12.60.
я—, ,пУРСл| 9 классов с МакМіп УрСк | ВСЕ классы | ВКЛ Фильтр по класс шкале | ВЫКЛ Фйльтр по класс шкале | ГраФдиафамма |
є .41.■ ■——— ЦДЯ
Распознаваемые объекты Интегральный критерий сходства "Семантический резонанс знаний"
СТАТЬЯ-ЮА701106034 . 9823
2 410807003 15 СТАТЬЯ-ЮА701106039 17.66 ІІІІІІІІІІІІІІІУ
3 540310015 15 СТАТЬЯ-ЮА701108050 17.63 IIIIIIIIIIIIIIIII
4 581004004 15 СТАТЬЯ-ЮА701106051 . 17.20 ІІІІІІІІІІІІУІІІ
5 641010007 801206019 13. СТАТЬЯ-IDA651101010 . 16.38 IIIIIIIIIIIIIIII
в 15 СТАТЬЯ-ЮА701106025 16.19 IIIIIIIIIIIIIIII
7 34 СТАТЬЯ-IDA1001406034 16.05 IIIIIIIIIIIIIIII
8 891305048 15 СТАТЬЯ-ЮА701106012 . 15.95 ІІІІШІШІШ
9 981404056 15. СТАТЬЯ-ЮА701106002 . 15.70. IIIIIIIIIIIIIII
981404104 Т1 ПГ
Интегральный критерий сксоства Сумма знани
СТАТЬЯ-ЮА701106034 . ™Т,90Л5Г
15 СТАТЬЯ-ЮА701106039 13.29 у
13 СТАТЬЯ-IDA651101010 12.41 IIIIIIIIIIII
15 СТАТЬЯ-ЮА701106050 . 12.36 ІІІІШІШІ
15. СТАТЬЯ-ЮА68П 04041 . 12.21 IIIIIIIIIIII
15 СТАТЬЯ-ЮА701106002 11.55 IIIIIIIIIII
15 СТАТЬЯ TDA701106012 11.52 IIIIIIIIIII
23 СТАТЬЯ-ЮА8П 207035 . 11.49 ■«III
15. СТ АТ ЬЯ *1D А701106051 . 11.44 IIIIIIIIIII
я—, ,пУРСл| 9 классов с МакМіп УрСк | ВСЕ классы | ВКЛ Фильтр по класс шкале | ВЫКЛ Фильтр по класс шкале | Граф диаграмма |
е Ш1 • Ч1 ■ ■ І.„ЦаіДИИ
1 Распознаваемые объекты Интегральный критерий сксоства "Семантический резонанс знаний"
8964
2 410807003 . 28 СТАТЬЯ-IDA881304064 42.51
3 540910015 19 СТАТЬЯ-IDA751201083 32.26
4 581004004 27 СТАТЬЯ-IDA861302048 . 27.98
5 641010007 39. СТАТЬЯ-IDA991405069 . 27.21
є 701106034 . 32 СТАТЬЯ-IDA921308047 25.82
7 801206019 981404056 26 СТАТЬЯ-IDA851301049 25.47
8 26 СТАТЬЯ-IDA851301042 27 СТАТЬЯ-IDA861302059 . 24.47
981404104 . Т1 ПГ
Интегральный критерий скодства Сумма знани
д 28 СТАТЬЯ-IDA881304064 Illlllllllllllllllllll
19 СТАТЬЯ-IDA751201083 17.59 IIIIIIIIIIIIIIIII
27 СТАТЬЯ-IDA861302048 . 16.34 ІІІІШІШІШІ
32 СТАТЬЯ-IDA921308047 . 15.16. IIIIIIIIIIIIIII
26 СТАТЬЯ-IDA851301049 14.70 ІІІІІІІІІІІУІ
26 СТАТЬЯ-IDA851301042 13.96 lllllllllllll
27 СТАТЬЯ-IDA861302059 . 13.96 ««««11111
39. СТАТЬЯ-IDA991405069 . 13.33. lllllllllllll
я— ,ПУРС>| 9 классов с Ма-Мш УрС- | ВСЕ классы | ВКЛ Фильтр по класс шкале | ВЫКЛ Фильтр по класс шкале | ГраФдиафамма |
с) 413.1. Визуализация результатов распознавания а отношении: 'Обьект-классьГ Те^дая модель: "3NF1' 111 nll'"llM*fr
1 Распознаваемые объекты Интегральный критерий сксоства "Семантический резонанс знаний" 1
СТАТЬЯ-IDA981404104 . ““
2 410807003 37 СТАТЬЯ-IDA971403074 33.65
3 540910015 38 СТАТЬЯ-ЮА981404105 27.93
4 581004004 38 СТАТЬЯ-IDA991405026 . 26.63
5 641010007 37 СТАТЬЯ-ЮА981404037 . 25.73
6 701106034 37 СТАТЬЯ-IDA971403075 24.87
7 801206019 37 СТАТЬЯ-IDA971403077 24.29
8 891305048 37 СТАТЬЯ-ЮА981404033 . 24.22,
8 981404056 20 СТАТЬЯ-IDA771203042 . 22.66
Сумма знани
СТАТЬЯ-IDA981404104 . "^ббТ
37 СТАТЬЯ-IDA971403074 18.79 nnnninnngi
38 СТАТЬЯ-ЮА981404105 16.61 nnnninnni
37 СТАТЬЯ-IDA971403077 15.95 ІІІІШІШІШ
20 СТАТЬЯ-IDA771203042 . 15.31 IIIIIIIIIIIIIII
37 СТАТЬЯ-IDA971403075 14.87 nninnngi
38 СТАТЬЯ-ЮА991405026 14.39 iiiinninni
37 СТАТЬЯ-IDA981404041 13.57 ngnginn
37 СТАТЬЯ-ЮА981404037 . 13.43 nnninnn
я— ,пУРСл| 9 классов с Ма-Мш УрС- | ВСЕ классы | ВКЛ Фильтр по класс шкале | ВЫКЛ Фильтр по класс шкале | Граф диаграмма |
C) 4131. Визуализация результатов распознавания а отношении: "Объект-классы" Текущая модель: "TNF1-
1 Распознаваемые объекты Интегральный критерий сксоства 'Семантический резонанс знаний"
і в 9823
2 410807003 581004004 1 Т-ТЬЧ 1C11 и 141П ІІІІІІІІІІІІІІІІІІІІІІІІІІІІ
3 І Т-ТЬЧІС-4 їм 27.42 ІІІІІІІІІІІІІІІІІІІІІІІІІІІ
4 І Т-ТЬЧІС-4 1 26,18 ІІІІІІІІІІІІІІІІІІІІІІІІІІ
5 641Q10007 іТ-ТЬЧІС-4 . ІІІІІІІІІІІІІІІІІІІІІІІІІ
6 701106034 І Т-ТЬЧ І[ -С4І мі 1
7 801206019 III І Т-ТЬЧ 1CІ ми ми 23.72
8 891305048 І Т-ТЬЧ 1C 11 . 23.00 ■■■■І
9 981404056 і т-тьч і: . 22.44
981404104 ^1 It ш
^■ШСТАТЬЯ.ЮА540Э10015 . 18.29 іііі
8681 СТАТЬЯ-IDA420808001 1
9391 СТАТЬЯ-ЮА470903007 16.85 ІІІШІШІШІІ
855І СТАТЬЯ-ЮА410807011 . 16.64
86з| СТАТЬЯ-ЮА420808002 16.40
10 |сТАТЬЯ-ЮА540910003 16.37 1
8701 СТАТЬЯ-IDA420808003 . 10 | СТАТЬЯ-ЮА520908007 . 15.82
„_| .— |я—, ,„U,C,| Э классов c МаиМіп U,C, | ВСЕ классы | .ЯЯ | ЯЫЯЯ |
е ш.1. , _ та™™™-. 1NF1- — 1~ииапя
1 Распознаваемые объекты ,« пьный критерий сксоства "Семантический резонанс знаний"
і в 9512
1 2 410807003 ьч 42.67
1 з 540310015 ЬЧ [ 27.96
0 581004004 701106034 ьч . 24.72
| 5 .'4 ьч .
6 ьч
7 801206019 ьч
8 891305048 ьч ■■■«її
9 981404056 .'4 ьч 20.42
981404104
Интегральный критерий сксоства 'Сумма знаний"
на 68.89
ьч 32,02
ьч 18.04
ьч . 17.78
ьч . 16.58
ьч 15.65
ьч 15.48
ьч . 14.96 «■«««
14 ьч . 14.67
я— 1» "I ~ | r„.|
О 4131. Визуализация результатов распознавания а отношении: -Объект-классы- Текущая модель: W1" ІрЬ=ЬІИЙНІ
1 Распознаваемые объекты Интегральный критерий сксоства "Семантический резонанс знаний"
СТАТЬЯ-ЮАбОІ 206019 .
1 2 410807003 . СТАТЬЯ-ЮА801206026
1 з 540910015 22 | СТАТЬЯ-ГОА801206004 18.74
« 581004004 20 I СТАТЬЯ-ЮА771203002 . 17.67 «III
I 5 641Q10007 23. | СТАТЬЯ-ЮА801206045 . 16.70
I 6 701106034 . 111 СТАТЬЯ-ЮАІООІ406011 16.21
8 22 | СТАТЬЯ-ГОА801206023 21 |СТАТЬЯ-ЮА781204019 15.09
9 981404056 34 I СТАТЬЯ-ЮА951401012 . 14.97
981404104 ^1 Л ■ пг
Интегральный критерий сксоства Сумма знани
в
Т ТЬЧ С 11- 12,83 IIIIIIIIIIII
Т ТЬЧ [[ 11-1- 12.50 IIIIIIIIIIII
.л т тьч с і и . 11.50 ІІІІШІШ
Т ТЬЧ С 1 І- г . 11.32 IIIIIIIIIII
л т тьч : чи 111- 11.30 IIIIIIIIIII
т тьч і: і і- 11.08 IIIIIIIIIII
т тьч : і н е 11.07 ««««III
Т ТЬЧ С 11-1 . 11.01 IIIIIIIIIII
п_1 я—
о 413.1. Визуализация результатов распознавания в отношении: 'Объект-классы-. Те^ая модель: "3NF1" ІПІ^ІЯІІИКНІ
1 Распознаваемые объекты Интегральный критерий сксоства "Семантический резонанс знаний"
iSoca^^^™ в 81.78.
2 410807003 І Т-ТЬЧ 1C-н 1411411
3 540910015 І Т-ТЬЧ 1C-н 141141 її- 18.15
1 4 581004004 І Т-ТЬЧ 1C-н 14114N н . 17.90 «Ill
| 5 641Q10007 І Т-ТЬЧ 1C-н 141141 и І . 17.24
1 3 701106034 І Т-ТЬЧ 1C-н 14114N її 16.94
1 7 801206019 І Т-ТЬЧ 1C-н 14114N І- 16.73 1
1 8 981404104 І Т-ТЬЧ 1C -4 14іі4іі . 15,12 ««««««««
_d t ■ J-іГ
Интегральный критерий сксоства Сумма знани
в ™“f . -ГоГ
І Т-ТЬЧ 1C-н 14114N її 12,70 IIIIIIIIIIII
І Т-ТЬЧ 1C - пі пні 1 12.29 IIIIIIIIIIII
І Т-ТЬЧ ІС-н 1411411 І- 11.88 ІІІІШІШ
І Т-ТЬЧ 1C-н 141141 її- . 11.88 IIIIIIIIIII
І Т-ТЬЧ ІС-н 1411411 н 11.62 IIIIIIIIIII
І Т-ТЬЧ ІС-н 14114П 11.46 IIIIIIIIIII
І Т-ТЬЧ ІС-н 141141N14 10.94 «««nil
І Т-ТЬЧ ІС-н 1411411 . 10.75 llllllllll
я— ,пУРСк| 9 класссвсМакМ,пУРСк| ВСЕ классы | ВКЛ Фильтр пс класс шкале | ВЫКЛ Фильтр пс класс шкале | Граф диаграмма |
Рисунок 21. Экранные формы с результатами идентификации статей в модели INF1: 3949 статей, 19989 слов
Из рисунка 21 мы видим, что все 10 статей, выбранных для идентификации случайным образом, идентифицированы по их стандартному библиографическому описанию абсолютно верно, причем со значительным, в разы, превышением уровня сходства с правильной статьей по сравнению со следующей за ней наиболее сходной. Это означает, что поставленная в
http ://ej. kubagro .ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
33
статье задача успешно решена. Если же различие в уровне сходства наиболее сходной статьи и следующей за ней незначительное, то информацию об этих статьях необходимо предоставить для принятия решения специалисту.
Рассмотрим теперь идентификацию статей с нестандартными и некорректными библиографическими описаниями в модели INF1, созданной на основе 3949 библиографических описаний статей.
Для формирования некорректных библиографических ссылок возьмем стандартную ссылку на статью автора (1-я строка таблицы 7) и будем, начиная с конца библиографического описания, последовательно удалять из него элементы описания и создавать новые строки с неполными библиографическими описаниями. Две последних строки получены не путем удаления элементов библиографического описания, что приводит к неполноте описания, а путем добавления лишних элементов (шума, выделено желтым фоном): наклонной черты после имени автора и неверного указания страниц. Как показывает опыт, в настоящее время подобные описания не идентифицируются программным обеспечением РИНЦ.
В результате получим таблицу 7:
Таблица 7 - Распознаваемая выборка с некорректными (неполными ) _______________библиографическими описаниями______________
№ Объект Статья Автор Библиографическая ссылка
1 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3) / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. -№03(037) С. 154 - 185. - Шифр Информрегистра: 04208000120031, IDA [article ID]: 0370803012 - Режим доступа: http://ej.kubagro.ru/2008/03/12.pdf, 1,938 у.п.л., им-пакт-фактор РИНЦ=0,346
2 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3) / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. -№03(037) С. 154 - 185. - Шифр Информрегистра: 04208000120031, IDA [article ID]: 0370803012 - Режим доступа: http://ej.kubagro.ru/2008/03/12.pdf, 1,938 у.п.л.
3 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3) / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. -№03(037) С. 154 - 185. - Шифр Информрегистра: 04208000120031, IDA [article ID]: 0370803012
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
34
4 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3) / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. -№03(037) С. 154 - 185. - Шифр Информрегистра: 04208000120031
5 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3) / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. -№03(037) С. 154 - 185.
6 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3) / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. -№03(037)
7 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3) / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008.
8 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3)
9 370803012 IDA370803012 Луценко_Е_В Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3)
10 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. / Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3) / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. -№03(037) С. 154 - 185. - Шифр Информрегистра: 04208000120031, IDA [article ID]: 0370803012 - Режим доступа: http://ej.kubagro.ru/2008/03/12.pdf, 1,938 у.п.л., им-пакт-фактор РИНЦ=0,346
11 370803012 IDA370803012 Луценко_Е_В Луценко Е. В. / Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1-3) / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. -№03(037) С. 1154 - 2185. - Шифр Информрегистра: 04208000120031, IDA [article ID]: 0370803012 - Режим доступа: http://ej.kubagro.ru/2008/03/12.pdf, 1,938 у.п.л., им-пакт-фактор РИНЦ=0,346
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
35
Распознаваемую выборку из некорректных (неполных и зашумленных) библиографических описаний введем в систему «Эйдос» с помощью универсального программного интерфейса с внешними базами данных
2.3.2.2 при параметрах, показанных на рисунке 22:_
2.3.2.2. Универсальный программный интерфейс импорта данных в сьиггему гЭЙДОС-Х++“
Автоматическая формализация предметной области: генерация классификационных и описательных шкал и градаций, а также обучающей и распознаваемой выборки на основе базы исходных данных: Inp data1'
—Задайте тип Файла исходных данных: "lnp_data":---------------
S' XLS - MS ЕхсеІ-2003 Стандарт XFS-Файла
Г XLSX- М S Е xcel-2007[2010) ----------------------
Г DBF - DBASE IV (DBF/NTX) Стандарт DBF-Файла
Ґ' CSV - Comma-Separated Values _Стандарт CSy-Файла
—Считать нули и пробелы отсутствием данных?----------------
t* Да Нули и пробелы считаются отсутствием данных
Г Нет Г- Н е знаю
Пояснения по работе конвертера исходных данных I
—Задайте диапазон столбцов классификационных шкал.— Начальный столбец классификационных шкал: J-
Конечный столбец классификационных шкал: J-
-Задайте диапазон столбцов описательных шкал:-Начальный столбец описательных шкал: Конечный столбец описательных шкал:
(-^Задайте режим:------------------------------------------
С' Формализации предметной области (на основе "lnp_data"| f* Генерации распознаваемой выборки (на основе "lnp_rasp"]
-Задайте способ выбора размера интервалов:--------
t* Равные интервалы с разным числом наблюдений Г4 Разные интервалы с равным числом наблюдений
—Задание параметров Формирования сценариев или способа интерпретации текстовых полей "lnp_data":-Г" Не применять сценарный метод АСК-анализа и спец.интерпретацию TXT-полей Г' Применить сценарный метод прогнозирования АСК-анализа (* Применить специальную интерпретацию текстовых полей "lnp_data"
Пояснения по режиму
Параметры интерпретации значений текстовых полей "lnp_data":
—В качестве классов рассматриваются: —В качестве признаков рассматриваются:
Ґ* Значения полей целиком {* Значения полей целиком
(* Элементы значений полей - слова Элементы значений полей • слова
Ґ" Элементы значений полей - символы С Элементы значений полей • символы
J Cancel j
Рисунок 22. Экранная форма универсального программного интерфейса с внешними базами данных для ввода распознаваемой выборки
В результате получена распознаваемая выборка, которую можно просмотреть в режиме 4.1.2 (рисунок 23).
Рисунок 23. Экранная форма распознаваемой выборки некорректных библиографических описаний
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
36
Процесс распознавания проведем в режиме 4.2.1 в модели INF1, созданной на основе библиографических описаний всех 3949 статей (рисунок 24):_____________________________________________
в 4.1.2. Пакетное распознавание, Текущая модель: "IN: 1"
-Стадии исполнения процесса^------------------------------------------------------------------
ОП ЕРАЦИЯ: ПАКЕТНО Е РАСПОЗНАВАНИ Е В ТЕКУ ЩЕЙ МОД Е ЛИ "INF1 1/11: Распознавание (идентификация) 11-го объекта обучающей выборки из 11 - Готово 2/11: Исследование распределений уровней сходства верно и ошиб.идент.объектов - Готово 3/11: Создание сжатых полных форм результатов распознавания по 2-му интегр.крит. - Готово 4/11: Создание подробной наглядной формы: "Объект-классы". Инт.крит.-корреляция - Г отово 5/11: Создание подробной наглядной формы: "Объект-классы". Инт.крит.-сумма инф. - Г отово 6/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит.-корреляция - Г отово 7/11: Создание итоговой наглядной формы:. "Объект-класс". Инт.крит.-сумма инф. - Г отово 8/11: Создание подробной наглядной формы: "Класс-объекты". Инт.крит.-корреляция - Г отово 9/11: Создание подробной наглядной формы: "Класс-объекты". Инт.крит.-сумма инф.- Готово 10/11: Создание итоговой наглядной формы: "Класс-объекты". Инт.крит.-корреляция - Г отово 11/11: Создание итоговой наглядной формы: "Класс-объекты". Инт.крит.-сумма инф. - Г отово
ПАКЕТНОЕ РАСПОЗНАВАНИЕ ОБЪЕКТОВ РАСПОЗНАВАЕМОЙ ВЫБОРКИ ЗАВЕРШЕНО УСПЕШНО
|—Прогноз времени исполнения------------------------------------------------------------
Начало: 14:13:20 Окончание: 17:37:42
104Й1
Прошло: 3:31:56
□ сталось: 0:-7:3
0к
Рисунок 24. Экранная форма отображения стадии процесса идентификации нестандартных и некорректных библиографических описаний
Как видно из рисунка 24, процесс идентификации 11 статей в этой модели занял примерно три с половиной часа или около 20 минут на одно описание.
Результаты распознавания приведены на рисунках 25:
t"} 4.1.3.1. Визуализация результатов распознавания в отношении: 'Объект-хслассы". Текущая модель: "INF1" L
І р аспознаваемые объекты | Интегральный критерий сксдства: "Семантический резонанс знаний" |
1 код | Наим.объекха 2_ HI код Наименование класса Сходство ф~. Сходство Дата Время
1 1 370803012 Г" 778 СТАТЬЯ-ЮА370803012 ... 80,73... V 30.11.2014 17:45:02
1 2 370803012 .. 784 СТДТЬЯ-ЮА380804003 . 52.95 . ІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІ .. 30.11.2014 17 45 02
3 370803012 ... 137 СТАТЬЯ-IDAI0301005 ... 23,29... ІІІІІІІИ mm ... 30.11.2014 17.45.02
4 370803012 .. 13.. СТАТЬЯ-ЮА651101029 . 22Д.9' : iiiiiiiii mu .. 30.11.2014 17-4502
5 .370803012 ... 762 СТАТЬЯ-ЮА360802012 ... 21,81...| Illllllll llll ... 30.11.2014 17.45.02
6 370803012 ... 761 СТАТЬЯ-ЮА360802011 ... 21,68... IIIIIIIII mi ... 30.11.2014 17:45:02
7 370803012 .. 773 СТДТЬЯ-ЮА370803007 . 21.55 : Illllllll llll . 30.11.2014 17-4502
8 370803012 ... 36... СТАТЬЯ-ЮА971403048 ... 20,53... IIIIIIIII Ill ... 30.11.2014 17.45.02
9 370803012 .. 32.. СТАТЬЯ-ЮА921308039 . 19.ТЗ... Illllllll II . . 30.11.2014 17-45-02 3
10 370803012 .. <1 І—.1
11 370803012 ... Ингегральнь їй критерий сходства "Сумма знаний"
■1 Код Наименование Класса I Сходство I Сходство Дата 1 Время :
■ 778 СТАТЬЯ-ЮА370803012 ... 99,45... V iiiiiiiii iiiiiiiii mum mum mum mum m 30.11.2014 17.45.05
704 СТАТЬЯ-ЮА380804003 ... 66,10... iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiini ... 30.11.2014 17:45:05
13.. СТАТЬЯ-ЮАЄБ1101029 .. 25.88:. iiiiiiiii iiiiiiiii . . 3011 2014 17-45-05
761 СТАТЬЯ-ЮА380802011 ... 25,54... iiiiiiiii iiiiiiiii ... 30.11.2014 17.45.05
871 СТАТЬЯ-ЮА420808004 .. 23,89.. iiiiiiiii mini . 3011 2014 17-45-05 ~
14.. СТАТЬЯ-ЮАЄЄ1102045 .. 23.69.. iiiiiiiii mini . 3011 2014 17 45 05
137 СТАТЬЯ-IDAI 0301005 ... 23,14... iiiiiiiii mini .. 30.11.2014 17:45:05
34.. СТАТЬЯ-ЮА951401007 .. 22.76.. iiiiiiiii iiiiii .. 3011 2014 17-45-05
773 СТДТЬЯ-ЮА370803007 ... 22,39... ... 30.11.2014 17.45.05 3
Ч t= )>1 Г 3 г—>1
II Помощь | 9 классов | Классы с MaxMin УрСх | 9 классов с MaxMin УрСх | ВСЕ классы | ВКЛ ■ Фильтр по класс шкале | ВЫК.Л фильтр по класс.шкале | Граф.диаграмма | ||
11 — J
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
37
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
38
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
39
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
40
Рисунок 25. Экранная форма отображения результатов идентификации
нестандартных и некорректных библиографических описаний
Из рисунков 25 видно, что в модели INF1, созданной на основе 3949 статей Научного журнала КубГАУ за 2003-2014 годы, верно идентифицированы все тестовые библиографические описания из таблицы 7: и стандартное из строки 1, и все 10 нестандартные и некорректные (неполные и зашумленные), приведенные в строках 2-11.
5. Выводы
На основе выше изложенного можно сделать обоснованный вывод о том, что АСК-анализ и его программный инструментарий интеллектуальная система «Эйдос», обеспечивают решение задачи идентификации текстов и авторов на основе библиографических описаний публикаций, в том числе нестандартных и некорректных, неполных и зашумленных. При этом обеспечивается очень высокий уровень достоверности идентификации объектов с классами, к которым он действительно принадлежат (100%) и очень высокий уровень достоверности не идентификации объектов с классами, к которым они действительно не принадлежат (около 98%).
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
41
6. Некоторые недостатки и перспективы
Конечно, предлагаемый подход не лишен и некоторых недостатков и ограничений, в преодолении которых состоят некоторые перспективы его развития.
6.1. Повышение быстродействия алгоритмов
Основной недостаток предлагаемых решений, выявленный на приведенных в данной статье примерах, состоит в довольно значительных затратах вычислительных ресурсов, внешней памяти и времени на создание моделей, их верификацию и решение в этих моделях задач идентификации. Особенно это заметно на примере со 3949 статей, 19989 слов.
Таким образом, как обычно возникает вопрос о том, что делать в этих условиях.
Прежде всего, возникает мысль о том, что в больших библиографических базах типа РИНЦ, Скопус и т.п., предлагаемые в данной статье решения целесообразно применять не ко всем статьям и авторам, а лишь к тем, которые не удалось идентифицировать с помощью более простых и быстродействующих алгоритмов, уже реализованных в программном обеспечении этих систем. Иначе говоря применять их в тех случаях, в которых ранее было необходимо участие человека.
Следующая очевидная мысль состоит в том, что необходимо оптимизировать предлагаемые решения алгоритмы и решения специально для их реализации в программном обеспечении больших библиографических баз данных, таких как РИНЦ, Скопус и др. Для того, чтобы это сделать необходимо предварительно разобраться с причинами возникновения этой ситуации. Мы видим две такие основные причины:
Во-первых, это универсальность и независимость от предметной области алгоритма, реализованного в системе «Эйдос». В процессе синтеза и верификации моделей в системе производится расчет большого количества различных выходных форм, которые не нужны при решении задач, поставленных в статье.
Во-вторых, это отсутствие морфологического анализатора в текущей версии системы «Эйдос», в результате чего слова не приводятся к начальной форме и используются все словоформы, реально встретившиеся в библиографических ссылках. Это на порядок увеличивает размерность моделей и время их создания и использования для решения задач.
Соответственно, представляется, что есть два основных пути повышения быстродействия предложенных алгоритмов при их использовании для решения задач идентификации литературных источников и авторов на основе библиографических описаний:
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
42
1) оптимизация алгоритма специально для очень больших библиографических баз данных, типа РИНЦ и Скопус;
п
2) лемматизация текста на основе морфологического анализа, т.е. приведение слов к их исходной форме, и сокращение за счет этого размерностей баз данных на порядок и такое же повышение быстродействия алгоритма.
Кроме того, на взгляд автора, для повышения быстродействия алгоритмов обработки матриц чрезвычайно перспективным является примене-
о
ние в системе «Эйдос» технологии CUDA или другой функционально аналогичной, но более универсальной и менее зависимой от аппаратного обеспечения технологии, обеспечивающей высокопроизводительные параллельные неграфические вычисления на графических процессорах, обладающих огромными вычислительными ресурсами, на порядки превосходящими ресурсы центрального процессора.
6.2. Перспективы применения АСК-анализа и системы «Эйдос» для решения задач идентификации и прогнозирования на основе анализа Internet-контента
Описанная в статье технология может быть применена для решения задач выявления взаимосвязей между динамикой Internet-контента и событиями в области экономики, политики, культуры и в других областях. Особенное значение это приобретает в условиях жесткого информационного противоборства, если не сказать информационной войны, ведущих центров влияния в мире.
Например, в работе [16] тотальная ложь рассматривается как стратегическое информационное оружие общества периода глобализации и дополненной реальности. Рассматривается возможность применения в современном обществе принципа наблюдаемости, как общепринятого в физике критерия реальности. Показано, в каких случаях применение данного принципа в исследованиях общества приводит к общественным иллюзиям, а когда дает адекватные результаты. Предлагаются понятие: «Степень виртуализации общества» и количественная шкала для ее измерения, а также вводится понятие «Общественный умвельт» под которым понимается область общества, существенно отличающаяся от остальных своими фундаментальными закономерностями.
В работах [17] и [18] рассматриваются применение технологий нейролингвистического программирования (НЛП) для астротурфинга9 и манипулирования сознанием больших масс людей и различных целевых групп населения.
7 См., например: http://www.solarix.ru/for developers/api/lemmatization.shtml
8 См., например: http://www.ixbt. com/video3/cuda-1. shtml
9 http://ru.wikipedia.org/wiki/Астротvрфинг___________________________
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
43
Язык программирования Аляска xBase++, на котором написана система «Эйдос-Х++» позволяет реализовать все существующие в настоящее время возможности взаимодействия с Internet-ресурсами, но для этого необходима библиотека Xb2net.dll, которая у автора есть только в демоверсии (функционально-ограниченная).
Литература
1. Луценко Е.В. Атрибуция текстов, как обобщенная задача идентификации и прогнозирования / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. - №02(002). С. 146 - 164. -IDA [article ID]: 0020302013. - Режим доступа: http://ej.kubagro.ru/2003/02/pdf/13.pdf, 1,188 у.п.л.
2. Луценко Е.В. Атрибуция анонимных и псевдонимных текстов в системнокогнитивном анализе / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2004. - №03(005). С. 44 - 64. -IDA [article ID]: 0050403003. - Режим доступа: http://ej.kubagro.ru/2004/03/pdf/03.pdf,
1.312 у.п.л.
3. Луценко Е.В. Лабораторный практикум по интеллектуальным информационным системам: Учебное пособие для студентов специальности "Прикладная информатика (по областям)" и другим экономическим специальностям. 2-е изд., перераб. и доп.
- Краснодар: КубГАУ, 2006. - 318с. http://lc.kubagro.ru/aidos/aidos06 lab/index.htm
4. Луценко Е.В. АСК-анализ проблематики статей Научного журнала КубГАУ в динамике / Е.В. Луценко, В.И. Лойко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №06(100). С. 109 - 145.
- IDA [article ID]: 1001406007. - Режим доступа: http://ej.kubagro.ru/2014/06/pdf/07.pdf,
2.312 у.п.л.
5. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). - Краснодар: КубГАУ. 2002.
- 605 с. http://lc.kubagro.ru/aidos/aidos02/index.htm
6. Луценко Е.В. Теоретические основы, технология и инструментарий автоматизированного системно-когнитивного анализа и возможности его применения для сопоставимой оценки эффективности вузов / Е.В. Луценко, В.Е. Коржаков // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. - №04(088). С. 340 - 359. - IDA [article ID]: 0881304022. - Режим доступа: http://ej.kubagro.ru/2013/04/pdf/22.pdf, 1,25 у.п.л.
7. Луценко Е. В. Универсальная когнитивная аналитическая система «Эй-дос". Монография (научное издание). - Краснодар, КубГАУ. 2014. - 600 с. ISBN 978-594672-830-0
8. Сайт профессора Е.В.Луценко [Электронный ресурс]. Режим доступа: http://lc.kubagro.ru/, свободный. - Загл. с экрана. Яз. рус.
9. Луценко Е.В. Методологические аспекты выявления, представления и использования знаний в АСК-анализе и интеллектуальной системе «Эйдос» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственно-
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
44
го аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2011. - №06(070). С. 233 - 280. - Шифр Информрегистра: 0421100012\0197, IDA [article ID]: 0701106018. - Режим доступа:
http://ej.kubagro.ru/2011/06/pdf/18.pdf, 3 у.п.л.
10. Луценко Е.В. Метризация измерительных шкал различных типов и совместная сопоставимая количественная обработка разнородных факторов в системнокогнитивном анализе и системе «Эйдос» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. -№08(092). С. 859 - 883. - IDA [article ID]: 0921308058. - Режим доступа: http://ej.kubagro.ru/2013/08/pdf/58.pdf, 1,562 у.п.л.
11. Луценко Е.В. Системно-когнитивный анализ как развитие концепции смысла Шенка - Абельсона / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2004. - №03(005). С. 44 - 65. - IDA [article ID]: 0050403004. - Режим доступа: http://ej.kubagro.ru/2004/03/pdf/04.pdf, 1,375 у.п.л.
12. Луценко Е.В. Количественный автоматизированный SWOT- и PEST-анализ средствами АСК-анализа и интеллектуальной системы «Эйдос-Х++» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №07(101). С. 1368 - 1410. - IDA [article ID]: 1011407090. - Режим доступа: http://ej.kubagro.ru/2014/07/pdf/90.pdf, 2,688 у.п.л.
13. Луценко Е.В. Системная теория информации и нелокальные интерпретируемые нейронные сети прямого счета / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. -№01(001). С. 79 - 91. - IDA [article ID]: 0010301011. - Режим доступа: http://ej.kubagro.ru/2003/01/pdf/11.pdf, 0,812 у.п.л.
14. Луценко Е.В. Современное состояние и перспективы развития Политематиче-
ского сетевого электронного научного журнала Кубанского государственного аграрного университета / Е.В. Луценко, В.И. Лойко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №06(100). С. 146 -176. - IDA [article ID]: 1001406008. - Режим доступа:
http://ej.kubagro.ru/2014/06/pdf/08.pdf, 1,938 у.п.л.
15. Луценко Е.В. Моделирование сложных многофакторных нелинейных объектов
управления на основе фрагментированных зашумленных эмпирических данных большой размерности в системно-когнитивном анализе и интеллектуальной системе «Эй-дос-Х++» / Е.В. Луценко, В.Е. Коржаков // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. - №07(091). С. 164 -188. - IDA [article ID]: 0911307012. - Режим доступа:
http://ej.kubagro.ru/2013/07/pdf/12.pdf, 1,562 у.п.л.
16. Луценко Е.В. Тотальная ложь как стратегическое информационное оружие общества периода глобализации и дополненной реальности (применим ли в современном обществе принцип наблюдаемости как критерий реальности) / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Красно-
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
45
дар: КубГАУ, 2014. - №07(101). С. 1411 - 1429. - IDA [article ID]: 1011407091. - Режим доступа: http://ej.kubagro.ru/2014/07/pdf/91.pdf, 1,188 у.п.л.
17. Кара-Мурза С.Г. Манипуляция сознанием. — М.: Изд-во: Эксмо, 2005. — 832
с. ISBN 5-699-08331-6/ http://socioline.ru/files/5/52/kara-murza s. -
manipulyaciya soznaniem politicheskii bestseller - 2005.pdf
18. Ричард Броди. ПСИХИЧЕСКИЕ ВИРУСЫ. Методическое пособие для слушателей курса. «Современные психотехнологии». Москва, 2002, 192 стр.
http://yandex.ru/yandsearch?text= Ричард%20Броди. %20ПСИХИЧЕСКИЕ%20ВИРУСЫ
References
1. Lucenko E.V. Atribucija tekstov, kak obobshhennaja zadacha identifikacii i prog-nozirovanija / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Ku-banskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2003. - №02(002). S. 146 - 164. - IDA [article ID]: 0020302013. - Rezhim dostupa: http://ej.kubagro.ru/2003/02/pdf/13.pdf, 1,188 u.p.l.
2. Lucenko E.V. Atribucija anonimnyh i psevdonimnyh tekstov v sistemno-kognitivnom analize / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2004. - №03(005). S. 44 - 64. - IDA [article ID]: 0050403003. - Rezhim dostupa: http://ej.kubagro.ru/2004/03/pdf/03.pdf, 1,312 u.p.l.
3. Lucenko E.V. Laboratornyj praktikum po intellektual'nym informacionnym siste-mam: Uchebnoe posobie dlja studentov special'nosti "Prikladnaja informatika (po oblastjam)" i drugim jekonomicheskim special'nostjam. 2-e izd., pererab. i dop. - Krasnodar: KubGAU,
2006. - 318s. http://lc.kubagro.ru/aidos/aidos06_lab/index.htm
4. Lucenko E.V. ASK-analiz problematiki statej Nauchnogo zhurnala KubGAU v di-namike / E.V. Lucenko, V.I. Lojko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. - №06(100). S. 109 - 145. - IDA [article ID]: 1001406007. - Rezhim dostupa: http://ej.kubagro.ru/2014/06/pdf/07.pdf, 2,312 u.p.l.
5. Lucenko E.V. Avtomatizirovannyj sistemno-kognitivnyj analiz v upravlenii aktiv-
nymi ob#ektami (sistemnaja teorija informacii i ee primenenie v issledovanii jeko-nomicheskih, social'no-psihologicheskih, tehnologicheskih i organizacionno-tehnicheskih sis-tem): Monografija (nauchnoe izdanie). - Krasnodar: KubGAU. 2002. - 605 s.
http ://lc. kub agro .ru/aidos/aidos02/index. htm
6. Lucenko E.V. Teoreticheskie osnovy, tehnologija i instrumentarij avtomatizirovan-
nogo sistemno-kognitivnogo analiza i vozmozhnosti ego primenenija dlja sopostavimoj ocen-ki jeffektivnosti vuzov / E.V. Lucenko, V.E. Korzhakov // Politematicheskij setevoj jelek-tronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2013. - №04(088). S. 340 -359. - IDA [article ID]: 0881304022. - Rezhim dostupa:
http://ej.kubagro.ru/2013/04/pdf/22.pdf, 1,25 u.p.l.
7. Lucenko E.V. Universal'naja kognitivnaja analiticheskaja sistema «Jejdos". Monografija (nauchnoe izdanie). - Krasnodar, KubGAU. 2014. - 600 s. ISBN 978-5-94672-830-0
8. Sajt professora E.V.Lucenko [Jelektronnyj resurs]. Rezhim dostupa: http://lc.kubagro.ru/, svobodnyj. - Zagl. s jekrana. Jaz. rus.
9. Lucenko E.V. Metodologicheskie aspekty vyjavlenija, predstavlenija i ispol'zovanija znanij v ASK-analize i intellektual'noj sisteme «Jejdos» / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2011. -
http://ej.kubagro.ru/2014/09/pdf/32.pdf
Научный журнал КубГАУ, №103(09), 2014 года
46
№06(070). S. 233 - 280. - Shifr Informregistra: 0421100012\0197, IDA [article ID]: 0701106018. - Rezhim dostupa: http://ej.kubagro.ru/2011/06/pdf/18.pdf, 3 u.p.l.
10. Lucenko E.V. Metrizacija izmeritel'nyh shkal razlichnyh tipov i sovmestnaja sopostavimaja kolichestvennaja obrabotka raznorodnyh faktorov v sistemno-kognitivnom an-alize i sisteme «Jejdos» / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2013. - №08(092). S. 859 - 883. - IDA [article ID]: 0921308058. - Rezhim dostupa: http://ej.kubagro.ru/2013/08/pdf/58.pdf, 1,562 u.p.l.
11. Lucenko E.V. Sistemno-kognitivnyj analiz kak razvitie koncepcii smysla Shenka -Abel'sona / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2004. - №03(005). S. 44 - 65. - IDA [article ID]: 0050403004. - Rezhim dostupa: http://ej.kubagro.ru/2004/03/pdf/04.pdf, 1,375 u.p.l.
12. Lucenko E.V. Kolichestvennyj avtomatizirovannyj SWOT- i PEST-analiz sredstvami ASK-analiza i intellektual'noj sistemy «Jejdos-H++» / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU,
2014. - №07(101). S. 1368 - 1410. - IDA [article ID]: 1011407090. - Rezhim dostupa: http://ej.kubagro.ru/2014/07/pdf/90.pdf, 2,688 u.p.l.
13. Lucenko E.V. Sistemnaja teorija informacii i nelokal'nye interpretiruemye nejronnye seti prjamogo scheta / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2003. - №01(001). S. 79 - 91. - IDA [article ID]: 0010301011. - Rezhim dostupa: http://ej.kubagro.ru/2003/01/pdf/11.pdf, 0,812 u.p.l.
14. Lucenko E.V. Sovremennoe sostojanie i perspektivy razvitija Politematicheskogo setevogo jelektronnogo nauchnogo zhurnala Kubanskogo gosudarstvennogo agrarnogo universiteta / E.V. Lucenko, V.I. Lojko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. - №06(100). S. 146 - 176. - IDA [article ID]: 1001406008. - Rezhim dostupa: http://ej.kubagro.ru/2014/06/pdf/08.pdf, 1,938 u.p.l.
15. Lucenko E.V. Modelirovanie slozhnyh mnogofaktornyh nelinejnyh ob#ektov uprav-lenija na osnove fragmentirovannyh zashumlennyh jempiricheskih dannyh bol'shoj razmer-nosti v sistemno-kognitivnom analize i intellektual'noj sisteme «Jejdos-H++» / E.V. Lucenko, V.E. Korzhakov // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2013. - №07(091). S. 164 - 188. - IDA [article ID]: 0911307012. - Rezhim dostupa: http://ej.kubagro.ru/2013/07/pdf/12.pdf, 1,562 u.p.l.
16. Lucenko E.V. Total'naja lozh' kak strategicheskoe informacionnoe oruzhie ob-shhestva perioda globalizacii i dopolnennoj real'nosti (primenim li v sovremennom ob-shhestve princip nabljudaemosti kak kriterij real'nosti) / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. -№07(101). S. 1411 - 1429. - IDA [article ID]: 1011407091. - Rezhim dostupa: http://ej.kubagro.ru/2014/07/pdf/91.pdf, 1,188 u.p.l.
17. Kara-Murza S.G. Manipuljacija soznaniem. — M.: Izd-vo: Jeksmo, 2005. — 832 s.
ISBN 5-699-08331-6/ http://socioline.ru/files/5/52/kara-murza_s._-
_manipulyaciya_soznaniem_politicheskii_bestseller_-_2005.pdf
18. Richard Brodi. PSIHIChESKIE VIRUSY. Metodicheskoe posobie dlja slushatelej
kursa. «Sovremennye psihotehnologii». Moskva, 2002, 192 str.
http://yandex.ru/yandsearch?text= Richard%20Brodi. %20PSIHIChESKIE%20VIRUSY
http://ej.kubagro.ru/2014/09/pdf/32.pdf