УДК 004.8
08.00.13 - Математические и инструментальные методы экономики (экономические науки)
ПРОГНОЗИРОВАНИЕ РИСКОВ НЕВОЗВРАТА ССУДЫ С ПРИМЕНЕНИЕМ ИНТЕЛЛЕКТУАЛЬНОГО ИТЕРАЦИОННОГО АЛГОРИТМА УЧЕТА НЕТИПИЧНЫХ СЛУЧАЕВ
Луценко Евгений Вениаминович
д.э.н., к.т.н., профессор
Web of Science ResearcherID S-8667-2018
Scopus Author ID: 57188763047
РИНЦ id=123162, SPIN-code: 9523-7101
prof.lutsenko@gmail.com http ://lc. kub agro.ru
https://www.researchgate.net/profile/Eugene-Lutsenko
В данной работе ставится, рассматривается и решается актуальная задача достоверного прогнозирования рисков невозврата ссуды. От успешности решения этой задачи самым непосредственным образом зависят прибыльность, успешность и устойчивость субсидирующих организаций. Предлагается теоретическое и практическое решение этой задачи путем применения интеллектуального итерационного алгоритма учета нетипичных случаев субсидирования, которые обычно и приводят к понижению достоверности прогнозирования. Предлагаемое решение основано на применении автоматизированного системно-когнитивного анализа (АСК-анализ) и его программного инструментария - интеллектуальной системы «Эйдос». Приводится подробный численный пример, основанный на данных портала Каггл
Ключевые слова: АВТОМАТИЗИРОВАННЫЙ СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ, АСК-АНАЛИЗ, СИСТЕМА «ЭЙДОС»
DOI: http://dx.doi.org/10.21515/1990-4665-170-009
UDC 004.8
08.00.13 - Mathematical and instrumental methods of Economics (Economics)
FORECASTING THE RISKS OF LOAN NON-REPAYMENT USING AN INTELLIGENT ITERATIVE ALGORITHM FOR ACCOUNTING FOR ATYPICAL CASES
Lutsenko Evgeniy Veniaminovich
Dr.Sci.Econ., Cand.Tech.Sci., professor
Web of Science ResearcherlD S-8667-2018
Scopus Author ID: 57188763047
RSCI id=123162, SPIN-code: 9523-7101
prof.lutsenko@gmail.com http://lc.kubagro.ru
https://www.researchgate.net/profile/Eugene-Lutsenko
In this work we set, examine and solve the actual problem of reliable forecasting of the risks of non-repayment of a loan. The profitability, success, and sustainability of subsidizing organizations directly depend on the success of this task. We have also proposed a theoretical and practical solution to this problem is by applying an intelligent iterative algorithm for accounting for atypical cases of subsidies, which usually lead to a decrease in the reliability of forecasting. The proposed solution is based on the use of automated system-cognitive analysis (ASC-analysis) and its software tools which is "Eidos", the intelligent system. We also provide a detailed numerical example based on data from the Kaggl portal
Keywords: AUTOMATED SYSTEM-COGNITIVE ANALYSIS, ASC-ANALYSIS, "EIDOS" SYSTEM
Введение
В данной работе ставится, подробно рассматривается и решается актуальная задача достоверного прогнозирования рисков невозврата ссуды. От успешности решения этой задачи самым непосредственным образом зависят прибыльность, успешность и устойчивость субсидирующих организаций. Предлагается теоретическое и практическое решение этой задачи путем применения интеллектуального итерационного алгоритма учета нетипичных случаев субсидирования, которые обычно и приводят к понижению достоверности прогнозирования. Предлагаемое решение основано на применении методов, ссылка на которые дается во введении работы [35].
1. Проблематика работы
1.1. Описание предметной области, объект, предмет, проблема, цель и задачи работы
Задача прогнозирования рисков невозврата финансовых средств (ссуд, кредитов, инвестиций)1 физическими и юридическими лицами является весьма актуальной для всех, систематически занимающихся этим видом деятельности. Если достоверно прогнозировать риск невозврата ссуды и предоставлять ее только тогда, когда риск ее невозврата мал и не предоставлять ее, когда он велик, то прибыль от субсидирования будет высока2. Понятно, что чем ниже достоверность прогнозирования риска невозврата ссуды, тем ниже прибыльность от субсидирования. Более того, при высоком риске невозврата субсидирование может привести к убыточности от этого вида деятельности или даже к банкротству («неоправданное кредитование») .
Поэтому прибыль от субсидирования самым непосредственным образом зависит от достоверности прогнозирования риска невозврата ссуды.
Из этого следует объект и предмет исследования, а также проблема, решаемая в работе, ее цель и задачи.
Объект исследования - прогнозирование риска невозврата ссуды.
Предмет исследования - прогнозирование рисков невозврата ссуды с применением интеллектуального итерационного алгоритма учета нетипичных случаев.
Проблема - возникающая при прогнозировании риска невозврата ссуды - ложно-отрицательные решения, возникающие, когда модель не относит ситуацию к классу (обобщенной категории), к которой она в действительности относится. Этот вид ошибок возникает в нетипичных ситуациях, резко снижает достоверность прогнозирования и приводит к ошибочным рекомендациям о выдаче или невыдачи ссуды, противоположным адекватным. Фактически стандартные алгоритмы прогнозирования основаны на обобщении типовых ситуаций и, поэтому, нетипичные ситуации ими обрабатываются ошибочно. Желательно было бы, чтобы алгоритм прогнозирования корректно обрабатывал не только типовые, но и нетипичные случаи.
Таким образом, налицо противоречие между фактическим и желаемым и это противоречие неприемлемо.
Постановка целей и задач работы подробно описывается в разделе 1.1 работы [35].
1 Далее в работе будем говорить о ссудах
2 Это очень напоминает вечный двигатель, основанный на «демоне Максвелла», непосредственно преобразующий информацию в энергию.
3 Случаи целенаправленного банкротства в данной работе не рассматриваются.
1.2. Обоснование требований к методу решения проблемы
Конкретно требования к методу решения проблемы приведены в разделе 1.2 работы [35]. Очень важно также, чтобы данный метод был реализован в реально доступной пользователям программной системе.
1.3. Выбор метода решения проблемы, соответствующего обоснованным требованиям
В работах [4-9], посвященных вопросам прогнозирования рисков невозврата заемных средств (скоринг) само понятие «нетипичные случаи» вообще не встречается. В работе [10] оно встречается, но не приводится ни способа выявления таких нетипичных случаев с применением технологий искусственного интеллекта, ни способа их обработки и учета в интеллектуальных моделях (о которых в работе [10] вообще не упоминается).
В работах автора [11-18] приводятся исследования и разработки учета нетипичных случаев в интеллектуальных скоринговых моделях (см. также раздел 1.3 работы [35]).
Эти разработки соответствуют всем обоснованным в разделе 1.2 требованиям, за исключением одного, но критически важного требования: описанная в них DOS-версия системы «Эйдос» морально устарела и давно отсутствует в открытом доступе.
Поэтому с 2012 года автором разрабатывается и непрерывно совершенствуется органичная для MS Windows новая версия этой системы: «Эйдос-Х++» (подробнее о системе «Эйдос» см. также раздел 1.3 работы [35]).
В рамках решения поставленной в данной работе проблемы в системе «Эйдос» должен быть разработан новый режим, реализующий предложенные в данной работе идею, концепцию и интеллектуальный итерационный алгоритм учета в модели прогнозирования нетипичных случаев возврата и невозврата ссуды. Описание данных идеи, концепции, алгоритма и режима в открытой печати осуществляется впервые. В этом состоит актуальность данной работы.
1.4. Выводы
По результатам 1-й главы сформулированы объект, предмет, проблема, цель и задачи работы. В качестве метода решения поставленной проблемы выбран АСК-анализ, который полностью соответствует обоснованным требованиям.
Вместе с тем этот метод должен быть доработан в следующих аспектах:
1. Должна быть предложена идея и разработана концепция учета в модели прогнозирования нетипичных случаев возврата и невозврата ссуды.
2. Данная концепция должна быть конкретизирована и детализирована до уровня, описанного в разделе 1.4 работы [35].
В этой доработке наиболее подходящего метода решения проблемы и его апробации на основе реальных данных и состоит содержание последующих разделов данной работы.
2. Научное (теоретическое) решение проблемы
2.1. Идея и концепция научного решения проблемы
Идея научного решения проблемы состоит в следующем. Обобщенные образы классов создаются путем обобщения всех относящихся к ним наблюдений обучающей выборки. При верификации моделей выясняется, что некоторые наблюдения модель правильно относит к тем классам, к которым они действительно принадлежат, а некоторые нет. Естественно считать, что верно идентифицируются те наблюдения, которые являются типичными для данной предметной области. Нетипичные же наблюдения, являющиеся исключениями из правила (т.е. выявленных и отраженных в модели закономерностей), модель не относит к тем классам, к которым они в действительности относятся, т.е. дает ложно-отрицательные решения. Предлагается создать собственные классы с теми же наименованиями для нетипичных наблюдений (исключений).
Концепция научного решения проблемы. Формулировка концепции решения проблемы дана в разделе 2.1 работы [35]. Необходимо также провести верификацию моделей путем распознавания в них наблюдений из обучающей выборки. Выбрать модель, наиболее достоверную по Б-критерию Ван Ризбергена. Если количество ложно-отрицательных решений в результатах распознавания в наиболее достоверной модели не уменьшилось, то переход на выход. Иначе для наблюдений обучающей выборки, идентификация которых привела к ложно-отрицательным решениям (т.е. они не были отнесены к классам, к которым в действительности относятся) создать для них в исходных данных свои классы с теми же наименованиями, но с добавлением к названию символов, означающих, что этот класс создан для исключений. Перейти на начало. Выход.
2.2. Описание общей теории метода решения проблемы: суть метода АСК-анализа
Суть метода АСК-анализа описана в разделе 2.2 работы [35].
Понятие данных, по-видимому, является одним из предельно общих понятий, выработанных человечеством, может быть даже это наиболее общее понятие. По мнению автора, понятие данных является даже более общим, чем понятия материи и сознания, бытия и небытия, пространства и времени. О чем бы мы не говорили, о чем бы не думали, что бы не
представляли, все это мы делаем лишь оперируя определенными данными. Таким образом, человек находится как бы в мыльном пузыре или коконе из данных, за пределы которого он в принципе не может выйти. И цветные движущиеся узоры на поверхности этого мыльного пузыря человек и принимает за реальный мир. А чтобы определить, что такое данные именно это и нужно сделать, т.е. необходимо выйти за пределы данных к чему-то еще более общему. Но как это сделать не совсем понятно, даже в принципе. Это создает большие сложности для традиционного определения понятия данных (см. раздел 2.2 работы [35])4.
Поэтому предлагается два варианта.
1-й вариант: указать только специфический признак данных, а более общее понятие не указывать. Этот вариант приводит к такому определению: данные - это все, связанное с теми или иными различиями в наличии или степени выраженности тех или иных свойств.
2-й вариант: определить понятие данных через частное понятие, входящее в него, и сделать это не смотря на то, что это не принято5.
Подробнее смысловое содержание понятий: «Данные», «Информация», «Знания» в сопоставлении друг с другом раскрывается в разделе 2.2 работы [35].
2.3. Описание личного вклада автора в теоретическое решение проблемы (научная новизна)
- предлагается идея и концепция учета нетипичных случаев;
- которая в отличие от традиционного подхода (Луценко, 1995, 1996);
- путем разделения классов на типичную и нетипичную части (нетипичными считаются наблюдения, порождающие ложно-отрицательные решения);
- обеспечивает 61,5%: повышение достоверности прогнозирования рисков невозврата ссуды по критерию Ь1 проф.Е.В.Луценко (мера Ь1 является нечетким мультиклассовым обобщением известной Б-меры Ван Ризбергена [24]).
В этом и состоит научная новизна исследования.
2.4. Выводы
В данном разделе автором предложен интеллектуальный итерационный алгоритм учета нетипичных случаев, который в отличие от
4 Например, как определяют млекопитающее: это животное (более общее понятие), выкармливающее своих детенышей молоком (специфический признак, выделяющий из более общего понятия определяемое подмножество).
5 Например, животные (более общее понятие), это и млекопитающие, и не млекопитающие, т.е. как выкармливающее своих детенышей молоком (специфический признак, выделяющий из более общего понятия известное частное понятие), так и не молоком и вообще не выкармливающие.
традиционного подхода (Луценко, 1995, 1996) путем разделения классов на типичную и нетипичную части (нетипичными считаются наблюдения, порождающие ложно-отрицательные решения) обеспечивает 61,5%: повышение достоверности прогнозирования рисков невозврата ссуды.
Этим самым поставленная проблема решена теоретически и задача главы выполнена.
Однако для применения предложенного теоретического решения поставленной проблемы на практике необходимо разработать и создать инфраструктуру практического применения этого решения. Решению этой задачи и посвящен следующий раздел.
3. Инженерное (практическое) решение проблемы: технология (программный инструментарий) и методика решения проблемы
3.1. Технико-экономическое обоснование целесообразности работы (ТЭО)
Ответим на вопрос: «Зачем это нужно?». Ответ на этот вопрос, по сути, является основным содержанием «Технико-экономического обоснования» (ТЭО).
Задача прогнозирования рисков невозврата финансовых средств (ссуд, кредитов, инвестиций) физическими и юридическими лицами является весьма актуальной для всех, систематически занимающихся этим видом деятельности. Если достоверно прогнозировать риск невозврата ссуды и предоставлять ее только тогда, когда риск ее невозврата мал и не предоставлять ее, когда он велик, то прибыль от субсидирования будет высока. Понятно, что чем ниже достоверность прогнозирования риска невозврата ссуды, тем ниже прибыльность от субсидирования. Более того, при высоком риске невозврата субсидирование может привести к убыточности от этого вида деятельности или даже к банкротству («неоправданное кредитование»). Поэтому прибыль от субсидирования самым непосредственным образом зависит от достоверности прогнозирования риска невозврата ссуды.
Из этого следует целесообразность проведения исследования.
3.2. Техническое задание (ТЗ): функциональное описание того, что необходимо сделать (ТЗ)
Ответим на вопрос: «Что нужно сделать», чтобы решить поставленную проблему, т.е. какие функции необходимо реализовать в программной системе, чтобы она обеспечивала решение поставленной проблемы. Ответ на этот вопрос является основным содержанием «Технического задания» (ТЗ).
В системе «Эйдос» необходимо реализовать режим, обеспечивающий реализацию сформулированных выше идеи и концепции решения проблемы.
3.3. Технический проект (ТП) и рабочий проект (РП): структуры и отношения данных, алгоритмы их обработки, реализация
Подробнее содержание технического проекта описано в разделе 3.3 работы [35].
3.3.1. Суть математической модели АСК-анализа и частные критерии
Суть математической модели АСК-анализа описана в разделе 3.3.1 работы [35].
3.3.2. Интегральные критерии и принятие управляющих решений
Интегральные критерии, применяемые в настоящее время в АСК-анализе, описаны в разделе 3.3.2 работы [35].
3.3.3. Интеллектуальный итерационный алгоритм учета нетипичных случаев
Предлагается следующий алгоритм решения проблемы (рисунок 1):
Шаг 1. Содержание данного шага приведено в разделе 3.3.3 работы [35].
Шаг 2. Выполнить синтез моделей [35].
Шаг 3. Провести верификацию моделей путем распознавания в них наблюдений из обучающей выборки.
Шаг 4. Выбрать модель, наиболее достоверную по Б-критерию Ван Ризбергена.
Шаг 5. Если количество ложно-отрицательных решений в результатах распознавания в наиболее достоверной модели не уменьшилось, то переход на шаг 7 (выход).
Шаг 6. Для наблюдений обучающей выборки, идентификация которых привела к ложно-отрицательным решениям (т.е. они не были отнесены к классам, к которым в действительности относятся) создать для них в исходных данных свои классы с теми же наименованиями, но с добавлением к названию символов, означающих, что этот класс создан для исключений. Перейти на шаг 1.
Шаг 7. Выход.
Шаг 1. Осуществить формализацию предметной области: подготовка исходных данных и формализация предметной области (разработка классификационных и описательных шкал и градаций и кодирование исходных с их помощью, т.е. получение обучающей выборки).
Шаг 2. Выполнить синтез моделей: Abs, Prc1, Prc2, Infi, Inf2, Inf3, Inf4, Inf5, Inf6, Inf7.
Выбрать модель, наиболее достоверную по F-
\аг 5. Посчитать количество ложно-отрицательных решений (РЫ-решения) в результатах распознавания в наиболее достоверной модели.
наблюдений обучающей выборки, идентификация которых привела к ложно-отрицательным решениям (т.е. они не были отнесены к классам, к которым в действительности относятся) создать в исходных данных свои классы с теми же наименованиями, но с добавлением к названию символов, означающих, что этот класс создан для исключений. Перейти на шаг 1.
Рисунок 1. Интеллектуальный итерационный алгоритм учета нетипичных случаев
Рабочий проект (РП) - это сама программная реализация данного алгоритма и соответствующих структур данных.
В этапы разработки технического и рабочего проекта АСК-анализа и интеллектуальной системы «Эйдос» приведены в разделе 3.3.3 работы [35].
Обычно считается, что программирование является не научной, а инженерной работой (приложение 1). Автор всю сознательную жизнь профессионально занимается программированием (с 1976 года) и совершенно не согласен с этой распространённой точкой зрения. По мнению автора, программирование, являясь инженерным трудом, безусловно, включает серьезную научную компоненту, а также является видом искусства.
3.4. Выводы
По результатам данного раздела можно сделать обоснованный вывод о том, что инфраструктура применения на практике ранее разработанного научного решения проблемы успешно спроектирована и создана, чем научное решение доведено до статуса инновации.
Следующим шагом является внедрение, применение на практике новой версии системы «Эйдос», в состав которой входит режим, реализующий предложенные в данной работе идею, концепцию и интеллектуальный алгоритм учета нетипичных случаев при прогнозировании рисков невозврата ссуды.
В данной работе в качестве применения на практике предложенных решений рассмотрим подробный численный пример, основанный на реальных данных, находящихся в общем доступе. Для этого необходимо разработать все виды обеспечения внедрения и осуществить само внедрение, что позволит проверить эффективность всех ранее принятых решений и оценить их значение для науки и практики. Все это и является содержанием следующего раздела.
4. Применение разработанной технологии на практике,
ее внедрение и оценка эффективности решения проблемы 4.1. Методика, план и обеспечение внедрения
Методика внедрения - это перечень этапов работ или задач, которые необходимо выполнить для осуществления внедрения.
В разделе данной работы путем декомпозиции ее цели получена определенная последовательность задач, подробнее о которых можно прочитать в разделе 4.1 работы [35].
План внедрения - это утвержденный руководителем внедрения перечень мероприятий с датами выполнения и ответственными по каждому пункту. В принципе план внедрения это методика внедрения, дополненная различной информацией, необходимой для ее реализации.
В данном случае автор в одном лице совмещал роли и руководителя, и ответственного исполнителя внедрения. Как исполнитель автор решал все поставленные задачи в сроки, которые он заранее жестко не определял, но так, чтобы успеть подготовить материал к очередному номеру журнала.
Виды обеспечения внедрения:
- финансовое (финансирование работ по внедрению);
- организационное (описание схем и регламентов информационного, финансового и материального взаимодействия участников внедрения, логистика);
- юридическое (документы, придающие внедрению и формируемым в его результате отношениям и документам необходимый юридический статус);
- кадровое (специалисты, участвующие во внедрении, их количество и компетенции);
- техническое (компьютерная и орг.техника, компьютерные сети, доступ в Internet, а транспортное обеспечение, здания и сооружения, служебные помещения).
Все эти виды обеспечения внедрения необходимы для его успеха.
Данная работа выполнялась по инициативе и за счет автора на его собственном компьютере.
4.2. Методика оценки эффективности внедрения
Эффективность внедрения может рассматриваться в натуральном или/и стоимостном выражении.
В натуральном выражении эффективность это в основном количество и качество продукции.
В стоимостном выражении эффективность это в основном прибыль и рентабельность.
В случае данной работы эффективность предложенных решений в натуральном выражении может измеряться повышением достоверности моделей прогнозирования, в частности уменьшением количества ложно-отрицательных решений (ошибок не отнесения ситуаций к классам, к которым они на самом деле относятся). В данной работе мы оценим этот вид эффективности в численном примере, основанном на реальных данных.
В стоимостном выражении эффективность предлагаемых решений можно определить путем сравнения прибыли от субсидирования за определённый период до их применения и после их применения. Ожидается увеличение этой прибыли за счет снижения доли неадекватных решений.
4.3. Описание внедрения и его результатов (численный пример)
На этом численном примере наглядно проиллюстрируем принятые решения в той форме, в которой они в настоящее время реализованы в системе «Эйдос», и исследуем их эффективность [35].
4.3.1. Задача 1: когнитивная структуризация предметной области
Система «Эйдос» выявляет эмпирические закономерности в
моделируемой предметной области и отображает их в различных формах: табличной, графической и аналитической. Это соответствует эмпирическому этапу развития. Этим самым она вплотную подводит исследователя к теоретическому уровню познания [23, 35]6
О том, что это значит, можно подробнее ознакомиться в разделе 4.3.1 работы [35].
Данная работа основана на исходных данных, размещенных на портале Kaggle: https://www.kaggle.com/kmldas/loan-default-prediction.
По описанию задачи на портале Kaggle можно сделать вывод о том, что ее смысл состоит в том, чтобы по характеристикам получателя ссуды спрогнозировать риск ее невозврата. На основе этого прогноза можно принять обоснованное решение о выдаче или невыдаче ссуды данному конкретному ссудополучателю.
Исходные данные содержат следующие параметры:
- серийный номер или уникальный идентификатор ссудополучателя;
- занятость ссудополучателя (работает ли он или является безработным);
- банковский баланс ссудополучателя;
- годовая зарплата ссудополучателя;
- результат возврата/невозврата ссуды.
О том, что в данной работе выбрано в качестве классификационных и описательных шкал и градаций можно прочитать в разделе 4.3.1 работы [35] (таблицы 1 и 2):
Таблица 1 - Классификационная Таблица 2 - Описательные шкалы шкала
Код Наименование
1 DEFAULTED?
Код Наименование
1 EMPLOYED
2 BANK BALANCE
3 ANNUAL SALARY
4.3.2. Задача 2: подготовка исходных данных и формализация предметной области
Исходные данные для данной работы получены непосредственно с портала Kaggle по прямой ссылке: https://www.kaggle.com/kmldas/loan-default-prediction/download.
Эти данные представлены в виде С8У-файла. После скачивания этого файла для ввода в систему «Эйдос» с ним было выполнено несколько простых преобразований:
6 См., также: http://lc.kubagro.ru/aidos/Works on identification presentation and use of knowledge.htm
1. CSV-файл был переименован с «Default_Fin.csv» на «Inp_data.csv» и размещен в папке: ..\Aidos-X\AID_DATA\Inp_data\ системы «Эйдос» для исходных данных табличного типа.
2. CSV-файл был преобразован в XLS-файл для удобства дальнейшей корректировки и ввода в систему «Эйдос».
Само CSV-XLS преобразование (конвертирование) может быть осуществлено онлайн с помощью одного из онлайн-конвертеров. Рекомендуется использовать следующие CSV-XLS-онлайн конвертеры, которые очень хорошо работают со стандартными CSV-файлами:
https://convertio.co/ru/csv-xls/,
https://onlineconvertfree.com/ru/convert-format/csv-to-xls/;
https://document.online-convert.com/ru/convert/csv-to-excel.
В простейшем случае CSV-файл это текст, состоящий из строк, в каждой из которых содержится одинаковое количество элементов, разделенных каким-либо разделителем, чаще всего запятой. Таким образом, строки CSV-файла можно поставить в соответствие строкам таблицы, а элементы строк - колонкам таблицы.
Но следует иметь в виду, что сам CSV-стандарт (форматированный текст) еще не совсем устоялся. Но в CSV-файлах в качестве разделителя могут быть использованы и другие символы, например, точка с запятой или табуляция. Иногда, когда необходимо, чтобы внутри элементов использовалась запятая, эти элементы выделяют кавычками. Поэтому иногда (достаточно редко) встречаются CSV-файлы с необычными форматами, которые не всякий конвертер сможет корректно преобразовать. В этом случае рекомендуется попробовать подобрать другой конвертер, которых очень много в открытом доступе. Потратив на это некоторое время, обычно удается получить желаемый результат.
3. После преобразования CSV-файла в XLS-файл в нем средствами MS-Excel были произведены следующие корректировки:
- в колонках Employed и Defaulted логические переменные 0/1 замены на Yes, No соответственно;
- колонка Defaulted, советующая классификационной шкале, выделена желтым фоном;
- в числовых колонках сделано два знака после запятой (по числу максимальному числу разрядов после запятой, которое встречается в исходных данных в данной колонке);
- при разработке реальных научных интеллектуальных приложений убедительно рекомендуется в числовых колонах в обязательном порядке указывать единицы измерения, в нашем случае это доллары США;
- XLS-файл (стандарт MS Excel-2003) записан в стандарте более новых версий MS Excel как XLSX. Это сделано потому, что в новом стандарте файл имеет размер примерно в два раза меньше, чем в старом.
В результате всех этих операций получилась таблица исходных данных (см. таблицу 3 в работе [35]):
В таблице 3 работы [35] приведен лишь небольшой фрагмент исходных данных, т.к. в этой таблице 10000 строк. Полностью ее можно скачать из Эйдос-облака по прямой ссылке: http://aidos.byethost5.com/Source data applications/Applications-000293/Inp data.xlsx.
Запустим режим 2.3.2.2 системы «Эйдос» [351 (рисунок 2):_
{*) 2.3.2.2,.Универсальный програм!
импорта данных в систему ЭИДОС'-Х-i
j' a
Автоматическая формализация предметной области: генерация классификационных и описательных шкал и градаций, а также обучающей и распознаваемой выборки на основе базы исходных данных: "1пр с1а1а"
—Задайте тип файла исходных данный: "lnp_dala":
Стандарт XLS-Файла
Г RLS'-MS'Excei-2Q03
П XLSX- MS Е xcel-2007(2010] Г DBF - DBASE IV (DBF/NTX) С CSV - CSV => DBF конвертер
Стандарт DBF-Файла
Стандарт CSV-Файла
i—Завайте диапазон столбцов классификационных шкал: Начальный столбец классификационных шкал: Конечный столбец классификационных шкал:
-Задайте параметры:-
<•" Нули и пробелы считать ОТСУТСТВИЕМ данных Г Нули и пробелы считать ЗНАЧЕНИЯМИ данных Создавать БД средних по классам "lnp_davi.dbf"?
Требования к файлу исходных данных
[—Задайте диапазон столбцов описательных шкал: Начальный столбец описательных шкал: Конечный столбец описательных шкал:
(* Формализации предметной области (на основе "lnp_data") Г Генерации распознаваемой выборки (на основе "lnp_rasp"]
—Задайте способ выбора размера интервалов: С Равные интервалы с разным числом наблюдений (* Разные интервалы с равным числом наблюдений
—Задание параметров формирования сценариев или способа интерпретации <• Не применять сценарный метод АСК-анализа С Приг
олей "lnp_data":-
j сценарный метод АСК-ан
Параметры интерпретации значений текстовых полей "Inp data":
Интерпретация ТХТ-полей признаков:
—Интерпретация ТХТ-полей классов:--
Значения полей текстовых классификационных шкал Файла исходных данных "lnp_data" рассматриваются как целое
Значения полей текстовых описательных шкал Файла исходных данных "lnp_data" рассматриваются как целое
-Какие наименования ГРАДАЦИЙ числовых шкал использовать: Только интервальные числовые значения С Только наименования интервальных числовых значений И интервальные числовые значения, и их наименования
(например; "1 /3-{59873.0000000,178545. S6S6S67}") (например: "Минимальное"]
(например: "Минимальное: 1 /3-{5Э873.0000000,178545.6666667}'')
Рисунок 2. Экранные форма программного интерфейса (API) 2.3.2.2 системы «Эйдос» с внешними данными табличного типа
О выводах, которые можно сделать на основе рисунка 4 и о смысле и требованиях API-2.3.2.2 (рисунок 3) можно узнать из раздела 4.3.2 работы [35].
Рисунок 3. Экранные формы HELP программного интерфейса (API) 2.3.2.2
О результатах работы АР1-2.3.2.2, а также о том, что представляет собой обучающая выборка и какие возможности дальнейшей обработки открывает АР1-2.3.2.2 можно прочитать в разделе 4.3.2 работы [35] (таблицы 3, 4, 5).
Таблица 3 - Классификационные шкалы и градации (возврат/невозврат ссуды)
Код Наименование
1 DEFAULTED?-1/2-No
2 DEFAU LTE D?-2/2-Yes
Таблица 4 - Описательные шкалы и градации
(характеристики ссудополучателей)
Код Наименование
1 EMPLOYED-1/2-No
2 EM PLOYE D-2/2-Yes
3 BANK BALANCE, $-1/3-{0.2400000, 7799.1600000}
4 BANK BALANCE, $-2/3-{7799.1600000, 12737.0400000}
5 BANK BALANCE, $-3/3-{12737.0400000, 31851.8400000}
6 ANNUAL SALARY, $-1/3-{9263.6400000, 304886.6400000}
7 ANNUAL SALARY, $-2/3-{304886.6400000, 487205.0400000}
8 ANNUAL SALARY, $-3/3-{487205.0400000, 882650.7600000}
Таблица 5 - Обучающая выборка (фрагмент)
ID ссудополучателя EMPLOYED BANK BALANCE, $- ANNUAL SALARY, $- DEFAULTED?-
1 2 4 8 1
2 1 4 6 1
3 2 5 7 1
4 2 3 7 1
5 2 4 7 1
6 1 4 6 1
7 2 4 6 1
8 1 4 6 1
9 2 5 7 1
*** *** *** *** ***
25 2 4 7 1
4.3.3. Задача 3: применение итерационного алгоритма
разделения обобщенных образов классов на типичную и нетипичную части
В соответствии с предложенным интеллектуальным итерационным алгоритмом учета нетипичных случаев при прогнозировании невозврата ссуды сначала создадим базовую (исходную) модель, а затем будем повышать ее достоверность путем создания в исходных данных классов для нетипичных случаев и синтеза и верификации моделей в последовательных итерациях. Этот процесс останавливается тогда, когда модели перестают улучшаться в его результате.
4.3.3.1. Исходная модель
4.3.3.1.1. Синтез и верификация статистических и системно-когнитивных моделей
Синтез и верификация статистических и системно-когнитивных моделей (СК-моделей) моделей осуществляется в режиме 3.5 системы «Эйдос» (рисунок 4).
Обратим внимание на то, что на рисунке 6 в правом нижнем углу окна задана опция: «Расчеты проводить на графическом процессоре (GPU)».
Из рисунка 6 видно, что весь процесс синтеза и верификации моделей занял 5 минут 34 секунды. Отметим, что при синтезе и верификации моделей использовался графический процессор (GPU) видеокарты. На центральном процессоре (CPU) выполнение этих операций занимает значительно большее время (на некоторых задачах это происходит в десятки, сотни и даже тысячи раз дольше). Таким образом, неграфические вычисления на графических процессорах видеокарты делает возможной обработку больших объемов исходных данных за разумное время. В процесс синтеза и верификации моделей осуществляется также расчет 10 выходных форм, на что уходит более 99% времени исполнения.
{*) 3,5, Синтез и верификация моделей
ы ИВ -I
- Задайте модели для синтеза и верификации Статистические базы:
-1. АВ5 - частный критерий: количество встреч сочетаний: "класс-признак" у объектов обуч.выборки
2. РПС1 - частный критерий: усл. вероятность 1-го признака среди признаков объектов ¡-го класса
3. РБ1С2 - частный критерий: условная вероятность ¡-го признака у объектов ¡-го класса Системно-когнитивные модели (базы знаний):
р 4 INFI
I? 5 INF2
W е INF3
Р 7 INF4
!✓ 8 INF5
I? Э INF6
10.INF7 - частный критерий: разн.усл.и безусл. вероятностей; вероятности из PRC2
Текущая модель
Г 1. ABS Г 2. PRC1 Г 3. PRC2
(Г 4 INFI
Г 5 INF2
Г е INF3
г 7 INF4
г 8 INF5
г 8 INF6
г 10.INF7
Параметры копирования обучающей выборки в распознаваемую:
-Какие объекты обуч.выборки копировать: (• Копировать всю обучающую выборку С Копировать только текущий объект С Копировать каждый М-й объект С Копировать N случайных объектов С Копировать все объекты от N1 до N2 С Вообще не менять распознаваемую выборку
~ Пояснение по алгоритму верификации ] --
-Удалять Из обуч.выборки скопированные объекты:-i* Не удалять С Удалять
Подробнее |
Измеряется внутренняя достоверн. модели
Для каждой заданной модели выполнить:
Синтез и верификацию С Только верификацию С Только синтез
На каком процессоре выполнять расчеты: С CPU (i GPU
Уменьшение размеров базы данных результатов распознавания: Р|а5р.с1Ы
Расчетный размер БД результатов распознавания Вй5р.с1Ь( равен 1000200 байт, т.е.: 0.0465754 % от МДК-возможного, (от 2Гб) Задайте, сколько X от исходной БД Вазр,с!Ы оставить, удаляя наименее достоверные результаты распознавания: |100г ООООООО
3.5, Синтез и верификация моделей
Копирований обучающей выборки ц распознаваемую - Готово Синтез/.стат.модели "ABS" (расчет матрицы абсолютных частот) - Готово Синтез'стат.моделей "PRC1" и "PRC2" (усл.безусл^ распр.) - Готово Синтез системно-когнитивны/ моделей: INF1-INF7 - Готово
Стадии исполнения процесса Шаг 1-Й из 11 Шаг 2-й из 11 Шаг 3-й из 11 Шаг 4-й из 11
НАЧАЛО ЦИКЛА ПО ЧАСТНЫМ И ИНТЕГРАЛЬНЫМ КРИТЕРИЯМ-ИСПОЛНЕНИЕ-Шаг 5-й из 11: Задание модели "INF?" в качестве текущей1- Готово Шаг Б-й из 11. Пакетное распознавание в модели "INF7" - Готово
Шаг 7-й из 11: Измерение достоверности модели "Inf?" - Интегральный критерий: "Сумма знаний" - Готово
КОНЕЦ ЦИКЛА ПО ЧАСТНЫМ И ИНТЕГРАЛЬНЫМ КРИТЕРИЯМ - ГОТОВО'-...
Шаг 8-й из 11: Объединение БД DostRsp# в БД DostRasp - Готово
Шаг Э-й из 11. Печать сводной формы по результатам верификации моделей-.Готобо
Шаг 10-й из 11: Создание формы: "Достоверность идет.классов в различны/моделях"-Готово
Шаг 11-й из 11' "Присвоение заданной модели: Infi статуса текущей'^Готово
Синтез и верификация статистических и системно-когнитивных моделей упешно завершены !!!
- Прогноз времени иополнемнч
Начало: 12:51:31 Окончание: 12:57:06
т%
ж
Прошла: 0:05:34
Осталось: 1):00:00
Рисунок 4. Экранные формы режима синтеза и верификации моделей
системы «Эйдос» (режим 3.5)
Некоторые созданные статистические и модели (СК-модели) приведены на рисунках 5-8:
системно-когнитивные
I В
С) 5.5. Модель: 1. ABS - частный критерий: кол/чество ес-реч сочетаний; "Класс-признак" у объектов обуч.еыборк,-'
Код признака Наименование описательной шкапы иградации г DEFAULTED? 2/2 YES ш Среднее Средн. кеаар. отк л.
2 EMPL0YED-1 /2-Но 2817 127 2944 1472.00 1902.12
EMPLOYED-2/2-Yes 6850 206 7056 3528.00 4698.02
3 BANK BALANCE, $ 1/3 {0.2400000, 7799.1600000) 3167 3167 15е3.50 2239.41
4 BANK BALANCE, $-2/3-(7799.1600000, 12737.0400000} 3158 9 3167 1583.50 2226.68
5 BANK BALANCE, $-3/3-(l2737.0400000, 31851.84000001 2843 324 3167 1583.50 1781.20
6 ANNUAL SALARY, $-1/3-{9263.6400000, 304886.6400000} 3199 134 3333 1666.50 2167.28
7 ANNUAL SALARY, $-2/3-<304886.6400000,487205.0400000} 3235 98 3333 1666.50 2218.19
8 ANNUAL SALARY, $-3/3-{487205.0400000,882650.7600000} 3233 101 3334 1667.00 2214.66
Сумма числа признаков 28502 999 29501
Среднее 3563 125 1843.81
Среднеквадратичное отклонение 1339 105 10000 - 917.45
Сумма числа объектов обуч. выборки 9667 333
Рисунок 5. Матрица абсолютных частот: статистическая Модель ABS
5.5. Модель: "3. PRC2 - частный критерий: условная вероятность ¡-го признака у объектового класса
Коя признака Наименование описательной шкалы и градации 1. DEFAULT... 1/2 NO 2. DEFAULT... 2/2 YES Безус л. еероягн Среднее Средн. квшр. откл.
1 EMPLOYED-l/2-No 29.140 38.13S 29.440 33.639 6.362
2 EMPLOYED-2/2-Yes 70.860 61.862 70.560 31.670 66.361 16.380 6.362
3 BANK BALANCE. i-1 /3 {0.2400000,7799.1600000} 32.761 23.165
4 BANK BALANCE, $-2/3-{77ЭЭ, 1600000,12737.0400000} 32.668 2.703 31.670 17.685 21.189
5 BANK BALANCE, $-3/3-{12737 0400000.31351.8400000} 29.409 97.297 31.670 63.353 48.004
В ANNUAL SALARY. $-1/3-{9263.6400000. 304886,6400000} 33.092 40.240 33.330 36.666 5.055
7 ANNUAL SALARY. $-2/3-{304886.6400000. 487205,0400000} 33.464 29.429 33.330 31.447 2.853
8 ANNUAL SALARY. $-3/3-{487205.0400000. 882650,7600000} 33.444 30.330 33.340 31.887 2.201
Сумма 294.езе 300.000 594.838
Среднее 36.855 37.500 37.177
Среднеквадратичное отклонение 13.851 31.421 23.457
Рисунок 6. Матрица условных и безусловных процентных распределений:
статистическая модель РЯС2
Ф 5.5. Модель: "4. INFI - частный критерий: количество знаний по А.Харкевичу; вероятности иа PRC1"
Код признака Наименование описательной шкалы и градации 1. DEFAULTED? 1/2 NO 2. DEFAULTED? 2/2 YES Сумма Среднее Средн. квадр. откл.
1 EMPLOYED-l/2-No -0.0Q1 0.024 0.023 0.011 0.017
2 EMPLOYED-2/2-Yes 0.000 -0.014 -0.014 -0.007 0.011
3 BANK BALANCE. $-1/3-{0.2400000. 7799.1600000} 0.003 0.003 0.002 0.002
4 BANK BALANCE. $.2/3 (7799.1600000,12737.0400000} 0.003 -0.241 -0.238 -0.119 0.172
5 BANK BALANCE. $-3/3(12737.0400000.31851.8400000} -0.007 0.107 0.100 0.050 o.oei
Б ANNUAL SALARY, $-1 /3.(9263.6400000. 304836 64000001 -0.001 0.017 0.016 o.ooe 0.012
7 ANNUAL SALARY. $-2/3-(30488S.6400000. 487205.0400000} 0.000 -0.014 -0.013 -0.007 0.010
8 ANNUAL SALARY. t-3/3-{487205.0400000. 882650.7600000} o.ooo -o.oii -o.oio -0.005 o.ooe
Сумма -0.001 -0.132 -0.133
Среднее 0.000 -0.017 -0,008
Среднеквадратичной отклонение 0.003 0.099 о.ose
Рисунок 7. Матрица информативностей: СК-модель INF
{*) 5-5. Модель: "б. INF3 - частный критерий: Хи-квадрзт. разности между фактическими и ожидаемыми абс.частотами
Код признака Наименование описательной шкалы и градации t. DEFAULTED? 1/2N0 2 DEFAULTED? 2/2 YES Сумма Среднее средн. квадр. огкл.
t EMPLOYED-l/2-No -27.307 27.307 38.617
2 Е MPLO Y£ D -2/2-Yes 32.939 -32.939 46.563
3 BANK BALANCE. $-1 /3^0.2400000. 7789.1600000} 107.245 -107.245 0.000 0.000 151.667
4 BANK BALANCE. $-2/3-!7799.1600000.12737,04000001 98.245 -58.245 0.000 0.000 138.939
5 BANK BAIANCE. $-3/3-{12737.0400000. 31851.3400000! -216.755 216.755 0.000 0.000 306-536
Б ANNUAL SALARY. t-1/3-0263.6400000. 304886.6400000} -21.134 21.134 0.000 0.000 29.see
7 ANNUAL SALARY. t-2/3-{304386,6400000. 487205.0400000} 14.666 -14.366 0.000 0.000 21.024
8 ANNUAL SALARY. $-3/3-{487205.0400000. 882650 7600000} 11.900 -11.900 0.000 0.000 16.829
Сумма 0.000 0.000 0.000
Среднее 0.000 0.000 0.000
Среднеквадратичное отклонение 100.553 100.553 97.143
Рисунок 8. Матрица хи-квадрат: СК-модель INF3
Отметим, что в АСК-анализе и СК-моделях степень выраженности различных свойств объектов наблюдения рассматривается с единственной точки зрения: с точки зрения того, какое количество информации содержится в них о том, к каким обобщающим категориям (классам) будут принадлежать или не принадлежать эти объекты. Поэтому не играет никакой роли, в каких единицах измерения измеряются те или иные свойства объектов наблюдения, а также в каких единицах измеряются результаты влияния этих свойств, натуральных, в процентах или стоимостных [21]. Это и есть решение проблемы сопоставимости в АСК-анализе и системе «Эйдос», отличающее их от других интеллектуальных технологий.
4.3.3.1.2. Оценка достоверности моделей
Оценка достоверности моделей в системе «Эйдос» осуществляется путем решения задачи классификации объектов обучающей выборки по обобщенным образам классов и подсчета количества истинных и ложных положительных и отрицательных решений по Б-мере Ван Ризбергена, а также по критериям Ь1- Ь2-мерам проф. Е.В.Луценко, которые предложены для того, чтобы смягчить или полностью преодолеть некоторые недостатки Б-меры [24]. В режиме 3.4 системы «Эйдос» изучается достоверность каждой частной модели в соответствии с этими мерами достоверности (рисунок 9).
Из рисунка 11 мы видим, что в данном интеллектуальном приложении по Б-критерию Ван Ризбергена наиболее достоверной является СК-модель ШБ3 с интегральным критерием «Сумма знаний» (Б=0,708 при максимуме 1,000), что является неплохим результатом для моделируемой предметной области.
Это подтверждает наличие и адекватное отражение в СК-модели 1№3 сильной причинно-следственной зависимости между
характеристиками ссудополучателей и возвратом или невозвратом
ими полученной ссуды.
Рисунок 9. Экранная форма с информацией о достоверности моделей
по F-критерию Ван Ризбергена
На рисунке 10 приведено частотное распределения числа истинных и ложных положительных и отрицательных решений по результатам прогнозирования возврата/невозврата ссуды в СК-модели INF3 по данным обучающей выборки:
Рисунок 10. Частотные распределения числа истинных и ложных положительных и отрицательных решений и их разности в СК-модели ЫС
Рисунок 10 содержит изображения частотных распределений количества истинных и ложных положительных и отрицательных решений в зависимости от уровня сходства. Из этого рисунка мы видим, что в районе высоких уровней сходства есть аномальный выброс ложно-положительных и ложно-отрицательных решений, которого не должно
быть в разумной модели. Возможно, этот выброс связан с изменениями, внесенными их автором, разместившим их на портале Kaggle. Он упоминает об этих изменениях и объясняет их необходимостью обезличивания данных.
4.3.3.1.3.3адание текущей модели и распознавание в ней
Важно иметь в виду, что корректируется (путем разделения классов на типичную и нетипичную части) всегда та модель, в которой проводилось распознавание. Если данный режим 3.7.6 запускается сразу после режима синтеза и верификации моделей 3.5 - то это будет СК-модель ЮТ7, как последняя, в которой проводилась верификация в режиме 3.5. Если мы в режиме 3.4 выбрали другую модель для улучшения как наиболее достоверную, то надо ее задать в качестве текущей в режиме 5.6, а затем выполнить распознавание в этой модели в режиме 4.1.2.
Поэтому далее выполняем режим 5.6 (рисунки 1 и 11), а затем режим распознавания 4.1.2 в текущей модели 1ЫРЗ (рисунок 12).
Рисунок 11. Экранные формы придания наиболее достоверной СК-модели !п13 статуса текущей модели
4 1,2. Пакетное распознавание. ]екущая модель:
Стадии исполнения процесса
ОПЕРАЦИЯ: ПАКЕТНОЕ РАСПОЗНАВАНИЕ В ТЕКУЩЕЙ МОДЕЛИ "INF3":
1/11: GPU-Pacnoзнавание (идентификация) 10000 объектов распознаваемой выборки-Готово
2/11: Расчет распределений уровней сходства верно и ошиб.идент.объектов: 100.0000000%- Готово
3/11:. Создание сжатых полных форм результатов распозн.по двум интегр.крит.: 100.0000000%- Готово
4/11: Создание подр.нагл.формы: "Объект-классы". Инт.крит.-корреляция: 100.0000000%- Готово
5/11:. Создание подр.нагл.формы: "Объект-классы". Инт.крит.-суммаинф.: 100.0000000%- Готово
6/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит.-корреляция: 100.0000000%- Готово
7/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит.-суммаинф.: 100.0000000%-Готово
8/11: Создание подробной наглядной формы: "Класс-объекты". Инт:крит.-корреляция: 100.0000000%- Готово
9/11:. Создание подробной наглядной формы: "Класс-объекты". Инт.крит.-сумма инф.: 100.0000000%- Готово
10/11: Создание итоговой наглядной формы: "Класс-объекты". Инт.крит.-корреляция: 100.0000000%- Готово
11/11: Создание итоговой наглядной формы: "Класс-объекты".. Инт.крит.-сумма инф.: 100.0000000%- Готово
ПАКЕТНОЕ РАСПОЗНАВАНИЕ ОБЪЕКТОВ РАСПОЗНАВАЕМОЙ ВЫБОРКИ ЗАВЕРШЕНО УСПЕШНО !
-Прогноз времени исполнения-
Начало: 19:28:01 Окончание: 19:28:20
100%
Прошло: 0:00:18
Осталось: 0:00:00
Рисунок 12. Экранная форма пакетного распознавания в текущей СК-модели Inf3
Из экранной формы на рисунке 14 видно, что процесс идентификации 10000 объектов распознаваемой выборки шел 18 секунд. Для самого распознавания использовался графический процессор (GPU), а точнее 1500 шейдерных процессоров видеокарты NVIDIA GeForce GTX 770. Для расчета 10 выходных форм по результатам распознавания использовался центральный процессор (CPU) i7. В основном время было затрачено именно на расчет выходных форм.
4.3.3.2. Первая итерация. Синтез и верификация
статистических и системно-когнитивных моделей. Оценка достоверности моделей. Задание текущей модели и распознавание в ней
Для выполнения 1-й итерации запускаем режим 3.7.6 (рисунок 13):
Рисунок 13. Экранные формы режима разделения классов на типичную
и нетипичную части
После запуска режима появляется прогресс-бар и после него окно с сообщением и запускается АР1-2.3.2.2 с параметрами, сформированными данным режимом (рисунок 14). Затем выполняем режимы, следуя инструкциям системы (рисунки 15) ._
^ 4.2.2,4 (3.7.6) Разделение классов на типичную и нетипичную части
Назначено на новые классы: 2318 нетипичных объектов обучающей выборки. БД с объектами обучающей выборки, приведшими к РЫ-решениям: С: \А10 0 5 0_РАТ АМ пр_с1а1а\0 ^Ра^еЫед. н1з
Далее нужно выполнить режим 2.3.2.2 с параметрами, заданными по умолчанию. Этот режим будет запущен автоматически по нажатию клавиши: "ОК". После него нужно вручную запустить режим 3.5 и посмотреть достоверность в режиме 3.4. Если достоверность устраивает или перестала повышаться, то прекратить итерации
□ к
С) 2.3.2.2. Универсальный программный интерфейс импорта данных б систему ЭЙДОС-Х+
И в и^.
Автоматическая формализация предметной области: генерация классификационных и описательных шкал и градаций, а также обучающей и распознаваемой выборки на основе базы исходных данных: "1пр_с1а1а"
—Задайте параметры:-
Стандарт ХЬЭ-Файла
—Задайтетип Файла исходных данных: Чг^с^а' С Х1-5 -М6Ехсе1-2003 Г Х1_5Х- МЭ Е ксе1-2007(2010] С* ОВР - О ВАЙЕ IV (ОВР/ЫТХ) Стандарт ОВР-файла
С" СЭУ => РВР конвертер Стандарт С5У-Фзйла
(•" Нули и пробелы считать ОТСУТСТВИЕМ данным Г Нули и пробелы считать ЗНАЧЕНИЯМИ данных Г" Создавать БД средних по классам "lnp_davr.dbf"?
Требования к файлу исходных данных
Задайте диапазон столбцов классиФикационнык шкал: Начальный столбец классификационных шкал: ] 5 Конечный столбец классификационных шкал: | ^
—Задайте режим:-
(• Формализации предметной области [на основе "1пр_с1а1а") С Генерации распознаваемой выборки (на основе "1пр_газр")
Задайте диапазон столбцов описательных шкал: Начальный столбец описательных шкал: Конечный столбец описательных шкал:
—Задайте способ выбора размера интервалов:--
С Равные интервалы с разным числом наблюдений {Разные интервалы с равным числом наблюдений
Задание параметров Формирования сценариев или способа интерпретации текстовый полей "1пр_с1а1а":-(•Не применять сценарный метод АСК-анализа С" Применить сценарный метод АСК-анализа
Параметры интерпретации значений текстовых полей "1пр_с1а1а":
—Интерпретация ТХТ-полей классов: Значения полей текстовых классификационных шкал Файла исходных данных "1пр_с1а1а" рассматриваются как целое
Интерпретация ТХТ-полей признаков:
Значения полей текстовых описательным шкал Файла
исходных данных "1пр_с1а1а" рассматриваются как целое
Какие наименования ГРАДАЦИЙ числовым шкал использовэть:
(* Только интервальные числовые значения (например
С Только наименования интервальных числовых значений (например
И интервальные числовые значения, и их наименования (например
"1 /3-{59В73.0000000.178545.6666667}") "Минимальное"]
"Минимальное: 1/3-{5Э873.0000000,178545.6666667}")
Рисунок 14. Экранные формы режима разделения классов на типичную
и нетипичную части
Мы эти рисунки, полученные на 1-й итерации, не комментируем, т.к. их наименования есть в наименовании экранных форм и они полностью аналогичны полученным в исходной модели.
Рисунок 15. Экранные формы режима разделения классов на типичную
и нетипичную части 1 -й итерации
В данном интеллектуальном приложении по F-критерию Ван Ризбергена наиболее достоверной является СК-модель INF3 с интегральным критерием «Сумма знаний».
Из сравнения рисунков 9 и 15 мы видим, что в результате 1-й итерации достоверность этой модели :
- по критерию Ван Ризбергена выросла на 5,3%: с 0,708 до 0,746;
- по критерию L1 проф.Е.В.Луценко [24] выросла на 61,5%: с 0,592 до 0,956, что вообще является отличным показателем.
Частотное распределение истинных и ложных положительных и отрицательных решений в зависимости от уровня сходства также стало гораздо более разумным, т.к. мы видим, что отмеченная аномалия исчезла.
Видно, что для отрицательных решений ложные отрицательные решения вообще отсутствуют. Это и есть результат работы режима разделения классов на типичную и нетипичную части, реализующего предлагаемый в данной работе интеллектуальный алгоритм (рисунок 3).
Из рисунка 15 видно также, что для положительных решений картина более сложная и включает 3 диапазона уровней сходства
1) при уровнях сходства от 0% до 10% количество ложных решений больше числа истинных;
2) при уровнях сходства от 10% до примерно 20% есть и истинные и ложные положительные решения, но число истинных решений больше числа ложных и доля истинных решений возрастает при увеличении уровня сходства;
3) при уровнях сходства выше 20% ложные положительные решения практически не встречаются.
На рисунке 16 приведен Help режима 3.4, в котором описаны меры достоверности моделей, применяемые в системе «Эйдос»/
Также мы видим, что процесс синтеза и верификации моделей продолжался заметно дольше: если исходные модели формировались и верифицировались 5 минут 34 секунды, о модели 1-й итерации уже 8 минут 16 секунд. Это связано с увеличением количества классов в два раза в связи с добавлением классов для нетипичных случаев (таблица 6).
Из рисунка 15 мы видим, что из 10000 наблюдений обучающей выборки довольно значительная часть: 2918 оказались нетипичными, т.е. не были отнесены к классам, к которым они в действительности относятся. Для этих наблюдений и были созданы собственные классы с теми же наименованиями, но с добавление символов: _FN (это обозначение ложно-отрицательных решений по Ван Ризбергену) (таблица 6).
Таблица 6 - Классификационные шкалы и г
Код Наименование
1 DEFAULTED?-1/4-No
2 DEFAULTED?-2/4-No FN
3 DEFAULTE D?-3/4-Yes
4 DEFAULTE D?-4/4-Yes FN
эадации 1 -й итерации
Помощь по режимам; 3,4.4,1.3.#: Виды прогиозое и меры достоверности моделей в системе "Эйдос-Х++
Помощь по режимам: 3.4. 41.316, 4.1.3.7. 4.1.3.8, 4.1.3.10: Виды прогнозов и меры достоверности моделей в системе "Эйдос-Х++".
Предположим, модель дает такой прогноз, что выпадет все: и 1, и 2, и 3, и 4, и 5, и 6. Понятно, что из всего этого выпадет лишь что-то одно. В этом случае модель не предскажет, что не выпадет, но зато ома обязательно предскажет, что выпадет. Однако при этом очень много объектов будет отнесено к классам, к которым они не относятся. Тогда вероятность истинно-положительных решений у модели будет 1/Б. а вероятность ложно-положительных решений - 5/6. Ясно, что такой прогноз бесполезен, поэтому он
Представим себе, что мы выбрасываем кубик с 6 гранями, и модель предсказывает, что ничего не выпадет, т.е. не выпадет ни 1, ни 2. ни 3, ни 4, ни 5, ни 6, но что-то из этого, естественно, обязательно выпадет. Конечно, модель не предсказала, что выпадет, зато она очень хорошо предсказала, что не выпадет. Вероятность истинно-отрицательных решений у модели будет 5/6, а вероятность ложно-отрицательных решений -1 /6. Такой прогноз гораздо достовернее, чем положительный псевдопрогноз, но тоже бесполезен.
Если в случае с кубиком мы прогнозируем, что выпадет, например 1, и соответственно прогнозируем, что не выпадет 2,3,4, 5. и 6, то это идеальный прогноз, имеющий.
если он осуществляется, 100% достоверность идентификации и не идентификации. Идеальный прогноз, который полностью снимает неопределенность о будущем состоянии объекта
прогнозирования, на практике удается получить крайне редко и обычно мы имеем дело с реальным прогнозом.
На практике мы чаще всего сталкиваемся именно с этим видом прогноза. Реальный прогноз уменьшает неопределенность о будущем состоянии объекта прогнозирования, но не полностью, как идеальный прогноз, а оставляет некоторую неопределенность не снятой. Например, для игрального кубика делается такой прогноз: выпадет 1 или 2, и, соответственно, не выпадет 3,4,5 или 6. Понятно, что полностью на практике такой прогноз не может осуществиться, т.к. варианты выпадения кубика альтернативны, т.е. не может выпасть одновременно и 1, и 2. Поэтому у реального прогноза всегда будет определенная ошибка идентификации. Соответственно, если не осуществится один или несколько из прогнозируемых вариантов,то возникнет и ошибка не идентификации,т.к. это не прогнозировалось моделью. Теперь представите себе, что у Вас не 1 кубик и прогноз его поведения, а тысячи. Тогда можно посчитать средневзвешенные характеристики всех этих видов прогнозов.
Таким образом, если просуммировать число верно идентифицированных и не идентифицированных объектов и вычесть число ошибочно идентифицированных и не идентифицированных объектов, а затем разделить на число всех объектов то это и будет критерий качества модели (классификатора), учитывающий как ее способность верно относить объекты к классам, которым они относятся, так и ее способность верно не относить объекты к тем классам, к которым они не относятся. Этот критерий предложен и реализован в системе "Эйдос" проф. Е.В.Луценко в 1ЭЭ4 году. Эта мера достоверности модели предполагает два варианта нормировки: {-1, +1} и {0,1}:
где количество: TP - истинно-положительных решений; TN - истинно-отрицательных решений; FP - ложно-положительных решений; FN - ложно-отрицательных решений;
L1 -мера проФ.Е.В.Луценко - нечеткое мультиклассовое обобщение классической F-меры с учетом СУММ уровней сходства (колонка выделена ярко-зеленым Фоном):
» STP - Сумма модулей сходства истинно-положительных решений; STN - Сумма модулей сходства истинно-отрицательных решений; SFP - Сумма модулей сходства ложно-положительных решений; S FN - Сумма модулей сходства ложно-отрицательных решений.
1_2-мера проФ.Е.В.Луценко - нечеткое мультиклассовое обобщение классической F-меры с учетом СРЕДНИХ уровней сходства (колонка выделена желтым Фоном):
ATP=STFVTP - Среднее модулей сходства истинно-положительных решений; AFN=S FN /FN - Среднее модулей сходства истинно-отрицательных решений; AFP=SFP/FP - Среднее модулей сходства ложно-положительных решений; AFN=SFN/FN - Среднее модулей сходства ложно-отрицательных решений.
Строки с максимальными значениями F-меры, L1 -меры и 1_2-меры выделены Фоном цвета, соответствующего колонке.
Из графиков частотных распределений истинно-положительных, истинно-отрицательных, ложно-положительных и ложно-отрицательных решений видно, что чем выше модуль уровня сходства, тем больше доля истинных решений. Это значит, что модуль уровня сходства является адекватной мерой степени истинности решения и степени уверенности системы в этом решении. Поэтому система "Эйдос" имеет адекватный критерий достоверности собственных решений, с помощью которого она может отфильтровать заведомо ложные решения.
Луценко Е.В. Инвариантное относительно объемов данных нечеткое мультиклассовое обобщение F-меры достоверности моделей Ван Ризбергена в АСК-анализе и системе 'Эйдос" / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный
Рисунок 16. Help режима 3.4, в котором описаны меры достоверности моделей, применяемые в системе «Эйдос»
Важно иметь в виду, что корректируется (путем разделения классов на типичную и нетипичную части) всегда та модель, в которой проводилось распознавание. Если данный режим 3.7.6 запускается сразу после режима синтеза и верификации моделей 3.5 - то это будет СК-модель INF7, как последняя, в которой проводилась верификация в режиме 3.5. Если мы в режиме 3.4 выбрали другую модель для улучшения как наиболее достоверную, то надо ее задать в качестве текущей в режиме 5.6, а затем выполнить распознавание в этой модели в режиме 4.1.2.
Поэтому далее выполняем режим 5.6 (рисунки 1 и 17), а затем режим распознавания 4.1.2 в текущей модели INF3 (рисунок 18):
i gg в дд
Рисунок 17. Экранные формы придания наиболее достоверной СК-модели ТпВ статуса текущей модели
{*) 4 1.2- Гакгтнсе распознавание. ¡едущая модела
I = 1н1
Стации исполнения процесса
ОПЕРАЦИЯ: ПАКЕТНОЕ РАСПОЗНАВАНИЕ 3 ТЕКУЩЕЙ МОДЕЛИ ЩРр
1/11: СРО-Распознавание (идентификация) Ю300 объектов распознаваемой выборки- Готово
2/11: Расчет распределений уровней сходства верно и ошиб идеи г объектов 100 3000000%:- Готово
3/11: Создание сжатых по иных форм резуль татов респозкпо двум интегр крит." 100.0000000%- Готово
4/1 г Создание подр нагл.формы: "Объект-классы". Инт.крит -корреляция: 1 00.0000330%-Готоёо
Е/11: Создание подр нагл.формы: "Объект-классы". Инт.крит.-сумма инф. 100 3000030%- Готово
6/11" Создание итоговой наглядной формы. "Объект-класс". Инт крит-корреляция ' 00 (10000011%-Готово
7/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит -сумма инф.. 133.0000000%: Готово
3/11" Создание подробной наглядной формы: "Класообъекты". Инт.криг.-коррепяция: 100.0000000%^Готово
9/11: Создание подробной наглядной формы: "Класс-объекты". Инт.крит.-сумма инф.: 100.0000000.%- Готово
10/11. Создание итоговой наглядной формы :'Клесообъекты" Инт.крит.-корреляция: 1 00 0000000%- Готово
11/11: Создание итоговой наглядной формы "Класообъекты". Инт.крит.-сумма инф. 103.0000000'%;- Готово
ПАКЕТНОЕ РАСПОЗНАВАНИЕ ОБЪЕКТОВ РАСПОЗНАВАЕМОЙ ВЫБОРКИ ЗАВЕРШЕНО НСПЕШНО !
-■Прогноз времени исполнеыч
Начало: 20:09:34 Окончание: 20:10:12
10(К
Ок
Прошло: 0:00:38
Осталось: 0:00:00
Рисунок 18. Экранная форма пакетного распознавания в текущей СК-модели 1пВ
Из сравнения рисунков 12 и 18 видно, что на 1-й итерации распознавание 10000 объектов распознаваемой выборки длилось уже не 8, а 38 секунд. Это связано с увеличением числа классов с двух до 4 за счет создания классов для нетипичных случаев.
4.3.3.3. Вторая итерация. Синтез и верификация
статистических и системно-когнитивных моделей. Оценка достоверности моделей. Задание текущей модели и решение в ней всех поставленных задач
Для 2-й итерации запускаем еще раз режим 3.7.6 (рисунок 19).
В результате работы данного режима мы обнаруживаем, что новых нетипичных объектов в обучающей выборки не найдено и, соответственно, новых классов не создано. Поэтому модели 2-й итерация ничем не отличается от моделей 1-й итерации, которая и является последней. То, что так и получится, было видно и до 2-й итерации уже из формы по достоверности моделей 1-й итерации, приведенной на рисунке 15. Из этой формы видно, что в 1-й итерации уже нет ложно-отрицательных решений.
Назначено на новые классы: 0 нетипичных объектов обучающей выборки. БД с объектами обучающей выборки, приведшими к РИ-решениям: С: V\IDOS-XV\ID_DATAMnp_data\ObiFalseNeg.xls
Далее нужно выполнить режим 2.3.2.2 с параметрами, заданными по умолчанию. Этот режим будет запущен автоматически по нажатию клавиши: "ОК". После него нужно вручную запустить режим 3.5 и посмотреть достоверность в режиме 3.4. Если достоверность устраивает или перестала повышаться, то прекратить итерации
Ок
Рисунок 19. Экранные формы режима разделения классов на типичную и нетипичную части 2-й итерации
Поэтому на этом этапе выходим из интеллектуального алгоритма разделения классов на типичную и нетипичную части (рисунок 3), создаем все модели в режиме 3.5, выбираем наиболее достоверную модель ЮТ3 в качестве текущей в режиме 5.6 и решаем в ней все последующие задачи. Этому и посвящены последующие разделы данной работы.
4.3.4. Задача 4: решение различных задач в наиболее
достоверной модели 4.3.4.1. Подзадача 4.1. Прогнозирование (диагностика, классификация, распознавание, идентификация) Далее выполняется режим 4.1.2 (см. раздел 4.3.4.1 работы [35] (рисунок 20)._
4.1,2. Пакетное распознавание. Текущая модель; "ШРЗ1' 1 д | ЕЁЗ ^
г-Стадии исполнения процесса-
ОПЕРАЦИЯ: ПАКЕТНОЕ РАСПОЗНАВАНИЕ В ТЕКУЩЕЙ МОДЕЛИ "№3": 1/11: СРи-Распознавание (идентификация) 10000 объектов распознаваемой выборки-Готово 2/11: Расчет распределений уровней сходства верно и ошиб.идент.объектов: 100.0000000%- Готово 3/11: Создание сжатых полных форм результатов распозн.по двум интегр.крит.: 100.0000000%- Готово 4/11: Создание подр.нагл.формы: "Объект-классы". Инт.крит.-корреляция: 100.0000000%- Готово 5/11: Создание подр.нагл.формы: "Объект-классы". Инт.крит.-сумма инф.: 100.0000000%- Готово 6/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит.-корреляция: 100.0000000%- Готово 7/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит.-сумма инф.: 100.0000000%- Готово 1 8/11: Создание подробной наглядной формы: "Класообъекты". Инт:крит.-корреляция: 100.0000000%- Готово 9/11: Создание подробной наглядной формы: "Класообъекты". Инт.крит.-сумма инф.: 100.0000000%- Готово I 10/11: Создание итоговой наглядной формы: "Класообъекты". Инт.крит.-корреляция: 100.0000000%- Готово 11/11: Создание итоговой наглядной формы: "Класообъекты".. Инт.крит.-сумма инф.: 100.0000000%- Готово
ПАКЕТНОЕ РАСПОЗНАВАНИЕ ОБЪЕКТОВ РАСПОЗНАВАЕМОЙ ВЫБОРКИ ЗАВЕРШЕНО УСПЕШНО !
Прогноз времени нсполнення-
Начало: 07:25:01 Окончание: 7:26:39
ТИК.. ц |
Прошло: 0:00:33 Осталось: 0:00:00
Рисунок 20. Экранные формы, которые отображают процесс решения задачи системной идентификации в текущей модели
Выводы, которые можно сделать из экранных форм на рисунке 21 см. в разделе 4.3.4.1 работы [35] (рисунок 21).
Рисунок 21. Выходные формы по результатам прогнозирования риска невозврата ссуды по характеристикам получателей
Достоверные прогнозы в данной модели имеют уровень сходства выше 10% по интегральному критерию «Сумма знаний» (нижнее правое окно в экранных формах на рисунке 19), т.е., по сути, результаты с более низки уровнем сходства надо просто игнорировать (см. раздел 4.3.4.1 работы[35]).
4.3.4.2. Подзадача 4.2. Поддержка принятия решений в простейшем варианте (SWOT-анализ)
Для решения данной подзадачи используем режим 4.4.8 системы «Эйдос» (см. раздел 4.3.4.2 работы [35]). Результаты приведены на рисунках 22.
Рисунок 22. SWOT-диаграммы детерминации риска невозврата ссуды
характеристиками получателей
Смысл SWOT-диаграмм поясняется в разделе 4.3.4.2 работы [35]. Впервые акт внедрения системы, являющейся далеким предшественником системы «Эйдос», был получен в 1987 году (см. 2-й акт внедрения по ссылке: http://lc.kubagro.ru/aidos/aidos02/PR-4.htm). Уже в той версии системы был режим, выполняющий функции, реализованные в текущей версии при генерации SWOT-диаграмм и инвертированных SWOT-диаграмм (термин автора) (рисунок 23).
SWOT-ДИАГРАММА ЗНАЧЕНИЯ ФАКТОРА В М SWOT-ДИАГРАММА ЗНАЧЕНИЯ ФАКТОРА В IV
таг
/ \ X \ 7 N / \ / \
— рг- — г*-
/ \ / \
\ КМ* И" - — U |
„яшшш........ Фил»,» по юисс ВЫКЛЮЧЕН Ди.п.»« кодов: 1Л ЯШШШЯЁ
Рисунок 23. Примеры SWOT-диаграмм, отражающих силу и направление влияния различных характеристик ссудополучателя на риск невозврата
полученной им ссуды
Из инвертированных SWOT-диаграмм, приведенных на рисунке 21, видно, как влияет безработный ссудополучатель или нет на риск невозврата полученной им ссуды.
Отметим, что аналогичные инвертированные SWOT-диаграммы могут быть получены для всех характеристик ссудополучателей и здесь они не приводятся только из-за ограничений на объем работы. Но они могут получены любым желающим, если он скачает систему «Эйдос» с сайта ее автора и разработчика проф.Е.В.Луценко по ссылке: http://lc.kubagro.ru/aidos/_Aidos-X.htm, установит ее на своем компьютере, а затем в режиме 1.3 установит интеллектуальное облачное Эйдос-приложение №293, просчитает модели в режиме 3.5 и перейдет в режим 4.4.9.
Преимущества автоматизированного SWOT-анализа, реализованного в АСК-анализе и системе «Эйдос» перед традиционным SWOT-анализом подробнее описан в разделе 4.3.4.2 работы [35].
4.3.4.3. Подзадача 4.2. Развитый алгоритм принятия решений
В предыдущем разделе кратко описан лишь очень упрощенный вариант приятия решений. В развитой форме, полностью поддерживаемой системой «Эйдос», он приведен в данном разделе (рисунок 24).
Подробное пояснение данного алгоритма (который в принципе и так вполне понятен) не входит в задачи данной работы и дано в других работах автора, например [20], а также в видеозанятиях:
- в Пермском национальном университете: https://bigbluebutton.pstu.ru/b/w3y-2ir-ukd-bqn
- в Кубанском государственном университете и Кубанском государственном аграрном университете:
https://disk.yandex.ru/d/knISAD5qzV83Ng?w=1; https://studio.youtube.com/channel/UC_QF84d8SCaWxsnXnexNFzg.
Развитый алгоритм принятия решений в адаптивных интеллектуальных системах управления на основе АСК-анализа и системы «Эйдос»
Шаг 1-й. Ставим цели управления, т.е. определяем целевые состояния объекта управления. Обычно в натуральном выражении целевые состояния - это количество и качество продукции, а в стоимостном выражении - прибыль и рентабельность. Объект управления как система, эффективность объекта управления как системное свойство, повышение уровня системности объекта управления как цель управления. Модель отражает определенный уровень технологий, поэтому целевые состояния, недостижимые в одной модели, могут быть достижимы в другой модели с большим числом классов и факторов
Рисунок 24. Развитый алгоритм принятия решений в интеллектуальных системах управления на основе АСК-анализа и системы «Эйдос»
4.3.4.4. Подзадача 4.3. Исследование моделируемой предметной области путем исследования ее модели
О решении подзадачи 4.3 подробнее можно ознакомиться в разделе 4.3.4.4. работы [35].
4.3.4.4.1. Когнитивные диаграммы классов
Эти диаграммы отражают сходство/различие классов. Мы получаем их в режимах 4.2.2.1 и 4.2.2.2 (рисунки 25, 26) [35].
Рисунок 25. Когнитивная диаграмма классов, отражающая сходство/различие рисков невозврата ссуды по связанным с ними значениям характеристик ссудополучателей
Рисунок 26. Диалоговое окно управления параметрами формирования и вывода изображения когнитивной диаграммы классов
4.3.4.4.2. Агломеративная когнитивная кластеризация классов
Для получения агломеративных дендрограмм классов выполняем режимы 4.2.2.1 и 4.2.2.3 системы «Эйдос» (рисунки 27, 28).
С|1кК:|5-06.]рд а
ДЕНДРОГРАММА КОГНИТИВНОЙ КЛАСТЕРИЗАЦИИ КЛАССОВ В МОДЕЛИ: "1^3" "Интеллектуальное прогнозирование навозврата ссуды, 3 адапт.инт, 2-я итерация"
0ЕРА1Л_ТЕ0?-2/4-Мо_РМ 2
о ч «
н 5 к о
я
к
В! « о. 1
МЕЖКЛАСТЕРНЫЕ РАССТОЯНИЯ: КЛАСТЕРНАЯ ФОРМУЛА: ((2.3),(1,4)) 22 67 89 111 33 155 78 создана: 26.05.2021-08:ЗС 200 :29
Рисунок 27. Дендрограмма когнитивной агломеративной кластеризации, отражающая сходство/различие рисков невозврата ссуды по системе их детерминации характеристиками ссудополучателей
CiustClsDist-06.jpg @
200.00 177.80 ИЗМЕНЕНИЕ МЕЖКЛАСТЕРНЫХ РАССТОЯНИЙ ПРИ КОГНИТИВНОЙ КЛАСТЕРИЗАЦИИ КЛАССОВ В МОДЕЛИ: "1^3" "Интеллектуальное прогнозирование навозврата ссуды, 3 адапт.инт, 2-я итерация"
№ Наим.кластера в кодах исх.классов Расстояние между кластер 1 (2,3) 0.17 2 (1,4) 46.14 3 ((2,3),(1,4)) 200.00
:5
155.59 к 133.39 к 8 111.19 I -
=
-
я я
1 * г = 5
44.58 О
■й
22.37 а.
=
0.17 КЛАСТЕРНА.
ФОРМУЛА: ((2,3),(1,4)) Номера кластеров 3 Форма создана: 26.05.2021-08:31:17
Рисунок 28. График изменения межкластерных расстояний
4.3.4.4.3. Когнитивные диаграммы значений факторов
Для получения этих диаграмм запускаем режимы 4.3.2.1 и 4.3.2.2 системы «Эйдос» (рисунки 29, 30).
Рисунок 29. Сходство/различие характеристик ссудополучателей по их влиянию на риск невозврата ссуды
Рисунок 30. Параметры отображения когнитивной диаграммы, приведенной на рисунке 27
Необходимые пояснения даны в разделе 4.3.4.4.3 работы [35].
4.3.4.4.4. Агломеративная когнитивная кластеризация значений факторов
Для получения агломеративных дендрограмм значений факторов выполняем режимы 4.3.2.1 и 4.3.2.3 системы «Эйдос» (рисунки 31, 32).
ClustAtr-06-jpg i
ДЕНДРОГРАММА КОГНИТИВНОЙ КЛАСТЕРИЗАЦИИ ПРИЗНАКОВ В МОДЕЛИ: "Ш" "Интеллектуальное прогнозирование навозврата ссуды, 3 адапт.инт, 2-я итерация"
BANK BALANCE, №{12737.0400000,31851.8400000} 5 EMPLOYED-1/2-No 1 ANNUAL SALARY, №-{9263.6400000,304886.6400000} 6 ANNUAL SALARY, $-3/3^487205.0400000,882650.7600000} 8 EMPLOYED-2/2-Yes 2 ANNUAL SALARY, №-{304886.6400000,487205.0400000} 7 BANK BALANCE, №-{0.2400000.7799.1600000} 3 BANK BALANCE, №-{7799.1600000, 12737.0400000} 4
я н у
О 7
Ц я s
с с V К я
'J а
МЕЖКЛАСТЕРНЫЕ РАССТОЯНИЯ: 22 44 67 89 111 133 КЛАСТЕРНАЯ ФОРМУЛА: ((5,(1,6}),(8,(2,(7,(3,4))))) 156 178 200 Форма создана: 26.05.2021-09:20:14
Рисунок 31. Дендрограмма агломеративной когнитивной кластеризации характеристик ссудополучателей по их влиянию на риск невозврата ссуды
ClustAtrDist-06.jpg
Межкластерные расстояния > Ко £ о> ё й Р ИЗМЕНЕНИЕ МЕЖКЛАСТЕРНЫХ РАССТОЯНИЙ ПРИ КОГНИТИВНОЙ КЛАСТЕРИЗАЦИИ ПРИЗНАКОВ В МОДЕЛИ: "1^3" "Интеллектуальное прогнозирование навозврата ссуды, 3 адапт.инт, 2-я итерация" - о - В а | еС >
№ Наим.кластера в код 1 (3.4) 2 (1,6) 3 (7.(3.4)) ах исх.признаков Рассто 0.00 0.00 1.00 1.00
4 (2,(7,(3,4))) 6 (8,(2,(7,(3,4)))) 7 ((5,(1,6)),(8,(2,(7,(3,4)))) 2.00 3.00 200.00
------------------------------
Номера кластеров Форма создана: 26.05.2021-09:2Е :51
КЛАСТЕРНАЯ ФОРМУЛА: ((5,(1,6)),(8,(2,(7,(3,4)))))
Рисунок 32. График изменения межкластерных расстояний при когнитивной кластеризации значений факторов
4.3.4.4.5. Нелокальные нейроны и нелокальные нейронные сети
На рисунке 33 приведён пример нелокального нейрона, а на рисунке
34 — фрагмент одного слоя нелокальной нейронной сети [27]:
Рисунок 33. Пример нелокального нейрона, отражающего силу и направление влияния значений характеристик ссудополучателей на риск
невозврата полученной ими ссуды
Рисунок 34. Один слой нелокальной нейронной сети, отражающий силу и направление влияния характеристик ссудополучателей на риск невозврата полученной ими ссуды
Необходимые пояснения даны в разделе 4.3.4.4.5 работы [35].
4.3.4.4.6. З^интегральные когнитивные карты
На рисунке 32 приведена 3d-интегральная когнитивная карта в СК-модели ¡пС.
3d-интегральная когнитивная карта является отображением на одном рисунке когнитивных диаграмм классов и значений факторов, отображенных соответственно на рисунках 25 и 29, и одного слоя нейронной сети, приведенного на рисунке 34.
Рисунок 35. 3d-интегральная когнитивная карта в СК-модели Inf3
4.3.4.4.7. Когнитивные функции
Вместо описания того, что представляют собой когнитивные функции, приведем help соответствующего режима системы «Эйдос» (рисунок 36) и сошлемся на работы, в которых описан этот подход [22]8.
8 Подборка публикаций проф.Е.В.Луценко & C° по когнитивным функциям: http ://lc. kubagro. ru/aido s/W orks_on_cognitive_functions. htm.
Что такое шпажная Функция:
Визуализация прямых, обратных, позитивных, негативных, попностыо и частично редуцированных когнитивных Функций Когнитивная Функция представляет собой графическое отображение силы и направления впияния различных значений некоторого Фактора на перепады объекта управпенмя з состояния, соответствующие классам. Когнитивные Функции представляет собой новый перспективный инструмент отражения и нагпядной визуализации закономерностей и эмпирических законов. Разрабстка содержательной научной интерпретации когнитивных Функций приставляет собой способ познания природы, общества и человека. Когнитивные Функции могут быть: прямые, отражающие зависимость классов от признаков, обобщающие информационные портреты признаков; обратные, отражающие зависимость признаков от классов, обобщающие информационные портреты классов; позитивные, показывающие чему способствуют система детерминации, негативные, отражающие чему препятствуют система детерминации, средневзвешенные, отражающие совокупное влияние веек значений Факторов на поведение объекта (причем в качестве весов наблюдений используется количество информации в значении аргумента о значениях Функции) различной степенью редукции или степенью детерминации, которая отражает в графической Форме [в Форме полосы) количество знаний в аргументе о значении Функции и является аналогом и обобщением доверительного интервала. Если отобразить подматрицу матрицы знания, отображая цветом силу и направление влияния каждой градации некоторой описательной шкалы на переход объекта в состояния, соответствующие кпассам некоторой классификационной шкалы, то получим нередуцированную когнитивную Функцию. Когнитивные Функции являются наиболее развитым средством изучения причинно-следственных зависимостей з моделируемой предметной области, предоставляемым системой 'Эйдос". Необходимо отметить, что на вид Функций злияния математической моделью АСК-анализа не накладывается никаких ограничений, в частности, они могут быть и не дифференцируемые.
Луценко Е.Е Метод визуализации когнитивных Функций ■ новый инструмент исследования эмпирических данных большой размерности / Е.Е. Луценко, А.П. Трунев. Д.К. Еаидык // Политематический сетевой электронный научный журнал Кубанского государственного аграрного универсигста (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГДУ, 2011. ■ №03[Е7). С. 240 ■ 292. ■ Шифр ИнФормрегистра. 0421100012\0077., 2,688 у.п.л. ■ Режим доступа: ЬЦр: //ег киЬа^о. ш/2011 /ОЗ/осй Л 8. рсА
_
Рисунок 36. Help режима визуализации когнитивных функций
Необходимые пояснения по когнитивным функциям (рисунок 37) даны в разделе 4.3.4.4.7 работы [35].
В них есть несколько интересных неожиданных моментов, требующих специальной содержательной интерпретации. Эта содержательная интерпретация является делом специалистов по субсидированию и не входит в задачи данной работы.
2 г/4-Н0_ГЫ
1.ЕМ Р1_0УЕ0 ПРИЗНАКИ
Визуализации когнитивных функций системы «Эйдос». С Е-Р-Луценив (Россия), Д. К. Банды* (Беларусь}, Патент РФ 2011612056 РФ от 09 03 2011
Ш
0-я подматрица Степени редукции частично редуцированны* когнитивных функций: Позитивной от классов Позитивной от признаков Негативной от классов негативной от признаков Метод интерполяции: Фильтр тип.1
Количество градаций уровня: Цвет нерасчетных нулей:
Тип палитры:
Цветовая заливка, спектр сг Интерполяция нерасчетных кул!
"ЙЕЗЕГЯ!®"
А)
I ФУНКЦИЯ:
лектуальиое прогналироынис невозврата ссуды, 3 ад; Модель; 1пГЗ - частный критерий; Хн-квадрлт, разности исиду фактичео»
2.ВАНИ ВА1Л1ЧСЕ, $ ПРИЗНАКИ функций системы «Эйдос».
Б)
ш
1-я подпатрица Степени редукции частично редуцированны* когнитивных функций: Позитивной от классов Позитивной от признаков Негативной от классов негативной от признаков Метод интерполяции; Фильтр ТИП.1
Количество градаций уровня: Цвет нерасчетных нулей:
Тип палитры:
Цветовая заливка, спектр сг Интерполяция нерасчетных нул!
"ЕаяМГЙВИУ
КОГНИТИВНАЯ ФУНКЦИЯ:
Приложение: Интеллектуальное прогнозирование невозврата ссуды, 3 адапг.инт, 2-я итерации
Подели: Inf3 - частный критерий: Хи-квадрат, разности между фактическими л ожидаемыми абс.частотами
4 4/4-r«S_FN
3 3/4-Yes
3
2 2/4-No_FN 11/4-Ко
В)
Рисунок 37. Примеры когнитивных функций в СК-модели INF3, отражающих силу и направление влияния значений характеристик ссудополучателей на риск невозврата полученной ими ссуды
4.3.4.4.8. Сила и направление влияния значений факторов на принадлежность к классам
Для изучения ценности значений факторов (признаков) для решения задачи прогнозирования рисков субсидирования запускаем режим 3.7.5
системы «Эйдос» (рисунок 38, таблица 7)._
ParetoGrOpSc -06.jpg
ПАРЕТО-КРИВАЯ ЗНАЧИМОСТИ ГРАДАЦИЙ ОПИСАТЕЛЬНЫХ ШКАЛ (ПРИЗНАКОВ) В МОДЕЛИ: "Интеллектуальное прогнозирование навозврата ссуды, 3 адапт.инт, 2-я итерация" •INF3"
100.0
J 938 1
I 87.6
5 81.4
С 75.2
| 69 0 1
62.8 S
я 56.6 i
я 50.4 S s
44.2
38.0 ■к .5 21.3 3 .0 3 Гр .8 4 .5 ал (при 56.3 65.0 7: .8 82.5 91.3 100.0
Значимость градации признаке, по классам гатистт^сгах мо°д епях Т а!> вого интервального или ном ной мерой значимости приз , Ргс1, Ргс2 и в моделях зн ака в системе "Эйдос-Х++" ний: Infl.Inf2,Inf3. Inf4. InfS ия), т е Inffi, Inf 1 ВАРИАБЕЛЬНОСТЬ ЗНАЧЕНИЙ частых критериев, основанных на этом Расстояние между точками |}е<1-В1ие: 61% от максимально возможного
Путь на отображаемый айп: C:\AIDOS-X\AID_DATA\A0000003\SYSTEMWParetoGrOpSc\ParetoGrOpSc-INF3.jpg Форма создана: 26.05.2021-10:12:31
Рисунок 38. Парето-кривая значимости градаций описательных шкал
77Я.ПЯ 1Ы.К7
it ,ПЛ-"1
47 R4 1- -1ПЧ7 I -ЯЯ.ОИ I -177 7.
когнитивных функций:
Позитивной от классов .,„
Позитивной от признаков 1,00
Негативной от классов 0,00
Негативной от признаков 1,0С
Цвет нерасчетнь отсутствует Тип палитры:
3.ANNUAL SALARY, $ ПРИЗНАКИ
Визуализация когнитивных функций системы «Эйдос» (Россия). Д.К.Бандык (Беларусь), Патент РФ 201161205«
РФ От 09.03.2011
"ЗЗЗК-ЙЯ* £2®JBl
Таблица 7 - Парето-таблица значимости градаций описательных шкал, т.е. сила влияния значений характеристик ссудополучателя _на риск невозврата ссуды в СК-модели ШБЗ_
Значи-
мость
Код Значи- нараст.
№ Код Наименование шкалы мость, % итогом, %
1 5 BANK BALANCE, $-3/3-{12737.0400000, 31851.8400000} 2 37,990 37,990
2 3 BANK BALANCE, $-1/3-{0.2400000, 7799.1600000} 2 18,478 56,468
3 4 BANK BALANCE, $-2/3-{7799.1600000, 12737.0400000} 2 18,390 74,858
4 2 EMPLOYED-2/2-Yes 1 7,094 81,952
5 1 EMPLOYED-1/2-No 1 6,534 88,486
6 6 ANNUAL SALARY, $-1/3-{9263.6400000, 304886.6400000} 3 5,477 93,962
7 8 ANNUAL SALARY, $-3/3-{487205.0400000, 882650.7600000} 3 3,594 97,556
8 7 ANNUAL SALARY, $-2/3-{304886.6400000, 487205.0400000} 3 2,444 100,000
Данные, приведенные на рисунке 38 и в таблице 7, находится в ХЬ8-файлах, созданных в режиме 3.7.5. Информация об этом содержится в экранной форме на рисунке 39:
Результаты расчета силы влияния (значимости) признаков или значений Факторов содержатся в следующих базах данных, созданных на основе 'Zpr_lnf3.xls", 'Zpr_lnf4.xls", 'Zpr_lnf5.xls", 'Zpr_lnf6.xls", 'Zpr_lnf7.xls" в папке текущего приложения: C:\AIDOS-XV\ID_DATAV\0000003\SYSTEMV
Сила влияния (значимость) признака или значения Фактора представляет собой вариабельность количества информации в этом признаке о переходе объекта моделирования во все будущие состояния, соотвествующие классам, имеющимся в модели, т.е. это "жесткость", с которой данное значение Фактора обуславливают (детерминируют) переход объекта моделирования в различные состояния, соответствующие классам.
Рисунок 39. Информация о XLS-файлах
Необходимые пояснения даны в разделе 4.3.4.4.8 работы [35]. Из таблицы 7 видно, что наиболее сильное влияние на риск невозврата ссуды оказывают следующие характеристики ссудополучателя:
- BANK BALANCE, $-3/3-{12737.0400000, 31851.8400000};
- BANK BALANCE, $-1/3-{0.2400000, 7799.1600000}; а наиболее низкое:
- ANNUAL SALARY, $-3/3-{487205.0400000, 882650.7600000};
- ANNUAL SALARY, $-2/3-{304886.6400000, 487205.0400000}. При этом сила влияния наиболее и наименее значимых значений
факторов классов отличается в 15 раз, что очень существенно.
Ценность же характеристик ссудополучателей (всей описательной шкалы или фактора), для решения этих задач можно количественно оценивать как среднее от ценности значений этого параметра (таблица 8). Это можно сделать в режиме 3.7.4 (рисунок 40):
Рисунок 40. Информация о XLS-файлах
Таблица 8 - Парето-таблица значимости описательных шкал, т.е. сила влияния характеристик ссудополучателя на риск невозврата ссуды
в СК-модели ЮТ3
№ Код Название описательной шкалы Значи мость, % Значимость нарастающим итогом
1 2 BANK BALANCE, $ 70,0829613 70,0829613
2 1 EMPLOYED 19,1372199 89,2201812
3 3 ANNUAL SALARY, $ 10,7798188 100,0000000
Из таблицы 8 видно, что наиболее сильное влияние на прогнозирование риска невозврата ссуды оказывает баланс счета в банке, который дает более ИЗ суммарной значимости, в три с лишним раза меньшее влияние на это оказывает то, является ли ссудополучатель работающим или безработным, и еще в два раза меньшее влияние оказывает заработная плата за год.
При этом сила влияния наиболее и наименее значимых факторов классов отличается в 7 раз, что очень существенно.
4.3.4.4.9. Степень детерминированности классов значениями обуславливающих их факторов
Для изучения степени детерминированности классов значениями характеристик ссудополучателя запускаем режим 3.7.3 системы «Эйдос» (таблица 9) (рисунок 41).
' ParetoGrCISc-06.jpg | _ _ g
ПАРЕТО-КРИВАЯ СТЕПЕНИ ДЕТЕРМИНИРОВАННОСТИ КЛАССОВ (ГРАДАЦИЙ КЛАССИФИКАЦИОННЫХ ШКАЛ) В МОДЕЛИ: "1^3" "Интеллектуальное прогнозирование навозврата ссуды, 3 адапт.инт, 2-я итерация"
j g 1 s е s g s s g g 0.0
.0 32.5 40.0 47.5 55.0 62.5 70.0 77.5 85.0 92.5 10
Степень детерминированности класса (градации классификационной шкалы) представляет собой количественную оценку суммарной силы влияния всех факторов на переход объекта моделирования в состояние, соответствующее классу. Количественной мерой степени детерминированности класса в системе "Эйдос-Х++" является ВАРИАБЕЛЬНОСТЬ сипы и направления влияния различных значений факторов по данному классу в статистических: Abs, Ргс1. Ргс2 и в системно-когнитивных: Infi Inf2. Inf3. Inf4. Inf5. Inf6. Inf7 моделях. Иначе говоря степень детерминирован- Путь на отображаемый файл: C:\AIDOSP-ÄlD_DATA\A0000003\SYSTEM№aretoGrCISc\ParetoGrCISc-INF3.jpg Д Д Р° У Щ У 50% наиболее значимых классов обеспечивают 95% суммарной значимости 25% наиболее значимых классов обеспечивают 50% суммарной значимости Расстояние между точками Red-Blue: 72% от максимально возможного Форма создана: 26.05.2021-13:06:04
Рисунок 41. Парето-кривая степени детерминированности классов
Эта информация есть и в табличной форме (рисунок 42, таблица 9):
Рисунок 42. Информация о ХЬ8-файлах
Таблица 9 - Парето-таблица степеней детерминированности (обусловленности) классов в СК-модели INF3
Значимость
№ Код класса Название класса Значимость, % нарастающим итогом
1 1 DEFAULTED?-1/4-No 49,879 49,879
2 2 DEFAULTED?-2/4-No_FN 44,913 94,793
3 3 DEFAULTED?-3/4-Yes 5,056 99,849
4 4 DEFAULTED?-4/4-Yes_FN 0,151 100,000
Из таблицы 9 мы видим, что значения характеристик ссудополучателей наиболее сильно детерминируют (обуславливают) такие
- DEFAULTED?-1/4-No;
- DEFAULTED?-2/4-No_FN; а наименее сильно:
- БЕЕАиЪТЕБ?-3/4-Уе8;
- БЕЕАиЪТЕБ?-4/4-Уе8_ЕК
При этом степень детерминированности наиболее и наименее детерминированных классов отличается в 6622 раз, что очень существенно.
Чем выше степень детерминированности класса степени риска невозврата ссуды значениями характеристик ссудополучателя, тем легче определить этот класс по этим характеристикам.
4.3.5. Выводы
Со всеми моделями, созданными в данной статье, можно ознакомиться установив облачное Эйдос-приложение №293 в режиме 1.3 системы «Эйдос». Саму систему можно бесплатно скачать с сайта ее автора и разработчика проф.Е.В.Луценко по ссылке: http://lc.kubagro.ru/aidos/ Aidos-X.htm (см. раздел 4.3.5 работы [35]).
4.4. Выводы
По результатам данного раздела делается обоснованный вывод о том, что поставленные в работе задачи решены, цель достигнута, поставленная проблема успешно решена, эффективность внедрения подтверждена модельным численным примером, основанным на реальных данных портала Kaggle.
На основании этого делается обоснованный вывод том, что научное решение, ранее доведенное до статуса новаций, в данном разделе до инновационного уровня, т.е. полностью готово для широкого применения на практике.
Заключение
Объект исследования - прогнозирование риска невозврата ссуды.
Предмет исследования - прогнозирование рисков невозврата ссуды с применением интеллектуального итерационного алгоритма учета нетипичных случаев.
Проблема - возникающая при прогнозировании риска невозврата ссуды - ложно-отрицательные решения, возникающие, когда модель не относит ситуацию к классу (обобщенной категории), к которой она в действительности относится.
Целью данной работы является решение поставленной проблемы путем разработки алгоритма, обеспечивающего формирование обобщенных образов классов не только на основе типичных относящихся к ним наблюдений, но и на основе исключений, т.е. нетипичных случаев.
Путем декомпозиции цели получим последовательность задач, решение которых является этапами достижения цели: задача 1: когнитивная структуризация предметной области; задача 2: подготовка
исходных данных и формализация предметной области; задача 3: синтез и верификация статистических и системно-когнитивных моделей. Улучшение наиболее достоверной модели путем применения итерационного алгоритма разделения обобщенных образов классов на типичную и нетипичную части; задача 4: решение различных задач в наиболее достоверной модели: подзадача 4.1. Прогнозирование (диагностика, классификация, распознавание, идентификация); подзадача 4.2. Поддержка принятия решений; подзадача 4.3. Исследование моделируемой предметной области путем исследования ее модели.
Все поставленные задачи были решены.
Задача 1. В качестве классификационной шкалы выбран риск невозврата ссуды, в качестве описательных шкал: характеристики ссудополучателя работает ли он или нет, какой у него счет в банке и годовой доход.
Задача 2. Разработаны градации классификационных и описательных шкал и с их помощью закодированы исходные данные, в результате чего получена обучающая выборка.
Задача 3. Осуществлен синтез и верификация 3 статистических и 7 системно-когнитивных моделей, выбрана наиболее достоверная из них. Ей оказалась СК-модель Г№Р3. Затем было повышено качество наиболее достоверной модели путем применения итерационного алгоритма разделения обобщенных образов классов на типичную и нетипичную части. В результате ее достоверность по Ь1 критерию повысилась на 61%.
Задача 4. В наиболее достоверной модели: были решены следующие подзадачи: подзадача 4.1. Прогнозирование (диагностика, классификация, распознавание, идентификация); подзадача 4.2. Поддержка принятия решений; подзадача 4.3. Исследование моделируемой предметной области путем исследования ее модели: когнитивные диаграммы классов и значений факторов, агломеративная когнитивная кластеризация классов и значений факторов, нелокальные нейроны и нейронные сети, Зd-интегральные когнитивные карты, когнитивные функции), исследование силы и направления влияния факторов и степени детерминированности классов, обуславливающими их значениями факторов.
На основании всего этого можно сделать обоснованный вывод о том, что поставленные в работе задачи решены, цель достигнута, поставленная проблема успешно решена. Достигнутая в работе цель и решенная проблема соответствуют поставленным.
Литература
1. Lutsenko E.V. Methods of writing scientific papers, logic and the manner in which scientific statements // February 2021, DOI: 10.13140/RG.2.2.23546.41920, License CC BY-SA 4.0, https://www.researchgate.net/publication/349039044
2. Луценко Е. В. Научная публицистика : учебник / Е. В. Луценко. - Краснодар : ВЦСКИ «Эйдос», 2020. - 188 с. DOI 10.13140/RG.2.2.36089.01126, https://www.researchgate.net/publication/340264083.
3. Луценко Е. В. Современные информационно-коммуникационные технологии в научно-исследовательской деятельности и образовании: учеб. пособие для асп. напр. подг.: 40.06.01 "Юриспруденция"/ Е. В. Луценко, Г. М. Меретуков, В. И. Лойко. -Краснодар: КубГАУ,. 2019. - 256с. ISBN 978-5-907294-46-2, https://www.researchgate.net/publication/339285519.
4. Прокопьева А.А. Применение информационных технологий и математического моделирования в управлении банковскими рисками // Магист. дисс., Режим доступа: https://dspace.spbu.ru/bitstream/11701/12281/1/Master_s_dissertation-7.pdf (обращение: 23.05.2021).
5. Беляков А.В.. Резервы на возможные потери - экономическая сущность и учёт для целей налогообложения. Дата обращения: 27 февраля 2010. Архивировано 12 апреля 2012 года.
6. Курносенко А. А.. Особенности правового регулирования банковскими рисками в условиях рыночной экономики // Банковское право. — 2008. — Вып. 5.
7. Погорелова О.С.. Проблемы прогнозирования кредитных рисков // Банковское кредитование. — 2008. — Вып. 3.
8. Слуцкий А.А.. Концепция определения значения минимального резерва по ссудам // Банковское кредитование. — 2008. — Вып. 4.
9. Сухов А.В.. Управление кредитными рисками в России и Европе: сравнительный анализ // Управление в кредитной организации. — 2008. — Вып. 6.
10. Информационный бюллетень // Выпуск № 1(44), Москва 2013 год, Режим доступа: http://www.ksp.mos.ru/upload/documents/inf_bulletin/KSP-144.pdf, (обращение: 23.05.2021).
11. Луценко Е.В., Лебедев Е.А., Подсистема автоматического формирования двоичного дерева классов семантической информационной модели (Подсистема "Эйдос-Tree"). Пат. № 2008610096 РФ. Заяв. № 2007613721 РФ. Опубл. от 09.01.2008. -Режим доступа: http://lc.kubagro.ru/aidos/2008610096.jpg, 3,125 / 2,500 у.п.л.
12. Луценко Е.В. Системно-когнитивный анализ временных рядов на примере фондового рынка (когнитивная структуризация и формализация предметной области) / Е.В. Луценко, Е.А. Лебедев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. - №07(051). С. 1 - 37. - Шифр Информрегистра: 0420900012\0073, IDA [article ID]: 0510907001. - Режим доступа: http://ej.kubagro.ru/2009/07/pdf/01.pdf, 2,312 у.п.л.
13. Луценко Е.В. Системно-когнитивный анализ временных рядов на примере фондового рынка (синтез и верификация семантической информационной модели) / Е.В. Луценко, Е.А. Лебедев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. - №07(051). С. 38 - 46. - Шифр Информрегистра: 0420900012\0072, IDA [article ID]: 0510907002. - Режим доступа: http://ej.kubagro.ru/2009/07/pdf/02.pdf, 0,562 у.п.л.
14. Луценко Е.В. Системно-когнитивный анализ временных рядов на примере фондового рынка (прогнозирование, принятие решений и исследование предметной
области) / Е.В. Луценко, Е.А. Лебедев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. - №07(051). С. 47 - 82. - Шифр Информрегистра: 0420900012\0071, IDA [article ID]: 0510907003. - Режим доступа: http://ej.kubagro.ru/2009/07/pdf/03.pdf, 2,25 у.п.л.
15. Луценко Е.В. Повышение качества моделей «knowledge management» путем разделения классов на типичную и нетипичную части / Е.В. Луценко, Е.А. Лебедев,
B. Н. Лаптев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. - №10(054). С. 78 - 93. - Шифр Информрегистра: 0420900012\0109, IDA [article ID]: 0540910005. - Режим доступа: http://ej .kubagro.ru/2009/10/pdf/05 .pdf, 1 у.п.л.
16. Луценко, Е. В. Определение кредитоспособности физических лиц и риска их кредитования / Е. В. Луценко, Е. А. Лебедев // Финансы и кредит. - 2006. - № 32(236). -
C. 75-83. https://elibrary.ru/item.asp?id=9290406
17. Луценко Е.В. Астросоциотипология и спектральный анализ личности по астросоциотипам с применением семантических информационных мультимоделей / Е.В. Луценко, А.П. Трунев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. - №01(035). С. 101 - 151. - Шифр Информрегистра: 0420800012\0002, IDA [article ID]: 0350801010. - Режим доступа: http://ei.kubagro.ru/2008/01/pdf/10.pdf, 3,188 у.п.л.
18. Луценко Е.В. Повышение адекватности спектрального анализа личности по астросоциотипам путем их разделения на типичную и нетипичную части / Е. В. Луценко, А.П. Трунев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. - №02(036). С. 153 - 174. - Шифр Информрегистра: 0420800012\0017, IDA [article ID]: 0360802010. - Режим доступа: http://ei.kubagro.ru/2008/02/pdf/10.pdf, 1,375 у.п.л.
19. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). - Краснодар: КубГАУ. 2002. - 605 с. http://elibrary.ru/item.asp?id=18632909
20. Lutsenko E.V. SYSTEM ANALYSIS AND DECISION MAKING (Automated system-cognitive analysis and solving problems of identification, decision-making and research of the simulated subject area) // August 2020, DOI: 10.13140/RG.2.2.27247.05289, License CC BY-SA 4.0, https://www.researchgate.net/publication/343998862
21. Луценко Е. В. Метризация измерительных шкал различных типов и совместная сопоставимая количественная обработка разнородных факторов в системнокогнитивном анализе и системе «Эйдос» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. - №08(092). С. 859 - 883. - IDA [article ID]: 0921308058. - Режим доступа: http://ei.kubagro.ru/2013/08/pdf/58.pdf 1,562 у.п.л.
22. Орлов А.И., Луценко Е.В. Системная нечеткая интервальная математика. Монография (научное издание). - Краснодар, КубГАУ. 2014. - 600 с. ISBN 978-594672-757-0. http://elibrary.ru/item.asp?id=21358220/.
23. Луценко Е.В. Проблемы и перспективы теории и методологии научного познания и автоматизированный системно-когнитивный анализ как
автоматизированный метод научного познания, обеспечивающий содержательное феноменологическое моделирование / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2017. -№03(127). С. 1 - 60. - IDA [article ID]: 1271703001. - Режим доступа: http://ej.kubagro.ru/2017/03/pdf/01.pdf, 3,75 у.п.л.
24. Луценко Е.В. Инвариантное относительно объемов данных нечеткое мультиклассовое обобщение F-меры достоверности моделей Ван Ризбергена в АСКанализе и системе «Эйдос» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2017. -№02(126). С. 1 - 32. - IDA [article ID]: 1261702001. - Режим доступа: http://ej.kubagro.ru/2017/02/pdf/01.pdf 2 у.п.л.
25. Луценко Е.В. Количественный автоматизированный SWOT- и PEST-анализ средствами АСК-анализа и интеллектуальной системы «Эйдос-Х++» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №07(101). С. 1367 - 1409. - IDA [article ID]: 1011407090. - Режим доступа: http://ej.kubagro.ru/2014/07/pdf/90.pdf 2,688 у.п.л.
26. Луценко Е.В. Метод когнитивной кластеризации или кластеризация на основе знаний (кластеризация в системно-когнитивном анализе и интеллектуальной системе «Эйдос») / Е.В. Луценко, В.Е. Коржаков // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2011. - №07(071). С. 528 - 576. - Шифр Информрегистра: 0421100012\0253, IDA [article ID]: 0711107040. -Режим доступа: http://ej.kubagro.ru/2011/07/pdf/40.pdf 3,062 у.п.л.
27. Луценко Е.В. Системная теория информации и нелокальные интерпретируемые нейронные сети прямого счета / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. - №01(001). С. 79 - 91. - IDA [article ID]: 0010301011. - Режим доступа: http://ej.kubagro.ru/2003/01/pdf/11 .pdf 0,812 у.п.л.
28. Луценко Е.В. Моделирование сложных многофакторных нелинейных объектов управления на основе фрагментированных зашумленных эмпирических данных большой размерности в системно-когнитивном анализе и интеллектуальной системе «Эйдос-Х++» / Е.В. Луценко, В.Е. Коржаков // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. -№07(091). С. 164 - 188. - IDA [article ID]: 0911307012. - Режим доступа: http://ej.kubagro.ru/2013/07/pdf/12.pdf 1,562 у.п.л.
29. Луценко Е.В. Открытая масштабируемая интерактивная интеллектуальная online среда для обучения и научных исследований на базе АСК-анализа и системы «Эйдос» / Е. В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2017. - №06(130). С. 1 - 55. - IDA [article ID]: 1301706001. - Режим доступа: http://ej.kubagro.ru/2017/06/pdf/01.pdf, 3,438 у.п.л. http://lc.kubagro.ru/aidos/Presentation_Aidos-online.pdf
30. Луценко Е.В., Открытая масштабируемая интерактивная интеллектуальная online среда «Эйдос» («Эйдос-online»). Свид. РосПатента РФ на программу для ЭВМ,
Заявка № 2017618053 от 07.08.2017, Гос.рег.№ 2017661153, зарегистр. 04.10.2017. -Режим доступа: http://lc.kubagro.ru/aidos/2017661153.jpg 2 у.п.л.
31. Lutsenko E.V. Theoretical foundations, mathematical model and software tools for Automated system-cognitive analysis // July 2020, DOI: 10.13140/RG.2.2.21918.15685, License CC BY-SA 4.0, https://www.researchgate.net/publication/343057312
32. Сайт проф.Е.В.Луценко: http ://lc. kub agro.ru/
33. Блог Е.В.Луценко в RG https://www.researchgate.net/profile/Eugene-Lutsenko
34. Канал проф.Е.В.Луценко на YouTube: https://youtube.com/channel/UC_ QF84d8SCaWxsnXnexNFzg
35. Lutsenko E.V. Forecasting the risks of loan non-repayment using an intelligent iterative algorithm for accounting for atypical cases // May 2021, DOI: 10.13140/RG.2.2.32991.38560, https://www.researchgate.net/publication/351924470.
Literatura
1. Lutsenko E.V. Methods of writing scientific papers, logic and the manner in which scientific statements // February 2021, DOI: 10.13140/RG.2.2.23546.41920, License CC BY-SA 4.0, https://www.researchgate.net/publication/349039044
2. Lucenko E. V. Nauchnaya publicistika : uchebnik / E. V. Lucenko. - Krasnodar : VCzSKI «Fjdos», 2020. - 188 s. DOI 10.13140/RG.2.2.36089.01126, https://www.researchgate.net/publication/340264083.
3. Lucenko E. V. Sovremenny'e informacionno-kommunikacionnye texnologii v nauchno-issledovatefskoj deyatel'nosti i obrazovanii: ucheb. posobie dlya asp. napr. podg.: 40.06.01 "Yurisprudenciya"/ E. V. Lucenko, G. M. Meretukov, V. I. Lojko. - Krasnodar: KubGAU,. 2019. - 256s. ISBN 978-5-907294-46-2, https://www.researchgate.net/publication/339285519.
4. Prokop eva A.A. Primenenie informacionny'x texnologij i matematicheskogo modelirovaniya v upravlenii bankovskimi riskami // Magist. diss., Rezhim dostupa: https://dspace.spbu.ru/bitstream/11701/12281/1/Master_s_dissertation-7.pdf (obrashhenie: 23.05.2021).
5. Belyakov A.V.. Rezervy' na vozmozhny'e poteri - ekonomicheskaya sushhnost i uchyot dlya celej nalogooblozheniya. Data obrashheniya: 27 fevralya 2010. Arxivirovano 12 aprelya 2012 goda.
6. Kurnosenko A.A.. Osobennosti pravovogo regulirovaniya bankovskimi riskami v usloviyax ry'nochnoj ekonomiki // Bankovskoe pravo. — 2008. — Vy'p. 5.
7. Pogorelova O.S.. Problemy' prognozirovaniya kreditny'x riskov // Bankovskoe kreditovanie. — 2008. — Vy'p. 3.
8. Sluczkij A.A.. Koncepciya opredeleniya znacheniya minimalnogo rezerva po ssudam // Bankovskoe kreditovanie. — 2008. — Vy'p. 4.
9. Suxov A.V.. Upravlenie kreditny'mi riskami v Rossii i Evrope: sravnitel'ny'j analiz // Upravlenie v kreditnoj organizacii. — 2008. — Vy'p. 6.
10. Informacionnyj byulleten' // Vy'pusk № 1(44), Moskva 2013 god, Rezhim dostupa: http://www.ksp.mos.ru/upload/documents/inf_bulletin/KSP-144.pdf, (obrashhenie: 23.05.2021).
11. Lucenko E.V., Lebedev E.A., Podsistema avtomaticheskogo formirovaniya dvoichnogo dereva klassov semanticheskoj informacionnoj modeli (Podsistema "E'jdos-Tree"). Pat. № 2008610096 RF. Zayav. № 2007613721 RF. Opubl. ot 09.01.2008. - Rezhim dostupa: http://lc.kubagro.ru/aidos/2008610096.jpg, 3,125 / 2,500 u.p.l.
12. Lucenko E.V. Sistemno-kognitivny'j analiz vremenny'x ryadov na primere fondovogo ry'nka (kognitivnaya strukturizaciya i formalizaciya predmetnoj oblasti) / E.V. Lucenko, E.A. Lebedev // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal
Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2009. - №07(051). S. 1 - 37. - Shifr Informregistra: 0420900012\0073, IDA [article ID]: 0510907001. - Rezhim dostupa: http://ej.kubagro.ru/2009/07/pdf/01.pdf, 2,312 u.p.l.
13. Lucenko E.V. Sistemno-kognitivny'j analiz vremenny'x ryadov na primere fondovogo ry'nka (sintez i verifikaciya semanticheskoj informacionnoj modeli) / E.V. Lucenko, E.A. Lebedev // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2009. - №07(051). S. 38 - 46. - Shifr Informregistra: 0420900012\0072, IDA [article ID]: 0510907002. - Rezhim dostupa: http://ej.kubagro.ru/2009/07/pdf/02.pdf, 0,562 u.p.l.
14. Lucenko E.V. Sistemno-kognitivny'j analiz vremenny'x ryadov na primere fondovogo ry'nka (prognozirovanie, prinyatie reshenij i issledovanie predmetnoj oblasti) / E.V. Lucenko, E.A. Lebedev // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [Flektronnyj resurs]. - Krasnodar: KubGAU, 2009. - №07(051). S. 47 - 82. - Shifr Informregistra: 0420900012\0071, IDA [article ID]: 0510907003. - Rezhim dostupa: http://ej.kubagro.ru/2009/07/pdf/03.pdf, 2,25 u.p.l.
15. Lucenko E.V. Povy'shenie kachestva modelej «knowledge management» putem razdeleniya klassov na tipichnuyu i netipichnuyu chasti / E.V. Lucenko, E.A. Lebedev, V.N. Laptev // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [Flektronnyj resurs]. - Krasnodar: KubGAU, 2009. - №10(054). S. 78 - 93. - Shifr Informregistra: 0420900012\0109, IDA [article ID]: 0540910005. - Rezhim dostupa: http://ej.kubagro.ru/2009/10/pdf/05.pdf, 1 u.p.l.
16. Lucenko, E. V. Opredelenie kreditosposobnosti fizicheskix licz i riska ix kreditovaniya / E. V. Lucenko, E. A. Lebedev // Finansy' i kredit. - 2006. - № 32(236). - S. 75-83. https://elibrary.ru/item.asp?id=9290406
17. Lucenko E.V. Astrosociotipologiya i spektral'ny'j analiz lichnosti po astrosociotipam s primeneniem semanticheskix informacionny'x mul'timodelej / E.V. Lucenko, A.P. Trunev // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2008. - №01(035). S. 101 - 151. - Shifr Informregistra: 0420800012\0002, IDA [article ID]: 0350801010. - Rezhim dostupa: http://ej.kubagro.ru/2008/01/pdf/10.pdf, 3,188 u.p.l.
18. Lucenko E.V. Povy'shenie adekvatnosti spektral'nogo analiza lichnosti po astrosociotipam putem ix razdeleniya na tipichnuyu i netipichnuyu chasti / E.V. Lucenko, A.P. Trunev // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2008. - №02(036). S. 153 - 174. - Shifr Informregistra: 0420800012\0017, IDA [article ID]: 0360802010. - Rezhim dostupa: http://ej.kubagro.ru/2008/02/pdf/10.pdf, 1,375 u.p.l.
19. Lucenko E.V. Avtomatizirovanny'j sistemno-kognitivny'j analiz v upravlenii aktivny'mi ob''ektami (sistemnaya teoriya informacii i ee primenenie v issledovanii e'konomicheskix, social'no-psixologicheskix, texnologicheskix i organizacionno-texnicheskix sistem): Monografiya (nauchnoe izdanie). - Krasnodar: KubGAU. 2002. - 605 s. http://elibrary.ru/item.asp?id=18632909
20. Lutsenko E.V. SYSTEM ANALYSIS AND DECISION MAKING (Automated system-cognitive analysis and solving problems of identification, decision-making and research of the simulated subject area) // August 2020, DOI:
10.13140/RG.2.2.27247.05289, License CC BY-SA 4.0,
https://www.researchgate.net/publication/343998862
21. Lucenko E.V. Metrizaciya izmeritel'ny'x shkal razlichny'x tipov i sovmestnaya sopostavimaya kolichestvennaya obrabotka raznorodny'x faktorov v sistemnokognitivnom analize i sisteme «E'jdos» / E.V. Lucenko // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2013. -№08(092). S. 859 - 883. - IDA [article ID]: 0921308058. - Rezhim dostupa: http://ej.kubagro.ru/2013/08/pdf/58.pdf 1,562 u.p.l.
22. Orlov A.I., Lucenko E.V. Sistemnaya nechetkaya interval'naya matematika. Monografiya (nauchnoe izdanie). - Krasnodar, KubGAU. 2014. - 600 s. ISBN 978-5- 94672757-0. http://elibrary.ru/item.asp?id=21358220/.
23. Lucenko E.V. Problemy' i perspektivy' teorii i metodologii nauchnogo poznaniya i avtomatizirovanny'j sistemno-kognitivny'j analiz kak avtomatizirovanny'j metod nauchnogo poznaniya, obespechivayushhij soderzhatel'noe fenomenologicheskoe modelirovanie / E.V. Lucenko // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2017. - №03(127). S. 1 - 60. - IDA [article ID]: 1271703001. - Rezhim dostupa: http://ej.kubagro.ru/2017/03/pdf/01.pdf, 3,75 u.p.l.
24. Lucenko E.V. Invariantnoe otnositel'no ob'emov danny'x nechetkoe mul'tiklassovoe obobshhenie F-mery' dostovernosti modelej Van Rizbergena v ASKanalize i sisteme «E'jdos» / E.V. Lucenko // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2017. - №02(126). S. 1 - 32. - IDA [article ID]: 1261702001. - Rezhim dostupa: http://ej.kubagro.ru/2017/02/pdf/01.pdf 2 u.p.l.
25. Lucenko E.V. Kolichestvenny'j avtomatizirovanny'j SWOT- i PEST-analiz sredstvami ASK-analiza i intellektual'noj sistemy' «E'jdos-X++» / E.V. Lucenko // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2014. - №07(101). S. 1367 - 1409. - IDA [article ID]: 1011407090. - Rezhim dostupa: http://ej.kubagro.ru/2014/07/pdf/90.pdf 2,688 u.p.l.
26. Lucenko E.V. Metod kognitivnoj klasterizacii ili klasterizaciya na osnove znanij (klasterizaciya v sistemno-kognitivnom analize i intellektual'noj sisteme «E'jdos») / E.V. Lucenko, V.E. Korzhakov // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2011. - №07(071). S. 528 - 576. - Shifr Informregistra: 0421100012\0253, IDA [article ID]: 0711107040. - Rezhim dostupa: http://ej.kubagro.ru/2011/07/pdf/40.pdf 3,062 u.p.l.
27. Lucenko E.V. Sistemnaya teoriya informacii i nelokal'ny'e interpretiruemy'e nejronny'e seti pryamogo scheta / E.V. Lucenko // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2003. - №01(001). S. 79 - 91. -IDA [article ID]: 0010301011. - Rezhim dostupa: http://ej.kubagro.ru/2003/01/pdf/11.pdf 0,812 u.p.l.
28. Lucenko E.V. Modelirovanie slozhny'x mnogofaktorny'x nelinejny'x ob''ektov upravleniya na osnove fragmentirovanny'x zashumlenny'x e'mpiricheskix danny'x bol'shoj razmernosti v sistemno-kognitivnom analize i intellektual'noj sisteme «E'jdos-X++» / E.V. Lucenko, V.E. Korzhakov // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2013. - №07(091). S. 164 - 188. - IDA
[article ID]: 0911307012. - Rezhim dostupa: http://ej.kubagro.ru/2013/07/pdf/12.pdf 1,562 u.p.l.
29. Lucenko E.V. Otkry'taya masshtabiruemaya interaktivnaya intellektuafnaya online sreda dlya obucheniya i nauchny'x issledovanij na baze ASK-analiza i sistemy' «E'jdos» / E.V. Lucenko // Politematicheskij setevoj e'lektronny'j nauchny'j zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchny'j zhurnal KubGAU) [E'lektronny'j resurs]. - Krasnodar: KubGAU, 2017. - №06(130). S. 1 - 55. - IDA [article ID]: 1301706001. - Rezhim dostupa: http://ej.kubagro.ru/2017/06/pdf/01.pdf, 3,438 u.p.l. http://lc.kubagro.ru/aidos/Presentation_Aidos-online.pdf
30. Lucenko E.V., Otkry'taya masshtabiruemaya interaktivnaya intellektual'naya online sreda «E'jdos» («E'jdos-online»). Svid. RosPatenta RF na programmu dlya EVM, Zayavka № 2017618053 ot 07.08.2017, Gos.reg.№ 2017661153, zaregistr. 04.10.2017. -Rezhim dostupa: http://lc.kubagro.ru/aidos/2017661153.jpg 2 u.p.l.
31. Lutsenko E.V. Theoretical foundations, mathematical model and software tools for Automated system-cognitive analysis // July 2020, DOI: 10.13140/RG.2.2.21918.15685, License CC BY-SA 4.0, https://www.researchgate.net/publication/343057312
32. Sajt prof.E.V.Lucenko: http://lc.kubagro.ru/
33. Blog E.V.Lucenko v RG https://www.researchgate.net/profile/Eugene-Lutsenko
34. Kanal prof.E.V.Lucenko na YouTube: https://youtube.com/channel/UC_QF84d8SCaWxsnXnexNFzg
35. Lutsenko E.V. Forecasting the risks of loan non-repayment using an intelligent iterative algorithm for accounting for atypical cases // May 2021, DOI: 10.13140/RG.2.2.32991.38560, https://www.researchgate.net/publication/351924470.
Приложение 1. Программная реализация в системе «Эйдос» интеллектуального итерационного алгоритма
учета нетипичных случаев
*************************************************************************************************************************************
******** Из файла исходных данных "Inp_data.dbf" стандарта программного интерфейса 2.3.2.2 удаляются объекты обучающей выборки
******** с отрицательным уровнем сходства с классом, к которому они относятся. В данном режиме используются результаты распознавания. *************************************************************************************************************************************
FUNCTION F3_7_6()
LOCAL GetList := {}
*Razrab () *Running(.F.) *RETURN NIL
Running(.T.)
IF M_KodAdmAppls = 0 // Выйти из системы если нет авторизации
LB_Warning(L("Вы не авторизовались в системе (режим 1.1) и не можете ей пользоваться!")) Running(.F.) RETURN NIL ENDIF
*IF ApplChange("3.7.6()") // Если не запущен режим, работающий с БД, то перейти в папку выбранного приложения
* Running(.F.)
* RETURN NIL *ENDIF
IF ApplChange("") // Если не запущен режим, работающий с БД, то перейти в папку выбранного приложения
Running(.F.) RETURN NIL ENDIF
***** Проверки на наличие необходимых баз данных и сообщения, если их нет
IF .NOT. FILE(Disk_dir +"\AID_DATA\Inp_data\Inp_data.dbf")
LB_Warning(L('В папке: нет базы данных: "Inp_data.dbf"!'), L('3.7.6. Разделение классов на типичную и нетипичную части')) Running(.F.) RETURN NIL ENDIF
IF .NOT. FILE(Disk_dir +"\_2_3_2_2.arx")
LB_Warning(L("Необходимо создать модель в режиме 2.3.2.2."), L('3.7.6. Разделение классов на типичную и нетипичную части' )) ELSE
aSoftInt = DC_ARestore(M_PathAppl+"\_2_3_2_2.arx")
aSoftInt[ 2] = 1 // Нули и пробелы считать отсутствием данных
aSoftInt[15] = 1 // 1-равные интервалы, 2-адаптивные интервалы (с примерно равным количеством наблюдений, по
Котельникову)
адаптивные
aSoftInt [27] = 3 DC_ASave(aSoftInt DC_ASave(aSoftInt ENDIF
M_PathAppl+"\_2_3_2_2.arx") Disk_dir +"\_2_3_2_2.arx")
// Если удалять классы, то можно использовать равные интервалы, а если добавлять, то можно и // Использовать Inp_data.dbf
CLoseAll() // Закрытие всех баз данных с ожиданием завершения операций
USE Inp_data EXCLUSIVE NEW
mFlagTXT = .T.
FOR mClSc = aSoftInt [3] TO aSoftInt[4] IF FIELDTYPE(mClSc)="C" mFlagTXT = .F. EXIT ENDIF
NEXT
IF mFlagTXT aMess := {}
AADD(aMess, L(IВ файле исходных данных "Inp_data" нет текстовых классификационных шкал, AADD(aMess, L(lа данный режим работает только с текстовыми классификационными шкалами. LB_Warning(aMess, L('3.7.6. Разделение классов на типичную и нетипичную части' )) Running(.F.) RETURN NIL ENDIF
// Цикл по классификационным шкалам // Символьные столбцы
// Нет текстовых классификационных шкал
*MsgBox(M_PathAppl+"Rsp2i.dbf") IF .NOT. FILE(M_PathAppl+"Rsp2i.dbf") .OR.; •NOT. FILE(M_PathAppl+"Rsp2k.dbf") aMess := {}
AADD (aMess, L(^ папке: ') +ALLTRIM (M_PathAppl) +L (' нет базы данных: "Rsp2i .dbf"!')) AADD(aMess, L(1 Необходимо выполнить режим 3.5, чтобы сформировать ее.')) LB_Warning(aMess, L('3.7.6. Разделение классов на типичную и нетипичную части' )) Running(.F.) RETURN NIL ENDIF
**************************************************************************************
mIntKrit = 1
IF .NOT. FILEC_DelObj.txt')
StrFile(ALLTRIM(STR(1)), '_mIntKrit.txt') ENDIF
mIntKrit = VAL(FileStr('_mIntKrit.txt')) mDelObj = 1
IF .NOT. FILEC_DelObj.txt')
StrFile(ALLTRIM(STR(1)), '_DelObj.txt') ENDIF
// Запись текстового файла _mIntKrit.txt // Загрузка текстового файла _mIntKrit.txt
// Запись текстового файла _DelObj.txt
mDelObj = VAL(FileStr('_DelObj.txt')) // Загрузка текстового файла _DelObj.txt
mIntKrit = 2
@ 1, 0 DCGROUP oGroup1 CAPTION L('Какой интегральный критерий использовать? ') SIZE 80.0, 3.5
@ 1, 2 DCRADIO mIntKrit VALUE 1 PROMPT L('1. Резонанс знаний ') PARENT oGroup1
@ 2, 2 DCRADIO mIntKrit VALUE 2 PROMPT L('2. Сумма знаний ') PARENT oGroup1
@1.2,50 DCPUSHBUTTON CAPTION L("Пояснение") SIZE 15, 1.5 ACTION {||Help376(), DC_GetRefresh(GetList)} PARENT oGroup1
@ 5, 0 DCGROUP oGroup2 CAPTION L('Как обрабатывать нетипичные объекты обучающей выборки:') SIZE 80.0, 3.5 @ 1, 2 DCRADIO mDelObj VALUE 1 PROMPT L('Удалять нетипичные объекты из "Inp_data.dbf" ') PARENT oGroup2 @ 2, 2 DCRADIO mDelObj VALUE 2 PROMPT L('Создавать новые классы для нетипичных объектов ') PARENT oGroup2
DCREAD GUI;
TO lExit ; FIT;
ADDBUTTONS; MODAL;
TITLE L("4.2.2.4 (3.7.6) Разделение классов на типичную и нетипичную части") ********************************************************************
IF lExit
** Button Ok ELSE
**************************************************************
***** БД, открытые перед запуском главного меню
***** Восстанавливать их после выхода из функций главного меню **************************************************************
CLoseAll() // Закрытие всех баз данных с ожиданием завершения операций
DIRCHANGE(Disk_dir) // Перейти в папку с исполнимым модулем системы
USE PathGrAp EXCLUSIVE NEW USE Appls EXCLUSIVE NEW
USE Users EXCLUSIVE NEW **************************************************************
Running(.F.) RETURN NIL ENDIF
********************************************************************
ERASE('_IntKrit.txt');StrFile(ALLTRIM(STR(mIntKrit)), '_IntKrit.txt') // Запись текстового файла _ObjErr.txt
ERASE('_DelObj.txt') ;StrFile(ALLTRIM(STR(mDelObj)) , '_DelObj.txt') // Запись текстового файла _DelObj.txt
**************************************************************************************
aSoftInt = DC_ARestore(M_PathAppl+"\_2_3_2_2.arx")
// Если в объектах обучающей выборки, приведших к FN-решениям, удалять классы, то допустимы только равные интервалы, // а если для таких решений классы добавлять, то можно использовать и адаптивные интервалы IF mDelObj = 1 // Удалять нетипичные объекты из "Inp_data.dbf
aSoftInt[ 2] = 1 // Нули и пробелы считать отсутствием данных
aSoftInt[15] = 1 // 1-равные интервалы, 2-адаптивные интервалы (с примерно равным количеством наблюдений, по
Котельникову) <<<===################## ENDIF
aSoftInt[27] = 3 // Использовать Inp_data.dbf
DC_ASave(aSoftInt , M_PathAppl+"\_2_3_2_2.arx") DC_ASave(aSoftInt , Disk_dir +"\_2_3_2_2.arx")
CLoseAll() // Закрытие всех баз данных с ожиданием завершения операций
COPY FILE ("Inp_data.dbf") TO ("ObjFalseNeg.dbf") COPY FILE ("Inp_data.dbf") TO ("InpDataSource.dbf")
CLoseAll() // Закрытие всех баз данных с ожиданием завершения операций
USE Inp_data EXCLUSIVE NEW USE Obj FalseNeg EXCLUSIVE NEW;ZAP
DO CASE
CASE mIntKrit=1
USE Rsp2k EXCLUSIVE NEW CASE mIntKrit=2
USE Rsp2i EXCLUSIVE NEW
ENDCASE
nMax = RECCOUNT ()
Mess = L('4.2.2.4 (3.7.6). Разделение классов на типичную и нетипичную части')
@ 4,5 DCPROGRESS oProgress SIZE 70,1.1 MAXCOUNT nMax COLOR GRA_CLR_CYAN PERCENT EVERY 100
DCREAD GUI TITLE Mess PARENT @oDialog FIT EXIT
oDialog:show()
nTime = 0
DC_GetProgress(oProgress,0,nMax) mNObj FN = 0 DBGOTOP()
DO WHILE .NOT. EOF()
mKodObj = KOD_OBJ mKodClSc = KOD_CLSC
mNameClsOld = ALLTRIM(NAME_CLS) mPos = RAT('-', mNameClsOld)
mNameCls = SUBSTR(mNameClsOld, mPos+1, LEN(mNameClsOld)-mPos)
IF LEN(ALLTRIM(Fakt)) > 0 .AND. IF(mIntKrit=1, KORR, SUM_INF) < 0
* MsgBox(,Kod_obj=,+ALLTRIM(STR(KOD_OBJ))+' '+ALLTRIM(NAME_OBJ)+' '+ALLTRIM(STR(KOD_CLS))+' '+ALLTRIM(NAME_CLS)+' '+ALLTRIM(STR(KOD_CLSC))+'
'+ALLTRIM(STR(KORR))+' '+ALLTRIM(STR(SUM_INF))+' '+ALLTRIM(FAKT))
SELECT Inp_data DBGOTO(mKodObj)
* MsgBox('Kod_obj = '+ALLTRIM(STR(FIELDGET(1))) + ' '+ALLTRIM(FIELDGET(2)) + ' '+ALLTRIM(STR(FIELDGET(3))) + ' '+ALLTRIM(STR(FIELDGET(4))) + '
'+ALLTRIM(FIELDGET(5)))
mNumClSc = aSoftInt[3]+mKodClSc-1 IF FIELDTYPE(mNumClSc) = "C" mNObj FN+ + IF mDelObj = 1
FIELDPUT(mNumClSc, ) ELSE
FIELDPUT(mNumClSc, mNameCls+'_FN' ) ENDIF aObj := {} FOR j=1 TO FCOUNT()
AADD(aObj, FIELDGET(j))
NEXT
SELECT ObjFalseNeg
APPEND BLANK
FOR j=1 TO LEN(aObj)
FIELDPUT (j , aObj [j])
NEXT ENDIF
// Номер колонки классификационной шкалы в БД Inp_data // Текстовые классификационые шкалы
// Удалять объекты обучающей выборки // Класс - отсутствие данных
// Класс - отсутствие данных
// БД с объектами обучающей выборки, приведшими к ложно-отрицательным решениям
ENDIF
DO CASE
CASE mIntKrit=1
SELECT Rsp2k CASE mIntKrit=2
SELECT Rsp2i
ENDCASE
DC_GetProgress(oProgress, ++nTime, nMax) DBSKIP(1)
ENDDO
*MsgBox('STOP')
DC_GetProgress(oProgress,nMax,nMax) oDialog:Destroy()
**** После корректировки файла Inp_data.dbf в папке приложения записать его в ..\AID_DATA\Inp_data\ *MsgBox(M_ApplsPath+"\Inp_data\Inp_data.dbf")
CLoseAll() // Закрытие всех баз данных с ожиданием завершения операций
COPY FILE ("Inp_data.dbf") TO (M_ApplsPath+"\Inp_data\Inp_data.dbf") COPY FILE ("Obj FalseNeg.dbf") TO (M_ApplsPath+"\Inp_data\ObjFalseNeg.dbf") COPY FILE ("Obj FalseNeg.dbf") TO (M_ApplsPath+"\Inp_data\ObjFalseNeg.xls")
aMess := {}
1Р тОеЮЬ = 1
ААББ(аМезз, Ь('Удалено:')+' '+ALLTRIM(STR(mNObjFN)) + ' '+Ь('нетипичных объектов обучающей выборки.')) ^ mDelObj = 2
ААББ(аМезз, L(lНазначено на новые классы:')+' l+ALLTRIM(STR(mNObjFN))+l l+L(lнетипичных объектов обучающей выборки.')) ENDIF
ААББ(аМезз, L(IБД с объектами обучающей выборки, приведшими к FN-решениям:l)+l l+M_ApplsPath+"\Inp_data\ObjFalseNeg.xls") AADD(aMess, L(, '))
AADD(aMess, L(lДалее нужно выполнить режим 2.3.2.2 с параметрами, заданными по умолчанию.')) LB_Warning(aMess, L(l4.2.2.4 (3.7.6) Разделение классов на типичную и нетипичную части'))
***************************************************************************
******** ЗАПИСАТЬ ПАРАМЕТРЫ ДЛЯ 2.3.2.2, ЧТОБЫ ЗАГРУЗКА ШЛА ИЗ INP_DATA.DBF ***************************************************************************
IF FILE("_2_3_2_2.arx")
aSoftInt = DC_ARestore(Disk_dir +"\_2_3_2_2.arx") aSoftInt[ 2] = 1 aSoftInt [27] = 3
DC_ASave(aSoftInt , Disk_dir +"\_2_3_2_2.arx") ENDIF
****************************
***** Запустить 2.3.2.2, 3.5 ****************************
F2_3_2_2("","") // Запуск универсального программного интерфейса с внешними базами данных
* Возникает ошибка в отображении хода исполнения. Так и не смог разобраться
* F3_5('GPU','','','') // Какая модель?
* F3_5('GPU','SintRec','3.7.6','ALL') // Какая модель?
* F3_5('GPU','SintRec','3.5','ALL') **************************************************************
***** БД, открытые перед запуском главного меню
***** Восстанавливать их после выхода из функций главного меню **************************************************************
CLoseAll() // Закрытие всех баз данных с ожиданием завершения операций
DIRCHANGE(Disk_dir) // Перейти в папку с исполнимым модулем системы
USE PathGrAp EXCLUSIVE NEW USE Appls EXCLUSIVE NEW
USE Users EXCLUSIVE NEW **************************************************************
AADD(aMess, L(' '))
AADD(aMess, L('Далее необходимо в режиме 3.5 создать и верифицировать модели: Abs, Prcl, Prc2, Infi, Inf2, Inf3, Inf4, Inf5, AADD(aMess, L('Затем в режиме 3.4 необходимо определить модель и интегральный критерий, при которых достигается максимальная AADD(aMess, L(' '))
Inf6, Inf7. ')) достоверность.'))
AADD(aMess, L( AADD(aMess, L( AADD(aMess, L( AADD(aMess, L( AADD(aMess, L(
Режим 4.2.2.4 (3.7.6) можно повторять до достижения необходимого достаточно высокого уровня достоверности моделей. '))
'))
Если достоверность модели достаточно высока, то в ней корректно можно решать задачи идентификации и прогнозирования (4.1.2),')) принятия решений (4.4.8) и исследования объекта моделирования путем исследования его модели (режимы: 4.4.9, 4.4.10, 4.4.11,')) 4.4.12, 4.2.1, 4.2.2.1, 4.2.2.2, 4.2.2.3, 4.2.3, 4.3.2.1, 4.3.2.2, 4.3.2.3, 4.5, 3.7.5, 3.7.4., 3.7.3, 3.7.9 и т.д.) '))
LB_Warning(aMess, L('4.2.2.4 (3.7.6) Разделение классов на типичную и нетипичную части'))
Running(.F.) RETURN NIL
****************************************************************************************************