УДК 338.436.33: [004:330.322]
ББК 65.9(2) 32-5
Б-24
Барановская Татьяна Петровна, профессор, доктор экономических наук, заведующая кафедрой системного анализа и обработки информации факультета прикладной информатики ФГБОУ ВО «Кубанский государственный аграрный университет им. И.Т. Трубилина»; 350044, г. Краснодар, ул. Калинина, 13; e-mail: [email protected].;
Луценко Евгений Вениаминович, профессор, доктор экономических наук, кандидат технических наук, профессор кафедры компьютерных технологий и систем факультета прикладной информатики ФГБОУ ВО «Кубанский государственный аграрный университет им. И.Т. Трубилина»; 350044, г. Краснодар, ул. Калинина, 13; e-mail:prof.lutsenko@,gmail.com, http://lc.kubagro.ru
ИНФОРМАЦИОННЫЕ И КОГНИТИВНЫЕ ТЕХНОЛОГИИ В УПРАВЛЕНИИ КАЧЕСТВОМ ЖИЗНИ ПУТЕМ ИНВЕСТИЦИЙ В АПК: СИНТЕЗ И ВЕРИФИКАЦИЯ СИСТЕМНО-КОГНИТИВНЫХ МОДЕЛЕЙ*
(рецензирована)
В предыдущих работах авторов была решена задача когнитивной структуризации и формализации предметной области, которая состоит в разработке классификационных и описательных шкал и градаций и кодировании исходных данных с их помощью, в результате чего формируется обучающая выборка. Данная работа посвящена синтезу и верификации системно-когнитивной модели, отражающей влияние инвестиций в АПК на качество жизни населения региона.
Ключевые слова: АСК-анализ, система «Эйдос», автоматизированный системно-когнитивный анализ, качество жизни, регион, качество жизни.
Baranovskaya Tatyana Petrovna, a professor, Doctor of Economics, head of the Department of System Analysis and Information Processing of the Faculty of Applied Computer Science of FSBEI HE "Kuban State Agrarian University named after I.T. Trubilin"; 350044, Krasnodar, 13 Kalinin str.; e-mail: [email protected].;
Lutsenko Evgeniy Veniaminovich, a professor, Doctor of Economics, Candidate of Technical Sciences, professor of the Department of Computer Technologies and Systems of the Faculty of Applied Computer Science of FSBEI HE "Kuban State Agrarian University named after I.T. Trubilin"; 350044, Krasnodar, 13 Kalinin str.; e-mail: [email protected], http://lc.kubagro.ru
INFORMATION AND COGNITIVE TECHNOLOGIES IN THE LIFE QUALITY MANAGEMENT THROUGH INVESTMENTS
IN THE AGRICULTURAL SECTOR: SYNTHESIS AND VERIFICATION OF SYSTEM-COGNITIVE MODELS
(reviewed)
In previous studies the authors solved the problem of cognitive structurization and formalization of the subject area, which consisted in developing classification and descriptive scales and gradations and coding the source data with their help, as a result of which the
* Работа выполнена при финансовой поддержке РФФИ, проект № 17-02-00045-ОГН.
training sample was formed. This paper is devoted to the synthesis and verification of a system-cognitive model, reflecting the impact of investments in the agro-industrial complex on the quality of life of the population of the region.
Keywords: ASC-analysis, Eidos system, automated system-cognitive analysis, quality of life, region.
В работе [1] сформулирована идея рассматривать инвестиции как управляющий фактор, позволяющий достичь значимой цели в реальной предметной области: повысить качество жизни населения региона.. В работе [2] поставлены задачи, которые должны быть решены для достижения этой цели. В данной работе завершается решение 4-й из этих задач, а именно выбранные по критериям метод и инструментарий применяются для создания математической модели регионального социума, адекватно отражающей интересующие нас причинно-следственные взаимосвязи. Отметим, что первая часть этой задачи решена в работе [2].
1. Синтез системно-когнитивной модели объекта моделирования
Различные системно-когнитивные модели (СК-модели) отличаются частными критериями (таблица 1), с помощью которых они рассчитываются на основе исходных данных.
Таблица 1 - Частные критерии
Условное наименование СК-модели Выражение для частного критерия
через относительные частоты через абсолютные частоты
INF1 P Ij Log2 P nn I a _ТхLog2 j j n,n, j j
INF2 Ij _Wx Log, Pj N.N Ia _fx Log2 j j 52 n.n. j j
INF3 — N,N, I _ n.. j j J J N
INF4 p p - P I j i j • j Pi Pi N.N I и _—--1 j n,n, j J
INF5 p p - p I _ j i _ JJ • j P P j J N.N I a _—--1 jj n,n, j j
INF6 I _ P - P у у j i _ nl - n j n. n
INF7 I _ P - P у у j I _ Nl - N. J N N
На рисунке 1 приведена экранная форма с заданием на синтез и верификацию моделей:
Рис. 1. Скриншот режима синтеза и верификации моделей На рисунке 2 приведен фрагмент системно-когнитивной модели !по.
Рис. 2. Фрагмент СК-модели 1^3 2. Достоверность СК-модели объекта моделирования
Из рисунка 3 мы видим, что в соответствии с критерием L2 достоверность наилучшей СК-модели МВ (см. табл. 1) с интегральным критерием «Сумма знаний» составляет 0,911 при максимуме 1, что является довольно хорошим результатом.
Рис. 3. Форма с результатами оценки достоверности моделей Суть критерия достоверности моделей L2 приведена в Help режима 4.1.3.6 (рисунок 4).
(*) Помощь по режимам: 4,1.3.6,4.1.3.7,4.1.3.8,4,1.3.10: Виды прогнозов и меры достоверности моделей в системе "Эйдос-Х+
Помощь по режимам: 4.1.3.6, 4.1.3.7,4.1.3.8,4.1.3.10: Воды прогнозов и меры достоверности моделей в системе ,:.:;дии-::':!++1 ПОЛОЖИТЕЛЬНЫЙ ПСЕВДОПРОГНОЗ.
Предположим, модель дает такой прогноз: выпадет 1.2,3,4,5 или 6. В этом случае а нее б дает 100? достоверность идентификации, т. е. не будет ни одного объекта, не отнесенного к тому классу, к которому он действительно относится, но при этом бздет очень большая ошибка ложной идентификации, т.к. огромное количество объектов будет отнесено к классам, к которым они не относятся (и именно за счет этого у модели и будет очень высокая достоверность идентификации]. Ясно, что такой прогноз бесполезен, поэтому он и назван мной псевдопрогнозом. ОТРИЦАТЕЛЬНЫЙ ПСЕВДОПРОГНОЗ.
Представим себе, что мы выбрасываем кубик с Б гранями, и модель предсказывает, что не выпадет: 1,2,3,4,5 и 6, а что-то из этого естественно выпало. Конечно, модель дает ошибку в прогнозе в том плане, что не предсказала, что выпадет, зато она очень хорошо угадала, что не выпадет. Н о ясно, что выпадет что-то одно, а не все, что предсказано, поэтому такого рода предсказания хорошо оправдываются в том, что нв произошло и плохо в том,произошло, т.е. в этом случае у модели будет 100? достоверность не идентификации, но очень низкая достоверность идентификации. ИДЕАЛЬНЫЙ ПРОГНОЗ.
Е ели в случае с кубиком мы прогнозируем, что выпадет, например 1, и состветственно прогнозируем, что не выпадет 2,3,4,5. и В, то это идеальный прогноз, имеющий,
если он осуществляется, 100% достоверность идентификации и не идентификации. Идеальный прогноз, который полностью снимает неопределенность о будущем состоянии объекта
прогнозирования, на практике уцаегсяполучитькрайнередкоиобычномыимеемделосреальнымпрогнозом.
РЕАЛЬНЫЙ ПРОГНОЗ.
Н а практике мы чаще всего сталкиваемся именно с этим видом прогноза. Реальный прогноз уменьшает неопределенность о будущем состоянии объекта прогнозирования, но не полностью, как идеальный прогноз, а оставляет некоторую неопределенность не снятой. Например, для игрального кубика делается такой прогноз: выпадет 1 или 2, и, соответственно, не выпадет 3,4,5 или В. Понятно, что полностью на практике такой прогноз не может осуществиться, т.к. варианты выпадения кубика альтернативны, т.е. не может выпасть одновременно и 1, и 2. Поэтому у реального прогноза всегда будет определенная ошибка идентификации. Соответственно, если не осуществится один или несколько из прогнозируемых вариантов, то возникнет и ошибка не идентификации, т. к. это не прогнозировалось моделью. Т еперь представите себе, что у В ас не 1 кубик и прогноз его поведения, а тысячи. Т огда можно посчитать средневзвешенные характеристики всех этик видов прогнозов.
Т аким образом, если просуммировать число верно идентифицированных и не идентифицированных объектов и вычесть число ошибочно гщенгифицированных и не идентифицированным объектов, а затем разделить на число всех объектов то это и будет критерий качества модели [классификатора], учитывающий как ее способность верно относить объекты к классам, которым они относятся, так и ее способность верно не относить объекты к тем классам, к которым они не относятся. Этот критерий предложен и реализован в системе 'Эйдос" проф. Е.В.Луценко в 1ЭЭ4 году. Эта мера достоверности модели предполагает два варианта нормировки: {-1, +1} и {0,1 (: И =( TP + TN - FP - FN ] / (TP + TN + FP + FN) [нормировка: {-Ъ1}) L2 = (1 + (TP + TN - FP ■ FN) / [ TP + TN + FP + FN) ] / 2 (нормировка:{0,1})
где количество: TP ■ истино-положительных решений: TN ■ истино-отрицательных решений; FP ■ ложно-положтельных решений; FN ■ ложно-отрицательных решений;
Классическая F-мера достоверности моделей Ван Ризбергена [колонка вьделена ярко-годубым Фоном]: F-meia = 2K(Precision:<Recall)/(P[ecision+Recall) Precision = TP/(TP+FP) ■ точность модели; Recall = TP/(TP+FN] - полнота модели;
L1 -мера проф.Е.В.Луценко - нечеткое мультиклассовое обобщение классической F-меры с учетом СУММ уровней сходства [колонка вьделена ярко-зеленым Фоном]: L1 -meia = 2"(SP[ecision"SRecall]/(SPrecision+SRecall) SPrecision = 5TP/(5TP+5FP) -точность с учетом сумм уровней сходства; SRecall = STP/(STP+SFN] - полнота с учетом сумм уровней сходства;
STP - Сумма модулей сходства истино-положительных решений; STN ■ Сумма модулей сходства истино-отрицательных решений; SFP ■ Сумма модулей сходства ложно-положительных решений; SFN ■ Сумма модулей сходства ложно-отрицательных решений.
L2-Mepa проф.Е.В.Луценко ■ нечеткое мультиклассовое обобщение классической F-меры с учетом СРЕДНИХ уровней сходства [колонка выделена жетым Фоном):
L2-meia = 2"(AP[ecision"AR ecall]/(APrecision+AR ecall)
APiecision=ATP/(ATP+AFP] -точность с учетом средних уровней сходства;
ARecall = ATP/(ATP+AFN] -полнота с учетом средних уровней сходства;
АТР=ВТР/ТР ■ Среднее модулей сходства истино-положительных решений; AFN=SFN/FN ■ Среднее модулей сходства истино-отрицательных решений; AFP=SFP/FP ■ Среднее модулей сходства ложно-положительных решений; AFN=SFN/FN ■ Среднее модулей сходства ложно-отрицательных решений.
Строки с максимальными значениями F-меры, L1 -меры и 1.2-меры выделены Фоном цвета, соответствующего колонке.
Л уценке Е. В. Инвариантное относительно объемов данных нечеткое мультиклассовое обобщение F-меры достоверности моделей В ан Ризбергена в АСК-анализе и системе 'Эйдос" / Е.В. Луценко // Полтематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ] Рлектронный ресурс]. - Краснодар: КубГАУ, 2017. -№02(126). С. 1 - 32. ■ IDA [article ID]: 1261702001. - Режим доступа: http://ei.kubago.ru/2017/02/pdl/01.pdt, 2 у.п.л.
Рис. 4. Help режима 4.1.3.6 (оценка достоверности моделей) Достоверность созданных моделей оценивалась по трем критериям: - F-мера Ван Ризбергена;
TP
Precision = -
Recall =
TP + FP
TP_
TP + FN
F
2 * Precision * Recall Precision + Recall
- Ы-мера, представляющая собой нечеткое мультиклассовое обобщение Б-меры Ван Ризбергена [3]:
V т к
$ТР ж—, ж—,
Р =
$ТР = X X \ЬТР I/, ] ]|,
^ ^ , С ' $ТР = X \ЬТР I
' ^ $рр ¿=1 }=1
V Т к
\ьрр [и ]>
^ е I е рр X / ^ рр I °тр ^ $ РЫ ¿=1 j=l
2 Р Я т к
11 = р • = X X \Ьры Ь,J].
р ^ Я ¿=1 J =1
- Ь2-мера, представляющая собой обобщение Ы-меры, инвариантное относительно объема обучающей выборки [3]:
Т к
Р =
АТР ЛТР КШ
А АТР + Лрр ' ¿=1 J=1 ЫТР
ЛТР А _ у у ]|
ЯА = Л +Л ' Лрр '
ЛТР -Г лРЫ ¿=1 J=1 ы рр
Ь 2 = 2РЛЯЛ г^Ьр^Л
рл + ЯЛ ■ Л™ =Х £ Мш ■
Смысл условных обозначений, использованных в этих математических выражениях, приведен в работе [3], в которой и предложены Ь1 и Ь2 меры.
Рассмотрим частотные распределения истинных и ложных положительных и отрицательных решений (рисунок 5).
Сглаживание частотных распределений истинных и ложных положительных и отрицательных решений осуществляюсь методом центрированной скользящей средней.
Из частотных распределений истинных и ложных положительных и отрицательных решений, приведённых на рисунке 5, видно, что:
1. Для отрицательных решений количество истинных решений всегда значительно превосходит количество ложных решений, причем при уровнях различия больше 15% ложные отрицательные решения вообще не встречаются.
Рис. 5. Частотные распределения истинных и ложных положительных и отрицательных решений в СК-модели 1п/.3
2. Для положительных решений картина более сложная и включает 3 диапазона уровней сходства: при низких уровнях сходства от 0% до 20% количество ложных решений всегда больше числа истинных; при средних уровнях сходства от 20% до 55% количество истинных решений всегда больше числа ложных; при высоких уровнях сходства выше 55% ложные решения вообще не встречаются.
Отметим, что эти частотные распределения напоминают два нормальных распределения, сдвинутых относительно друг друга.
1-е нормальное распределение состоит из частотных распределений истинно -отрицательных и ложно-положительных решений (сдвинуто влево, центр в районе уровня сходства (точнее уровня различия): -12%);
2-е нормальное распределение состоит из частотных распределений ложно-отрицательных и истинно-положительных решений (сдвинуто вправо, центр в районе уровня сходства +45%).
Наличие заметного сдвига между этими двумя нормальными распределениями (около 60%) и небольшое значение корреляции между ними (0,27) делает возможным решение различных задач в данной модели. Все эти результаты вполне разумны.
3. Выводы и перспективы
На основании полученных результатов можно обоснованно сделать два основных вывода:
1. Созданные СК-модели предметной области имеют достаточно высокий уровень достоверности и правильно отражают влияние инвестиций в АПК на уровень качества жизни населения региона.
2. С применением созданных СК-моделей могут быть корректно решены задачи прогнозирования (задача 5), поддержки принятия решений (задача 6) и исследования предметной области (задача 7). Эти задачи, также поставлены в работе [2]. Их планируется решить в последующих статьях.
Литература:
1. Луценко Е.В., Лойко В.И., Барановская Т.П. От управления инвестициями к управлению с помощью инвестиций // Новые технологии. 2017. Вып. 4. С. 184-191.
2. Луценко Е.В., Лойко В.И., Барановская Т.П. Информационные и когнитивные технологии в управлении качеством жизни путем инвестиций: формальная постановка задачи // Новые технологии. 2018. Вып. 3.
3. Луценко Е.В. Инвариантное относительно объемов данных нечеткое мультиклассовое обобщение F-меры достоверности моделей Ван Ризбергена в АСК-анализе и системе «Эйдос» [Электронный ресурс] // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ). 2017. №02(126). С. 1-32. Режим доступа: http://ej .kubagro.ru/2017/02/pdf/01.pdf, 2 у.п.л.
Literature:
1. Lutsenko E.V., Loiko V.I., Baranovskaya, T.P. From investment management to management with investments //New technologies. 2017. Vol. 4. P. 184-191.
2. Lutsenko E.V., Loiko V.I., Baranovskaya T.P. Information and cognitive technologies in managing the quality of life through investments: a formal formulation of the problem // New technologies. 2018. Vol. 3
3. Lutsenko E.V. The fuzzy multiclass generalization of the F-measures of van Riesbergen models in the ASC-analysis and the Eidos system [Electronic resource] invariant with respect to data volumes // Polythematic network electronic scientific journal of Kuban State Agrarian University (Scientific journal of KubSAU). 2017. No. 02 (126). P. 1-32. Access mode: http://ej.kubagro.ru/2017/02/pdf/01.pdf, 2p.sh.