УДК 303.732.4
АСТРОСОЦИОТИПОЛОГИЯ И СПЕКТРАЛЬНЫЙ АНАЛИЗ ЛИЧНОСТИ ПО АСТРОСОЦИОТИПАМ С ПРИМЕНЕНИЕМ СЕМАНТИЧЕСКИХ ИНФОРМАЦИОННЫХ МУЛЬТИМОДЕЛЕЙ
Луценко Евгений Вениаминович д. э. н., к. т. н., профессор
Кубанский государственный аграрный университет, Краснодар, Россия
Трунев А.П. к. ф.-м. н., Ph.D
Директор, A&E Trounev IT Consulting, Торонто, Канада
В статье приводятся основные научные результаты, полученные в 2007 году при создании и исследовании семантической информационной мультимодели, обеспечивающей как выявление зависимостей между астропризнаками и принадлежностью респондентов к обобщенным социальным категориям, так и использование знания этих зависимостей для идентификации респондентов по этим категориям. Мультимодель включает 172 частные модели на 37 обобщенных категорий, причем каждая из категорий представлена не менее чем 1000 респондентов при общем объеме выборки 20007 респондентов. При этом применяется метод системно-когнитивного анализа, который рассматривается как один из универсальных вариантов решения 13-й проблемы Гильберта на практике (теоретически эта проблема решена в теореме А.Н.Колмогорова, являющейся обобщением теоремы В.И. Арнольда (1957).
Ключевые слова: АСТРОСОЦИОТИПОЛОГИЯ, СПЕКТРАЛЬНЫЙ АНАЛИЗ,
АСТРОСОЦИОТИП, СЕМАНТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ МУЛЬТИМОДЕЛИ.
UDC 303.732.4
ASTROSOCIOTYPOLOGY AND SPECTRAL ANALYSIS OF A PERSON BY ASTROSOCIOTYPES WITH THE APPLICATION OF SEMANTIC INFORMATION MULTI MODELS
Lutsenko Evgeny Veniaminovich Dr. Sci. Econ., professor
Kuban State Agrarian University, Krasnodar, Russia
Trunev A.P.
Cand. Phys.-Math. Sci., Ph.D
Director, A&E Trounev IT Consulting, Toronto, Canada
Main scientific results, which were received in 2007 under creation and investigation of semantic information multi mode, providing as detection of dependence between astro signs and accessory of respondents to generalized social categories as a use of knowledge of these dependences for identification of respondents by these categories are casted in the article. Multi model includes 172 private models on 37 generalized categories and each of categories is presented less than 1000 respondents under general fetch capacity of 20007 respondents. It was applied the method of systemic- cognitive analysis, which is considered as one of the universal variants of decision of thirteen problem of Gilbert in practice ( theoretically this problem has been done in the theorem of A.N. Kolmogorova, which is a generalization of theorem V.I. Arnold ( 1957) under it.
Key words: ASTROSOCIOTYPOLOGY, SPECTRAL ANALYSIS, ASTROSOCIOTYPE, SEMANTIC INFORMATION MULTI MODELS.
Данная статья содержит описание основных результатов научных исследований и разработок в области астросоциотипологии, полученных авторами в 2007 году, и является продолжением итоговой статьи [19] по результатам 2006 года.
В статье [19] ставился вопрос о том, действительно ли существуют зависимости между астрономическими признаками респондентов на момент рождения (астропризнаками) и обобщенными категориями, отражающими социальный статус личности (т.к. астросоциотипами).
По мнению авторов, на этот вопрос, имеющий фундаментальное научное значение, был получен убедительный положительный ответ, т. е. с применением автоматизированного системно-когнитивного анализа (АСК-анализ) [1-12] - нового метода ис-
кусственного интеллекта и его инструментария - системы "Эйдос" [20] были созданы модели, позволяющие обоснованно утверждать, что эти зависимости существуют и их характер выявлен и известен нам [8, 13-19].
Необходимо отметить, что сила этих зависимостей для различных категорий оказалась весьма различной, и из более 11000 категорий нами было выявлено всего лишь несколько десятков наиболее статистически представленных категорий, для которых эти связи оказались наиболее сильными [19].
В той же статье [19] был сформулирован и второй вопрос, закономерно вытекающий из первого: возможно ли знание этих зависимостей между астропризнаками и социальными типами использовать для идентификации респондентов на практике?
Для положительного ответа на второй вопрос необходимо не только выявить зависимости между астропризнаками и социальным статусом респондентов, но и разработать такие модели и технологии, которые бы обеспечили настолько высокий уровень достоверности идентификации, чтобы это могло представлять уже не только научный, но и прагматический интерес. В 2007 году нами были предприняты усилия по созданию таких моделей и технологий.
В самом начале исследований и разработок в области астросоциотипологии (такое название получило новое научное направление, предложенное и развиваемое авторами в рамках астросоциологии) были исследованы многочисленные модели, отличающиеся наборами обобщенных категорий (классов), а также описательных шкал и градаций. При этом созданные модели оценивались на достоверность методами бутст-репной статистики, реализованными в системе "Эйдос" [6]. В результате была выбрана так называемая 3-я модель, которая затем и была подробно исследована для получения ответа на первый вопрос.
В этих исследованиях было обнаружено следующее.
1. Достоверность идентификации по категориям практически обратно пропорционально зависит от количества респондентов обучающей выборки, относящихся к этой категории [8, 13-19].
2. Достоверность идентификации одних и тех же классов в разных моделях различна, и для каждого класса всегда есть конкретная частная модель, в которой он идентифицируется с наивысшей достоверностью.
Причины 1-й закономерности мы видим в том, что чем больше респондентов обучающей выборки приходится на категорию, тем выше вариабельность внутри нее по астропризнакам и, соответственно, тем ниже уровень сходства каждого конкретного респондента с обобщенным образом этой категории.
При небольшом количестве респондентов на категорию задача идентификации с ней редуцируется в задачу поиска, аналогичную тому, который осуществляется в информационно-поисковых системах. Поиск осуществляется с высокой степенью достоверности, но для нас он неинтересен, т.к. осуществляется не на основе выявленных и действующих в предметной области (генеральной совокупности) закономерностей, а по простому совпадению признаков. Из этого мы сделали вывод о том, что впредь исследовать только те категории, которые представлены очень большой статистикой. Например, в данной статье исследуются модели идентификации с 37 категориями, каждая из которых представлена не менее 1000 респондентами. При этом "вес", т.е. вклад информации о каждом конкретном респонденте в обобщенный образ категории становится пренебрежимо малым, и поэтому достоверность модели можно проверять не на основе респондентов, данные которых не использовались при ее синтезе, а на тех, которые для этого использовались.
Объяснение 2-й закономерности еще предстоит найти, однако можно высказать два важных соображения:
- сам факт наличия этой закономерности говорит о том, что, по-видимому, существует много различных механизмов "детерминации" астропризнаками принадлежности респондентов к социальным категориям, и для разных категорий этот механизм различен, и поэтому одна модель более адекватно отражает один механизм, а вторая -другой;
- не существует какой-то одной модели, обеспечивающей столь высокий уровень идентификации респондентов по всем категориям, как наилучшая из частных моделей по каждой из категорий.
Поэтому у авторов в начале 2007 года возник проект разработки специальной системы, которая реализовала бы "коллективы решающих правил" [24], т.е. была бы способна:
- автоматически генерировать большое количество частных моделей, которые бы образовывали одну целостную систему, которую мы назвали "мультимодель";
- исследовать частные модели на адекватность идентификации респондентов в них по различным категориям;
- идентифицировать респондентов в системе частных моделей, т.е. в каждой из них, в том числе с учетом априорной информации о достоверности идентификации по различным категориям в частных моделях ("скоростное распознавание");
- обобщать результаты идентификации конкретных респондентов в разных частных моделях с учетом информации о достоверности идентификации в них по разным категориям ("голосование моделей").
Такая система была разработана - это система "Эйдос-астра" [21], являющаяся 3-й системой окружения универсальной когнитивной аналитической системы "Эйдос" [20] (есть еще две системы окружения: "Эйдос-фонд" [22] и "Эйдос-^" [23]).
Благодаря использованию технологии голосования частных моделей или коллективов решающих правил в системе "Эйдос-астра", достоверность идентификации респондентов по каждому из классов в мультимодели не ниже, чем в частной модели, в которой он идентифицируется с наивысшей достоверностью из всех созданных и исследованных частных моделей. Это обеспечивается тем, что в каждой частной модели идентификация проводится только по тем категориям, идентификация которых в данной модели осуществляется с наивысшей достоверностью из всех частных моделей, а также другими более сложными алгоритмами голосования и взвешивания решений, которые кратко описаны ниже.
С помощью системы "Эйдос-астра" в 2007 году были созданы и исследованы несколько мультимоделей, отличающихся как набором социальных категорий, так и самих частных моделей. В статье мы опишем лишь одну из этих мультимоделей, включающую 37 социальных категорий и 172 частные модели, как наиболее полно статистически представленную. В этой мультимодели на каждую из категорий приходится не менее 1000 респондентов, а общий объем обучающей выборки составляет 20007 респондентов.
Описание системы "Эйдос-астра" и алгоритмов голосования моделей
Система "Эйдос-астра" предназначена для синтеза мультимодели и идентификации социального статуса респондентов по астрономическим показателям на момент их рождения и применяется с теми же целями, что и стандартные психологические и профориентационные тесты (т.е. тесты на способность к определенным видам деятельности), обеспечивая выполнение следующих функций:
- генерация исходных баз данных на основе времени и координат рождения респондентов;
- генерация описательных шкал и градаций и обучающей выборки для частных моделей с заданным числом разбиений описательных шкал;
- синтез мультимодели;
- измерение достоверности идентификации респондентов по классам в частных моделях;
- идентификация респондентов распознаваемой выборки в частных моделях;
- голосование результатов идентификации в частных моделях и генерация баз данных для Универсальной когнитивной аналитической системы "ЭЙДОС", в которой проводится углубленное исследование созданной модели.
Текущая версия системы "Эйдос-астра" состоит из набора отдельных сервисных программ и двух взаимосвязанных модулей, первый из которых ("Inpob_mm.exe") обеспечивает синтез мультимодели, а второй ("Inprs_mm.exe") - ее тестирование на достоверность и применение для идентификации респондентов. Эти модули разработаны на языке программирования CLIPPER 5.01+T00LS II+BiGraph 3.01r1 и размещаются в головной директории для синтеза мультимодели, которую определяет сам пользователь. Исходный текст этих модулей 8-м шрифтом имеет размер: "Inpob_mm.exe" 63 листа, "Inprs_mm.exe" - 109 листов формата А4.
Перед запуском модуля синтеза мультимодели ("Inpob_mm.exe"):
- база данных с исходной информацией для синтеза мультимодели (база прецедентов) должна быть записана в выработанном ранее совместно в В.Н. Шашиным [19] стандарте с именем "Abankall.dbf";
- база данных (БД), содержащая перечень социальных категорий, по которым будет проводиться многопараметрическая типизация (обобщение), и идентификация должна быть записана в стандарте с именем "Newpf.dbf" (файл формируется и записывается в Excel в стандарте dbf 4 (dBASE IV) (*.dbf));
- в диалоге пользователь задает перечень частных моделей (количество секторов в описательных шкалах для создаваемых частных моделей).
Перечень категорий и частотное распределение респондентов обучающей выборки по категориям, а также объединенная база данных прецедентов формируются предварительно с помощью специально для этого созданных сервисных программных модулей, входящих в состав системы "Эйдос-астра".
При этом в качестве исходной информации использовались Excel-файлы, содержащие для каждого респондента информацию о категориях, к которым он относится, и полную характеристику в форме астропризнаков. Основным источником астрологической базы данных, подготовленной для системы ЭЙДОС, является Lois Rodden’s AstroDatabank (www.astrodatabank.com). Эта база содержит жизнеописание знаменитостей и простых людей, проживавших (или проживающих) в США. Достоинством этой базы данных является то, что все события жизни классифицированы, а все профессиональные и иные категории упорядочены. На первом этапе данные были конвертированы в формат баз данных JDataStore фирмы Borland, затем тщательно отсортированы с использованием SQL запросов и специальных функций на языке Java. В результате были получены астрологические и биографические данные для 20007 уникальных персон и 16360 записей событий, происходивших с ними. Для них всех с помощью библиотеки швейцарских эфемерид (www.astro.com) были вычислены координаты небесных тел (долгота и широта в градусах и расстояние в астрономических единицах). Для записей с точным временем вычисляли куспиды астрологических домов в системе Плацидуса, а также звездные стоянки Луны - накшатры (использовалась система из 27 стоянок). С целью анализа были использованы эфемериды следующих небесных тел: Солнца, Лу-
ны, Меркурия, Венеры, Марса, Юпитера, Сатурна, Урана, Нептуна, Плутона и Хирона. Следующим шагом является сортировка персон по категориям. В результате было получено XML дерево категорий исходной базы данных. Для этой цели была написана процедура, позволяющая безошибочно изменять категории, сортируя его. Далее база данных была полностью экспортирована в формат Excel, а из него - в формат интеллектуальной системы ЭЙДОС. Архив исходных данных в формате Excel доступен по адресу: http://astro.proforums.ru/tmp/abank.rar. На этом этапе в исследованиях и разработках активное участие принимал В.Н. Шашин [2, 13-19].
При работе модуля синтеза мультимодели он прогнозирует время завершения процесса и отображает его стадию, а также сам ведет базу данных, содержащую протокол успешно завершенных операций и позволяющую нормально продолжить и завершить процесс синтеза даже после полного аварийного (т.е. в любой момент) выключения компьютера. Это необходимо потому, что процесс синтеза мультимодели может быть довольно длительным: от нескольких часов до нескольких суток и даже недель в зависимости от объема обучающей выборки, количества и размерности частных моделей.
После завершения процесса синтеза мультимодели запускается модуль "Inprs_mm.exe", обеспечивающий ее использование для идентификации и прогнозирования. Этот модуль имеет следующие режимы:
1. Измерение внутренней дифференциальной валидности [3, 5] моделей, т.е. достоверности идентификации классов в различных частных моделях.
2. Генерация БД Atest_mm.dbf для измерения достоверности идентификации в моделях.
3. Скоростное распознавание респондентов из Atest.dbf с использованием БД DostIden.dbf.
4. Полное распознавание респондентов из Atest.dbf во всех частных моделях.
5. Голосование моделей (с выбором одного из пяти алгоритмов).
6. Голосование моделей по всем ПЯТИ алгоритмам по очереди.
БД Atest_mm.dbf и Atest.dbf должны быть в том же стандарте, что и БД Abankall.dbf.
Рассмотрим алгоритмы этих режимов.
1. Алгоритм измерения достоверности идентификации классов в различных частных моделях.
1. Если БД достоверности идентификации классов DostIden.dbf уже существует, то добавить или удалить в ней столбцы новых частных моделей из БД Setup_mm.dbf, иначе - создавать эту БД заново (на шаге 4).
2. Если БД тестирующих выборок респондентов TestResp.dbf уже существует, то спросить, переформировать ли ее заново (шаги 3, 6), иначе - использовать имеющуюся.
3. Если создание БД TestResp.dbf заново, то задать в диалоге ее параметры.
4. ПОДГОТОВКА К ИСПОЛНЕНИЮ АЛГОРИТМА:
4.1. Выборка из БД Setup_mm.dbf массива видов моделей.
4.2. Запись строки описательных шкал для Logoastr_d.
4.3. Рекогносцировка.
5. Если не продолжение расчета БД DostIden.dbf, то создать ее заново и заполнить нулями.
6. Если создание БД TestResp.dbf заново, то
6.1. Создать ее по заданным в п. 3 ее параметрам.
6.2. Заполнить кодами источников тестирующих респондентов.
7. Цикл по видам моделей из БД Setup_mm.dbf, начиная с последней модели.
8. Создание БД результатов распознавания и массива-локатора в директории частной модели.
9. Если продолжение расчета DostIden.dbf, то пропустить уже просчитанные модели (где не нули).
10. Цикл по классам заданного диапазона.
11. Копирование тестирующей выборки ПО ЗАДАННОМУ КЛАССУ В ТЕКУЩЕЙ МОДЕЛИ из обучающей в распознаваемую.
12. Если задано измерение внешней валидности - удаление из обучающей выборки тестирующей и пересинтез модели, иначе п.13.
13. Идентификация тестирующей выборки ТОЛЬКО С ЕЕ КЛАССОМ.
14. Конец цикла по классам заданного диапазона.
15. Расчет достоверности идентификации заданных классов в данной модели.
16. Занесение информации о достоверности идентификации в БД достоверности идентификации классов.
17. Если задано измерение внешней валидности - добавление распознаваемой выборки к обучающей (ее восстановление), иначе п.18.
18. Конец цикла по видам моделей.
19. Дорасчет БД достоверности идентификации классов.
2. Алгоритм генерации БД "Atest_mm.dbf" для измерения достоверности идентификации в моделях.
На первом этапе организуется цикл по БД "TestResp.dbf", созданной в предыдущем режиме и содержащей коды (id) респондентов для измерения достоверности идентификации по каждой категории. В этом цикле формируется массив, содержащий коды респондентов и исключающий их повторы в формируемой БД "Atest_mm.dbf".
На втором этапе из БД "Abankall.dbf" выбираются записи по определенным на предыдущем этапе респондентам, и эти записи добавляются в БД "Atest_mm.dbf".
В дальнейшем сформированная в данном режиме база данных "Atest_mm.dbf" может быть использована для измерения достоверности идентификации респондентов по категориям при полном распознавании. Для этого ее надо предварительно переименовать в "Atest.dbf1, т.к. на работу именно с этой базой рассчитан режим полного распознавания.
3. Алгоритм режима скоростного распознавания респондентов из Atest.dbf с использованием априорной информации о достоверности идентификации по категориям из БД DostIden.dbf.
1. Сброс распознаваемой выборки во всех остальных частных моделях.
2. Сгенерировать распознаваемую выборку в тех частных моделях, которые оказались наиболее достоверными по данным БД DostIden.dbf, причем в каждой частной модели создавать ее только один раз!!! В каждой частной модели может наиболее достоверно идентифицироваться НЕСКОЛЬКО классов. Поэтому нужно иметь БД с информацией об этом и проводить распознавание в этой модели в ЦИКЛЕ по этим классам. Эта БД и есть DostIden.dbf.
3. Сделать цикл по БД DostIden.dbf (по частным моделям + классам).
4. Идентифицировать ВСЕХ респондентов из БД Atest.dbf в каждой частной модели ТОЛЬКО с теми классами, которые идентифицируется в данной модели наиболее достоверно (по данным из DostIden.dbf).
Данный алгоритм основан на простой идее о том, что по каждой из социальных категорий рационально идентифицировать респондентов только в той частной модели, в которой эта категория (по данным предварительного исследования частных моделей)
идентифицируется с наивысшей достоверностью из всех частных моделей. На описываемой мультимодели этот алгоритм осуществляет идентификацию 370 респондентов за 40 минут вместо 2-х суток полной идентификации.
4. Алгоритм полного распознавания респондентов из Atest.dbf во всех частных моделях.
Существуют 3 варианта:
1-й: пакетного распознавания респондентов из Atest.dbf не было выполнено ни в одной частной модели.
2-й: пакетное распознавания респондентов из Atest.dbf было выполнено не во всех частных моделях.
3-й: пакетное распознавания респондентов из Atest.dbf было выполнено во всех частных моделях.
Необходимо сообщить пользователю, какой вариант имеет место - 2-й или 3-й, и предложить ему закончить распознавание или начать заново:
- ЗАКОНЧИТЬ имеет смысл с тем же файлом Atest.dbf;
- НАЧАТЬ ЗАНОВО имеет смысл с новым файлом Atest.dbf;
- если не было выполнено пакетного распознавания ни в одной частной модели, то просто МОЛЧА начать его выполнять для тех моделей, для которых выполнен синтез модели.
Затем организуется цикл по частным моделям.
Распознавание выполняется только, если: синтез модели уже выполнен, а распознавание еще нет.
Проводится запись исходных БД для генерации распознаваемой выборки модели в поддиректорию с этой частной моделью.
Выполняется генерация исходных файлов распознаваемой выборки частной модели из БД Atest.dbf.
Проводится пакетное распознавание как в базовой системе "Эйдос".
5. Алгоритм голосования моделей (с выбором одного из 5-и алгоритмов).
Пользователю в диалоге предлагается задать один из режимов голосования моделей, когда в итоговую карточку идентификации респондента берется:
1. СУММАРНАЯ ЧАСТОТА ИДЕНТИФИКАЦИИ респондента с каждым классом, рассчитанная по всем частным моделям [2, 13].
2. СРЕДНЕЕ уровней сходства с этим классом из всех карточек идентификации частных моделей.
3. Уровень сходства этого респондента с классом из той частной карточки идентификации, в которой он МАКСИМАЛЬНЫЙ.
4. Уровень сходства из карточки идентификации той частной модели, которая показала МАКСИМАЛЬНУЮ достоверность распознавания ДАННОГО КЛАССА из всех моделей.
5. СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.
1-й алгоритм голосования моделей.
В данном алгоритме, который был предложен первым, определяется СУММАРНАЯ ЧАСТОТА ИДЕНТИФИКАЦИИ респондента с каждым классом, рассчитанная по всем частным моделям.
Пользователю предлагается в диалоге ввести следующие параметры:
- минимальный учитываемый уровень сходства респондента с классом в %;
- частоту идентификации респондента с классом в частных моделях в %.
Затем выполняются следующие шаги:
1. Скопировать БД Яавр.ёЬГ из всех директорий моделей с именами: Ка8р1###.ёЬ£, где ### - вид модели.
2. Объединить их все в одну БД ЯаБр.ёЬГ.
3. Рассортировать так, чтобы записи с одинаковым результатом идентификации респондента с классом оказались рядом.
4. Создать новую БД Яавр1.ёЬГ, в которой сделать записи с суммарной частотой идентификации респондента с каждым классом, рассчитанной по всем частным моделям.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ЛЬЬ1 и переиндексировать.
2-й алгоритм голосования моделей.
В этом алгоритме определяется СРЕДНЕЕ уровней сходства с этим классом из всех карточек идентификации частных моделей.
1. Скопировать БД ЯаБр.ёЬГ из всех директорий моделей с именами: Яа8р1###.ёЬ£, где ### - вид модели.
2. Объединить их все в одну БД ЯаБр.ёЬГ.
3. Рассортировать так, чтобы записи с одинаковым результатом оказались рядом.
4. Сделать новую БД Яавр1.ёЬГ, в которой объединить записи, просуммировав уровни сходства.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ЛЬЬ2 и переиндексировать.
3-й алгоритм голосования моделей.
В данном алгоритме определяется уровень сходства этого респондента с классом из той частной карточки идентификации, в которой он МАКСИМАЛЬНЫЙ.
1. Скопировать БД ЯаБр.ёЬГ из всех директорий моделей с именами: Яа8р1###.ёЬ£, где ### - вид модели.
2. Объединить их все в одну БД ЯаБр.ёЬГ.
3. Рассортировать ее так, чтобы записи с одинаковым классом оказались рядом и ранжированы в порядке убывания сходства.
4. Сделать новую БД Яавр1.ёЬГ, в которой из предыдущей взять только записи с максимальным уровнем сходства.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ЛЬЬ3 и переиндексировать.
4-й алгоритм голосования моделей.
В данном алгоритме определяется уровень сходства из карточки идентификации той частной модели, которая показала МАКСИМАЛЬНУЮ достоверность распознавания ДАННОГО КЛАССА из всех моделей.
1. Скопировать БД ЯаБр.ёЬГ из всех директорий моделей с именами: Яа8р1###.ёЬ£, где ### - вид модели.
2. Объединить их все в одну БД ЯаБр.ёЬГ.
3. Рассортировать ее так, чтобы записи с одинаковым классом оказались рядом и ранжированы в порядке убывания сходства.
4. Сделать новую БД Rasp1.dbf, в которую из предыдущей для каждого класса взять записи только из тех частных моделей, в которых они идентифицируются с MAX достоверностью.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ALL4 и переиндексировать.
5-й алгоритм голосования моделей.
В данном алгоритме определяется СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.
1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.
2. Объединить их все в одну БД Rasp.dbf.
3. Рассортировать ее так, чтобы записи с одинаковым классом оказались рядом и ранжированы в порядке убывания сходства.
4. Сделать новую БД Rasp1.dbf, в которой из предыдущей взять СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ALL5 и переиндексировать.
6. Алгоритм голосования моделей по всем ПЯТИ алгоритмам по очереди.
Он представляет собой режим, полностью аналогичный предыдущему, в котором все алгоритмы голосования запускаются по очереди со значениями параметров по умолчанию.
Все частные и обобщающие модели, созданные с помощью системы окружения "Эйдос-астра", полностью совестимы с базовой универсальной когнитивной аналитической системой "Эйдос" и могут быть просмотрены и исследованы в этой системе.
Описание результатов синтеза и исследования мультимодели
Основными причинами выбора для исследования мультимодели на 37 категорий, каждая из которых представлена не менее чем 1000 респондентов при объеме обучающей выборки 20007 респондентов, являются высокая статистическая достоверность полученных результатов и возможность убедительно говорить о том, что в результате проведенного исследования действительно выявлены закономерности между астропризнаками и социальными категориями (социотипами).
Перечень выбранных категорий и частотное распределение респондентов по этим категориям приведены в таблице 1.
Таблица 1 - СПРАВОЧНИК КЛАССИФИКАЦИОННЫХ ШКАЛ И ГРАДАЦИЙ (ОБОБЩЕННЫЕ КАТЕГОРИИ) И ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ
РЕСПОНДЕНТОВ ПО НИМ
Код
категории
Наименование категории
Кол-во
респондентов
2
3
4
SC:M-
SCW-
SC:A53-Sports SC:A1-Book Collection
13640
5125
4567
4471
5 SC:A15-Famous 3373
6 SC:A42-Medical 2910
7 SC:A323-Sexuality 2675
8 SC:A5-Entertainment 2577
9 SC:A9-Relationship 2442
10 SC:A40-Occult Fields 2396
11 SC:B111-Sports:Basketball 2385
12 SC:B329-Sexuality:Sexual perversions 2360
13 SC:A55-Art 2232
14 SC:A19-Writers 2223
15 SC:A129-Death 2168
16 SC:A25-Personality 2083
17 SC:A68-Childhood 1996
18 SC:A31-Business 1813
19 SC:C330-Sexuality:Sexual perversions:Homosexual m 1807
20 SC:B45-Famous:Greatest hits 1795
21 SC:A29-Parenting 1754
22 SC:B173-Sports:Football 1613
23 SC:B97-Occult Fields:Astrologer 1480
24 SC:B21-Relationship:Number of marriages 1417
25 SC:B2-Book Collection:Profiles Of Women 1389
26 SC:A92-Birth 1343
27 SC:B14-Entertainment:Actor/ Actress 1256
Продолжение таблицы 1
Код Кол-во
категории Наименование категории респондентов
28 SC:?- 1242
29 SC:B49-Book Collection:American Book 1178
30 SC:B26-Personality:Body 1163
31 SC:B189-Medical:Illness 1159
32 SC:B6-Entertainment:Music 1086
33 SC:A99-Financial 1075
34 SC:B48-Famous:Top 5% of Profession 1073
35 SC:A38-Politics 1039
36 SC:A23-Psychological 1007
37 SC:A108-Education 1002
По большинству категорий респондентов значительно более 1000. Это объясняется тем, что один и тот же респондент одновременно может относиться к нескольким категориям. В графической форме частотное распределение респондентов по категориям представлено на рисунке 1.
В результате синтеза мультимодели были получены 172 частные модели с различным количеством разбиений круга на секторы: 2, 3, 4, ..., 173. Максимальное количество разбиений составило 173, т. к. при 23 описательных шкалах и таком количестве разбиений во всех шкалах получается суммарно 3979 градаций, тогда как в текущей версии системы "Эйдос" максимальное количество градаций описательных шкал в модели не может превосходить 4000. Однако в данном случае это ограничение не является принципиальным, т.к. оно не помешало нам увидеть общей картины.
В качестве примеров приведем справочники описательных шкал и градаций для частных моделей с 2 и 3 разбиениями (таблицы 2 и 3).
Система "Эйдос-астра" автоматически формирует справочники классификационных и описательных шкал и градаций для всех заданных частных моделей, а затем с использованием этих справочников и БД "АЬапкаП.ёЬГ также автоматически формирует обучающую выборку в каждой из этих частных моделей. Таким образом, система "Эйдос-астра" обеспечивает автоматическую формализацию предметной области в системе частных моделей.
Приведем в качестве примера фрагмент обучающей выборки частной модели с двумя разбиениями (таблица 4).
Таблица 2 - СПРАВОЧНИК ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ
ЧАСТНОЙ МОДЕЛИ С Д1 И ЯМ И Е И Б З А Рч
Код Наименование Код Наименование
1 SUNLON-[2]: {0.000, 180.000} 25 HOUSE2-[2]: {0.000, 180.000}
2 SUNLON-[2]: {180.000, 360.000} 26 HOUSE2-[2]: {180.000, 360.000}
3 MOONLON-[2]: {0.000, 180.000} 27 HOUSE3-[2]: {0.000, 180.000}
4 MOONLON-[2]: {180.000, 360.000} 28 HOUSE3-[2]: {180.000, 360.000}
5 MERCURYLON-[2]: {0.000, 180.000} 29 HOUSE4-[2]: {0.000, 180.000}
6 MERCURYLON-[2]: {180.000, 360.000} 30 HOUSE4-[2]: {180.000, 360.000}
7 VENUSLON-[2]: {0.000, 180.000} 31 HOUSE5-[2]: {0.000, 180.000}
8 VENUSLON-[2]: {180.000, 360.000} 32 HOUSE5-[2]: {180.000, 360.000}
9 MARSLON-[2]: {0.000, 180.000} 33 HOUSE6-[2]: {0.000, 180.000}
10 MARSLON-[2]: {180.000, 360.000} 34 HOUSE6-[2]: {180.000, 360.000}
11 JUPITERLON-[2]: {0.000, 180.000} 35 HOUSE7-[2]: {0.000, 180.000}
12 JUPITERLON-[2]: {180.000, 360.000} 36 HOUSE7-[2]: {180.000, 360.000}
13 SATURNLON-[2]: {0.000, 180.000} 37 HOUSE8-[2]: {0.000, 180.000}
14 SATURNLON-[2]: {180.000, 360.000} 38 HOUSE8-[2]: {180.000, 360.000}
15 URANUSLON-[2]: {0.000, 180.000} 39 HOUSE9-[2]: {0.000, 180.000}
16 URANUSLON-[2]: {180.000, 360.000} 40 HOUSE9-[2]: {180.000, 360.000}
17 NEPTUNELON-[2]: {0.000, 180.000} 41 HOUSE10-[2]: {0.000, 180.000}
18 NEPTUNELON-[2]: {180.000, 360.000} 42 HOUSE10-[2]: {180.000, 360.000}
19 PLUTOLON-[2]: {0.000, 180.000} 43 HOUSE11-[2]: {0.000, 180.000}
20 PLUTOLON-[2]: {180.000, 360.000} 44 HOUSE11-[2]: {180.000, 360.000}
21 NODELON-[2]: {0.000, 180.000} 45 HOUSE12-[2]: {0.000, 180.000}
22 NODELON-[2]: {180.000, 360.000} 46 HOUSE12-[2]: {180.000, 360.000}
23 HOUSE1-[2]: {0.000, 180.000}
24 HOUSE1-[2]: {180.000, 360.000}
Таблица 3 - СПРАВОЧНИК ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ ЧАСТНОЙ МОДЕЛИ С ТРЕМЯ РАЗБИЕНИЯМИ
Код Наименование Код Наименование
1 SUNLON-[3]: {0.000, 120.000} 37 HOUSE2-[3]: {0.000, 120.000}
2 SUNLON-[3]: {120.000, 240.000} 38 HOUSE2-[3]: {120.000, 240.000}
3 SUNLON-[3]: {240.000, 360.000} 39 HOUSE2-[3]: {240.000, 360.000}
4 MOONLON-[3]: {0.000, 120.000} 40 HOUSE3-[3]: {0.000, 120.000}
5 MOONLON-[3]: {120.000, 240.000} 41 HOUSE3-[3]: {120.000, 240.000}
6 MOONLON-[3]: {240.000, 360.000} 42 HOUSE3-[3]: {240.000, 360.000}
7 MERCURYLON-[3]: {0.000, 120.000} 43 HOUSE4-[3]: {0.000, 120.000}
8 MERCURYLON-[3]: {120.000, 240.000} 44 HOUSE4-[3]: {120.000, 240.000}
9 MERCURYLON-[3]: {240.000, 360.000} 45 HOUSE4-[3]: {240.000, 360.000}
10 VENUSLON-[3]: {0.000, 120.000} 46 HOUSE5-[3]: {0.000, 120.000}
11 VENUSLON-[3]: {120.000, 240.000} 47 HOUSE5-[3]: {120.000, 240.000}
12 VENUSLON-[3]: {240.000, 360.000} 48 HOUSE5-[3]: {240.000, 360.000}
13 MARSLON-[3]: {0.000, 120.000} 49 HOUSE6-[3]: {0.000, 120.000}
14 MARSLON-[3]: {120.000, 240.000} 50 HOUSE6-[3]: {120.000, 240.000}
15 MARSLON-[3]: {240.000, 360.000} 51 HOUSE6-[3]: {240.000, 360.000}
16 JUPITERLON-[3]: {0.000, 120.000} 52 HOUSE7-[3]: {0.000, 120.000}
17 JUPITERLON-[3]: {120.000, 240.000} 53 HOUSE7-[3]: {120.000, 240.000}
18 JUPITERLON-[3]: {240.000, 360.000} 54 HOUSE7-[3]: {240.000, 360.000}
19 SATURNLON-[3]: {0.000, 120.000} 55 HOUSE8-[3]: {0.000, 120.000}
20 SATURNLON-[3]: {120.000, 240.000} 56 HOUSE8-[3]: {120.000, 240.000}
21 SATURNLON-[3]: {240.000, 360.000} 57 HOUSE8-[3]: {240.000, 360.000}
22 URANUSLON-[3]: {0.000, 120.000} 58 HOUSE9-[3]: {0.000, 120.000}
23 URANUSLON-[3]: {120.000, 240.000} 59 HOUSE9-[3]: {120.000, 240.000}
24 URANUSLON-[3]: {240.000, 360.000} 60 HOUSE9-[3]: {240.000, 360.000}
25 NEPTUNELON-[3]: {0.000, 120.000} 61 HOUSE10-[3]: {0.000, 120.000}
26 NEPTUNELON-[3]: {120.000, 240.000} 62 HOUSE10-[3]: {120.000, 240.000}
27 NEPTUNELON-[3]: {240.000, 360.000} 63 HOUSE10-[3]: {240.000, 360.000}
28 PLUTOLON-[3]: {0.000, 120.000} 64 HOUSE11-[3]: {0.000, 120.000}
29 PLUTOLON-[3]: {120.000, 240.000} 65 HOUSE11-[3]: {120.000, 240.000}
30 PLUTOLON-[3]: {240.000, 360.000} 66 HOUSE11-[3]: {240.000, 360.000}
31 NODELON-[3]: {0.000, 120.000} 67 HOUSE12-[3]: {0.000, 120.000}
32 NODELON-[3]: {120.000, 240.000} 68 HOUSE12-[3]: {120.000, 240.000}
33 NODELON-[3]: {240.000, 360.000} 69 HOUSE12-[3]: {240.000, 360.000}
34 HOUSE1-[3]: {0.000, 120.000}
35 HOUSE1-[3]: {120.000, 240.000}
36 HOUSE1-[3]: {240.000, 360.000}
Таблица 4 - ОБУЧАЮЩАЯ ВЫБОРКА ЧАСТНОЙ МОДЕЛИ _______С ДВУМЯ РАЗБИЕНИЯМИ (ФРАГМЕНТ)_______
id Наименование 1 1 1 1 1
Коды категорий
1 Aadland, Beverl 2 4 5 8 9 14 24 25 27 32
Коды аст ропризнаков
1 4 6 7 9 11 13 15 17 19 21
24 26 28 30 31 33 35 37 39 41 44
46
Коды категорий
2 Aadland, Floren 2 4 5 9 14 16 18 21 25 30 36
Коды аст ропризнаков
1 4 6 8 10 12 13 16 17 19 22
23 25 27 29 32 34 36 38 40 42 43
45
Коды категорий
3 Aafjes, Bertus 1 14
Коды астропризнаков
1 4 5 7 9 12 13 16 17 19 22
Коды категорий
4 Aal-Pomares, He 1 8 35
Коды аст ропризнаков
2 3 6 8 9 11 14 15 17 19 22
23 25 27 29 31 33 36 38 40 42 44
46
Коды категорий
5 Aaron, Dave 1 5 6 10 18 20
Коды аст ропризнаков
2 4 6 8 10 11 13 15 18 19 21
23 25 27 30 32 34 36 38 40 41 43
45
Коды категорий
6 Aaron, Hank 1 3 4 5 16 20 29 30 34
Коды аст ропризнаков
2 4 6 8 10 12 14 15 17 19 22
23 26 28 30 32 34 36 37 39 41 43
45
Коды категорий
7 Aavikko, Armi 2 5 8 13 20 32
Коды аст ропризнаков
1 3 5 7 9 12 14 15 18 19 22
24 26 28 30 32 34 35 37 39 41 43
45
Коды категорий
8 Abad, Andy 1 8 13 32
Коды аст ропризнаков
2 3 6 8 10 11 13 16 18 19 21
23 25 27 29 31 33 36 38 40 42 44
46
Коды категорий
9 Abbado, Claudio 1 4 5 8 9 13 16 17 20 21 24 30 32
Коды аст ропризнаков
1 3 5 7 9 11 14 15 17 19 22
23 25 27 29 31 33 36 38 40 42 44
46
Для каждой частной модели на основе обучающей выборки формируется сначала матрица абсолютных частот (таблица 5), а затем и матрица информативностей (таблица 6). В качестве математической модели СК-анализа используется системная теория информации (СТИ), предложенная автором [3, 5, 1-12].
Таблица 5 - ФРАГМЕНТ МАТРИЦЫ АБСОЛЮТНЫХ ЧАСТОТ ВСТРЕЧ ПРИЗНАКОВ ПО КАТЕГОРИЯМ В ЧАСТНОЙ МОДЕЛИ ________________С ДВУМЯ РАЗБИЕНИЯМИ_________________
Коды приз- наков Коды категорий
1 2 3 4 5 6 7 8 9 10 11 12
1 6744 2623 2281 2201 1671 1477 1378 1271 1222 1201 1230 1208
2 6896 2502 2286 2270 1702 1433 1297 1306 1220 1195 1155 1152
3 6786 2539 2325 2187 1689 1445 1330 1273 1207 1211 1218 1177
4 6854 2586 2242 2284 1684 1465 1345 1304 1235 1185 1167 1183
5 6261 2401 2070 2039 1561 1343 1307 1185 1125 1086 1134 1156
6 7379 2724 2497 2432 1812 1567 1368 1392 1317 1310 1251 1204
7 6907 2688 2332 2274 1735 1510 1422 1301 1263 1193 1232 1263
8 6733 2437 2235 2197 1638 1400 1253 1276 1179 1203 1153 1097
9 7137 2760 2443 2344 1754 1500 1454 1341 1269 1223 1330 1279
10 6503 2365 2124 2127 1619 1410 1221 1236 1173 1173 1055 1081
11 6896 2507 2499 2140 1568 1406 1293 1187 1164 1186 1191 1151
12 6744 2618 2068 2331 1805 1504 1382 1390 1278 1210 1194 1209
13 6146 2474 1854 2046 1578 1379 1368 1228 1184 1197 928 1217
14 7494 2651 2713 2425 1795 1531 1307 1349 1258 1199 1457 1143
15 9589 3308 3698 2432 1986 1752 2384 1666 1491 1455 1989 2169
16 4051 1817 869 2039 1387 1158 291 911 951 941 396 191
17 6083 2517 1147 2734 2078 1703 928 1601 1612 1357 872 752
18 7557 2608 3420 1737 1295 1207 1747 976 830 1039 1513 1608
19 12886 4609 4541 4041 3116 2748 2641 2513 2350 2277 2381 2341
20 754 516 26 430 257 162 34 64 92 119 4 19
21 7681 2670 2975 2315 1740 1517 1412 1341 1290 1248 1347 1232
22 5959 2455 1592 2156 1633 1393 1263 1236 1152 1148 1038 1128
23 4170 2212 290 1782 1513 1176 1249 1137 1083 1111 12 1144
24 4161 2140 310 1772 1480 1121 1234 1071 1045 1042 12 1132
25 4215 2201 286 1812 1535 1167 1235 1148 1075 1127 14 1139
26 4116 2151 314 1742 1458 1130 1248 1060 1053 1026 10 1137
27 4218 2237 292 1804 1545 1129 1237 1137 1083 1101 15 1141
28 4113 2115 308 1750 1448 1168 1246 1071 1045 1052 9 1135
29 4195 2210 288 1780 1544 1109 1228 1112 1085 1102 12 1126
30 4136 2142 312 1774 1449 1188 1255 1096 1043 1051 12 1150
31 4175 2200 303 1781 1541 1134 1232 1102 1094 1083 11 1123
32 4156 2152 297 1773 1452 1163 1251 1106 1034 1070 13 1153
33 4172 2151 300 1785 1499 1127 1250 1076 1065 1043 10 1146
34 4159 2201 300 1769 1494 1170 1233 1132 1063 1110 14 1130
35 4161 2140 310 1772 1480 1121 1234 1071 1045 1042 12 1132
36 4170 2212 290 1782 1513 1176 1249 1137 1083 1111 12 1144
37 4116 2151 314 1742 1458 1130 1248 1060 1053 1026 10 1137
38 4215 2201 286 1812 1535 1167 1235 1148 1075 1127 14 1139
39 4113 2115 308 1750 1448 1168 1246 1071 1045 1052 9 1135
40 4218 2237 292 1804 1545 1129 1237 1137 1083 1101 15 1141
41 4136 2142 312 1774 1449 1188 1255 1096 1043 1051 12 1150
42 4195 2210 288 1780 1544 1109 1228 1112 1085 1102 12 1126
43 4156 2152 297 1773 1452 1163 1251 1106 1034 1070 13 1153
44 4175 2200 303 1781 1541 1134 1232 1102 1094 1083 11 1123
45 4159 2201 300 1769 1494 1170 1233 1132 1063 1110 14 1130
46 4172 2151 300 1785 1499 1127 1250 1076 1065 1043 10 1146
Таблица 6 - ФРАГМЕНТ МАТРИЦЫ ИНФОРМАТИВНОСТЕЙ ПРИЗНАКОВ ПО КАТЕГОРИЯМ В ЧАСТНОЙ МОДЕЛИ С ДВУМЯ РАЗБИЕНИЯМИ _______________________(БИТХ100)____________________
Коды приз- наков Коды категорий
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
1 3 -1 17 -2 -3 -0 -3 -3 -3 -3 22 -4 -5 -2 -2 -1 -4 -1 -4 -6 -3 18
2 4 -3 17 -0 -3 -5 -2 -3 -3 20 -5 -3 -2 -2 -2 -3 -2 -5 -4 -4 22
3 3 -2 18 -2 -3 -4 -3 -3 -3 22 -4 -5 -1 -1 -2 -4 -2 -5 -4 -4 20
4 3 -2 16 -0 -3 -4 -2 -2 -4 20 -5 -4 -3 -3 -1 -3 -2 -4 -5 -2 20
5 3 -2 16 -2 -3 -2 -3 -3 -4 22 -2 -4 -2 -1 -2 -4 -1 -2 -5 -2 16
6 3 -3 17 -3 -6 -2 -2 -3 20 -6 -4 -2 -2 -1 -4 -2 -6 -5 -4 23
7 3 -1 17 -3 -3 -3 -2 -4 21 -3 -5 -2 -2 -2 -4 -2 -3 -5 -2 18
8 4 -3 17 -3 -5 -2 -3 -2 21 -6 -4 -2 -2 -2 -3 -2 -6 -5 -4 21
9 3 -1 17 -3 -2 -3 -3 -3 -4 23 -3 -4 -3 -2 -2 -4 -3 -3 -5 -4 17
10 3 -3 16 -3 -0 -5 -2 -2 -2 19 -6 -4 -1 -2 -1 -3 -0 -6 -4 -3 22
11 4 -2 21 -2 -5 -2 -4 -5 -4 -3 22 -5 -7 -3 -2 -3 -4 -2 -5 -7 -4 29
12 2 -2 13 -0 -1 -0 -3 -0 -2 -3 21 -4 -2 -1 -2 -1 -3 -1 -4 -3 -2 7
13 2 -1 12 -2 -3 -0 -0 -2 -1 -1 15 -1 -4 -2 0 -1 -6 -0 -2 -3 -2 15
14 4 -3 21 -0 -3 -1 -7 -3 -4 -6 26 -8 -5 -2 -4 -2 -2 -3 -7 -6 -4 23
15 5 -3 24 -8 -7 -5 7 -3 -6 -6 29 7 -6 -12 -6 -2 -8 -1 8 -10 -5 27
16 -1 -0 -4 10 4 5 -45 -0 3 2 -4 -56 -1 12 6 -0 4 -3 -62 4 -0 -0
17 -2 -3 -9 6 4 4 -18 5 7 1 9 -21 3 11 4 0 -15 5 -23 5 6 -103
18 7 -1 32 -10 -12 -7 6 -12 -16 -8 30 7 -14 -24 -9 -4 5 -10 8 -19 -16 45
19 3 -4 19 -2 -4 -1 -2 -1 -2 -3 23 -3 -3 -2 -2 -2 -10 -0 -2 -5 -3 22
20 -0 16 -69 16 6 -4 -60 -35 -20 -10 -109 -78 -21 -1 1 3 42 -37 -95 -4 -15 -107
21 5 -4 23 -3 -5 -2 -5 -4 -4 -5 23 -6 -5 -4 -4 -3 -5 -3 -6 -7 -5 35
22 1 -1 7 1 -1 1 -3 -1 -2 -2 19 -3 -3 0 0 0 -2 -1 -3 -2 -1 -16
23 -5 3 -48 1 3 1 4 3 3 4 -136 5 5 1 2 3 3 3 4 5 4 -83
24 -4 2 -45 4 1 5 2 3 3 -134 5 4 3 3 0 4 1 6 6 3 -75
25 -4 2 -49 1 4 1 3 3 3 5 -130 4 5 1 2 3 3 3 4 6 4 -83
26 -4 3 -44 1 3 1 5 2 3 3 -141 5 5 3 2 1 4 1 6 5 4 -75
27 -4 3 -48 1 4 -0 4 3 3 4 -127 4 5 2 3 2 4 2 4 6 4 -84
28 -4 2 -45 1 3 2 5 2 3 3 -145 5 5 3 2 1 4 2 6 5 3 -74
29 -4 3 -48 1 4 -0 3 3 3 4 -135 4 5 3 2 2 5 2 5 5 5 -73
30 -4 2 -44 3 3 5 3 3 3 -135 6 5 2 2 1 3 2 5 5 3 -85
31 -4 3 -46 1 4 0 4 2 4 4 -138 4 4 3 1 2 5 2 5 6 4 -75
32 -4 2 -46 1 3 2 5 3 2 4 -132 6 5 1 3 2 3 3 5 5 3 -83
33 -4 2 -46 4 1 5 2 3 3 -141 5 5 4 2 1 4 2 6 5 4 -79
34 -4 3 -46 1 3 2 4 3 3 4 -130 4 5 1 3 3 4 2 4 5 3 -78
35 -4 2 -45 4 1 5 2 3 3 -134 5 4 3 3 0 4 1 6 6 3 -75
36 -5 3 -48 1 3 1 4 3 3 4 -136 5 5 1 2 3 3 3 4 5 4 -83
37 -4 3 -44 1 3 1 5 2 3 3 -141 5 5 3 2 1 4 1 6 5 4 -75
38 -4 2 -49 1 4 1 3 3 3 5 -130 4 5 1 2 3 3 3 4 6 4 -83
39 -4 2 -45 1 3 2 5 2 3 3 -145 5 5 3 2 1 4 2 6 5 3 -74
40 -4 3 -48 1 4 -0 4 3 3 4 -127 4 5 2 3 2 4 2 4 6 4 -84
41 -4 2 -44 3 3 5 3 3 3 -135 6 5 2 2 1 3 2 5 5 3 -85
42 -4 3 -48 1 4 -0 3 3 3 4 -135 4 5 3 2 2 5 2 5 5 5 -73
43 -4 2 -46 1 3 2 5 3 2 4 -132 6 5 1 3 2 3 3 5 5 3 -83
44 -4 3 -46 1 4 0 4 2 4 4 -138 4 4 3 1 2 5 2 5 6 4 -75
45 -4 3 -46 1 3 2 4 3 3 4 -130 4 5 1 3 3 4 2 4 5 3 -78
46 -4 2 -46 2 4 1 5 2 3 3 -141 5 5 4 2 1 4 2 6 5 4 -79
Коэффициенты в матрице информативностей представляют собой количество информации о принадлежности (если они положительные) или непринадлежности (если они отрицательные) респондента, обладающего астропризнаками (вертикальная шапка), к обобщенной категории (столбцы). В статье эти коэффициенты приведены в битах, умноженных на 100 и без дробной части, а в системе они представлены с высо -кой точностью (8 знаков после запятой).
Важно отметить, что коэффициенты разложений в ряд по различным функциям, в т.ч. коэффициенты ряда Фурье по своей математической форме и смыслу сходны с ненормированными коэффициентами корреляции, т.е., по сути, скалярными произведениями для непрерывных функций в координатной форме. Поэтому процесс идентификации и прогнозирования (распознавания), реализованный в математической модели СК-анализа (системной теории информации), может рассматриваться как разложение вектора распознаваемого объекта в ряд по векторам категорий (классов распознавания) (см. раздел: "3.5. Сравнение, идентификация и прогнозирование как объектный анализ (разложение векторов объектов в ряд по векторам классов" в работах [3, 5]), что полностью аналогично спектральному анализу в физике. Поэтому вполне обоснованно можно считать, что идентификация респондентов на основе их астропризнаков, по сути, является спектральным анализом конкретного образа респондента по обобщенным категориям, соответствующим социальным типам. Сами эти обобщенные категории были предварительно сформированы в модели путем обобщения (точнее многопараметрической типизации) образов конкретных респондентов, относящихся к этим типам. Это и отражено в названии статьи.
Таким образом, в предложенной семантической информационной модели при идентификации и прогнозировании по сути дела осуществляется разложение векторов идентифицируемых объектов по векторам классов распознавания, т.е. осуществляется "объектный анализ" (по аналогии с спектральным, гармоническим или Фурье-анализом), что позволяет рассматривать идентифицируемые объекты как суперпозицию обобщенных образов классов различного типа с различными амплитудами. При этом вектора обобщенных образов классов с математической точки зрения представляют собой произвольные функции, и не обязательно образуют полную и не избыточную (ортонормированную) систему функций.
Для любого объекта всегда существует такая система базисных функций, что вектор объекта может быть представлен в форме линейной суперпозиции (суммы) этих базисных функций с различными амплитудами. Это утверждение, по-видимому, является одним из следствий фундаментальной теоремы А.Н.Колмогорова, доказанной им в 1957 году (О представлении непрерывных функций нескольких переменных в виде суперпозиций непрерывных функций одного переменного и сложения // Докл. АН СССР, том 114, с. 953-956, 1957).
Теорема Колмогорова: Любая непрерывная функция от п переменных ¥(х\, х2, ..., хп) может быть представлена в виде:
2п+\{ п . .Л
^(х,_,х2,...,х„) = £ gJ(х))
'=‘ V '=] 0
где gj и ку - непрерывные функции, причем ку не зависят от функции
Эта теорема означает, что для реализации функций многих переменных достаточно операций суммирования и композиции функций одной переменной. Удивительно, что в этом представлении лишь функции gj зависят от представляемой функции ¥, а функции к^ универсальны. Необходимо отметить, что терема А.Н.Колмогорова
является обобщением теоремы В.И.Арнольда (1957), которая дает решение 13-й проблемы Гильберта.
К сожалению определение вида функций ку и gj для данной функции Е представляет собой математическую проблему, для которой пока не найдено общего строгого решения.
В работах [3, 5] предлагается рассматривать предлагаемую семантическую информационную модель как один из универсальных вариантов решения этой проблемы. В этом контексте функция Е интерпретируется как образ идентифицируемого объекта, функция И,, — как образ 1-го класса, а функция 2, — как мера сходства образа объекта с образом класса.
Например результаты идентификации представлены на рисунке 2.
В графе "% Сх" приведены коэффициенты при слагаемых разложения в ряд по векторам обобщенных категорий. Птичками "V" отмечены категории, к которым данный респондент действительно относится. Мы видим, что:
- по результатам идентификации данный респондент правильно отнесен ко всем трем категориям, к которым он действительно относится;
- однако по результатам идентификации, кроме того, данный респондент был ошибочно отнесен к четырем категориям, к которым в действительности не относится;
- данный респондент действительно не относится ко всем категориям, к которым не был отнесен по результатам идентификации;
Рисунок 2 - Пример карточки идентификации респондента, т. е. спектрограммы его конкретного образа (разложение в ряд по социотипам)
Ключевым является вопрос о том, насколько достоверны результаты идентификации респондентов по категориям в созданных частных моделях. Ответ на этот вопрос предполагает разнообразные исследования, включающие:
1. Исследование наивысшей по всем частным моделям достоверности идентификации с разными категориями.
2. Изучение зависимости достоверности идентификации по категориям от количества секторов в частной модели.
3. Изучение зависимости достоверности идентификации респондентов в частных моделях с различным количеством секторов от категорий.
4. Изучение зависимости достоверности идентификации в среднем по всем категориям от количества секторов в частной модели.
5. Изучение достоверности идентификации респондентов при скоростном распознавании и в различных режимах голосования моделей.
Ответы на первые три вопроса можно получить путем исследования БД Бовйёеп.ёЬГ, которая создается в 1-м режиме модуля распознавания системы "Эйдос-астра".
1. Исследование наивысшей по всем частным моделям достоверности идентификации с разными категориями
Результаты идентификации респондентов с различными категориями имеют различную достоверность, т.е. "хорошо идентифицируемые категории" и "плохо идентифицируемые категории" (таблица 7).
Таблица 7 - БАЗА ДАННЫХ ПО ДОСТОВЕРНОСТИ ИДЕНТИФИКАЦИИ
С РАЗЛИЧНЫМИ КАТЕГОРИЯМИ В ЧАСТНЫ [Х МОДЕЛЯХ (ФРАГМЕНТ)
Код кате- гории Наименование категории Условное наименов. катег. для графиков Максимальная достоверность идентификации Модель, обеспеч. максим. достовер. Кол-во респ., относ. к катег.
22 SC:B173-Sports:Football k22 85,864 3 1613
11 SC:B111 -Sports:Basketball k11 74,773 2 2385
3 SC:A53-Sports k3 64,398 2 4567
7 SC:A323-Sexuality k7 28,488 6 2675
12 SC:B329-Sexuality:Sexual perversions k12 28,266 108 2360
26 SC:A92-Birth k26 27,115 128 1343
19 SC:C330-Sexuality:Sexual perversions:Homosexual m k19 26,102 108 1807
29 SC:B49-Book Collection:American Book k29 25,691 128 1178
36 SC:A23-Psychological k36 23,313 110 1007
18 SC:A31-Business k18 21,795 128 1813
24 SC:B21-Relationship:Number of marriages k24 21,655 163 1417
30 SC:B26-Personality:Body k30 21,405 162 1163
37 SC:A108-Education k37 20,867 128 1002
1 SC:M- k1 20,519 2 13640
31 SC:B189-Medical:Illness k31 20,447 166 1159
33 SC:A99-Financial k33 20,415 165 1075
35 SC:A38-Politics k35 19,523 144 1039
27 SC:B14-Entertainment:Actor/ Actress k27 19,212 153 1256
28 SC:?- k28 18,776 163 1242
32 SC:B6-Entertainment:Music k32 18,539 148 1086
34 SC:B48-Famous:Top 5% of Profession k34 18,494 153 1073
25 SC:B2-Book Collection:Profiles Of Women k25 18,365 148 1389
23 SC:B97-Occult Fields:Astrologer k23 18,353 146 1480
21 SC:A29-Parenting k21 18,265 147 1754
16 SC:A25-Personality k16 16,442 114 2083
8 SC:A5-Entertainment k8 16,238 152 2577
9 SC:A9-Relationship k9 14,974 160 2442
14 SC:A19-Writers k14 13,763 160 2223
13 SC:A55-Art k13 13,557 165 2232
10 SC:A40-0ccult Fields k10 13,138 151 2396
17 SC:A68-Childhood k17 13,069 162 1996
20 SC:B45-Famous:Greatest hits k20 11,937 167 1795
6 SC:A42-Medical k6 8,405 173 2910
5 SC:A15-Famous k5 6,094 169 3373
15 SC:A129-Death k15 5,422 168 2168
2 SC^- k2 5,254 152 5125
4 SC:A1-Book Collection k4 4,514 162 4471
Весьма знаменательно, что из 172 исследованных частных моделей лишь 23 модели оказались наилучшими по достоверности идентификации каких-либо из 37 кате-
горий, исследуемых в моделях. Причем разные частные модели оказались наилучшими для идентификации различного количества категорий (таблица 8).
Таблица 8 - СВОДНАЯ ИНФОРМАЦИЯ О КАЧЕСТВЕ ЧАСТНЫХ МОДЕЛЕЙ
№ Наименование модели Кол. кат., для ид. кот. мод. оказ. наилучш. Коды категорий № Наимено- вание модели Кол. кат., для ид. кот. мод. оказ. наилучш. Коды категорий
1 128 4 18, 26, 29, 37 11 3 1 22
2 2 3 1, 3, 11 12 6 1 7
3 162 3 4, 17, 30 13 110 1 36
4 108 2 12,19 14 114 1 16
5 148 2 25, 32 15 144 1 35
6 152 2 2, 8 16 146 1 23
7 153 2 27, 34 17 147 1 21
8 160 2 9, 14 18 151 1 10
9 163 2 24, 28 19 166 1 31
10 165 2 13, 33 20 167 1 20
21 168 1 15
22 169 1 5
23 173 1 6
При этом всего 4 частные модели из 172 с: 128, 2, 162 и 108 секторами оказались наилучшими для идентификации 12 категорий из 37. Таким образом, 2,3 % исследованных частных моделей позволяют наиболее достоверно идентифицировать 32,4 % всех категорий, а 5,8 % моделей - 64,9 % всех категорий.
Обратим внимание также на столбец: "Модель, обеспечившая максимальную достоверность" (см. таблицу 7). Если изобразить систему концентрических колец, каждое из которых соответствует определенной частной модели, и разделить эти кольца на количество секторов в соответствующей частной модели, раскрасить эти секторы различными цветами спектра так, чтобы их было видно (можно было различить), то получим логотип данной мультимодели (рисунок 3).
Рисунок 3 - Логотип мультимодели из 172 частных моделей на 37 категорий (после выбора 23 наиболее достоверных частных моделей)
Этот логотип получен с помощью программы Logoastr-v2.1, разработанной Д. Бандык (Беларусь) по алгоритму автора. Эту программу можно бесплатно скачать по ссылке: http://lc.kubagro.ru/ftp/lc sfx.exe с сайта автора.
Необходимо пояснить, каким образом рассчитывается приведенная в таблице 7 достоверность идентификации. Достоверность идентификации по каждой категории является эвристическим критерием, который представляет собой алгебраическую сумму уровней сходства с данной категорией верно отнесенных и не отнесенных системой к данной категории респондентов минус ошибочно отнесенных и неотнесенных респондентов, деленную на их количество:
- уровень сходства "1-го" респондента с "к-й" категорией, к которой он был правильно отнесен системой;
- уровень сходства "1-го" респондента с "к-й" категорией, к которой он был правильно не отнесен системой;
- уровень сходства "1-го" респондента с "к-й" категорией, к которой он был ошибочно отнесен системой;
- уровень сходства "1-го" респондента с "к-й" категорией, к которой он был ошибочно не отнесен системой.
На рисунке 4 приведен фрагмент карточки идентификации респондентов с классом, по которой рассчитывается достоверность идентификации с данным классом, т. к. в тестирующей выборке было 370 респондентов, и в полном виде эта карточка слишком объемна.
V
/
(1)
где
Ок - достоверность идентификации "к-й" категории;
N - количество респондентов в распознаваемой выборке;
Рисунок 4 - Фрагмент карточки идентификации респондентов с классом: "5 SC:A15Famous"
На рисунке 5 показано распределение (и его аппроксимация степенной функцией) достоверности идентификации респондентов по всем категориям: от категории "k22" с максимальной достоверностью идентификации и до категории "k4" с минимальной достоверностью идентификации.
По нашим данным, (см. таблицу 7) к "хорошо идентифицируемым категориям" относятся: SC:B173-Sports:Football, SC:B111-Sports:Basketball, SC:A53-Sports, а к "плохо идентифицируемым категориям" - SC:A42-Medical, SC:A15-Famous, SC:A129-Death, SC^-, SC:A1-Book Collection. По-видимому, к прогнозам, содержащим "хорошо идентифицируемые категории", можно в общем случае относиться с большим доверием, чем содержащим "плохо идентифицируемые категории". В принципе последние можно вообще исключать ("отфильтровывать") из карточек идентификации, что система "Эй-дос" позволяет делать автоматически.
2. Изучение зависимости достоверности идентификации по категориям от количества секторов в частной модели
Если на основе БД ВоБЙёеп.ёЬГ построить графики зависимости достоверности идентификации для каждой категории от количества секторов в частной модели, то получим рисунок 6, на котором наглядно видно, что существуют, по крайней мере, три группы категорий (классов), отличающиеся видом этой зависимости:
1. Достоверность максимальна в частных моделях с небольшим числом секторов и при их увеличении быстро уменьшается, а затем стабилизируется.
2. Достоверность минимальна в частных моделях с небольшим числом секторов и при их увеличении быстро увеличивается, а затем стабилизируется.
3. Достоверность мало зависит от числа секторов в частной модели.
Из рисунка 6 также видно, что:
- большинство из исследуемых в мультимодели 37 категорий относится ко 2-й или 3-й группам, что и определяет вид средней по всем классам зависимости достоверности частной модели о количества секторов в ней;
- достоверность идентификации категорий 1-й группы значительно превосходит достоверность идентификации категорий во 2-й и 3-й группах.
категории от количества секторов в частной модели
Поэтому можно сделать вывод о том, что идея применения концепции "коллектива решающих правил" или использования системы частных моделей, входящих в мультимодель, оказалась вполне обоснованной и оправданной.
Приведем на рисунке 7 наиболее типичные зависимости 1-й, 2-й и 3-й групп.
у = 2Е-11х° - 1Е-08Х + ЗЕ-ОбХ - О.ООМх^ + 0,0311х* - 1,2582х + 86,253 - Р2 = 0,8106
у = 6Е-11х -4Е-08Х + ЭЕ-06Х - О.ОО^ + 0,0558Х^ - 1.4Э43Х + 62,8 РЗ2 = 0,8424
у = 1Е-10Х - 6Е-08Х + 1Е-05Х - 0,0015х3 + 0,097х2 - 3.0988Х + 76,027 РЗ2 = 0,9646
Л»' 1 У = б'^о 93646'478
у = 4,75021_п(х) - 21.72 ^ = 0,8833
- к22 — к11 кЗ к7 к25 — к15 -ь- к2 — к4
Рисунок 7 - Наиболее типичные зависимости 1-й, 2-й и 3-й групп с аппроксимирующими их функциями
Функции, аппроксимирующие эти зависимости (полиномы и логарифмические функции), представлены ниже:
(к22) у = 2Е-11х6 - 1Е-08х5 + 3Е-06х4 - 0,0004х3 + 0,0311х2 - 1,2582х + 86,253 (2)
Я2 = 0,8106
(к03) у = 2Е-11х6 - 1Е-08х5 + 3Е-06х4 - 0,0004х3 + 0,0311х2 - 1,2582х + 86,253 Я2 = 0,8106 (3)
(к11) у = 1Е-10х6 - 6Е-08х5 + 1Е-05х4 - 0,0015х3 + 0,097х2 - 3,0988х + 76,027 Я2 = 0,9646 (4)
(к25) у = 6,362Ьи(х) - 16,478 Я2 = 0,9364 (5)
(к15) у = 4,7502Ьи(х) - 21,72 Я2 = 0,8839 (6)
3. Изучение зависимости достоверности идентификации респондентов в частных моделях с различным количеством секторов от категорий
На основе БД Бовйёеп.ёЬГ построим графики зависимостей достоверности идентификации респондентов со всеми категориями в частных моделях с различным количеством секторов (рисунок 8). На рисунке 8 красной жирной линией обозначена наивысшая, а жирной синей линией - наинизшая достоверность идентификации респондентов по каждой категории из всех частных моделей, достоверности идентификации в которых расположены между этими линиями.
со всеми категориями в частных моделях с различным количеством секторов
Из рисунка 8 видно, что все обобщенные категории можно разделить на две основные группы по тому, в какой степени эффективными оказались алгоритмы голосования, с точки зрения повышения достоверности, при идентификации с этими категориям. Категории, при идентификации с которыми алгоритмы голосования:
- показали высокую эффективность;
- практически не сказываются.
На рисунке 9 показаны зависимости достоверности идентификации от категории, с которой осуществляется идентификация, причем категории рассортированы таким образом, что разница между достоверностью при применении наилучшей и наихудшей частных моделей, т.е. эффективность алгоритмов голосования уменьшается.
с различным количеством секторов от категории при упорядочении категорий в порядке убывания эффективности алгоритмов голосования
В таблице 9 приведены наименования категорий и частных моделей в порядке уменьшения эффективности алгоритмов голосования.
Таблица 9 - ЭФФЕКТИВНОСТЬ АЛГОРИТМОВ ГОЛОСОВАНИЯ ПРИ ИДЕНТИФИКАЦИИ РЕСПОНДЕНТОВ С РАЗНЫМИ КАТЕГОРИЯМИ В ЧАСТНЫХ МОДЕЛЯХ С РАЗЛИЧНЫМ КОЛИЧЕСТВОМ СЕКТОРОВ
Код катег. Наименование категории Наиболее эффективная частная модель Наименее эффективная частная модель Эффект. голосо- вания
Досто- верность Кол-во секторов Досто- верность Кол-во секторов
k11 SC:B111 -Sports:BasketbaII 74,773 2 35,502 40 39,271
k2 SC^- 5,254 152 -26,314 2 31,568
k25 SC:B2-Book CoIIection:ProfiIes Of Women 18,365 148 -10,289 2 28,654
k31 SC:B189-MedicaI:IIIness 20,447 166 -4,971 2 25,418
k34 SC:B48-Famous:Top 5% of Profession 18,494 153 -5,768 3 24,262
k26 SC:A92-Birth 27,115 128 3,779 2 23,336
k16 SC:A25-PersonaIity 16,442 114 -6,580 3 23,022
k3 SC:A53-Sports 64,398 2 41,589 171 22,809
k22 SC:B173-Sports:FootbaII 85,864 3 63,245 40 22,619
k32 SC:B6-Entertainment:Music 18,539 148 -4,050 3 22,589
k15 SC:A129-Death 5,422 168 -16,673 3 22,095
k33 SC:A99-FinanciaI 20,415 165 -1,414 3 21,829
k17 SC:A68-ChiIdhood 13,069 162 -8,275 2 21,344
Продолжение таблицы Я
Код катег. Наименование категории Наиболее эффективная частная модель Наименее эффективная частная модель Эффект. голосо- вания
Досто- верность Кол-во секторов Досто- верность Кол-во секторов
k6 SC:A42-Medical 8,405 173 -11,402 2 19,807
k37 SC:A108-Education 20,867 128 2,078 3 18,789
k30 SC:B26-Personality:Body 21,405 162 2,691 2 18,714
k24 SC:B21-Relationship:Number of marriages 21,655 163 3,094 3 18,561
k35 SC:A38-Politics 19,523 144 2,073 3 17,450
k4 SC:A1-Book Collection 4,514 162 -11,869 4 16,383
k19 SC:C330-Sexuality:Sexual perversions:Homosexual m 26,102 108 9,741 2 16,361
k21 SC:A29-Parenting 18,265 147 2,544 2 15,721
k5 SC:A15-Famous 6,094 169 -9,297 3 15,391
k20 SC:B45-Famous:Greatest hits 11,937 167 -3,275 3 15,212
k27 SC:B14-Entertainment:Actor/ Actress 19,212 153 4,551 3 14,661
k13 SC:A55-Art 13,557 165 -0,533 3 14,090
k9 SC:A9-Relationship 14,974 160 1,666 3 13,308
k14 SC:A19-Writers 13,763 160 0,722 3 13,041
k28 SC:?- 18,776 163 5,797 2 12,979
k18 SC:A31-Business 21,795 128 9,017 2 12,778
k29 SC:B49-Book Collection:American Book 25,691 128 14,619 18 11,072
k10 SC:A40-Occult Fields 13,138 151 2,073 2 11,065
k12 SC:B329-Sexuality:Sexual perversions 28,266 108 17,391 2 10,875
k1 SC:M- 20,519 2 11,313 170 9,206
k23 SC:B97-Occult Fields:Astrologer 18,353 146 9,873 6 8,480
k8 SC:A5-Entertainment 16,238 152 7,959 3 8,279
k36 SC:A23-Psychological 23,313 110 15,164 8 8,149
k7 SC:A323-Sexuality 28,488 6 22,858 26 5,630
Сумма 17,698
Из таблицы 9 видно, что эффективность алгоритмов голосования для различных категорий изменяется от 39,2 % до 5,6 % и в среднем по всем категориям составляет 17,7 %. Продолжим исследование рисунка 8. На рисунке 10 линии максимальной и минимальной достоверностей идентификации по категориям показаны отдельно и приведены аппроксимирующие их логарифмические функции.
Рисунок 10 - Максимальная и минимальная достоверности идентификации по категориям и аппроксимирующие их логарифмические функции
Из вида графиков и функций, приведенных на рисунке 9, можно сделать вывод о том, что модель, наилучшая по достоверности идентификации по категориям, превос-
ходит наихудшую примерно на 21 % (при этом надо иметь в виду, что в качестве достоверности идентификации в данной статье рассматривается эвристический критерий, вычисляемый по формуле (1)). Это и есть тот максимальный эффект в повышении достоверности идентификации, который дает применение в системе "Эйдос-астра" системы частных моделей и алгоритмов голосования (коллективов решающих правил) и учета априорной информации о свойствах частных моделей при скоростном распознавании.
4. Изучение зависимости достоверности идентификации в среднем по всем категориям от количества секторов в частной модели
На рисунке 11 показана средняя по всем категориям зависимость достоверности идентификации от количества секторов в частной модели.
Наиболее достоверной простой аппроксимацией зависимости средней достоверности частной модели от количества секторов в ней является аппроксимация логарифмической функцией:
у = 2,658Ln(x) + 4,6642
R2 = 0,8399. ( }
При рассмотрении этой функции обращает на себя внимание то обстоятельство, что с увеличением количества секторов достоверность модели сначала возрастает очень быстро, затем на модели с 12 секторами скорость роста замедляется (т.е. 1-я производная становится меньше 45°) и в дальнейшем при увеличении числа секторов возрастет сравнительно незначительно. Однако 12 секторов, соответствующих разбиению на знаки Зодиака, получается довольно рационально и представляет собой результат весьма разумного компромисса между сложностью модели и ее достоверностью. Модель с разбиением на знаки Зодиака — это наиболее достоверная из сравнительно простых моделей, т.е. при дальнейшем ее упрощении она очень быстро теряет достоверность, а при усложнении ее достоверность возрастает, но очень медленно.
Рисунок 11 - Средняя по всем категориям зависимость достоверности идентификации от количества секторов в частной модели
Однако следует иметь в виду, что этот вывод был сделан на основе исследования средней достоверности всех 172 частных моделей по всем 37 категориям. Для отдельных категорий или их групп он может быть не совсем верным или вообще неверным, как мы видели выше при изучении зависимости достоверности идентификации по категориям от количества секторов в частной модели (рисунки 8, 9 и 10).
5. Изучение достоверности идентификации респондентов при скоростном распознавании и в различных режимах голосования моделей
Это исследование можно провести на респондентах, как входящих в обучающую выборку, на основе которой осуществлялся синтез модели, так и не входящих в нее, например, путем тестирования участников форумов. В первом случае мы получим оценку внутренней дифференциальной валидности, а во втором - внешней дифференциальной валидности. По мнению авторов, второй вариант в общем случае является более жестким и корректным, и в этом смысле предпочтительным с точки зрения возможности на основании него делать обоснованные выводы о достоверности модели. Однако в нашем случае разницы между этими вариантами практически нет, т.к. из-за очень высокой статистической представительности категорий и огромного общего объема обучающей выборки "относительный вес" или вклад данных каждого конкретного респондента в обобщенный образ любой из исследованных категорий столь мал, что им практически можно пренебречь, т.е. приближенно, практически не ошибаясь, считать, что его данные не использовались при синтезе модели вообще и данной категории, в частности. Получается, что при увеличении статистики внутренняя валидность асимптотически стремится к внешней. В этом и состоит одна из причин исследования столь представительной в целом (20007 респондентов) и по каждой из категорий (не менее 1000 респондентов) выборки.
Система "Эйдос" формирует сводные итоговые формы по результатам идентификации, предназначенные для оценки достоверности частных моделей. Приведем эти сводные формы для пяти алгоритмов голосования и скоростного распознавания.
1-й алгоритм голосования
Всего физических анкет: 370 (100% для п.15) Всего логических анкет: 454
4. Средняя достоверность идентификации логических анкет с учетом сходства
5. Среднее сходство логических анкет, правильно отнесенных к классу
6. Среднее сходство логических анкет, ошибочно не отнесенных к классу
7. Среднее сходство логических анкет, ошибочно отнесенных к классу
8. Среднее сходство логических анкет, правильно не отнесенных к классу
-20.281% 20.822% 0 .000% 41.103% 0.000%
9. Средняя достоверность идентификации логических
10. Среднее количество физич-х анкет, действительно Среднее количество физич-х анкет, действительно
11. Среднее количество и % лог-их анкет, правильно
12 . Среднее количество и % лог-их анкет, ошибочно
13. Среднее количество и % лог-их анкет, ошибочно
14. Среднее количество и % лог-их анкет, правильно
анкет с учетом кол-ва : -33.936%
относящихся к классу: 17.956 (100% для п.11 и п.12)
не относящихся к классу: 352.044 (100% для п.13 и п.14)
Всего физических анкет: 370.000 (100% для п.15) отнесенных к классу: 17.956, т.е. 100.000%
не отнесенных к классу: 0.000, т.е. 0.000%
отнесенных к классу: 37.068, т.е. 10.529%
не отнесенных к классу: 0.000, т.е. 0.000%
15. Средневзвешенная вероятность случайного угадывания принадлежности объекта к классу ( % ): 4.853
16. Средневзвешенная эффективность применения модели по сравнению со случ. угадыванием (раз): 30.154
2-й алгоритм голосования
Всего физических анкет: 370 (100% для п.15) Всего логических анкет: 1200
4 . Средняя достовер ность иденти фикации логических анкет с учет ом сходства : -2.864%
5. Среднее сходство логических анкет, правильно отнесенных к классу : 2.145%
6 . Среднее сходство логических анкет, ошибочно не отнесенных к классу : 0.000%
7. Среднее сходство логических анкет, ошибочно отнесенных к классу : 5.009%
8 . Среднее сходство логических анкет, правильно не отнесенных к классу : 0.000%
9. Средняя достоверность идентификации логических а нкет с учетом кол -ва : -29.372%
10 . Среднее количество ф изич-х анкет, действительно относящихся к классу: 45.080 (100% для п .11
Среднее количество ф изич-х анкет, действительно не относящихся к классу: 324.920 (100% для п .13
Всего физических анкет: 370.000 (100% для п .15
11. Среднее количество и % лог-их анкет, правильно отнесенных к классу: 45.080, т. е. 100 0 00%
12 . Среднее количество и % лог-их анкет, ошибочно не отнесенных к классу: 0 .000, т. е. 0 . 0 00%
13 . Среднее количество и % лог-их анкет, ошибочно отнесенных к классу: 139.823, т. е. 43 0 33%
14 . Среднее количество и % лог-их анкет, правильно не отнесенных к классу: 0 .000, т. е. 0 . 0 00%
15. Средневзвешенная вероятность случайного угадывания принадлежности объекта к классу ( % ): 12.184
16. Средневзвешенная эффективность применения модели по сравнению со случ. угадыванием (раз): 11.408
3-й алгоритм голосования
Всего физических анкет: 370 (100% для п.15) Всего логических анкет: 2079
4. Средняя р е в о т с о д ность иденти фикации логических анкет с учет ом сходства : -5.834%
5. Среднее сходство логических анкет, правильно отнесенных к классу : 6.895%
6. Среднее сходство логических анкет, ошибочно не отнесенных к классу : 0.103%
7. Среднее сходство логических анкет, ошибочно отнесенных к классу : 14.421%
8. Среднее сходство логических анкет, правильно не отнесенных к классу : 1.795%
9. Средняя достоверность идентификации логических анкет с учетом кол -ва : -27.265%
10 . Среднее количество ф изич-х анкет, действительно относящихся к классу: 87.080 (100% для п.11
Среднее количество ф изич-х анкет, действительно не относящихся к классу: 282.920 (100% для п.13
Всего физических анкет: 370.000 (100% для п.15
11. Среднее количество и % лог-их анкет, правильно отнесенных к классу: 82.244, т. е. 94 . 446%
12 . Среднее количество и % лог-их анкет, ошибочно не отнесенных к классу: 4.836, т. е. 5. 554%
13 . Среднее количество и % лог-их анкет, ошибочно отнесенных к классу: 230.604, т. е. 81. 509%
14 . Среднее количество и % лог-их анкет, правильно не отнесенных к классу: 52 .316, т. е. 18 . 491%
15. Средневзвешенная вероятность случайного угадывания принадлежности объекта к классу ( % ): 23.535
16. Средневзвешенная эффективность применения модели по сравнению со случ. угадыванием (раз): 6.352
4-й алгоритм голосования
Всего физических анкет: 370 (100% для п.15) Всего логических анкет: 2079
4. Средняя достовер ность иденти фикации логических анкет с учет ом сходства : 8 041
5. Среднее сходство логических анкет, правильно отнесенных к классу : 4 768
6. Среднее сходство логических анкет, ошибочно не отнесенных к классу : 0 771
7. Среднее сходство логических анкет, ошибочно отнесенных к классу : 6 269
8. Среднее сходство логических анкет, правильно не отнесенных к классу : 10 312
Средняя достоверность идентификации логических анкет с учетом кол-ва
10 . Среднее количество ф изич-х анкет, действительно относящихся к классу: 87.080 (100% для п.1
Среднее количество ф изич-х анкет, действительно не относящихся к классу: 282.920 (100% для п.1
Всего физических анкет: 370.000 (100% для п.1
11. Среднее количество и % лог-их анкет, правильно отнесенных к классу: 62.379, т. е. 71. 634%
12 . Среднее количество и % лог-их анкет, ошибочно не отнесенных к классу: 24.701, т. е. 28 . 366%
13 . Среднее количество и % лог-их анкет, ошибочно отнесенных к классу: 125.941, т. е. 44 . 515%
14 . Среднее количество и % лог-их анкет, правильно не отнесенных к классу: 156. 946, т. е. 55. 474%
15. Средневзвешенная вероятность случайного угадывания принадлежности объекта к классу ( % ): 23.535
16. Средневзвешенная эффективность применения модели по сравнению со случ. угадыванием (раз): 5.396
5-й алгоритм голосования
Всего физических анкет: 370 (100% для п.15) Всего логических анкет: 2077
4. Средняя достоверность идентификации логических анкет с учетом сходства 0.921%
5. Среднее сходство логических анкет, правильно отнесенных к классу 0.796%
6 . Среднее сходство логических анкет, ошибочно не отнесенных к классу 0.129%
7. Среднее сходство логических анкет, ошибочно отнесенных к классу 1.301%
8 . Среднее сходство логических анкет, правильно не отнесенных к классу 1.556%
9 .
10 .
11.
12 .
13 .
14 .
Средняя достоверность идентификации логических анкет с учетом кол-ва : Среднее количество физич-х анкет, действительно относящихся к классу:
Среднее количество физич-х анкет, действительно не относящихся к классу:
Всего физических анкет:
Среднее количество и % лог-их анкет, правильно отнесенных к классу:
Среднее количество и % лог-их анкет, ошибочно не отнесенных к классу:
Среднее количество и % лог-их анкет, ошибочно отнесенных к классу:
Среднее количество и % лог-их анкет, правильно не отнесенных к классу:
86.993 (100% для п.11 и п.12
283.007 (100% для п.13 и п.14
370.000 (100% для п.15)
61.184 , т. е. 70. 332%
25.809 , т. е. 29. 668%
138.381 , т. е. 48 . 897%
144.476 , т. е. 51. 050%
к классу ( % ): 23.512
16. Средневзвешенная эффективность применения модели по сравнению со случ. угадыванием (раз)
Режим скоростного распознавания
Всего физических анкет: 370 (100% для п.15)
Всего логических анкет: 2079
4. Средняя достоверность идентификации логических анкет с учетом сходства 8.058%
5. Среднее сходство логических анкет, правильно отнесенных к классу 4.813%
6. Среднее сходство логических анкет, ошибочно не отнесенных к классу 0.775%
7. Среднее сходство логических анкет, ошибочно отнесенных к классу 6.294%
8. Среднее сходство логических анкет, правильно не отнесенных к классу 10.315%
9. Средняя достоверность идентификации логических анкет с учетом кол-ва : 18.563%
10 . Среднее количество физич-х анкет, действительно относящихся к классу: 87.080 (100% для п.11
Среднее количество физич-х анкет, действительно не относящихся к классу: 282.920 (100% для п.13
Всего физических анкет: 370.000 (100% для п.15
11. Среднее количество и % лог-их анкет, правильно отнесенных к классу: 62.379, т. е. 71. 634%
12 . Среднее количество и % лог-их анкет, ошибочно не отнесенных к классу: 24.701, т. е. 28 . 366%
13 . Среднее количество и % лог-их анкет, ошибочно отнесенных к классу: 125.941, т. е. 44 . 515%
14 . Среднее количество и % лог-их анкет, правильно не отнесенных к классу: 156. 946, т. е. 55. 474%
15. Средневзвешенная вероятность случайного угадывания принадлежности объекта к классу ( % ): 23.535
16. Средневзвешенная эффективность применения модели по сравнению со случ. угадыванием (раз): 5.396
Из анализа этих форм видно, что использование мультимодели и алгоритмов голосования дает результаты идентификации (по большинству категорий), существенно отличающиеся от случайного угадывания (в лучшую сторону).
Из этого можно сделать три важных вывода:
1. В обучающей выборке выявлены взаимосвязи между астрономическими признаками респондентов на момент рождения (астропризнаками) и обобщенными социальными категориями (астросоциотипами), показывающие, что эта выборка существенно отличается от случайной.
2. Знание этих выявленных закономерностей позволяет относить респондентов к обобщенным социальным категориям с достоверностью, значительно превосходящей вероятность случайного угадывания.
3. Достоверность предыдущих двух выводов, как статистических высказываний, составляет значительно более 95 %.
Более подробная информация для оценки достоверности идентификации при применении различных алгоритмов голосования и скоростном распознавании приведена в таблицах 10-15.
Таблица 10 - ОЦЕНКИ ДОСТОВЕРНОСТИ РАСПОЗНАВАНИЯ ТЕСТИРУЮЩЕЙ ВЫБОРКИ
В 1-М АЛГОРИ ТМЕ ГОЛОСОВАНИЯ (АЛГОРИТ МЕ А.] П. ТРУНЕВА)
№ код кат Наименование категории Достов. идентиф. лог.анк. с учетом сходства эвр.крит Суммарное сходство/различие лог.анк, правильно или ошибочно отнесенных или не отнесенных к классу Достов. идентиф. лог.анк. с уч.количества эвр.крит Кол-во лог.анк., дейст-но относящихся к классу Количество логических анкет, правильно или ошибочно отнесенных или не отнесенных к классу Вероятн. случайного угадывания (%) =NLA/NFA Эффектив. модели по срав. со случ. угадыв. (раз)
Правиль. отнесен. Ошибочно не отнес. Ощибочно отнесен. Правиль. не отнес. Правиль. отнесен. Ошибочно не отнес. Ощибочно отнесен. Правиль. не отнес.
1 3 4 б 6 7 8 9 10 11 12 13 14 15 16
1 SC:M- 27,400 42,392 0,000 14,993 0,000 44,б81 34,000 34,000 0,000 13,000 0,000 9,189 10,883
2 БС:Ж- -32,904 1б,922 0,000 49,827 0,000 -48,93б 12,000 12,000 0,000 35,000 0,000 3,243 30,83б
3 SC:A53-Sports -21,179 20,б81 0,000 41,8б0 0,000 -34,б94 1б,000 1б,000 0,000 33,000 0,000 4,324 23,127
4 SC:A1-Book Collection 11,7б5 37,722 0,000 25,958 0,000 5,882 9,000 9,000 0,000 8,000 0,000 2,432 41,118
5 SC:A15-Famous -14,0б2 24,392 0,000 38,453 0,000 -30,233 15,000 15,000 0,000 28,000 0,000 4,054 24,бб7
б SC:A42-Medical -0,284 32,192 0,000 32,47б 0,000 -2,174 45,000 45,000 0,000 47,000 0,000 12,1 б2 8,222
7 SC:A323-Sexuality -24,788 19,712 0,000 44,500 0,000 -42,857 18,000 18,000 0,000 45,000 0,000 4,8б5 20,555
В SC:A5-Entertainment -22,717 20,б87 0,000 43,404 0,000 -38,182 17,000 17,000 0,000 38,000 0,000 4,595 21,7бЗ
9 SC:A9-Relationship -23,185 17,598 0,000 40,783 0,000 -41,4бЗ 12,000 12,000 0,000 29,000 0,000 3,243 30,83б
10 SC:A40-Occult Fields -53,507 4,447 0,000 57,954 0,000 -85,10б 7,000 7,000 0,000 87,000 0,000 1,892 52,854
11 SC:B111 -Sports:Basketball -54,495 б,420 0,000 б0,915 0,000 -83,193 10,000 10,000 0,000 109,000 0,000 2,703 Зб,99б
12 SC:B329-Sexuality:Sexual perversions -15,01б 23,020 0,000 38,03б 0,000 -25,000 24,000 24,000 0,000 40,000 0,000 б,48б 15,418
13 SC:A55-Art -33,418 14,434 0,000 47,851 0,000 -5б,522 5,000 5,000 0,000 18,000 0,000 1,351 74,019
14 SC:A19-Writers 1,914 31,250 0,000 29,33б 0,000 0,000 12,000 12,000 0,000 12,000 0,000 3,243 30,83б
15 SC:A129-Death -9,577 22,852 0,000 32,429 0,000 -22,222 14,000 14,000 0,000 22,000 0,000 3,784 2б,427
1б SC:A25-Personality -29,340 15,718 0,000 45,058 0,000 -42,857 8,000 8,000 0,000 20,000 0,000 2,1б2 4б,253
17 SC:A68-Childhood -40,884 9,б98 0,000 50,581 0,000 -б8,000 8,000 8,000 0,000 42,000 0,000 2,1б2 4б,253
18 SC:A31-Business -41,304 11 ,бЗб 0,000 52,940 0,000 -б2,857 13,000 13,000 0,000 57,000 0,000 3,514 28,458
19 SC:C330-Sexuality:Sexual perversions:Homosexual m -17,01б 21,822 0,000 38,837 0,000 -33,333 15,000 15,000 0,000 30,000 0,000 4,054 24,бб7
20 SC:B45-Famous:Greatest hits -35,133 12,043 0,000 47,17б 0,000 -57,143 9,000 9,000 0,000 33,000 0,000 2,432 41,118
21 SC:A29-Parenting -27,380 17,201 0,000 44,581 0,000 -43,39б 15,000 15,000 0,000 38,000 0,000 4,054 24,бб7
22 SC:B173-Sports:Football -33,702 10,990 0,000 44,б92 0,000 -б1,290 б,000 б,000 0,000 25,000 0,000 1,б22 б1,б52
23 SC:B97-Occult Fields:Astrologer -4б,888 б,б92 0,000 53,580 0,000 -80,392 5,000 5,000 0,000 4б,000 0,000 1,351 74,019
24 SC:B21-Relationship:Number of marriages -25,943 19,95б 0,000 45,899 0,000 -45,94б 10,000 10,000 0,000 27,000 0,000 2,703 Зб,99б
25 SC:B2-Book Collection:Profiles Of Women -42,829 11,919 0,000 54,748 0,000 -бб,бб7 3,000 3,000 0,000 15,000 0,000 0,811 123,305
2б SC:A92-Birth -49,395 4,805 0,000 54,200 0,000 -79,592 5,000 5,000 0,000 44,000 0,000 1,351 74,019
27 SC:B14-Entertainment:Actor/ Actress -34,112 12,880 0,000 4б,992 0,000 -б1,538 10,000 10,000 0,000 42,000 0,000 2,703 Зб,99б
2В SC:?- -57,288 2,515 0,000 59,803 0,000 -90,б98 2,000 2,000 0,000 41,000 0,000 0,541 184,843
29 SC:B49-Book Collection:American Book -37,287 11,424 0,000 48,711 0,000 -бб,бб7 10,000 10,000 0,000 50,000 0,000 2,703 Зб,99б
30 SC:B26-Personality:Body -45,8бб 10,бЗ1 0,000 5б,497 0,000 -б8,254 10,000 10,000 0,000 53,000 0,000 2,703 Зб,99б
31 SC:B189-Medical:Illness -9,744 24,3б5 0,000 34,109 0,000 -11,111 24,000 24,000 0,000 30,000 0,000 б,48б 15,418
32 SC:B6-Entertainment:Music -42,3б4 7,881 0,000 50,245 0,000 -73,333 б,000 б,000 0,000 39,000 0,000 1,б22 б1,б52
33 SC:A99-Financial -41,434 10,052 0,000 51,48б 0,000 -б8,889 7,000 7,000 0,000 38,000 0,000 1,892 52,854
34 SC:B48-Famous:Top 5% of Profession -39,б15 11,3б7 0,000 50,982 0,000 -б5,517 5,000 5,000 0,000 24,000 0,000 1,351 74,019
35 SC:A38-Politics -37,970 10,253 0,000 48,222 0,000 -б1,538 10,000 10,000 0,000 42,000 0,000 2,703 Зб,99б
Зб SC:A23-Psychological -30,045 19,344 0,000 49,389 0,000 -45,7бЗ 1б,000 1б,000 0,000 43,000 0,000 4,324 23,127
37 SC:A108-Education -48,952 8,378 0,000 57,329 0,000 -77,049 7,000 7,000 0,000 54,000 0,000 1,892 52,854
№ код кат Наименование категории Достов. идентиф. лог.анк. с учетом сходства эвр.крит Суммарное сходство/различие лог. анк., правильно или ошибочно отнесенных или не отнесенных к классу Достов. идентиф. лог.анк. с уч.количества эвр.крит Кол-во лог.анк., дейст-но относящихся к классу Количество логических анкет, правильно или ошибочно отнесенных или не отнесенных к классу Вероятн. случайного угадывания (%) =NLA/NFA Эффектив. модели по срав. со случ. угадыв. (раз)
Правиль. отнесен. Ошибочно не отнес. Ощибочно отнесен. Правиль. не отнес. Правиль. отнесен. Ошибочно не отнес. Ощибочно отнесен. Правиль. не отнес.
1 3 4 б 6 7 В З 10 11 12 13 14 15 16
1 SC:M- 3,148 5,092 0,000 1,944 0,000 15,480 115,000 115,000 0,000 б5,000 0,000 31,081 3,217
2 SCW- -4,29б 2,178 0,000 б,474 0,000 -1б,718 49,000 49,000 0,000 103,000 0,000 13,243 7,551
3 SC:A53-Sports -1,271 2,7бб 0,000 4,037 0,000 -22,050 28,000 28,000 0,000 99,000 0,000 7,5б8 13,214
4 SC:A1-Book Collection 0,031 1,188 0,000 1,15б 0,000 -7,121 33,000 33,000 0,000 5б,000 0,000 8,919 11,212
5 SC:A15-Famous -2,288 2,218 0,000 4,50б 0,000 -28,882 53,000 53,000 0,000 14б,000 0,000 14,324 б,981
б SC:A42-Medical -0,594 5,034 0,000 5,б28 0,000 -1б,718 82,000 82,000 0,000 13б,000 0,000 22,1б2 4,512
7 SC:A323-Sexuality -3,б20 2,4б0 0,000 б,079 0,000 -38,509 4б,000 4б,000 0,000 170,000 0,000 12,432 8,044
8 SC:A5-Entertainment -2,591 2,0б8 0,000 4,б59 0,000 -24,458 45,000 45,000 0,000 124,000 0,000 12,1 б2 8,222
9 SC:A9-Relationship -2,34б 1,3б4 0,000 3,710 0,000 -31,3бб 41,000 41,000 0,000 142,000 0,000 11,081 9,024
10 SC:A40-Occult Fields -11,21б 0,931 0,000 12,147 0,000 -б7,802 22,000 22,000 0,000 241,000 0,000 5,94б 1б,818
11 SC:B111 -Sports:Basketball -10,872 1,39б 0,000 12,2б8 0,000 -б5,325 15,000 15,000 0,000 22б,000 0,000 4,054 24,бб7
12 SC:B329-Sexuality:Sexual perversions -2,721 2,421 0,000 5,143 0,000 -33,127 43,000 43,000 0,000 150,000 0,000 11 ,б22 8,б04
13 SC:A55-Art -1,383 0,88б 0,000 2,2б9 0,000 -18,57б 23,000 23,000 0,000 83,000 0,000 б,21б 1б,088
14 SC:A19-Writers -1,1 бб 1,205 0,000 2,371 0,000 -23,220 27,000 27,000 0,000 102,000 0,000 7,297 13,704
15 SC:A129-Death -1,948 1,ббб 0,000 3,б14 0,000 -25,77б 49,000 49,000 0,000 132,000 0,000 13,243 7,551
1б SC:A25-Personality -2,2бб 0,989 0,000 3,255 0,000 -23,839 34,000 34,000 0,000 111,000 0,000 9,189 10,883
17 SC:A68-Childhood -4,590 1,029 0,000 5,б18 0,000 -40,0б2 42,000 42,000 0,000 171,000 0,000 11,351 8,810
18 SC:A31-Business -б,193 1,377 0,000 7,570 0,000 -4б,440 29,000 29,000 0,000 179,000 0,000 7,838 12,758
19 SC:C330-Sexuality:Sexual perversions:Homosexual m -2,039 1,820 0,000 3,859 0,000 -31,3бб 34,000 34,000 0,000 135,000 0,000 9,189 10,883
20 SC:B45-Famous:Greatest hits -3,722 0,889 0,000 4,б11 0,000 -41,48б 2б,000 2б,000 0,000 1б0,000 0,000 7,027 14,231
21 SC:A29-Parenting -5,779 1,704 0,000 7,483 0,000 -4б,273 3б,000 3б,000 0,000 185,000 0,000 9,730 10,277
22 SC:B173-Sports:Football -2,8б5 1,2б1 0,000 4,12б 0,000 -53,5б0 11,000 11,000 0,000 184,000 0,000 2,973 ЗЗ,бЗб
23 SC:B97-Occult Fields:Astrologer -5,408 0,б97 0,000 б,1 Об 0,000 -4б,130 15,000 15,000 0,000 1б4,000 0,000 4,054 24,бб7
24 SC:B21-Relationship:Number of marriages -2,791 1,2б9 0,000 4,059 0,000 -34,3б5 21,000 21,000 0,000 132,000 0,000 5,б7б 17,б18
25 SC:B2-Book Collection:Profiles Of Women -2,205 0,438 0,000 2,б43 0,000 -25,б97 11,000 11,000 0,000 94,000 0,000 2,973 ЗЗ,бЗб
2б SC:A92-Birth -5,бб0 0,403 0,000 б,0б3 0,000 -54,489 10,000 10,000 0,000 18б,000 0,000 2,703 Зб,99б
27 SC:B14-Entertainment:Actor/ Actress -4,99б 1,294 0,000 б,290 0,000 -54,9б9 24,000 24,000 0,000 201,000 0,000 б,48б 15,418
28 SC:?- -5,755 0,299 0,000 б,054 0,000 -44,272 10,000 10,000 0,000 153,000 0,000 2,703 Зб,99б
29 SC:B49-Book Collection:American Book -5,884 1,383 0,000 7,2б7 0,000 -б4,907 20,000 20,000 0,000 229,000 0,000 5,405 18,501
30 SC:B26-Personality:Body -б,905 1,454 0,000 8,359 0,000 -45,820 30,000 30,000 0,000 178,000 0,000 8,108 12,333
31 SC:B189-Medical:Illness -2,035 2,3б9 0,000 4,404 0,000 -30,341 48,000 48,000 0,000 14б,000 0,000 12,973 7,708
32 SC:B6-Entertainment:Music -4,835 0,813 0,000 5,б48 0,000 -43,789 25,000 25,000 0,000 1бб,000 0,000 б,757 14,799
33 SC:A99-Financial -3,872 0,930 0,000 4,802 0,000 -37,771 1б,000 1б,000 0,000 138,000 0,000 4,324 23,127
34 SC:B48-Famous:Top 5% of Profession -2,742 0,702 0,000 3,443 0,000 -39,130 18,000 18,000 0,000 144,000 0,000 4,8б5 20,555
35 SC:A38-Politics -б,103 1,142 0,000 7,245 0,000 -53,870 27,000 27,000 0,000 201,000 0,000 7,297 13,704
Зб SC:A23-Psychological -4,55б 2,15б 0,000 б,712 0,000 -4З,9бЗ 25,000 25,000 0,000 1б7,000 0,000 б,757 14,799
37 SC:A108-Education -7,75б 1,0б4 0,000 8,820 0,000 -44,272 17,000 17,000 0,000 1б0,000 0,000 4,595 21,7бЗ
№ код кат Наименование категории Достов. идентиф. лог.анк. с учетом сходства эвр.крит Суммарное сходство/различие лог.анк., правильно или ошибочно отнесенных или не отнесенных к классу Достов. идентиф. лог.анк. с уч.количества эвр.крит Кол-во лог.анк., дейст-но относящихся к классу Количество логических анкет, правильно или ошибочно отнесенных или не отнесенных к классу Вероятн. случайного угадывания (%) =NLA/NFA Эффектив. модели по срав. со случ. угадыв. (раз)
Правиль. отнесен. Правиль. не отнес. Правиль. отнесен. Ошибочно не отнес Ощибочно отнесен. Правиль. не отнес.
1 3 4 б 6 7 В З 10 11 12 13 14 1б 16
1 SC:M- 12,199 20,494 0,211 8,139 0,054 31,351 252,000 238,000 14,000 113,000 5,000 б8,108 1,387
2 SCW- -4,842 5,043 0,207 10,898 1,220 -29,189 101,000 9б,000 5,000 234,000 35,000 27,297 3,482
3 SC:A53-Sports -12,959 б,999 0,000 19,9б8 0,010 -7б,21б 41,000 41,000 0,000 32б,000 3,000 11,081 9,024
4 SC:A1-Book Collection 4,128 4,2б2 0,475 б,341 б,б82 15,б7б 91,000 73,000 18,000 138,000 141,000 24,595 3,2б2
5 SC:A15-Famous 3,033 4,423 0,3б9 б,177 5,15б б,48б 83,000 б8,000 15,000 158,000 129,000 22,432 3,б52
б SC:A42-Medical -3,22б 10,б48 0,081 15,191 1,398 -11,351 127,000 124,000 3,000 203,000 40,000 34,324 2,845
7 SC:A323-Sexuality -11,98б б,594 0,000 19,599 1,019 -49,189 б1,000 б1,000 0,000 27б,000 33,000 1б,48б б,0бб
8 SC:A5-Entertainment -б,908 б,277 0,001 14,5б2 1,378 -38,378 80,000 79,000 1,000 255,000 35,000 21 ,б22 4,5б7
9 SC:A9-Relationship -5,б77 5,9б0 0,000 13,950 2,313 -32,973 72,000 72,000 0,000 24б,000 52,000 19,459 5,139
10 SC:A40-Occult Fields -12,577 2,204 0,045 15,791 1,055 -б1,б22 34,000 32,000 2,000 297,000 39,000 9,189 10,242
11 SC:B111 -Sports:Basketball -32,33б 3,58б 0,000 35,928 0,00б -89,189 18,000 18,000 0,000 350,000 2,000 4,8б5 20,555
12 SC:B329-Sexuality:Sexual perversions -11,279 5,995 0,000 18,288 1,015 -50,270 55,000 55,000 0,000 278,000 37,000 14,8б5 б,727
13 SC:A55-Art -б,б59 3,б5б 0,012 12,7б0 2,458 -32,432 5б,000 54,000 2,000 243,000 71,000 15,135 б,371
14 SC:A19-Writers -0,045 3,803 0,050 9,098 5,301 3,784 58,000 55,000 3,000 175,000 137,000 15,б7б б,049
15 SC:A129-Death -3,554 5,433 0,332 11,033 2,378 -18,919 95,000 82,000 13,000 207,000 б8,000 25,б7б 3,3б2
1б SC:A25-Personality -10,717 5,235 0,005 17,277 1,330 -41,081 57,000 5б,000 1,000 2б0,000 53,000 15,405 б,378
17 SC:A68-Childhood -2,545 4,249 0,0б2 8,755 2,024 -11,351 73,000 б9,000 4,000 202,000 95,000 19,730 4,791
18 SC:A31-Business -14,7б1 4,433 0,000 19,917 0,723 -б1 ,б22 45,000 45,000 0,000 299,000 2б,000 12,1 б2 8,222
19 SC:C330-Sexuality:Sexual perversions:Homosexual m -12,738 5,5б9 0,000 19,148 0,841 -54,595 51,000 51,000 0,000 28б,000 33,000 13,784 7,255
20 SC:B45-Famous:Greatest hits -2,713 2,542 0,049 9,733 4,527 -15,135 38,000 35,000 3,000 210,000 122,000 10,270 8,9б8
21 SC:A29-Parenting -9,438 4,948 0,03б 1б,313 1,9бЗ -44,324 58,000 5б,000 2,000 2б5,000 47,000 15,б7б б,159
22 SC:B173-Sports:Football -25,475 3,150 0,000 28,б51 0,02б -89,189 14,000 14,000 0,000 350,000 б,000 3,784 2б,427
23 SC:B97-Occult Fields:Astrologer -13,378 1,975 0,045 1б,б22 1,314 -б1,081 29,000 28,000 1,000 297,000 44,000 7,838 12,318
24 SC:B21-Relationship:Number of marriages -11,483 4,51б 0,000 17,922 1,923 -50,270 44,000 44,000 0,000 278,000 48,000 11,892 8,409
25 SC:B2-Book Collection:Profiles Of Women -10,307 2,920 0,001 14,б74 1,449 -52,432 3б,000 35,000 1,000 281,000 53,000 9,730 9,992
2б SC:A92-Birth -8,5б5 1,400 0,017 11,035 1,087 -5б,21б 18,000 1б,000 2,000 287,000 б5,000 4,8б5 18,271
27 SC:B14-Entertainment:Actor/ Actress -15,б22 3,8б1 0,000 20,118 0,бЗ5 -б4,324 40,000 40,000 0,000 304,000 2б,000 10,811 9,250
28 SC:?- -19,127 1,595 0,000 21,53б 0,814 -б7,5б8 17,000 17,000 0,000 310,000 43,000 4,595 21,7бЗ
29 SC:B49-Book Collection:American Book -8,б14 2,445 0,028 14,27б 3,244 -31,892 2б,000 25,000 1,000 243,000 101,000 7,027 13,б83
30 SC:B26-Personality:Body -22,5бЗ 4,804 0,004 27,743 0,380 -бб,48б 43,000 42,000 1,000 307,000 20,000 11 ,б22 8,404
31 SC:B189-Medical:Illness -11 ,бЗ1 7,422 0,099 19,740 0,787 -38,919 77,000 73,000 4,000 253,000 40,000 20,811 4,55б
32 SC:B6-Entertainment:Music -14,132 3,118 0,000 18,290 1,039 -б2,1б2 38,000 38,000 0,000 300,000 32,000 10,270 9,737
33 SC:A99-Financial -18,441 2,782 0,000 22,429 1,205 -б1,б22 27,000 27,000 0,000 299,000 44,000 7,297 13,704
34 SC:B48-Famous:Top 5% of Profession -8,880 2,б48 0,021 14,302 2,79б -41,081 31,000 30,000 1,000 2б0,000 79,000 8,378 11,551
35 SC:A38-Politics -8,б70 3,2б5 0,000 14,527 2,591 -Зб,757 34,000 34,000 0,000 253,000 83,000 9,189 10,883
Зб SC:A23-Psychological -25,082 4,304 0,000 29,б00 0,214 -73,514 34,000 34,000 0,000 321,000 15,000 9,189 10,883
37 SC:A108-Education -13,252 2,404 0,000 17,423 1,7б7 -50,811 25,000 25,000 0,000 279,000 бб,000 б,757 14,799
№ код кат Наименование категории Достов. идентиф. лог.анк. с учетом сходства эвр.крит Суммарное сходство/различие лог. анк., правильно или ошибочно отнесенных или не отнесенных к классу Достов. идентиф. лог. анк. с уч. количества эвр.крит Кол-во лог.анк., дейст-но относящихся к классу Количество логических анкет, правильно или ошибочно отнесенных или не отнесенных к классу Вероятн. случайного угадывания (%) =NLA/NFA Эффектив. модели по срав. со случ. угадыв. (раз)
Правиль. отнесен. Правиль. не отнес Правиль. отнесен. Ошибочно не отнес. Ощибочно отнесен. Правиль. не отнес.
1 3 4 б 6 7 В З 10 11 12 13 14 1б 16
1 SC:M- 7,711 13,б19 1,421 5,25б 0,7б9 10,270 252,000 1б5,000 87,000 79,000 39,000 б8,108 0,9б1
2 SCW- 3,90б 2,438 0,939 4,070 б,47б 18,378 101,000 б7,000 34,000 117,000 152,000 27,297 2,430
3 SC:A53-Sports -б,855 б,594 0,000 13,812 0,3б3 -б2,1б2 41,000 41,000 0,000 300,000 29,000 11,081 9,024
4 SC:A1-Book Collection 15,б91 2,949 1,587 2,98б 17,31б 37,838 91,000 52,000 39,000 7б,000 203,000 24,595 2,323
5 SC:A15-Famous 1б,401 3,355 1,423 2,3б9 1б,838 48,108 83,000 53,000 30,000 бб,000 221,000 22,432 2,847
б SC:A42-Medical 10,579 б,924 2,342 б,5б9 12,5бб 22,1б2 127,000 87,000 40,000 104,000 139,000 34,324 1,99б
7 SC:A323-Sexuality -3,9б2 б,159 0,128 15,819 5,825 -1б,21б б1,000 59,000 2,000 213,000 9б,000 1б,48б 5,8б7
8 SC:A5-Entertainment б,50б 3,387 0,405 4,133 7,б58 23,784 80,000 б4,000 1б,000 125,000 1б5,000 21 ,б22 3,700
9 SC:A9-Relationship 8,9бЗ 4,350 0,385 5,292 10,289 24,324 72,000 57,000 15,000 125,000 173,000 19,459 4,0б8
10 SC:A40-Occult Fields 7,972 1,311 0,497 б,112 13,270 30,270 34,000 23,000 11,000 118,000 218,000 9,189 7,3б2
11 SC:B111 -Sports:Basketball -10,301 3,5б2 0,000 14,11б 0,254 -74,595 18,000 18,000 0,000 323,000 29,000 4,8б5 20,555
12 SC:B329-Sexuality:Sexual perversions б,б09 5,417 0,035 10,47б 11,703 12,432 55,000 53,000 2,000 1б0,000 155,000 14,8б5 б,483
13 SC:A55-Art 9,94б 2,309 0,35б 4,341 12,334 30,270 5б,000 43,000 13,000 11 б,000 198,000 15,135 5,073
14 SC:A19-Writers 14,б4б 2,490 0,473 3,447 1б,07б 40,000 58,000 41,000 17,000 94,000 218,000 15,б7б 4,509
15 SC:A129-Death 10,751 3,577 2,018 4,047 13,240 23,784 95,000 57,000 38,000 103,000 172,000 25,б7б 2,337
1б SC:A25-Personality 8,545 3,597 0,б09 8,32б 13,883 20,000 57,000 44,000 13,000 135,000 178,000 15,405 5,011
17 SC:A68-Childhood 9,051 2,971 0,8б1 4,032 10,973 27,027 73,000 52,000 21,000 114,000 183,000 19,730 3,б10
18 SC:A31-Business 5,374 3,000 0,549 8,010 10,933 12,432 45,000 35,000 10,000 152,000 173,000 12,1 б2 б,395
19 SC:C330-Sexuality:Sexual perversions:Homosexual m б,591 4,958 0,023 10,189 11,845 8,б49 51,000 50,000 1,000 1б8,000 151,000 13,784 7,113
20 SC:B45-Famous:Greatest hits 15,б85 2,079 0,485 3,885 17,97б 35,б7б 38,000 2б,000 12,000 107,000 225,000 10,270 б,бб2
21 SC:A29-Parenting 7,401 3,958 0,248 б,994 10,б8б 15,135 58,000 51,000 7,000 150,000 1б2,000 15,б7б 5,б09
22 SC:B173-Sports:Football -б,370 3,090 0,000 13,72б 4,2бб -14,595 14,000 14,000 0,000 212,000 144,000 3,784 2б,427
23 SC:B97-Occult Fields:Astrologer 7,081 1,408 0,308 7,04б 13,02б 17,838 29,000 25,000 4,000 148,000 193,000 7,838 10,999
24 SC:B21-Relationship:Number of marriages 8,215 3,б09 0,134 7,785 12,525 20,811 44,000 40,000 4,000 142,000 183,000 11,892 7,б45
25 SC:B2-Book Collection:Profiles Of Women 8,97б 2,0б7 0,042 4,931 11,883 31,892 3б,000 32,000 4,000 122,000 212,000 9,730 9,13б
2б SC:A92-Birth 9,1б1 1,127 0,181 4,571 12,785 28,б49 18,000 12,000 б,000 12б,000 22б,000 4,8б5 13,703
27 SC:B14-Entertainment:Actor/ Actress 5,818 2,958 0,17б 8,028 11,0б5 17,297 40,000 35,000 5,000 148,000 182,000 10,811 8,094
28 SC:?- 1,552 1,003 0,028 9,40б 9,984 7,027 17,000 1б,000 1,000 171,000 182,000 4,595 20,483
29 SC:B49-Book Collection:American Book 13,10б 1,834 0,082 5,249 1б,б02 39,189 2б,000 23,000 3,000 109,000 234,000 7,027 12,589
30 SC:B26-Personality:Body 5,б85 3,204 0,1б7 7,б90 10,338 10,811 43,000 38,000 5,000 1б0,000 1б7,000 11 ,б22 7,б04
31 SC:B189-Medical:Illness 8,0б4 4,744 0,б07 б,005 9,931 23,243 77,000 бЇ ,000 1б,000 12б,000 1б7,000 20,811 3,807
32 SC:B6-Entertainment:Music б,72б 2,090 0,037 б,37б 11,049 13,514 38,000 34,000 4,000 15б,000 17б,000 10,270 8,712
33 SC:A99-Financial 4,002 1,б85 0,2бб б,784 9,3бб 1б,757 27,000 24,000 3,000 151,000 192,000 7,297 12,182
34 SC:B48-Famous:Top 5% of Profession 10,275 2,022 0,110 б, 187 14,550 22,1б2 31,000 28,000 3,000 141,000 198,000 8,378 10,781
35 SC:A38-Politics 14,б5б 2,708 0,030 5,919 17,898 32,432 34,000 32,000 2,000 123,000 213,000 9,189 10,242
Зб SC:A23-Psychological 2,801 2,7б8 0,240 8,88б 9,159 9,189 34,000 29,000 5,000 1бЗ,000 173,000 9,189 9,282
37 SC:A108-Education 10,741 1,б83 0,112 б,155 15,32б 29,730 25,000 21,000 4,000 12б,000 219,000 б,757 12,432
№ код кат Наименование категории Достов. идентиф. лог.анк. с учетом сходства эвр.крит Суммарное сходство/различие лог.анк., правильно или ошибочно отнесенных или не отнесенных к классу Достов. идентиф. лог.анк. с уч.количества эвр.крит Кол-во лог.анк., дейст-но относящихся к классу Количество логических анкет, правильно или ошибочно отнесенных или не отнесенных к классу Вероятн. случайного угадывания (%) =NLA/NFA Эффектив. модели по срав. со случ. угадыв. (раз)
Правиль. отнесен. Правиль. не отнес Правиль. отнесен. Ошибочно не отнес Ощибочно отнесен. Правиль. не отнес
1 3 4 б 6 7 В З 10 11 12 13 14 1б 16
1 SC:M- 1,348 2,272 0,б09 0,734 0,419 1б,757 252,000 158,000 94,000 б0,000 58,000 б8,108 0,921
2 SCW- 0,097 0,114 0,037 0,21б 0,237 5,405 101,000 71,000 30,000 145,000 124,000 27,297 2,575
3 SC:A53-Sports -0,792 4,0б0 0,010 б,898 2,05б -2б,48б 41,000 40,000 1,000 233,000 9б,000 11,081 8,804
4 SC:A1-Book Collection -0,448 0,098 0,039 0,550 0,043 -43,784 91,000 52,000 39,000 227,000 52,000 24,595 2,323
5 SC:A15-Famous -0,0б5 0,0б1 0,004 0,178 0,05б -10,000 82,000 72,000 10,000 193,000 94,000 22,1б2 3,9б2
б SC:A42-Medical 0,394 0,285 0,13б 0,318 0,5б2 20,541 127,000 82,000 45,000 102,000 141,000 34,324 1,881
7 SC:A323-Sexuality 1,0б9 1,87б 0,039 3,772 3,004 б,48б б1,000 57,000 4,000 1б9,000 140,000 1б,48б 5,бб8
8 SC:A5-Entertainment 1,139 0,бб7 0,105 0,98б 1,5б2 17,838 80,000 б2,000 18,000 134,000 15б,000 21 ,б22 3,584
9 SC:A9-Relationship 1,330 0,597 0,057 0,874 1,бб5 27,297 72,000 57,000 15,000 119,000 178,000 19,459 4,0б8
10 SC:A40-Occult Fields 0,572 0,12б 0,059 0,719 1,224 14,054 34,000 23,000 11,000 148,000 188,000 9,189 7,3б2
11 SC:B111 -Sports:Basketball -4,557 1,285 0,233 9,б24 4,015 -33,514 18,000 1б,000 2,000 245,000 107,000 4,8б5 18,271
12 SC:B329-Sexuality:Sexual perversions 1,243 1,7б9 0,002 3,700 3,17б 7,5б8 55,000 54,000 1,000 170,000 145,000 14,8б5 б,б05
13 SC:A55-Art 1,058 0,243 0,075 0,б25 1,514 23,243 5б,000 38,000 18,000 124,000 190,000 15,135 4,483
14 SC:A19-Writers 2,118 0,271 0,08б 0,42б 2,359 35,б7б 58,000 34,000 24,000 95,000 217,000 15,б7б 3,740
15 SC:A129-Death -0,3бб 0,1б7 0,052 0,б00 0,119 -2б,757 94,000 б9,000 25,000 209,000 бб,000 25,405 2,889
1б SC:A25-Personality 1,102 0,3бб 0,083 0,879 1,б99 18,378 57,000 39,000 18,000 133,000 180,000 15,405 4,441
17 SC:A68-Childhood 0,777 0,197 0,070 0,279 0,928 35,135 73,000 4б,000 27,000 93,000 204,000 19,730 3,194
18 SC:A31-Business 0,951 0,707 0,081 1,8б8 2,193 7,5б8 45,000 3б,000 9,000 1б2,000 1бЗ,000 12,1 б2 б,578
19 SC:C330-Sexuality:Sexual perversions:Homosexual m 1,302 1,402 0,003 3,083 2,98б 5,405 51,000 50,000 1,000 174,000 145,000 13,784 7,113
20 SC:B45-Famous:Greatest hits 1,198 0,123 0,047 0,2б4 1,38б 38,108 38,000 2б,000 12,000 102,000 229,000 10,270 б,бб2
21 SC:A29-Parenting 1,257 0,б57 0,0б8 1,302 1,970 14,595 58,000 49,000 9,000 149,000 1бЗ,000 15,б7б 5,389
22 SC:B173-Sports:Football 5,873 2,840 0,095 7,583 10,711 18,378 14,000 12,000 2,000 149,000 207,000 3,784 22,б52
23 SC:B97-Occult Fields:Astrologer 1,197 0,212 0,073 1,141 2,198 7,027 29,000 22,000 7,000 1б5,000 17б,000 7,838 9,б79
24 SC:B21-Relationship:Number of marriages 1,912 0,734 0,034 1,709 2,921 20,000 44,000 40,000 4,000 144,000 182,000 11,892 7,б45
25 SC:B2-Book Collection:Profiles Of Women 1,208 0,235 0,019 0,б49 1,б42 28,б49 3б,000 28,000 8,000 124,000 210,000 9,730 7,994
2б SC:A92-Birth 2,827 0,328 0,090 1,2б2 3,850 32,432 18,000 10,000 8,000 117,000 235,000 4,8б5 11,419
27 SC:B14-Entertainment:Actor/ Actress 0,7б4 0,4б5 0,033 1,530 1,8б2 10,270 40,000 31,000 9,000 157,000 173,000 10,811 7,1б9
28 SC:?- 0,090 0,187 0,020 1,908 1,831 1,б22 17,000 14,000 3,000 179,000 174,000 4,595 17,922
29 SC:B49-Book Collection:American Book 4,24б 0,494 0,053 1,415 5,221 42,1б2 2б,000 20,000 б,000 101,000 243,000 7,027 10,947
30 SC:B26-Personality:Body 0,б95 0,бЗ1 0,041 1,8б2 1,9б7 9,189 43,000 37,000 б,000 1б2,000 1б5,000 11 ,б22 7,404
31 SC:B189-Medical:Illness 1,512 0,848 0,201 1,219 2,083 20,541 77,000 57,000 20,000 127,000 1бб,000 20,811 3,557
32 SC:B6-Entertainment:Music 1,074 0,253 0,037 0,992 1,850 1б,757 38,000 2б,000 12,000 142,000 190,000 10,270 б,бб2
33 SC:A99-Financial 0,721 0,283 0,057 1,444 1,939 10,270 27,000 22,000 5,000 1б1,000 182,000 7,297 11,1бб
34 SC:B48-Famous:Top 5% of Profession 1,б87 0,24б 0,030 0,827 2,299 23,784 31,000 25,000 б,000 135,000 204,000 8,378 9,б2б
35 SC:A38-Politics 2,385 0,302 0,010 0,б9б 2,788 40,541 34,000 31,000 3,000 107,000 229,000 9,189 9,922
Зб SC:A23-Psychological 0,195 0,82б 0,08б 2,955 2,410 2,1б2 34,000 29,000 5,000 17б,000 1б0,000 9,189 9,282
37 SC:A108-Education 2,212 0,288 0,025 1,1б1 3,110 30,б23 25,000 21,000 4,000 124,000 220,000 б,757 12,432
Таблица 15 - ОЦЕНКИ ДОСТОВЕРНОСТИ РАСПОЗНАВАНИЯ ТЕСТИРУЮЩЕЙ ВЫБОРКИ В РЕЖИМЕ СКОРОСТНОГО РАСПОЗНАВАНИЯ (С ИСПОЛЬЗОВАНИЕМ АПРИОРНОЙ ИНФОРМАЦИИ О ДОСТОВЕРНОСТИ ИДЕНТИФИКАЦИИ КАТЕГОРИЙ В ЧАСТНЫХ МОДЕЛЯХ)
№ код кат Наименование категории Достов. идентиф. лог.анк. с учетом сходства эвр.крит Суммарное сходство/различие лог.анк, правильно или ошибочно отнесенных или не отнесенных к классу Достов. идентиф. лог.анк. с уч.количества эвр.крит Кол-во лог.анк., дейст-но относящихся к классу Количество логических анкет, правильно или ошибочно отнесенных или не отнесенных к классу Вероятн. случайного угадывания (%) =NLA/NFA Эффектив. модели по срав. со случ. угадыв. (раз)
Правиль. отнесен. Правиль. не отнес. Правиль. отнесен. Ошибочно не отнес. Ощибочно отнесен. Правиль. не отнес
1 3 4 б 6 7 В З 10 11 12 13 14 1б 16
1 SC:M- 7,902 13,957 1,45б 5,38б 0,788 10,270 252,000 1б5,000 87,000 79,000 39,000 б8,108 0,9б1
2 SCW- 3,90б 2,438 0,939 4,070 б,47б 18,378 101,000 б7,000 34,000 117,000 152,000 27,297 2,430
3 SC:A53-Sports -7,025 б,758 0,000 14,155 0,372 -б2,1б2 41,000 41,000 0,000 300,000 29,000 11,081 9,024
4 SC:A1-Book Collection 15,б91 2,949 1,587 2,98б 17,31б 37,838 91,000 52,000 39,000 7б,000 203,000 24,595 2,323
5 SC:A15-Famous 1б,401 3,355 1,423 2,3б9 1б,838 48,108 83,000 53,000 30,000 бб,000 221,000 22,432 2,847
б SC:A42-Medical 10,579 б,924 2,342 б,5б9 12,5бб 22,1б2 127,000 87,000 40,000 104,000 139,000 34,324 1,99б
7 SC:A323-Sexuality -3,9б2 б,159 0,128 15,819 5,825 -1б,21б б1,000 59,000 2,000 213,000 9б,000 1б,48б 5,8б7
8 SC:A5-Entertainment б,50б 3,387 0,405 4,133 7,б58 23,784 80,000 б4,000 1б,000 125,000 1б5,000 21 ,б22 3,700
9 SC:A9-Relationship 8,9бЗ 4,350 0,385 5,292 10,289 24,324 72,000 57,000 15,000 125,000 173,000 19,459 4,0б8
10 SC:A40-Occult Fields 7,972 1,311 0,497 б,112 13,270 30,270 34,000 23,000 11,000 118,000 218,000 9,189 7,3б2
11 SC:B111 -Sports:Basketball -10,55б 3,б50 0,000 14,4бб 0,2б0 -74,595 18,000 18,000 0,000 323,000 29,000 4,8б5 20,555
12 SC:B329-Sexuality:Sexual perversions б,б09 5,417 0,035 10,47б 11,703 12,432 55,000 53,000 2,000 1б0,000 155,000 14,8б5 б,483
13 SC:A55-Art 9,94б 2,309 0,35б 4,341 12,334 30,270 5б,000 43,000 13,000 11 б,000 198,000 15,135 5,073
14 SC:A19-Writers 14,б4б 2,490 0,473 3,447 1б,07б 40,000 58,000 41,000 17,000 94,000 218,000 15,б7б 4,509
15 SC:A129-Death 10,751 3,577 2,018 4,047 13,240 23,784 95,000 57,000 38,000 103,000 172,000 25,б7б 2,337
1б SC:A25-Personality 8,545 3,597 0,б09 8,32б 13,883 20,000 57,000 44,000 13,000 135,000 178,000 15,405 5,011
17 SC:A68-Childhood 9,051 2,971 0,8б1 4,032 10,973 27,027 73,000 52,000 21,000 114,000 183,000 19,730 3,б10
18 SC:A31-Business 5,374 3,000 0,549 8,010 10,933 12,432 45,000 35,000 10,000 152,000 173,000 12,1 б2 б,395
19 SC:C330-Sexuality:Sexual perversions:Homosexual m б,591 4,958 0,023 10,189 11,845 8,б49 51,000 50,000 1,000 1б8,000 151,000 13,784 7,113
20 SC:B45-Famous:Greatest hits 15,б85 2,079 0,485 3,885 17,97б 35,б7б 38,000 2б,000 12,000 107,000 225,000 10,270 б,бб2
21 SC:A29-Parenting 7,401 3,958 0,248 б,994 10,б8б 15,135 58,000 51,000 7,000 150,000 1б2,000 15,б7б 5,б09
22 SC:B173-Sports:Football -б,370 3,090 0,000 13,72б 4,2бб -14,595 14,000 14,000 0,000 212,000 144,000 3,784 2б,427
23 SC:B97-Occult Fields:Astrologer 7,081 1,408 0,308 7,04б 13,02б 17,838 29,000 25,000 4,000 148,000 193,000 7,838 10,999
24 SC:B21-Relationship:Number of marriages 8,215 3,б09 0,134 7,785 12,525 20,811 44,000 40,000 4,000 142,000 183,000 11,892 7,б45
25 SC:B2-Book Collection:Profiles Of Women 8,97б 2,0б7 0,042 4,931 11,883 31,892 3б,000 32,000 4,000 122,000 212,000 9,730 9,13б
2б SC:A92-Birth 9,1б1 1,127 0,181 4,571 12,785 28,б49 18,000 12,000 б,000 12б,000 22б,000 4,8б5 13,703
27 SC:B14-Entertainment:Actor/ Actress 5,818 2,958 0,17б 8,028 11,0б5 17,297 40,000 35,000 5,000 148,000 182,000 10,811 8,094
28 SC:?- 1,552 1,003 0,028 9,40б 9,984 7,027 17,000 1б,000 1,000 171,000 182,000 4,595 20,483
29 SC:B49-Book Collection:American Book 13,10б 1,834 0,082 5,249 1б,б02 39,189 2б,000 23,000 3,000 109,000 234,000 7,027 12,589
30 SC:B26-Personality:Body 5,б85 3,204 0,1б7 7,б90 10,338 10,811 43,000 38,000 5,000 1б0,000 1б7,000 11 ,б22 7,б04
31 SC:B189-Medical:Illness 8,0б4 4,744 0,б07 б,005 9,931 23,243 77,000 бЇ ,000 1б,000 12б,000 1б7,000 20,811 3,807
32 SC:B6-Entertainment:Music б,72б 2,090 0,037 б,37б 11,049 13,514 38,000 34,000 4,000 15б,000 17б,000 10,270 8,712
33 SC:A99-Financial 4,002 1,б85 0,2бб б,784 9,3бб 1б,757 27,000 24,000 3,000 151,000 192,000 7,297 12,182
34 SC:B48-Famous:Top 5% of Profession 10,275 2,022 0,110 б, 187 14,550 22,1б2 31,000 28,000 3,000 141,000 198,000 8,378 10,781
35 SC:A38-Politics 14,б5б 2,708 0,030 5,919 17,898 32,432 34,000 32,000 2,000 123,000 213,000 9,189 10,242
Зб SC:A23-Psychological 2,801 2,7б8 0,240 8,88б 9,159 9,189 34,000 29,000 5,000 1бЗ,000 173,000 9,189 9,282
37 SC:A108-Education 10,741 1,б83 0,112 б,155 15,32б 29,730 25,000 21,000 4,000 12б,000 219,000 б,757 12,432
ФОРМУЛЫ РАСЧЕТА ПОКАЗАТЕЛЕЙ ДИФФЕРЕНЦИАЛЬНОЙ ВАЛИДНОСТИ (ПО КЛАССАМ):
C04[k] = C05[k] - C06[k] - C07[k] + C08[k]
C09[k] = ( C11[k] - C12[k] - C13[k] + C14[k] ) / ( C11[k] + C12[k] + C13[k] + C14[k] ) * 100
C10[k] = C11[k] + C12[k]
C15[k] = C10[k] / NFiz * 100
C16[k] = C09[k] / C15[k]
где k - класс (соответствует строке)
где NFiz - суммарное количество физических анкет (объектов) в распознаваемой выборке
ФОРМУЛЫ РАСЧЕТА ПОКАЗАТЕЛЕЙ ИНТЕГРАЛЬНОЙ ВАЛИДНОСТИ (СРЕДНЕВЗВЕШЕННОЕ ПО ВСЕМ КЛАССАМ):
Ci = СУММА_по_М Ci[k] * C10[k] ) / NLog
где i = { 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 }
где NLog = СУММА по k(C10[k]) - суммарное количество логических анкет в распознаваемой выборке
ПРИМЕЧАНИЕ: учтены только результаты идентификации с модулем сходства не менее: 0
Итак, в мультимодели, основанной на солидной базе прецедентов (20007 респондентов) с огромной статистической представительностью категорий (не менее 1000 респондентов на категорию), получены результаты идентификации респондентов тестирующей выборки из 370 респондентов, подобранных таким образом, чтобы их было не менее 10 на категорию.
Полученные результаты идентификации подтверждают, что (см. таблицы 9-14):
1. В созданной с помощью системы "Эйдос-астра" мультимодели выявлены зависимости между астропризнаками респондентов на момент их рождения и принадлежностью этих респондентов к обобщенным социальным категориям (типам).
2. Эти зависимости имеют такую силу, что их знание, по-видимому, может быть успешно использовано для идентификации респондентов по категориям.
3. Методы голосования моделей (коллективы решающих правил) позволяют повысить достоверность полученных результатов идентификации до 21 %, по сравнению с наихудшими частными моделями, поэтому это может представлять не только чисто научный, но, по-видимому, и практический интерес. Полученные результаты показывают, что достоверность идентификации с помощью мультимодели часто в 2,5 раза, а иногда - и в десятки раз превышает вероятность случайного угадывания, значит, их достоверность, как статистических высказываний, в этих случаях выше 95 %.
4. Выявлены категории, по которым уровень достоверности идентификации особенно высок или очень низкий. С учетом этого, предлагается при отнесении респондента системой к категориям второго типа не принимать эти результаты слишком серьезно.
5. Результаты экспериментального тестирования посетителей форума и обращающихся за консультациями в фирму: A&E Trounev IT Consulting (Canada, Toronto) показали, что научные исследования и разработки, описанные в данной статье и работах [8, 13-19], представляют не только научный, но и практический интерес, т.к. совпадение прогноза с фактом является довольно высоким и вполне очевидным как для консультанта, так и для его клиентов.
Некоторые результаты исследования модели
Формулы астросоциотипологии (информационные портреты астросоциотипов, семантические портреты астропризнаков, нелокальные нейроны) [8, 13, 19].
Естественно будет разумным и обоснованным, если формулы астросоциотипологии по каждой из категорий получать в той частной модели, в которой она идентифицируется с наивысшей достоверностью из всех исследованных частных моделей, т.е. с учетом информации, приведенной в таблице 8. В связи с ограниченным объемом данной статьи в качестве примеров приведем не все нелокальные нейроны, а только полученные в тех частных моделях, в которых их не менее двух (таблица 16).
Таблица 16 - НЕЛОКАЛЬНЫЕ НЕЙРОНЫ, СГЕНЕРИРОВАННЫЕ СИСТЕМОЙ "ЭЙДОС-АСТРА”, ОТРАЖАЮЩИЕ ВЛИЯНИЕ АСТРОПРИЗНАКОВ НА ПРИНАДЛЕЖНОСТЬ ОБЛАДАЮЩИХ ИМИ РЕСПОНДЕНТОВ К ОБОБЩЕННЫМ АСТРОСОЦИОТИПАМ
Продолжение таблицы 16
№ Наименование модели Количество категорий, для идентификации которых модель оказалась наилучшей Коды категорий
1 128 4 18,26, 29,37
CopuRialit (с) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo *340217. All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [18] - SCiАЗ 1-Вusiness
JUPITERLOH-ll
CopuRialit tc) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo 340217, All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [26] - SC J A92-Birt h
(IRRNUSLON-aS
№ Наименование модели Количество категорий, для идентификации которых модель оказалась наилучшей Коды категорий
4 108 2 12,19
Продолжение таблицы 16
CopuRialit (с) Scientific & industrial enterprise AIDOS, Russia, 1373-2O03. Russian Patent Mo 340217, All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [12] - SCJB329-Sexuality:Sexual perversions
URAHUSL0H-C1S
I Возбуждение:
Торможение:
U I Бес сбязи - толщина линии|
CopuRialit Сс) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo 340217, All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА І [IS] - SC:C330-Sexuality:Sexual peruersions: Homosexual m
URAHUSLOH - [1081
URAHUSLOH-
I Возбуждение:
Торможение: -
I Бес сбязи - толщина линии|
№ Наименование модели Количество категорий, для идентификации которых модель оказалась наилучшей Коды категорий
5 148 2 25, 32
Продолжение таблицы 16
CopuRialit Сс) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo *340217. All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [32] - SCiB6-EntertainmentiMusi с
MCICMLCIN-1H81
I Возбуждение:- Торможение:-
I Бес сбязи - толщина линии|
№ Наименование модели Количество категорий, для идентификации которых модель оказалась наилучшей Коды категорий
6 152 2 2, 8
Продолжение таблицы 16
CopuRialit Сс) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo 340217, All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [8] - SCtA5-Entertainment
NEPIUHELOH- [152]
NEPTUHELOH-
|Возбуждение:
Торможение: -
I Бес сбязи - толщина линии|
№ Наименование модели Количество категорий, для идентификации которых модель оказалась наилучшей Коды категорий
7 153 2 27, 34
Продолжение таблицы 16
CopuRiglit Сс) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo 340217, All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [34] - SCiB48-FamoustTop 5% of Profession
YEHUSL0H“[I53]
MERCUR4L0H - [1531 MERCUR4L0H - [1531:
PLUIOLON "11533 PLUIOLON41533j^<3 *
(«9
PLUTOLOH-H531 PLUTOL0hT-U53^ (2
PLUIOLON-1153] PLJIOLON41533^f2 PLUIOLON-C1531
|Возбуждение:
Торможение: -
I Бес сбязи - толщина линии|
№ Наименование модели Количество категорий, для идентификации которых модель оказалась наилучшей Коды категорий
8 160 2 9, 14
Продолжение таблицы 16
CopuRialit Сс) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo *340217. All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [14] - SCJA19-Writers
NEPIUHELOH-[1601
|Возбуждение:
Торможение: -
I Бес сбязи - толщина линии|
№ Наименование модели Количество категорий, для идентификации которых модель оказалась наилучшей Коды категорий
9 163 2 24, 28
Продолжение таблицы 16
CopuRiglit Сс) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo 340217. All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [24] - SCiB21-RelationshiptNumber of marriages
PLUIOLON-не;
|Возбуждение:
Торможение:
U I Бес сбязи - толщина линии|
CopuRiglit Сс) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo 340217. All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I
[28] - sc:?-
URAHUSLOH - [1631
URAHUSLOH-
|Возбуждение:
Торможение: -
I Бес сбязи - толщина линии|
№ Наименование модели Количество категорий, для идентификации которых модель оказалась наилучшей Коды категорий
10 165 2 13, 33
Окончание таблицы 16
CopuRiglit Сс) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo 340217. All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [13] - SC t A5 5-Art
NEPIUHELOH-[I
|Возбуждение:
Торможение:
U I Бес сбязи - толщина линии|
CopuRiglit Сс) Scientific & industrial enterprise AIDOS, Russia, 1373-2Q03. Russian Patent Mo 340217. All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА I [33] - sc:A99-Financial
MERCURtfLON-l:
|Возбуждение:
Торможение: -
I Бес сбязи - толщина линии|
В таблице 16 изображения нелокальных нейронов не очень читабельны и для их детального просмотра рекомендуется считать doc-файл статьи и просматривать его в увеличенном масштабе (200-250 %).
Каждый астропризнак несет определенное количество информации о принадлежности или непринадлежности обладающего им респондента к той или иной обобщенной социальной категории. Астропризнаки, несущие информацию о принадлежности (способствующие факторы), соединены с центром красными линиями, а о непринадлежности - синим (препятствующие факторы). Таким образом, цвет линии несет информацию о знаке или направлении влияния астропризнака. Толщина линии отражает силу влияния данного астропризнака: чем толще линия, тем сильнее влияние. На каждой линии в маленьком кружочке сила и знак влияния указаны в виде числа, представляющего собой процент от теоретически-максимально-возможной (ТМВ) силы влияния. ТМВ сила влияния полностью определяется количеством обобщенных категорий в модели и представляет собой просто количество информации, которое мы получаем, когда точно узнаем, что респондент относится к той или иной категории. Это количество информации рассчитывается по формуле Хартли для количества информации как двоичный логарифм от количества категорий. В нашем случае во всех частных моделях исследовалось 37 категорий, поэтому ТМВ-сила влияния равна Log2(37)=5.209 бит.
Каждому нелокальному нейрону соответствует информационный потрет обобщенной социальной категории (класса, социотипа), который выводится системой "Эй-дос" в текстовой и графической форме. В текстовой форме информация может быть представлена полнее, чем в графической (больше астропризнаков, точнее сила влияния), но менее наглядно, поэтому в графической форме отображается наиболее значимая информация, а незначимая отфильтровывается. Для примера приведем полностью информационные портреты социотипов с кодами: "к1", "к3" и "к11" из частной модели с двумя секторами, в которой они идентифицируются с наивысшей достоверностью из всех изученных частных моделей (таблицы 17, 18, 19). Для примера выбрана модель именно с двумя секторами, т.к. в этой модели размерность информационных портретов классов самая низкая.
В информационных портретах цветом отмечены астропризнаки, отображенные в нелокальных нейронах:
- светло-желтым - астропризнаки, способствующие принадлежности респондента к данному социотипу;
- а светло-зеленым - препятствующие.
Незначимые признаки можно отфильтровывать из информационных портретов по порогу, заданному в диалоге. Кроме того, в системе "Эйдос" реализованы другие различные виды фильтрации, которые удобно использовать при исследованиях модели.
Таблица 17 - ИНФОРМАЦИОННЫЙ ПОРТРЕТ СОЦИОТИПА:
КОД: 1, НАИМЕНОВ АНИЕ: 8С:М-
№ Код астропризнака Наименование астропризнака Количество информации в астропризнаке о принадлежности обладающего им респондента к социотипу
Бит % от ТМВ силы влияния
1 18 МЕРТиМЕиЭ1\1-[2]: {180.000, 360.000} 0,07319 1,40
2 15 иРЛМивКЭМ-И: {0.000, 180.000} 0,05108 0,98
3 21 1\ЮОЕ1.ОМ-[2]: {0.000, 180.000} 0,04514 0,87
4 14 8ЛТиР1\1иЭМ-[2]: {180.000, 360.000} 0,04132 0,79
5 11 Л1Р!ТЕРиО1\1-[2]: {0.000, 180.000} 0,04089 0,78
6 8 УЕ1\1и8иОМ-[2]: {180.000, 360.000} 0,03588 0,69
7 2 8и1\11.ОМ-[2]: {180.000, 360.000} 0,03502 0,67
8 6 МЕРСиРУ1_О1\1-[21: {180.000, 360.000} 0,03332 0,64
9 19 Р1_иТО1_ОМ-[2]: {0.000, 180.000} 0,03247 0,62
10 10 МЛР81_О1\1-[2]: {180.000, 360.000} 0,03160 0,61
11 4 МОО1\И-О1\1-[2]: {180.000, 360.000} 0,03063 0,59
12 3 МОО1\И-О1\1-[2]: {0.000, 180.000} 0,03048 0,59
13 9 МЛР8ЮЫ-[2]: {0.000, 180.000} 0,02961 0,57
14 5 МЕРСиРУиЭ1\1-[2]: {0.000, 180.000} 0,02731 0,52
15 1 8имиЭ1\1-[2]: {0.000, 180.000} 0,02604 0,50
16 7 УЕ1\1и8иЭМ-[2]: {0.000, 180.000} 0,02543 0,49
17 12 Л1Р!ТЕР1_О1\1-[2]: {180.000, 360.000} 0,02028 0,39
18 13 8ЛТиР1\1иЭМ-[2]: {0.000, 180.000} 0,01785 0,34
19 22 МООЕиЭ1\1-[2]: {180.000, 360.000} 0,01258 0,24
20 20 РШТО1_О1\1-[2]: {180.000, 360.000} -0,00080 -0,02
21 16 иРЛ1\1и8иЭМ-[2]: {180.000, 360.000} -0,01386 -0,27
22 17 МЕРТиМЕиЭ1\1-[2]: {0.000, 180.000} -0,01626 -0,31
23 24 НО118Е1-[2]: {180.000, 360.000} -0,03646 -0,70
24 35 НО118Е7-[2]: {0.000, 180.000} -0,03646 -0,70
25 33 НО118Е6-[2]: {0.000, 180.000} -0,03846 -0,74
26 46 НО118Е12-[2]: {180.000, 360.000} -0,03846 -0,74
27 26 НО118Е2-[2]: {180.000, 360.000} -0,03923 -0,75
28 37 НО118Е8-[2]: {0.000, 180.000} -0,03923 -0,75
29 32 НО118Е5-[2]: {180.000, 360.000} -0,03989 -0,77
30 43 НО118Е11-[2]: {0.000, 180.000} -0,03989 -0,77
31 30 НО118Е4-[2]: {180.000, 360.000} -0,04065 -0,78
32 41 НО118Е10-[2]: {0.000, 180.000} -0,04065 -0,78
33 28 НО118Е3-[2]: {180.000, 360.000} -0,04078 -0,78
34 39 НО118Е9-[2]: {0.000, 180.000} -0,04078 -0,78
35 27 НО118Е3-[2]: {0.000, 180.000} -0,04222 -0,81
36 40 НО118Е9-[2]: {180.000, 360.000} -0,04222 -0,81
37 29 НО118Е4-[2]: {0.000, 180.000} -0,04235 -0,81
38 42 НО118Е10-[2]: {180.000, 360.000} -0,04235 -0,81
39 31 НО118Е5-[2]: {0.000, 180.000} -0,04311 -0,83
40 44 НО118Е11-[2]: {180.000, 360.000} -0,04311 -0,83
41 25 НОЫ8Е2-[2]: {0.000, 180.000} -0,04372 -0,84
42 38 НОЫ8Е8-[2]: {180.000, 360.000} -0,04372 -0,84
43 34 НО118Е6-[2]: {180.000, 360.000} -0,04454 -0,85
44 45 НО118Е12-[2]: {0.000, 180.000} -0,04454 -0,85
45 23 НО118Е1-[2]: {0.000, 180.000} -0,04648 -0,89
46 36 НОУ8Е7-[2]: {180.000, 360.000} -0,04648 -0,89
Таблица 18 - ИНФОРМАЦИОННЫЙ ПОРТРЕТ СОЦИОТИПА:
КОД: 3 НАИМЕНОВАНИ [Е: 8С:Л53-8РОЯТ8
№ Код астропризнака Наименование астропризнака Количество информации в астропризнаке о принадлежности обладающего им респондента к социотипу
Бит % от ТМВ силы влияния
1 18 МЕРТиМЕиЭ1\1-[2]: {180.000, 360.000} 0,31917 6,13
2 15 иРЛ1\1и81_ОМ-[2]: {0.000, 180.000} 0,23902 4,59
3 21 ЫООЕЮЫ-И: {0.000, 180.000} 0,23464 4,50
4 14 8ЛТиР1\1иЭМ-[2]: {180.000, 360.000} 0,20631 3,96
5 11 Л1Р!ТЕРиЭ1\1-[2]: {0.000, 180.000} 0,20625 3,96
6 19 РШТОЮЫ-^]: {0.000, 180.000} 0,18770 3,60
7 3 МООЫ1ОЫ-[2]: {0.000, 180.000} 0,17549 3,37
8 9 МЛР8ЮЫ-[2]: {0.000, 180.000} 0,17428 3,35
9 6 МЕРСиРУ1_О1\1-[2]: {180.000, 360.000} 0,17383 3,34
10 8 УЕ1\1и8иЭМ-[2]: {180.000, 360.000} 0,16941 3,25
11 2 8иЫ1ОЫ-[2]: {180.000, 360.000} 0,16806 3,23
12 1 8иЫ1ОЫ-[2]: {0.000, 180.000} 0,16637 3,19
13 7 УЕЫи81ОЫ-[2]: {0.000, 180.000} 0,16512 3,17
14 5 МЕРСиРУЮЫ-[2]: {0.000, 180.000} 0,15939 3,06
15 10 МЛР81_О1\1-[2]: {180.000, 360.000} 0,15925 3,06
16 4 МООЫ1ОЫ-[2]: {180.000, 360.000} 0,15883 3,05
17 12 ииР!ТЕРЮЫ-[2]: {180.000, 360.000} 0,12504 2,40
18 13 8ЛТиР1\1иЭМ-[2]: {0.000, 180.000} 0,11667 2,24
19 22 МООЕиЭ1\1-[2]: {180.000, 360.000} 0,06733 1,29
20 16 иРЛМи81ОЫ-[2]: {180.000, 360.000} -0,03873 -0,74
21 17 ЫЕРТиЫЕиЭМ-И: {0.000, 180.000} -0,08793 -1,69
22 26 НОи8Е2-[2]: {180.000, 360.000} -0,43921 -8,43
23 37 НОи8Е8-[2]: {0.000, 180.000} -0,43921 -8,43
24 30 НОи8Е4-[2]: {180.000, 360.000} -0,44470 -8,54
25 41 НОи8Е10-[2]: {0.000, 180.000} -0,44470 -8,54
26 24 НОи8Е1-[2]: {180.000, 360.000} -0,44503 -8,54
27 35 НОи8Е7-[2]: {0.000, 180.000} -0,44503 -8,54
28 28 НОи8Е3-[2]: {180.000, 360.000} -0,44749 -8,59
29 39 НОи8Е9-[2]: {0.000, 180.000} -0,44749 -8,59
30 33 НОи8Е6-[2]: {0.000, 180.000} -0,45989 -8,83
31 46 НОи8Е12-[2]: {180.000, 360.000} -0,45989 -8,83
32 31 НОи8Е5-[2]: {0.000, 180.000} -0,46119 -8,85
33 44 НОи8Е11-[2]: {180.000, 360.000} -0,46119 -8,85
34 32 НОи8Е5-[2]: {180.000, 360.000} -0,46357 -8,90
35 43 НОи8Е11-[2]: {0.000, 180.000} -0,46357 -8,90
36 34 НОи8Е6-[2]: {180.000, 360.000} -0,46483 -8,92
37 45 НОи8Е12-[2]: {0.000, 180.000} -0,46483 -8,92
38 27 НОи8Е3-[2]: {0.000, 180.000} -0,47743 -9,16
39 40 НОи8Е9-[2]: {180.000, 360.000} -0,47743 -9,16
40 23 НОи8Е1-[2]: {0.000, 180.000} -0,48004 -9,21
41 36 НОи8Е7-[2]: {180.000, 360.000} -0,48004 -9,21
42 29 НОи8Е4-[2]: {0.000, 180.000} -0,48058 -9,23
43 42 НОи8Е10-[2]: {180.000, 360.000} -0,48058 -9,23
44 25 НОи8Е2-[2]: {0.000, 180.000} -0,48621 -9,33
45 38 НОи8Е8-[2]: {180.000, 360.000} -0,48621 -9,33
46 20 Р1иТОЮЫ-[2]: {180.000, 360.000} -0,68887 -13,22
Таблица 19 - ИНФОРМАЦИОННЫЙ ПОРТРЕТ СОЦИОТИПА: КОД: 11 НАИМЕНОВАНИЕ: 8С:Б111-8РОКТ8:БА8КЕТБАЬЬ
№ Код астропризнака Наименование астропризнака Количество информации в астропризнаке о принадлежности обладающего им респондента к социотипу
Бит % от ТМВ силы влияния
1 18 МЕРТиМЕиЭ1\1-[2]: {180.000, 360.000} 0,30362 5,83
2 15 иРА1\1и81_ОМ-[2]: {0.000, 180.000} 0,29435 5,65
3 14 8АТиР1\И-О1\1-[2]: {180.000, 360.000} 0,26110 5,01
4 9 МАР8иЭ1\1-[2]: {0.000, 180.000} 0,23401 4,49
5 19 Р1_иТО1-ОМ-[2]: {0.000, 180.000} 0,23379 4,49
6 21 ЫООЕЮЫ-И: {0.000, 180.000} 0,22750 4,37
7 1 8и1\11.ОМ-[2]: {0.000, 180.000} 0,22264 4,27
8 5 МЕРСиРУ1_О1\1-[2]: {0.000, 180.000} 0,22139 4,25
9 3 МООЫ1ОЫ-[2]: {0.000, 180.000} 0,22126 4,25
10 11 Л1Р!ТЕР1_ОМ-[2]: {0.000, 180.000} 0,21771 4,18
11 7 УЕ1\1и8иЭМ-[2]: {0.000, 180.000} 0,21395 4,11
12 8 УЕ1\1и8иЭМ-[2]: {180.000, 360.000} 0,20962 4,02
13 12 Л1Р!ТЕР1_О1\1-[2]: {180.000, 360.000} 0,20609 3,96
14 6 МЕРСиРУиЭ1\1-[2]: {180.000, 360.000} 0,20341 3,90
15 4 МООЫ1ОЫ-[2]: {180.000, 360.000} 0,20228 3,88
16 2 8иЫ1ОЫ-[2]: {180.000, 360.000} 0,20070 3,85
17 22 МООЕиЭ1\1-[2]: {180.000, 360.000} 0,19249 3,70
18 10 МАР81_О1\1-[2]: {180.000, 360.000} 0,18571 3,56
19 13 8АТиРЫ1ОЫ-[2]: {0.000, 180.000} 0,14591 2,80
20 17 МЕРТиМЕиЭ1\1-[2]: {0.000, 180.000} 0,09296 1,78
21 16 иРАЫи81ОЫ-[2]: {180.000, 360.000} -0,04354 -0,84
22 20 РШТО1_О1\1-[2]: {180.000, 360.000} -1,08765 -20,88
23 27 НОи8Е3-[2]: {0.000, 180.000} -1,27418 -24,46
24 40 НОи8Е9-[2]: {180.000, 360.000} -1,27418 -24,46
25 34 НОи8Е6-[2]: {180.000, 360.000} -1,29642 -24,89
26 45 НОи8Е12-[2]: {0.000, 180.000} -1,29642 -24,89
27 25 НОи8Е2-[2]: {0.000, 180.000} -1,30046 -24,96
28 38 НОи8Е8-[2]: {180.000, 360.000} -1,30046 -24,96
29 32 НОи8Е5-[2]: {180.000, 360.000} -1,31840 -25,31
30 43 НОи8Е11-[2]: {0.000, 180.000} -1,31840 -25,31
31 24 НОи8Е1-[2]: {180.000, 360.000} -1,34444 -25,81
32 35 НОи8Е7-[2]: {0.000, 180.000} -1,34444 -25,81
33 30 НОи8Е4-[2]: {180.000, 360.000} -1,34645 -25,85
34 41 НОи8Е10-[2]: {0.000, 180.000} -1,34645 -25,85
35 29 НОи8Е4-[2]: {0.000, 180.000} -1,35329 -25,98
36 42 НОи8Е10-[2]: {180.000, 360.000} -1,35329 -25,98
37 23 НОи8Е1-[2]: {0.000, 180.000} -1,35525 -26,02
38 36 НОи8Е7-[2]: {180.000, 360.000} -1,35525 -26,02
39 31 НОи8Е5-[2]: {0.000, 180.000} -1,38388 -26,56
40 44 НОи8Е11-[2]: {180.000, 360.000} -1,38388 -26,56
41 26 НОи8Е2-[2]: {180.000, 360.000} -1,40942 -27,06
42 37 НОи8Е8-[2]: {0.000, 180.000} -1,40942 -27,06
43 33 НОи8Е6-[2]: {0.000, 180.000} -1,41355 -27,13
44 46 НОи8Е12-[2]: {180.000, 360.000} -1,41355 -27,13
45 28 НОи8Е3-[2]: {180.000, 360.000} -1,44893 -27,81
46 39 НОи8Е9-[2]: {0.000, 180.000} -1,44893 -27,81
Сравнение приведенных информационных портретов социотипов показало, что астропризнаки о принадлежности и непринадлежности к некоторым социотипам несут значительно больше информации, чем о принадлежности и непринадлежности к другим. Это обусловлено различной вариабельностью по астропризнакам тех респондентов, на основе информации о которых сформированы данные социотипы. В терминологии АСК-анализа это свойство классов называется степенью сформированности или степенью редукции обобщенного образа класса (категории, социотипа). Обычно, чем выше степень сформированности социотипа, тем выше достоверность его идентификации при всех прочих равных условиях (например, в разных частных моделях). Кроме того, видно, что некоторые социотипы определены астропризнаками, в основном способствующими принадлежности к ним, а некоторые - в основном препятствующими. В этой связи представляет интерес исследование смысла астропризнаков. Это исследова-
ние позволяют привести различные средства системы "Эйдос", в частности - семантические портреты астропризнаков.
Семантические портреты астропризнаков
В системе "Эйдос" реализован режим, позволяющий ранжировать все астропризнаки в порядке убывания среднего количества информации о принадлежности или непринадлежности обладающих ими респондентов к социотипам (таблица 20).
Таблица 20 - АСТРОПРИЗНАКИ, РАНЖИРОВАННЫЕ В ПОРЯДКЕ УБЫВАНИЯ СРЕДНЕГО КОЛИЧЕСТВА ИНФОРМАЦИИ О ПРИНАДЛЕЖНОСТИ ИЛИ НЕПРИНАДЛЕЖНОСТИ ОБЛАДАЮЩИХ ИМИ
РЕСПОНДЕНТОВ К СОЦИОТИПАМ
Сила влияния
Код Наименование Бит Нарастающим итогом (бит) Нарастающим итогом (%)
20 РШТ0Ь01Ч-[2]: {180.000, 360.000} 0,40017241 0,40017241 4,64
28 НОи8Е3-[2]: {180.000, 360.000} 0,27864453 0,67881694 7,88
39 НОи8Е9-[2]: {0.000, 180.000} 0,27864453 0,95746147 11,11
33 НОи8Е6-[2]: {0.000, 180.000} 0,27804916 1,23551063 14,34
46 НОи8Е12-[2]: {180.000, 360.000} 0,27804916 1,51355979 17,56
23 НОи8Е1-[2]: {0.000, 180.000} 0,27431101 1,78787080 20,75
36 НОи8Е7-[2]: {180.000, 360.000} 0,27431101 2,06218181 23,93
26 НОи8Е2-[2]: {180.000, 360.000} 0,27329268 2,33547449 27,10
37 НОи8Е8-[2]: {0.000, 180.000} 0,27329268 2,60876717 30,27
30 НОи8Е4-[2]: {180.000, 360.000} 0,27306225 2,88182942 33,44
41 НОи8Е10-[2]: {0.000, 180.000} 0,27306225 3,15489167 36,61
31 НОи8Е5-[2]: {0.000, 180.000} 0,27083179 3,42572346 39,76
44 НОи8Е11-[2]: {180.000, 360.000} 0,27083179 3,69655525 42,90
32 НОи8Е5-[2]: {180.000, 360.000} 0,26852988 3,96508513 46,01
43 НОи8Е11-[2]: {0.000, 180.000} 0,26852988 4,23361501 49,13
25 НОи8Е2-[2]: {0.000, 180.000} 0,26728709 4,50090210 52,23
38 НОи8Е8-[2]: {180.000, 360.000} 0,26728709 4,76818919 55,33
29 НОи8Е4-[2]: {0.000, 180.000} 0,26646474 5,03465393 58,43
42 НОи8Е10-[2]: {180.000, 360.000} 0,26646474 5,30111867 61,52
24 НОи8Е1-[2]: {180.000, 360.000} 0,26445075 5,56556942 64,59
35 НОи8Е7-[2]: {0.000, 180.000} 0,26445075 5,83002017 67,66
27 НОи8Е3-[2]: {0.000, 180.000} 0,26407695 6,09409712 70,72
40 НОи8Е9-[2]: {180.000, 360.000} 0,26407695 6,35817407 73,79
34 НОи8Е6-[2]: {180.000, 360.000} 0,26179540 6,61996947 76,82
45 НОи8Е12-[2]: {0.000, 180.000} 0,26179540 6,88176487 79,86
17 МЕРТиЫЕ1-ОМ-[2]: {0.000, 180.000} 0,20378935 7,08555422 82,23
16 иРАЫи81ОЫ-[2]: {180.000, 360.000} 0,16890644 7,25446066 84,19
18 МЕРТиЫЕ1-ОМ-[2]: {180.000, 360.000} 0,16257405 7,41703471 86,07
15 иРАЫи81ОЫ-[2]: {0.000, 180.000} 0,10288526 7,51991997 87,27
21 МООЕиЭ1\1-[2]: {0.000, 180.000} 0,08910275 7,60902272 88,30
11 ииР!ТЕРЮЫ-[2]: {0.000, 180.000} 0,07978191 7,68880463 89,23
14 8АТиРЫ1ОЫ-[2]: {180.000, 360.000} 0,07849428 7,76729891 90,14
19 РШТОЦЭЫ-^]: {0.000, 180.000} 0,07684234 7,84414125 91,03
6 МЕРСиРУЮЫ-[2]: {180.000, 360.000} 0,06597809 7,91011934 91,80
3 МООЫ1ОЫ-[2]: {0.000, 180.000} 0,06526427 7,97538361 92,55
8 УЕЫи81ОЫ-[2]: {180.000, 360.000} 0,06489746 8,04028107 93,31
2 8иЫ1ОЫ-[2]: {180.000, 360.000} 0,06372270 8,10400377 94,05
9 МАР81_О1\1-[2]: {0.000, 180.000} 0,06326132 8,16726509 94,78
10 МАР8ЮЫ-[2]: {180.000, 360.000} 0,06311615 8,23038124 95,51
1 8иЫ1ОЫ-[2]: {0.000, 180.000} 0,06251588 8,29289712 96,24
7 УЕЫи81ОЫ-[2]: {0.000, 180.000} 0,06133174 8,35422886 96,95
4 МОО1\И-О1\1-[2]: {180.000, 360.000} 0,06094887 8,41517773 97,66
5 МЕРСиРУЮЫ-[2]: {0.000, 180.000} 0,05998950 8,47516723 98,35
22 МООЕиЭ1\1-[2]: {180.000, 360.000} 0,04772957 8,52289680 98,91
12 ииР!ТЕРЮЫ-[2]: {180.000, 360.000} 0,04747167 8,57036847 99,46
13 8АТиР1ЧЬ01Ч-[2]: {0.000, 180.000} 0,04658163 8,61695010 100,00
Из таблицы 20 видно, что астропризнак: 20, РЬиТОЬОК-[2]: {180.000, 360.000} оказывает на принадлежность респондентов к социотипам почти на порядок меньше влияние, чем астропризнак: 13, 8АТЦКЫЬОК-[2]: {0.000, 180.000}. Поэтому представ-
ляет интерес семантический информационный портрет именно 1-го астропризнака, который и приведен в таблице 21.
Таблица 21 - СЕМАНТИЧЕСКИЙ ИНФОРМАЦИОННЫЙ ПОРТРЕТ АСТРОПРИЗНАКА: КОД: 20 ГРАДАЦИЯ : PLUTOLON-[21: {180.000, 360.000}
№ Код социотипа Наименование социотипа Количество информации о принадлежности к социотипу (бит) Количество информации о принадлежности к социотипу (% от ТМВ-силы)
1 26 SC:A92-Birth 0,67858 13,03
2 17 SC:A68-Childhood 0,42004 8,06
3 28 SC:?- 0,36418 6,99
4 29 SC:B49-Book Collection:American Book 0,21332 4,09
5 25 SC:B2-Book Collection:Profiles Of Women 0,18147 3,48
6 2 SC^- 0,16412 3,15
7 4 SC:A1-Book Collection 0,15883 3,05
8 5 SC:A15-Famous 0,05524 1,06
9 16 SC:A25-Personality 0,03053 0,59
10 35 SC:A38-Politics 0,01093 0,21
11 34 SC:B48-Famous:Top 5% of Profession 0,01007 0,19
12 15 SC:A129-Death 0,00889 0,17
13 30 SC:B26-Personality:Body 0,00442 0,08
14 1 SC:M- -0,00080 -0,02
15 14 SC:A19-Writers -0,00688 -0,13
16 6 SC:A42-Medical -0,03835 -0,74
17 20 SC:B45-Famous:Greatest hits -0,04247 -0,82
18 31 SC:B189-Medical:Illness -0,04797 -0,92
19 10 SC:A40-0ccult Fields -0,10228 -1,96
20 33 SC:A99-Financial -0,11438 -2,20
21 21 SC:A29-Parenting -0,15156 -2,91
22 36 SC:A23-Psychological -0,15735 -3,02
23 9 SC:A9-Relationship -0,19707 -3,78
24 32 SC:B6-Entertainment:Music -0,20370 -3,91
25 13 SC:A55-Art -0,21398 -4,11
26 37 SC:A108-Education -0,22950 -4,41
27 24 SC:B21-Relationship:Number of marriages -0,24687 -4,74
28 8 SC:A5-Entertainment -0,34528 -6,63
29 18 SC:A31-Business -0,37411 -7,18
30 23 SC:B97-0ccult Fields:Astrologer -0,57062 -10,95
31 7 SC:A323-Sexuality -0,60264 -11,57
32 3 SC:A53-Sports -0,68887 -13,22
33 27 SC:B14-Entertainment:Actor/ Actress -0,69152 -13,27
34 12 SC:B329-Sexuality:Sexual perversions -0,77536 -14,88
35 19 SC:C330-Sexuality:Sexual perversions:Homosexual m -0,95026 -18,24
36 22 SC:B173-Sports:Football -1,06528 -20,45
37 11 SC:B111 -Sports:Basketball -1,08765 -20,88
Некоторые нерешенные вопросы и перспективы исследований
I. Остаются нерешенными вопросы:
1. О причинах существования обнаруженных взаимосвязей между астропризнаками и социотипами и о конкретных механизмах осуществления этих взаимосвязей.
2. О том, насколько выявленные в наших исследованиях закономерности совпадают или не совпадают с уже известными в астрологии.
По первому вопросу могут быть самые разные точки зрения. Однако, на взгляд авторов, интересной является идея о решающей роли времени. Если посчитать корреляцию между показаниями часов и различными видами активности людей, то будет обнаружено, что между ними существуют довольно сильные корреляционные зависимости. Мы ведь далеки от мысли считать, что показания часов детерминируют поведение людей. Все понимают, что и показания часов, и деятельность людей зависят от некоторого общего фактора, который влияет и на первое, и на второе, а именно - от времени. Именно ход или течение времени, а не показания часов детерминирует поведение людей (когда они просыпаются и ложатся спать, идут на работу и с работы, принимают
пищу и т.д.). Наши обычные часы синхронизированы с суточным солнечным ритмом, т.к. он, совершенно очевидно, является основным ритмом, наиболее сильно влияющим на нашу деятельность. В данной модели влияние этот ритма моделируется путем разбиения суточного цикла на 12 частей, именуемых домами Плацидуса. Астрономические параметры на момент рождения также представляют собой показания определенных, а именно астрономических часов, циферблат которых размечен не в соответствии с суточным циклом, а на месяцы (цикл Луны), годы (циклы Солнца, Меркурия, Венеры, Марса), десятки (циклы Юпитера, Сатурна, Урана) или даже сотни лет (циклы Нептуна и Плутона). Наличие выявленных закономерностей между астропризнаками и социотипами говорит в пользу того, что на нашу жизнь оказывает влияние не только солнечное и лунное, но и планетарное время Солнечной системы.
По второму вопросу получены результаты, подтверждающие, что выявленные закономерности во многом совпадают с уже известными в астрологии, хотя при их получении нами не использовались никакие астрологические представления, а только астрономические и социологические данные и методы искусственного интеллекта.
II. В системе "Эйдос" реализованы различные алгоритмы повышения качества (адекватности, достоверности) моделей, в частности:
- алгоритмы разделения классов на типичные и нетипичные части;
- алгоритмы образования сочетаний признаков по 2, 3, 4, 5, 6, 7 и 8.
В проведенных ранее численных экспериментах на моделях из других предметных областей эти режимы показали очень высокую эффективность: в ряде случаев достоверность идентификации повышалась до 100 %. В будущем планируется применить эти режимы для оптимизации наилучшей из исследованных частных моделей.
Чем меньше респондентов относится к категории, тем меньше вариабельность параметров респондентов, отнесенных к категории. В предельном случае, когда образ категории сформирован на примере одного респондента, вариабельность полностью отсутствует. В этом случае, по сути, задача распознавания вырождается (редуцируется) до задачи информационного поиска, т.е. становится тривиальной. Поэтому достоверность решения этой задачи максимальна и практически равна 100 %. Чем больше респондентов относится к некоторой категории, тем выше вариабельность параметров внутри категории, тем сложнее получить обобщенный образ этой категории и тем сложнее достоверно осуществить идентификацию конкретного респондента с этим образом. Однако это интересно тем, что конкретный респондент сходен с обобщенным образом, сформированным на основе большого количества респондентов, относящихся к данной категории. Если он не отнесен системой к ней, хотя в действительности к ней и относится, то это означает, что он является нетипичным для этой категории, в которой, видимо, очень высока вариабельность параметров, и это означает, что надо разделить эту категорию на несколько таким образом, чтобы вариабельность параметров внутри каждой из них была минимальной и достаточной для достоверной идентификации респондентов. В системе "Эйдос" реализован режим, реализующий эту процедуру. При этом формируется дерево разделения категорий, похожее на формирующееся при древовидной кластеризации. Мы тоже можем сформировать подобное дерево для частной модели, оказавшейся наиболее достоверной при распознавании всей системы категорий.
III. Исследованная база данных на 20007 респондентов, как выяснилось, обладает рядом недостатков, среди которых хотелось бы отметить два.
1. Крайне неравномерное распределение респондентов по категориям: в этой базе из 11000 категорий есть всего 37, представленных более чем 1000 респондентов. Поэтому выводы, полученные по хорошо мало представленным категориям, обладают
разной степенью достоверности: по хорошо представленным можно говорить о выявленных зависимостях, а по мало - о переобучении системы и ее работе практически как информационно-поисковой.
2. Эта база содержит информацию в основном по американцам, канадцам и немного европейцам, но в ней практически не представлены целые континенты и очень многие страны, в том числе Россия. Поэтому, если Вы не являетесь жителем этих стран, то результаты идентификации можно интерпретировать в том смысле, как если бы Вы жили в США или Канаде, то для Вас, возможно, имели бы место прогнозируемые варианты принадлежности к социальным категориям.
В перспективе целесообразно использовать для подобных исследований базы данных, содержащие информацию не по десяткам, а сотням тысяч или даже миллионам респондентов с категориями, представленными 1000 и более респондентами и отражающими не отдельные, пусть даже и большие страны, а большинство стран. Возможно, для этих исследований целесообразно использовать базы данных банковских структур и спецслужб.
IV. Текущая версия системы "Эйдос-астра" является по сути экспериментальной, т.е. предназначена, в основном, для проведения научных исследований. Поэтому при ее разработке мало внимания уделялось пользовательскому интерфейсу, к тому же она является локальной. В перспективе планируется создать версию, обеспечивающую для зарегистрированных пользователей on-line доступ через Internet в подсистемах формализации предметной области (в т.ч. пополнения базы прецедентов), синтеза модели, идентификации и прогнозирования, типологического (кластерно-конструктивного) и системно-когнитивного анализа модели предметной области.
Кроме того, в текущей версии существуют определенные не очень жесткие ограничения на размерность моделей, которые также предполагается снять в будущих версиях.
Решаемые задачи идеальны для распараллеливания, т.е. для реализации расчетов на параллельных (векторных или матричных) процессорах или в локальной сети. Диспетчеризацию подобных расчетов можно осуществлять и вручную, но было бы удобнее ее также автоматизировать в будущей версии. Особенно это актуально при учете, что синтез мультимодели, состоящей из 172 частных моделей, шел на P4 около 300 часов непрерывного счета, а одна модель считается в среднем менее 2 часов, и это время и было бы временем синтеза мультимодели на локальной сети из 172 (или более) компьютеров P4.
V. Для решения задач астросоциологии был применен новый метод искусственного интеллекта системно-когнитивный анализ (СК-анализ) и его инструментарий: универсальная когнитивная аналитическая система "Эйдос", а также система окружения "Эйдос-астра". Авторы уверены в том, что в перспективе для решения этих задач целесообразно применить и другие методы искусственного интеллекта и реализующие их программные системы, и приглашают специалистов к участию в этих исследованиях и разработках. Исходную базу данных для исследований, преобразованную в соответствии со стандартом системы "Эйдос-астра", можно бесплатно скачать по ссылке: http://lc.kubagro.ru/astr/abankall.rar на сайте автора.
Основные выводы и результаты
Авторы считают, что на основании проведенных исследований можно обоснованно сделать главный вывод о том, что зависимости между астрономическими параметрами респондентов на момент их рождения (астропризнаки) и принадлежностью этих респондентов к определенным обобщенным социальным категориям (социотипам) действительно существуют.
Предложенные математические модели, алгоритмы, реализующие их программные средства (базовая система "Эйдос" и система окружения "Эйдос-астра"), а также технология их применения обеспечили получение следующих результатов:
1. Автоматическую формализацию предметной области на основе преобразованного в соответствии с предложенным стандартом астробанка и синтез мультимодели, состоящей из десятков или даже сотен частных моделей.
2. На этапе синтеза мультимодели:
- обобщение тысяч и десятков тысяч конкретных примеров принадлежности респондентов, описанных в астробанке, к тем или иным социальным категориям и формирование обобщенных образов этих категорий, т.е. социотипов.
- выявление зависимостей (т.е. силы и направления влияния) между астропризнаками и принадлежностью обладающих ими респондентов к социотипам.
3. Тестирование этих частных моделей на достоверность идентификации респондентов в них по заданному набору социальных категорий.
4. Идентификацию респондентов в мультимодели либо по всем категориям, либо в каждой частной модели только по тем категориям, которые по данным тестирования частных моделей идентифицируются в ней с наивысшей достоверностью (скоростное распознавание с использованием априорной информации о достоверности частных моделей), либо с использованием алгоритмов голосования (коллективов решающих правил).
5. Исследование созданной мультимодели, в частности:
- вывод информации о выявленных зависимостях в текстовой и графической форме (информационные портреты социотипов, нелокальные нейроны, семантические портреты астропризнаков);
- кластерно-конструктивный анализ социотипов и астропризнаков;
- системно-когнитивный анализ мультимодели (генерацию и вывод семантических сетей социотипов и астропризнаков, классических и интегральных когнитивных карт, профилей социотипов и астропризнаков и т.д.).
6. Улучшение лучшей из созданных частных моделей путем разделения социотипов на типичные и нетипичные части и формирования сочетаний астропризнаков по
2, 3, 4, 5, 6, 7 и 8.
7. Авторы надеются, что уровень достоверности идентификации, достигнутый в мультимодели, достаточен для того, чтобы астросоциотипология приобрела не только научный интерес, но и практическую значимость, в частности в тех областях, где традиционно используются психологическое тестирование и тестирование на способности к различным видам деятельности.
Примененный для решения этих задач метод системно-когнитивного анализа рассматривается авторами как один из универсальных вариантов решения 13-й проблемы Гильберта на практике (теоретически эта проблема решена в тереме Колмогорова, являющейся обобщением теоремы В.И. Арнольда (1957) [3, 5].
В будущем планируется продолжить исследования и разработки в области астросоциотипологии и подробнее (на сколько это возможно) описать некоторые из полученных и перечисленных выше результатов в отдельных публикациях.
Благодарности
Данная статья является примером выполнения совместного исследования авторами, живущими в разных странах за тысячи километров друг от друга, что стало возможным благодаря Internet. Необходимо отметить, что работы выполнены при постоянной поддержке и участии посетителей сайтов: http://trounev.net, http://trounev.com. Авторы искренне благодарят всех участников эксперимента.
Список литературы
1. Lutsenko E.V. Conceptual principles of the system (emergent) information theory & its application for the cognitive modelling of the active obiects (entities). 2GG2 IEEE International Conference on Artificial Intelligence System (ICAIS 2GG2). - Computer society, IEEE, Los Alamos, California, Washington - Brussels - Tokyo, p. 268-269. http://pitis.tsure.ru/files13/5.pdf http://csdl2.computer.org/comp/proceedings/icais/2GG2/1733/GG/1733G268.pdf
2. Lutsenko Eugene, Trounev Alexander, Shashin Vladimir. Method of birth chart recognition by
using the artificial intelligence system AIDOS. International Journal Chaos and Correlation, No 1, November 3G, 2GG6. - Toronto, Canada, - Режим доступа:
http://trounev.com/WordPress/?p=23#more-23.
3. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). - Краснодар: КубГАУ, 2GG2. - 6G5 с.
4. Луценко Е.В. АСК-анализ как метод выявления когнитивных функциональных зависимостей в многомерных зашумленных фрагментированных данных // Научный журнал Куб-ГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GG5. - №G3(11). - 19 с. - Режим доступа: http://ei.kubagro.ru/2GG5/G3/19/p19.asp.
5. Луценко Е.В. Интеллектуальные информационные системы: Учебное пособие для студентов специальности "Прикладная информатика (по областям)" и другим экономическим специальностям. 2-е изд., перераб. и доп.- Краснодар: КубГАУ, 2GG6. - 615 с..
6. Луценко Е.В. Математический метод АСК-анализа в свете идей интервальной бутстрепной робастной статистики объектов нечисловой природы // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GG4. - № G1(3). - Режим доступа: http://ei .kubagro.ru/2GG4/G 1/13/p13.asp.
7. Луценко Е.В. Методика использования репозитария UCI для оценки качества математиче-
ских моделей систем искусственного интеллекта // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GG3. - № G2(2). - Режим доступа:
http://ei.kubagro.ru/2GG3/G2/12/p12.asp.
8. Луценко Е.В. Синтез астропрофессиограмм и прогнозирование успешности деятельности на основе применения АСК-анализа // Ж-л International Journal The World Astrology Review. [Электронный ресурс]. - Toronto, Canada, 2GG6. - № G2(5G), February 28. - Режим доступа: http://trounev.net/thewar/No5G/EL.htm.
9. Луценко Е.В. Системная теория информации и нелокальные интерпретируемые нейронные сети прямого счета // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: Куб-ГАУ, 2GG3. - №G1(1). - Режим доступа: http://ei.kubagro.ru/2GG3/G1/11/p11.asp.
1G. Луценко Е.В. Системно-когнитивный анализ как развитие концепции смысла Шенка -Абельсона // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GG4. - №G3(5). - Режим доступа: http://ei.kubagro.ru/2GG4/G3/G4/pG4.asp.
11. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"): Монография (научное издание). - Краснодар: КЮИ МВД РФ, 1996. - 28G с.
12. Луценко Е.В. Типовая методика и инструментарий когнитивной структуризации и формализации задач в АСК-анализе // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GG4. - № G1(3). - Режим доступа: http://ei .kubagro.ru/2GG4/G 1/16/p16.asp.
13. Луценко Е.В., Трунев А., Шашин В. Метод пакетного распознавания карт рождения в сис-
теме искусственного интеллекта ЭЙДОС. International Journal The World Astrology Review, No 1G (58), October 31, 2GG6. - Toronto, Canada, - Режим доступа:
http://trounev.com/thewar/No58/AIT58 1 .htm.
14. Луценко Е.В., Трунев А., Шашин В. Система идентификации субъектов по астрономиче-
ским данным на момент рождения. International Journal The World Astrology Review, No 9 (57), September 3G, 2GG6. - Toronto, Canada, - Режим доступа:
http://trounev.net/thewar/No57/ADOS.htm.
15. Луценко Е.В., Трунев А., Шашин В. Типизация и идентификация респондентов, описанных
астрономическими показателями на момент рождения, по социальным и психофизиологическим категориям с применением АСК-анализа. International Journal Chaos and Correlation, No 1, November 3G, 2GG6. - Toronto, Canada, - Режим доступа:
http://trounev.com/Chaos/N o 1 /AIT 59.htm.
16. Луценко Е.В., Трунев А.П., Шашин В.Н. Алгоритмы и законы типизации и идентификации
субъектов по астрономическим данным на момент рождения. Chaos and Correlation International Journal, No 8, July 5, 2GG7_ . - Toronto, Canada, - Режим доступа:
http://trounev.com/Chaos/No8/AIDOS8/aidos8.htm
17. Луценко Е.В., Трунев А.П., Шашин В.Н. Метод разделения категорий в задаче типизации и
идентификации субъектов по астрономическим данным на момент рождения. Chaos and Correlation, No 8, July 18, 2GG7. - Toronto, Canada, - Режим доступа:
http://trounev.com/Chaos/No8/LTS.htm.
18. Луценко Е.В., Трунев А.П., Шашин В.Н. Типизации и идентификации субъектов по астрономическим данным на момент рождения на базе психологических и персональных категорий International Journal Chaos and Correlation, No 9, July 22, 2GG7. - Toronto, Canada, - Режим доступа: http://trounev.com/Chaos/No9/LTS 1/LTS8 1 .htm.
19. Луценко, Е.В. и др. Типизация и идентификация респондентов в социологии по их астрономическим показателями на момент рождения/ Е.В. Луценко, А.П. Трунев, В.Н. Шашин // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GG7. - № G1(25).
- Режим доступа: http://ei .kubagro.ru/2GG7/G1/pdf/14.pdf.
2G. Пат. № 2GG361G986 РФ. Универсальная когнитивная аналитическая система "ЭЙДОС" / Е.В. Луценко (Россия); Заяв. № 2GG361G51G РФ. Опубл. от 22.G4.2GG3. - 5G с.
21. Пат. № 2GG861GG97 РФ. Система типизации и идентификации социального статуса респондентов по их астрономическим показателями на момент рождения "Эйдос-астра". /Е.В. Луценко (Россия), А.П. Трунев (Канада), В.Н. Шашин (Россия); Заяв. №2GG7613722. Опубл. G9.G1.G8. - 56 с.
22. Пат. № 94G334. РФ. Универсальная автоматизированная система анализа и прогнозирования ситуаций на фондовом рынке "ЭЙДОС-фонд" /Е.В. Луценко (Россия), Б.Х. Шульман (США); Заяв. № 94G336. Опубл. 23.G8.94. - 5G с.
23. Пат. № 2GG361G987 РФ. Автоматизированная система комплексной обработки данных психологического тестирования "ЭЙДОС-Y" / Е.В. Луценко (Россия), С.Д. Некрасов (Россия); Заяв. № 2GG361G511 РФ. Опубл. от 22.G4.2GG3. - 5Ga
24. http://www.yandex.ru/yandsearch?text=%EA%EE%EB%EB%E5%EA%F2%E8%E2%FB+%FQ %E5%F8%EG%FE%F9%E8%F5+%EF%FG%EG%E2%E8%EB&rpt=ra .
Примечание:
Для обеспечения доступа читателей к некоторым из этих и другим работам авторов они размещены в Internet по адресам: http://lc. kubagro .ru/aidos/eidos.htm http://ei.kubagro.ru/a/viewaut.asp?id=11.