Научная статья на тему 'Методика использования репозитария uCi для оценки качества математических моделей систем искусственного интеллекта'

Методика использования репозитария uCi для оценки качества математических моделей систем искусственного интеллекта Текст научной статьи по специальности «Математика»

CC BY
184
56
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Луценко Евгений Вениаминович

В статье предлагается методика преобразования исходных данных тестовых задач для систем искусственного интеллекта из html-формата в dbf-стандарт. Методика основана на использовании стандартных возможностей Internet-броузера, Word, Excel, а также специально созданного программного интерфейса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Луценко Евгений Вениаминович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методика использования репозитария uCi для оценки качества математических моделей систем искусственного интеллекта»

МЕТОДИКА ИСПОЛЬЗОВАНИЯ РЕПОЗИТАРИЯ UCI ДЛЯ ОЦЕНКИ КАЧЕСТВА МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ СИСТЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Луценко Е.В., к.т.н.

Кубанский государственный аграрный университет

В статье предлагается методика преобразования исходных данных тестовых задач для систем искусственного интеллекта из html-формата в dbf-стандарт. Методика основана на использовании стандартных возможностей Internet-броузера, Word, Excel, а также специально созданного программного интерфейса.

Постановка задачи и пути ее решения

Одним из важнейших направлений развития информационных систем является создание систем искусственного интеллекта (СИИ), в частности систем: с интеллектуальной обратной связью (биологическая обратная связь и семантический резонанс); распознавания образов; поддержки принятия решений; экспертных систем; нейронных сетей; генетических алгоритмов и машинной эволюции; когнитивного моделирования; выявления знаний из опыта (эмпирических фактов) и интеллектуального анализа данных (data mining), а также ряда других.

В связи с наличием многих альтернатив возникает необходимость оценки качества математических моделей и поддерживающих их систем искусственного интеллекта (ММ СИИ). Сопоставимое сравнение различных моделей актуально как для разработчиков моделей (адекватная самооценка своей работы), так и для потребителей моделей (адекватная оценка моделей и обоснованный выбор оптимальной из них по заданным критериям). Сопоставимость оценки может быть обеспечена, если модели будут протестированы на одних и тех же исходных данных по ряду типовых задач из области искусственного интеллекта.

Для этого необходимы:

1. Свободный доступ к тестовым исходным данным.

2. Методика, обеспечивающая преобразование исходных данных из формы, доступной через Internet, в форму, в которой они могут быть использованы в конкретной программной системе искусственного интеллекта, реализующей ту или иную математическую модель.

1-е условие выполнено сотрудниками Школы информации и компьютерных исследований Калифорнийского университета США (School of Information & Computer Science University of California, Irvine, USA, http://www.ics.uci.edu), которыми создан и размещен в Internet по адресу:

http://www.ics.uci.edn/~m1earn/MLSnmmary.ht.m1 банк исходных данных по задачам искусственного интеллекта.

На момент написания настоящей статьи этот банк включает базы исходных данных по следующим задачам: Abalone, Adult, Annealing, Anonymous Microsoft Web Data, Arrhythmia, Artificial Characters, Audiologys, Auto-Mpg, Automobile, Badges, Balance Scale, Balloons, Breast Cancer, Wisconsin Breast Cancers, Pittsburgh Bridges, Car Evaluation, Census Income, Chesss, Bach Chorales (time-series), Connect-4 Opening, Credit Screenings, Computer Hardware, Contraceptive Method Choice, Covertype data, Cylinder Bands, Dermatology, Diabetes Data, The Second Data Generation Program - DGP/2, Document Understanding, EBL Domain Theories and Examples, Echocardiogram, Ecoli, Flags,Function Findings, Glass Identification, Haberman's Survival Data, Hayes-Roth, Heart Diseases, Hepatitis, Horse Colic, Housing (Boston), ICU Data, Image segmentation, Internet Advertisements, Ionosphere, Iris Plant, Isolet Spoken Letter Recognition, Kinship, Labor relations, LED Display Domains, Lenses, Letter Recognition, Liver-disorders, Logic-theorist, Lung Cancer, Lymphography, Mechanical Analysis Data, Meta-data, Mobile Robots, Molecular Biologys, MONK's Problems, Moral Reasoner, Multiple Features, Mushrooms, MUSKs, Nursery, Othello Domain Theory, Page Blocks Classification, Pima Indians Diabetes, Optical Recognition of Handwritten Digits, Pen-Based Recognition of Handwritten Digits, Postoperative Patient, Primary Tumor, Qualitative Structure Activity Relationships (QSARs), Quadraped Animals Data Generator, Servo, Shuttle Landing Control, Solar Flares, Soybeans, Challenger USA Space Shuttle O-Rings, Low Resolution Spectrometer, Spambase, SPECT and SPECTF hearts, Sponge, Statlog Projects, Student Loan Relational, Teaching Assistant Evaluation, Tic-Tac-Toe Endgame, Thyroid Disease, Trains, University, Congressional Voting Records, Water Treatement Plant, Waveform Data Generator, Wine Recognition, Yeast, Zoo, Undocumenteds.

Поэтому остается выполнить 2-е условие, а именно: разработать типовую методику использования баз данных репозитария UCI для оценки качества математических моделей систем искусственного интеллекта, что и является основной задачей данной статьи.

На первый взгляд решение этой задачи является относительно несложным, т.к. требует в основном знания и умения использования стандартных возможностей Internet-броузера, Word и Excel. Однако как показывает опыт, это вполне может представлять определенную сложность из-за большого числа операций преобразования формы информации и принципиальной неполной формализуемости этого процесса. Поэтому предмет данной статьи достаточно актуален.

Сформулируем основные требования к методикам, предназначенным для этих целей, а также критерии их оценки и сравнения:

1. Высокая степень автоматизированности, т.е. минимизация затрат ручного труда.

2. Высокая скорость преобразования информации и, как следствие, -несущественность ее объема.

3. Высокая достоверность преобразования, т.е. отсутствие ошибок.

Однако в литературе и в Internet не приводятся методики аналогичного назначения. Исходя из этого можно предположить, что в основном это преобразование осуществляется вручную, что не соответствует сформулированным требованиям ни по одному из приведенных критериев.

Поэтому предлагается методика, свободная от указанных ограничений. Основная идея этой методики состоит в том, что преобразование формы представления исходных данных из HTML-формата непосредственно в базы данных системы осуществляется в два основных этапа:

- на 1-м этапе с использованием стандартных возможностей Word и Excel осуществляется преобразование исходных данных из HTML-формата в промежуточные DBF-таблицы;

- на 2-м этапе с помощью специально разработанного программного интерфейса осуществляется преобразование исходных данных из промежуточных DBF-таблиц в стандарт баз данных используемой системы искусственного интеллекта.

Рассмотрим данную методику подробнее на примере преобразования баз данных репозитария UCI по примеру ZOO-database в стандарт баз данных универсальной когнитивной аналитической системы "Эйдос" [2].

1-й этап: преобразование исходных данных из HTML-формата в промежуточные DBF- таблицы

Характеристика исходных данных

Из Internet по адресу: http://ftp.ics.uci.edu/pub/machine-1earning-

databases/zoo/zoo.names получаем исходную информацию: общее описание тестовой задачи (файл: zoo_names.htm) и обучающую выборку (файл: zoo_data.htm), которые приводятся далее без изменений.

Общее описание задачи (файл: zoo_names.htm):

Zoo Database

• From Richard Forsyth

• Artificial

• 7 classes of animals

• 17 attributes (besides name), 15 Boolean and 2 numeric-valued

• No missing attribute values

• Ftp Access

1. Title: Zoo database

2. Source Information

-- Creator: Richard Forsyth -- Donor: Richard S. Forsyth 8 Grosvenor Avenue Mapperley Park Nottingham NG3 5DX 0602-621676 -- Date: 5/15/1990

3. Past Usage:

-- None known other than what is shown in Forsyth's PC/BEAGLE User's Guide.

4. Relevant Information:

-- A simple database containing 17 Boolean-valued attributes. The "type" attribute appears to be the class attribute. Here is a breakdown of which animals are in which type: (I find it unusual that there are 2 instances of "frog" and one of "girl"!)

Class# Set of animals:

1 (41) aardvark, antelope, bear, boar, buffalo, calf,

cavy, cheetah, deer, dolphin, elephant, fruitbat, giraffe, girl, goat, gorilla, hamster,

hare, leopard, lion, lynx, mink, mole, mongoose,

opossum, oryx, platypus, polecat, pony,

porpoise, puma, pussycat, raccoon, reindeer,

seal, sealion, squirrel, vampire, vole, wallaby,wolf

2 (20) chicken, crow, dove, duck, flamingo, gull, hawk,

kiwi, lark, ostrich, parakeet, penguin, pheasant, rhea, skimmer, skua, sparrow, swan, vulture, wren

pitviper, seasnake, slowworm, tortoise, tuatara bass, carp, catfish, chub, dogfish, haddock, herring, pike, piranha, seahorse, sole, stingray, tuna frog, frog, newt, toad

flea, gnat, honeybee, housefly, ladybird, moth, termite, wasp clam, crab, crayfish, lobster, octopus, scorpion, seawasp, slug, starfish, worm Number of Instances: 101

6. Number of Attributes: 18 (animal name, 15 Boolean attributes, 2 numerics)

7. Attribute Information: (name of attribute and type of value domain)

3 (5)

4 (13)

5 (4)

6 (8)

7 (1O)

1. animal name: Unique for

2. hair Boolean

3. feathers Boolean

4. eggs Boolean

5. milk Boolean

6. airborne Boolean

7. aquatic Boolean

8. predator Boolean

9. toothed Boolean

1O. backbone Boolean

11. breathes Boolean

12. venomous Boolean

13. fins Boolean

14. legs Numeric

15. tail Boolean

16. domestic Boolean

17. catsize Boolean

18. type Numeric

8. Missing Attribute Values: None

9. Class Distribution: Given above

Обучающая выборка (файл: zoo_data.htm)

aardvark,1,0,0,1,0,0,1,1,1,1,0,0,4,0,0,1,1

bass,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4

bear,1,0,0,1,0,0,1,1,1,1,0,0,4,0,0,1,1

boar^^O^^O,!,!,!,!^^^,!^,!,!

calf,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,1,1

carp,0,0,1,0,0,1,0,1,1,0,0,1,0,1,1,0,4

catfish,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4

cavy,1,0,0,1,0,0,0,1,1,1,0,0,4,0,1,0,1

cheetah,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1

chicken,0,1,1,0,1,0,0,0,1,1,0,0,2,1,1,0,2

chub,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4

clam,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,7

crab,0,0,1,0,0,1,1,0,0,0,0,0,4,0,0,0,7

crayfish,0,0,1,0,0,1,1,0,0,0,0,0,6,0,0,0,7

crqw,0,1,1,0,1,0,1,0,1,1,0,0,2,1,0,0,2

deer,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1

dqgfish,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,1,4

dqlphin,0,0,0,1,0,1,1,1,1,1,0,1,0,1,0,1,1

duck,0,1,1,0,1,1,0,0,1,1,0,0,2,1,0,0,2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

elephant,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1

flaшingq,0,1,1,0,1,0,0,0,1,1,0,0,2,1,0,1,2

flea,0,0,1,0,0,0,0,0,0,1,0,0,6,0,0,0,6

frqg,0,0,1,0,0,1,1,1,1,1,0,0,4,0,0,0,5

frqg,0,0,1,0,0,1,1,1,1,1,1,0,4,0,0,0,5

fruitbat,1,0,0,1,1,0,0,1,1,1,0,0,2,1,0,0,1

giraffe,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1

girl,1,0,0,1,0,0,1,1,1,1,0,0,2,0,1,1,1

gnat,0,0,1,0,1,0,0,0,0,1,0,0,6,0,0,0,6

gqat,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,1,1

gull,0,1,1,0,1,1,1,0,1,1,0,0,2,1,0,0,2

haddock^O,!^^,!^,!,!^^,!^,!^^^

hamster,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,0,1

hare,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,0,1

hawk,0,1,1,0,1,0,1,0,1,1,0,0,2,1,0,0,2

herring,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4

hqneybee,1,0,1,0,1,0,0,0,0,1,1,0,6,0,1,0,6

hqusefly,1,0,1,0,1,0,0,0,0,1,0,0,6,0,0,0,6

kiwi,0,1,1,0,0,0,1,0,1,1,0,0,2,1,0,0,2

ladybird,0,0,1,0,1,0,1,0,0,1,0,0,6,0,0,0,6

lark,0,1,1,0,1,0,0,0,1,1,0,0,2,1,0,0,2

leopard,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1

liqn,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1

ЮЬзЬєг,0,0,1,0,0,1,1,0,0,0,0,0,6,0,0,0,7

lynx,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1

mink,1,0,0,1,0,1,1,1,1,1,0,0,4,1,0,1,1

mqle,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,0,1

mqngqqse,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1

mqth,1,0,1,0,1,0,0,0,0,1,0,0,6,0,0,0,6

newt,0,0,1,0,0,1,1,1,1,1,0,0,4,1,0,0,5

qctqpus,0,0,1,0,0,1,1,0,0,0,0,0,8,0,0,1,7

qpqssum,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,0,1

qryx,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1

qstrich,0,1,1,0,0,0,0,0,1,1,0,0,2,1,0,1,2

parakeet,0,1,1,0,1,0,0,0,1,1,0,0,2,1,1,0,2

penguin,0,1,1,0,0,1,1,0,1,1,0,0,2,1,0,1,2

pheasant,0,1,1,0,1,0,0,0,1,1,0,0,2,1,0,0,2

pike,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,1,4

piranha,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4

pitviper,0,0,1,0,0,0,1,1,1,1,1,0,0,1,0,0,3

platypus,1,0,1,1,0,1,1,0,1,1,0,0,4,1,0,1,1

pqlecat,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1

pqny,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,1,1

pqrpqise,0,0,0,1,0,1,1,1,1,1,0,1,0,1,0,1,1

puma,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1

pussycat,1,0,0,1,0,0,1,1,1,1,0,0,4,1,1,1,1

raccqqn,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1

reindeer,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,1,1

rhea,0,1,1,0,0,0,1,0,1,1,0,0,2,1,0,1,2

scqrpiqn,0,0,0,0,0,0,1,0,0,1,1,0,8,1,0,0,7

seahqrse,0,0,1,0,0,1,0,1,1,0,0,1,0,1,0,0,4

seal,1,0,0,1,0,1,1,1,1,1,0,1,0,0,0,1,1

sealiqn,1,0,0,1,0,1,1,1,1,1,0,1,2,1,0,1,1

seasnake,0,0,0,0,0,1,1,1,1,0,1,0,0,1,0,0,3

seawasp,0,0,1,0,0,1,1,0,0,0,1,0,0,0,0,0,7

skimmer,0,1,1,0,1,1,1,0,1,1,0,0,2,1,0,0,2

skua,0,1,1,0,1,1,1,0,1,1,0,0,2,1,0,0,2

tuatara,0,0,1,0,0,0,1,1,1,1,0,0,4,1,0,0,3

tuna,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,1,4

vampire,1,0,0,1,1,0,0,1,1,1,0,0,2,1,0,0,1

vole,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,0,1

vulture,0,1,1,0,1,0,1,0,1,1,0,0,2,1,0,1,2

wallaby,1,0,0,1,0,0,0,1,1,1,0,0,2,1,0,1,1

termite,0,0,1,0,0,0,0,0,0,1,0,0,6,0,0,0,6

toad,0,0,1,0,0,1,0,1,1,1,0,0,4,0,0,0,5

tortoise,0,0,1,0,0,0,0,0,1,1,0,0,4,1,0,1,3

Некоторые замечания к общему описанию задачи

Считаем необходимым согласится с мнением модератора UCI, который отметил два несоответствия в общем описании задачи (см. п.4):

- во-первых, 18-й атрибут "type” на самом деле содержит информацию о принадлежности объекта к классу и, поэтому, относится не к описательным шкалам и градациям, а к классификационным;

- во-вторых, в 5-м классе 2 раза указан один и тот же объект "frog" (возможно, они разного пола?).

Кроме того, проанализировав общее описание задачи, представленное репозитарием UCI, мы также отмечаем ряд несоответствий. Так, 1-й атрибут "animal name" является прямым указанием на объект и не должен включаться в систему атрибутов, т.к. это делает задачу идентификации объектов тривиальной. Классы автором задачи никак не названы и мы дали им свои названия. Вызывает некоторое сомнение объединение в один класс, который мы условно назвали "Многоногие", представителей различных видов, например таких, как скорпион и осьминог.

Этапы разработки семантической информационной модели

Разработка семантической информационной модели (СИМ) в системе "Эйдос" осуществляется в ряд этапов [2]:

- формализация предметной области (разработка классификационных и описательных шкал и градаций);

- подготовка и ввод обучающей выборки;

- синтез СИМ;

- оптимизация СИМ;

- проверка адекватности СИМ (измерение внутренней и внешней дифференциальной и интегральной валидности).

Если модель обладает достаточной адекватностью, то принимается решение о ее использовании в режиме идентификации и прогнозирования, а также об анализе предметной области путем исследования ее семантической информационной модели.

Формализация предметной области: разработка классификационных и описательных шкал и градаций

С учетом сформулированных замечаний к общему описанию задачи классификационные шкалы и градации будут иметь вид:

1. Млекопитающие.

2. Птицы.

3. Пресмыкающиеся.

4. Рыбы.

5. Земноводные.

6. Насекомые.

7. Многоногие.

Описательные шкалы и градации, приведенные в общем описании задачи, включают в основном булевы атрибуты, а также один количественный: 14. legs (количество ног). Этот атрибут мы преобразовали в шкалу с булевыми градациями. После этого, с учетом сделанных замечаний к общему описанию задачи, описательные шкалы и градации приняли вид, представленный в таблице 1.

Таблица 1 - ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

Код Наименование Код Наименование Код Наименование

2 hair 10 backbone 1S legs-4

З feathers 11 breathes 19 legs-5

4 eggs 12 venomous 20 legs-б

5 milk 1З fins 21 legs-7

б airborne 14 legs-0 22 legs-S

7 aquatic 15 legs-1 2З tail

S predator 1б legs-2 24 domestic

9 toothed 17 legs-З 25 catsize

Таблица 1 преобразуется из HTML-формата в Excel следующим образом:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Отмечаем блоком в Internet-броузере ту часть раздела 7 общего описания задачи (файл: zoo_names.htm), в которой перечислены атрибуты, копируем ее в буфер обмена, переходим в Word и вставляем из буфера обмена в документ.

2. Записываем обучающую выборку в форме TXT-файла с именем zoo_names.txt в стандарте "Текст DOS с разбиением на строки".

3. Загружаем Excel и выполняем шаги:

- считываем файл zoo_names.txt в Excel, предварительно указав в окне "Тип файлов" вариант "Все файлы";

- задаем формат файла "DOS или OS/2 (PC-S) и нажимаем кнопку: "Далее";

- задаем символ-разделитель "Символ табуляции" и "считать последовательные разделители одним" и нажимаем кнопку "Готово". После некоторой корректировки получаем вид описательных шкал и градаций, представленный на рисунке l;

- записываем Excel-файл с описательными шкалами и градациями с именем Prizn.xls.

Подготовка и ввод обучающей выборки

С обучающей выборкой осуществляем следующие преобразования формы представления:

1. Отмечаем блоком в Internet-броузере при просмотре файла zoo_data.htm весь файл, копируем его в буфер обмена, переходим в Word и вставляем из буфера обмена в документ.

2. Записываем обучающую выборку в форме TXT-файла с именем zoo_data.txt в стандарте "Текст DOS с разбиением на строки".

3. Загружаем Excel и выполняем шаги:

- считываем файл zoo_data.txt в Excel, предварительно указав в окне: "Тип файлов" вариант: "Все файлы", появляется 1-е окно (рисунок 2);

- в 1-м окне задаем формат файла: "DOS или OS/2 (PC-S) и нажимаем кнопку: "Далее", появляется 2-е окно (рисунок 3);

S

Мастер текстов [импорт] -

Данные восприняты как список значений с разделителями.

Если это вepнo^ нажмите кнопку "Далее в противном случае укажите формат данных.

-Формат исходных данных------

Укажите формат данных:

і* с дазделителями Ґ" фиксированной ширины

- значения полей отделяются символами-разделителями

- поля имеют заданную ширину

Начать импорт со строки:

її Э

Формат файла:

Предварительный просмотр файла D:\Mon документы\Луценко\Работа\Ра., .\zoo_data.txt

iardvark,l,0,0,1,0,0,1,1,1,1,0,0,4,0,0,1,1 aitelope,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1 iass,0,0,1,О,О,1,1,1,1,О,О,1,0,1,0,0,4 >еас,1,0,0,1,0,0,1,1,1,1,0,0,4,0,0,1,1 юаг,1,0,О,1,0,О,1,1,1,1,О,О,4,1,0,1,1

й

J

Мастер текстов (импорт] -

Данный диалог позволяет установить разделители для текстовых данных.

Результат выводится в окне образца разбора.

-Символом-разделителем является; -------------------------^ I

[7 точка с запятой [у* символ табуляции Считать

П последовательные разделители одним

Ограничитель строк:

І І

-Образец разбора данных

dvark,1,0,0,1,0,0,1,1,1,1,0,0,4,0,0,1,1 antelope,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1 s,0,О,1,0,О,1,1,1,1,О,О,1,0,1,0,О,4 г,1,0,0,1,0,0,1,1,1,1,0,0,4,0,0,1,1 г,1,0,О,1,0,О,1,1,1,1,О,О,4,1,0,1,1

Л.

Отмена | < Назад 11 Далее > | Готово

Рисунок 2. Excel-окно №1

Рисунок 3. Excel-окно №2

- во 2-м окне задаем символ-разделитель "запятая" и нажимаем кнопку: "Далее", появляется 3-е окно (рисунок 4);

- нажимаем "Готово" и появляется 4-е окно (рисунок 5):

Мастер текстов (импорт] - шаг 2 из 3

Данный диалог позволяет установить разделители для текстовых данных. Результат выводится в окне образца разбора.

-Символом-разделителем является:------

точка с запятой р1 символ табуляции р/ {запятая! Г” гробел Г другой:

Р Считать

последовательные разделители одним

Ограничитель строк:

гэ

-Образец разбора данных

±ardvark L D D L ж I

antelope L ) ) L

j ass 3 ) ) )

near L : ) L

:oar 1 3 j 1

<1

< Назад Далее > I Готово

у т а у х ъ ® <

ЦТо §1 ж к ч В

Z

иг

Рисунок 4. Excel-окно №3

Рисунок 5. Excel-окно №4

4. Оформляем Excel-таблицу, представленную на рисунке 5, с использованием информации, содержащейся в общем описании задачи. В результате получаем таблицу (рисунок б) и записываем ее в Excel-книге с именем: zoo data.xls.

Microsoft Excel - zoo_data

Ы1 Файл Правка Виц Вставка Формат Сервис Данные Окно ?

шж

-jg| х|

Q Закрыть Ц #а^ & % Ш, ■о ▼ % € т Х /* ЯІ АІ Й f 4* 1Ю% •

Arial Суг ИИ 10 Н ж к ч IHSiBi W % ♦,0 ,00 J ,00 + ,0 ▼ ▼

CDEFGH I JKLMiNOPQRS:

W

3 Ns animal name hair feathers | (Л ІП ЇК 0) milk airborne | aquatic predator I toothed backbone breathes | venomous | fins =9 a « 31 & "ra domestic | catsize r-r T“ 0І 2. kod animal name [1-101]

4 1 2 3 4 5 S 7 a 9 10 11 12 13 14 15 16 17 18 1

5 1 aardvark 1 0 0 1 0 0 1 1 1 1 0 0 4 0 0 1 1 1

6 2 antelope 1 0 0 1 0 0 0 1 1 1 0 0 4 1 0 1 1 2

7 3 bass 0 0 1 0 0 1 1 1 1 0 0 1 0 1 0 0 4 3

а 4 bear 1 0 0 1 0 0 1 1 1 1 0 0 4 0 1 1 4

э 5 boar 1 0 0 1 0 0 1 1 1 1 и 0 4 1 0 1 1 5

10 S buffalo 1 0 0 1 0 0 0 1 1 1 0 0 4 1 0 1 1 6 j

11 7 calf 1 0 0 1 0 0 0 1 1 1 0 0 4 1 1 1 1 7

12 8 carp 0 0 1 0 0 1 0 1 1 0 0 1 0 1 1 0 4 8 j

13 9 catfish 0 0 1 0 0 1 1 1 1 0 0 1 0 1 0 0 4 9

14 10 cavy 1 0 0 1 0 0 0 1 1 1 0 0 4 1 0 1 1(1

15 11 cheetah 1 0 0 1 0 0 1 1 1 1 0 0 4 1 0 1 1 11 I

16 12 chicken 0 1 1 0 1 0 0 0 1 1 0 0 2 1 1 0 2 12

17 13 chub 0 0 1 0 0 1 1 1 1 0 0 1 0 1 0 0 4 13

18 14 clam 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 7 14

19 15 crab 0 0 1 0 0 1 1 0 0 0 0 0 4 0 0 0 7 15 і

20 16 crayfish 0 0 1 0 0 1 1 0 0 0 0 0 6 0 0 0 7 T 1fi A -J

ИTVl ► ІМ\zoo_data / Kod /DBF /

ГОТОВО

Рисунок б. Вид фрагмента обучающей выборки в Excel

5. Создаем в Ехсеї-книге zoo_data.xls еще один лист с именем Ко^ в котором булевы значения, означающие "есть атрибут/нет атрибута", заменяются в описательных шкалах и градациях кодами атрибутов (рисунок 7):

6. Создаем Ехсе1-страницу для преобразования в ВББ-стандарт: модифицируем формулу, заменяя пробелы (нет кода) нулями, с целью сохранения единого типа данных для столбцов таблицы, которые станут полями базы данных. Получаем таблицу, фрагмент которой приведен на рисунке 8.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Microsoft Excel - гоо_ date .IS

Файл Правка Дцц Вставка Формат Сервис Данные Окно ? -|g| x|

D Й' Закрыть И El У & Ш IB <3 m т ш т u# T. $ I 21 Ц f 4Й »»% '

|| Ariai Суг - 10 * Ж К ч Щ ш щ gf в ш Ш % , td8 л fi _ -r Ф - A t

D5 Ч =1 =ECriM(zoo_data!D5=1;D$4;0)

ABC D|EFGH I J KLMNOPQR S т SilBu v | w X

1

2 Attributes Class#

3- animal name ‘5 feathers V; EF> SI -Ц. і airborne aquatic +-■ Я ■и Ч> 1— а. toothed backbone breathes venomous i/1 £ a (Л Ol a "ra +-■ 0 Ъ 1 о ■3 а Ы 1 О rv. Т“ 03 а. & kod animal name (1101) kiass type |1V| kiass kod name (1-1011

4 N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 23 24 25 26 33 Г 8

'> 1 aardvark 2 0 0 5 0 0 8 9 10 11 0 Q 18 Cl О 25 26 33 1 3

6 2 antelope 2 0 0 5 0 0 0 9 10 11 0 0 18 23 0 25 26 34 1 9

7 3 bass 0 0 4 0 0 7 8 9 10 0 0 13 14 23 0 0 29 35 4 10

В 4 bear 2 0 0 5 0 0 8 9 10 11 0 G 18 0 и 25 26 36 1 11

9 5 boar 2 I] 0 5 0 Cl 8 9 10 11 0 G 18 23 и 25 26 37 1 12

10 6 buffalo 2 0 0 5 0 0 0 9 10 11 0 G 18 23 0 25 26 за 1 13

11 7 calf 2 I] 0 5 0 0 0 9 10 11 0 0 18 23 24 25 26 39 1 14

12 8 carp 0 0 4 G 0 7 0 9 10 0 0 13 14 23 24 0 29 40 4 15

13 9 catfish 0 I] 4 D 0 7 8 9 10 I] 0 13 14 23 П 0 29 41 4 16

14 10 cavy 2 0 0 5 0 0 П 9 10 11 0 G 18 0 24 0 26 42 1 17

15 11 cheetah 2 0 0 5 0 Cl 8 9 10 11 0 0 18 23 0 25 26 43 1 18

16 12 chicken 0 3 4 G 6 0 0 0 10 11 0 G 16 23 24 0 27 44 2 19

17 13 chub 0 I] 4 G 0 7 8 9 10 I] G 13 14 23 0 0 29 45 4 20

18 14 clam 0 0 4 G 0 0 8 0 0 0 0 G 14 0 О 0 32 46 7 21

19 13 crab 0 I] 4 0 0 7 8 0 0 I] 0 0 18 0 0 0 32 47 7 22

20 16 crayfish 0 0 4 G 0 7 8 0 0 0 0 G 20 и и и 32 48 7 23

01 17 r ' Г: ' '"■■I л г Г n О 1 in 11 n n ifi ГІ п Э7 IQ T O/l

N < ► > I \ zoo data / Kod \DBF / 1< 1 HI

Готово I | | iNUMl Sf 3-

Рисунок 8. Лист кодов обучающей выборки в Excel для преобразования в DBF-стандарт

7. Записываем лист "ОББ" Ехсе1-таблицы в ВББ-стандарте:

- отмечаем блоком подтаблицу: Л4:У105, в которой находятся коды атрибутов и классов;

- помещаем отмеченный блок в буфер обмена;

- выбираем режим "Файл - Сохранить как - Тип файла: БББ 4 (ББЛБЕ IV) - Сохранить".

8. Аналогично записываем в БББ-стандарте Ехсе1-таблицу Prizn.xls.

В результате получаем промежуточные ОББ-файлы с именами:

- Zoo_data.dbf: база данных с кодами признаков (атрибутов);

- Prizn.dbf: база данных с признаками (атрибутами).

Фрагменты этих баз данных, как они отображаются в просмотрщике,

представлены на рисунках 9 и 10. Отметим, что эти промежуточные базы данных содержат всю необходимую и достаточную информацию в заданном стандарте для выполнения следующего - 2-го этапа работы.

nc - dbview

Авто

dBASE View: D: \ . l\zoo data.dbf 1 / 101

1

N N2 N3 N4 N5 N6 N7 N8 N9 N10 N11 N12 N13 N14 N15 N16 N17

1 aardvark HI 0 Ш Hi 0 0 '"33 9 10 ШІ ш ш т 0 Si

2 antelope 2 0 0 5 0 0 0 9 10 11 0 0 18 23 0

3 bass 0 0 4 0 0 7 8 9 10 0 0 13 14 23 0

4 bear 2 0 3 5 8 8 8 9 10 11 8 8 18 8 0

5 boar 2 0 0 5 0 0 8 9 10 11 0 0 18 23 0

6 buffalo 2 0 0 5 0 0 0 9 10 11 0 0 18 23 0

7 calf 2 0 0 5 0 0 0 9 10 11 0 0 18 23 24

8 carp 8 8 4 8 0 7 0 9 10 8 8 13 14 23 24

9 catfish 0 0 4 0 0 7 8 9 10 0 0 13 14 23 0

10 cavy 2 0 0 5 0 0 0 9 10 11 0 0 18 0 24

11 cheetah 2 0 0 5 0 0 8 9 10 11 0 0 18 23 0

12 chicken 0 0 4 8 6 8 8 8 10 її 0 8 16 23 24

13 chub 0 0 4 0 0 7 8 9 10 0 0 13 14 23 0

14 clam 0 0 4 0 0 0 8 0 0 0 0 0 14 0 0

15 crab 0 0 4 0 0 7 8 0 0 0 0 0 18 0 0

16 crayfish 0 8 4 8 8 7 8 8 8 8 8 8 20 8 0

17 crow 0 3 4 8 6 0 8 8 10 11 0 8 16 23 0

18 deer 2 0 0 5 0 0 0 9 10 11 0 0 18 23 0

19 dogfish 0 0 4 0 0 7 8 9 10 0 0 13 14 23 0

20 dolphin 0 8 0 5 0 7 8 9 10 11 0 13 14 23 0

HSearch

ИИ'І in і t

Рисунок 9. Фрагмент базы данных: Zoo_data.DBF

nc - dbview

вис

Авто

dBflSE View: D:\..,_s~l\prizn.dbf

animal name hair

feathers

eggs

milk

airborne

aquatic

predator

toothed

backbone

breathes

venomous

fins

legs-0

legs-1

legs-2

legs-3

legs-4

legs-5

legs-6

N3

Unique for each instance

Boolean

Boolean

Boolean

Boolean

Boolean

Boolean

Boolean

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Boolean

Boolean

Boolean

Boolean

Boolean

Numeric (set of values: {0-8})

HSearch

■EjjQuit

Рисунок 10. Фрагмент базы данных: Prizn.DBF

2-й этап: преобразование исходных данных из промежуточных DBF-файлов в базы данных системы "Эйдос"

Программный интерфейс для преобразования промежуточных DBF-файлов в базы данных системы "Эйдос"

Предлагается программный интерфейс, обеспечивающий автоматическое преобразование промежуточных DBF-файлов Zoo_data.dbf и Prizn.dbf в базы данных системы "Эйдос" (исходный текст на языке программирования - xBase приведен ниже): ********************************************************************************

*** ФОРМИРОВАНИЕ КЛАССИФИКАЦИОННЫХ И ОПИСАТЕЛЬНЫХ ШКАЛ И ГРАДАЦИЙ,

*** А ТАКЖЕ ОБУЧАЮЩЕЙ ВЫБОРКИ ИЗ DBF-Excel-файла РЕПОЗИТАРИЯ UCI ПО ЖИВОТНЫМ *** http://ftp.ics.uci.edu/pub/machine-learning-databases/zoo/zoo.names *** Луценко Е.В., 10/18/04 01:19pm ********************************************* scr23 = SAVESCREEN(0,0,24,79)

SET CURSOR OFF SET DATE ITALIAN SET DECIMALS TO 15

SET ESCAPE On FOR J=0 TO 24

@J,0 SAY REPLICATE(" ”,80) COLOR "rg+/N"

NEXT

SHOWTIME(0,60,.F.,"rg+/n",.F.,.F.)

Mess = " === ФОРМИРОВАНИЕ СПРАВОЧНИКОВ КЛАССИФИКАЦИОННЫХ ШКАЛ == "

@2,40-LEN(Mess)/2 SAY Mess COLOR "rg+/rb"

Vid = "Y"

@17, 6 SAY "Включать в признаки коды наименования животного и его вида <Y/N>? #" COLOR "w+/rb"

* 0123456789012345678901234567890123456789012345678901234567890123456789012345678

* 0 10 20 30 40 50 60 70

@17,72 GET Vid PICTURE "X" COLOR "rg+/r"

SET CURSOR ON;READ;SET CURSOR OFF IF Vid <> "Y" .AND. Vid <> "N"

Vid = "N"

ENDIF

USE Object EXCLUSIVE NEW;ZAP USE Zoo_data EXCLUSIVE NEW ArObj := {}

AADD(ArObj," МЛЕКОПИТАЮЩИЕ ")

AADD(ArObj," ПТИЦЫ ")

AADD(ArObj," ПРЕСМЫКАЮЩИЕСЯ ?")

AADD(ArObj," РЫБЫ ")

AADD(ArObj," ЗЕМНОВОДНЫЕ ")

AADD(ArObj," НАСЕКОМЫЕ ")

AADD(ArObj," МНОГОНОГИЕ ")

SELECT Zoo_data DBGOTOP()

DO WHILE .NOT. EOF()

AADD(ArObj,FIELDGET(2))

DBSKIP(1)

ENDDO

SELECT Object DBGOTOP()

FOR j=1 TO LEN(ArObj)

APPEND BLANK REPLACE Kod WITH j REPLACE Name WITH ArObj[j]

NEXT

CLOSE ALL

Mess = " ===== ФОРМИРОВАНИЕ СПРАВОЧНИКОВ ОПИСАТЕЛЬНЫХ ШКАЛ ===== "

USE Prizn EXCLUSIVE NEW

USE Priz_per EXCLUSIVE NEW;ZAP

ArPr := {}

SELECT Prizn DBGOTOP()

DO WHILE .NOT. EOF()

AADD(ArPr,FIELDGET(2))

DBSKIP(1)

ENDDO

SELECT Priz_per DBGOTOP()

FOR j=1 TO IF(Vid="Y",LEN(ArPr),25)

APPEND BLANK REPLACE Kod WITH j REPLACE Name WITH ArPr[j]

NEXT

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

CLOSE ALL

Mess = " ========== ФОРМИРОВАНИЕ ОБУЧАЮЩЕЙ ВЫБОРКИ ========== "

CLOSE ALL

USE Zoo_data EXCLUSIVE NEW USE ObInfZag EXCLUSIVE NEW;ZAP USE ObInfKpr EXCLUSIVE NEW;ZAP N_Rec = RECCOUNT()

DBGOTOP()

@24,0 SAY REPLICATE("-",80) COLOR "rb/n"

SELECT Zoo_data DBGOTOP()

DO WHILE .NOT. EOF()

ArObj := {}

FOR j=1 TO 2

AADD(ArObj,FIELDGET(j))

NEXT

FOR j=21 TO 22

AADD(ArObj,FIELDGET(j))

NEXT

ArPr := {}

FOR j=3 TO 20

Mv = FIELDGET(j)

IF Mv > 0

IF Vid = "Y"

AADD(ArPr,Mv)

ELSE

IF Mv <= 25

AADD(ArPr,Mv)

ENDIF

ENDIF

ENDIF

NEXT

****** Запись массива кодов классов из БД Zoo_data в БД ObInfZag

SELECT ObInfZag

APPEND BLANK

FOR j=1 TO LEN(ArObj)

FIELDPUT(j,ArObj[j])

NEXT

****** Запись массива кодов признаков из БД Zoo_data в БД ObInfKpr

SELECT ObInfKpr

APPEND BLANK

FIELDPUT(1,ArObj[1])

k=2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

FOR j=1 TO LEN(ArPr)

IF k <= 12

FIELDPUT(k++,ArPr[j])

ELSE

APPEND BLANK

FIELDPUT(1,ArObj[1])

k=2

FIELDPUT(k,ArPr[j])

ENDIF

NEXT

SELECT Zoo_data DBSKIP(1)

ENDDO

RESTSCREEN(0,0,24,79,scr23)

CLOSE ALL QUIT

Программный интерфейс автоматически заполняет исходными данными следующие базы данных системы "Эйдос":

- Object.dbf: классы (классификационные шкалы и градации);

- Priz_per.dbf: атрибуты (описательные шкалы и градации);

- ОЫ^Еад.^^ обучающая выборка (главная база данных);

- ОЫп^рг.^^ обучающая выборка (связанная база данных).

В результате система "Эйдос" готова к синтезу семантической информационной модели и выполнению последующих этапов работ.

Синтез семантической информационной модели

Синтез СИМ состоит в расчете ряда баз данных, главной из которых является матрица информативностей. Этот синтез осуществляется на основе информации, содержащейся в файлах, перечисленных в предыдущем разделе. Для этих целей используется режим: "Обучение - Синтез семантической информационной модели - Автоматическое выполнение 1 -2-3-4" (рисунок 11):

Оптимизация семантической информационной модели

Оптимизация СИМ состоит в удалении из модели атрибутов с низкой селективной силой (по сути это Парето-оптимизация или ортонормирование) и осуществляется в режиме: "Исключение признаков с низкой селективной силой" подсистемы "Оптимизация" (рисунок 12).

В данном случае оптимизации СИМ не требуется, т.к. система признаков в модели содержит всего 25 булевых градаций, и все они, в основном, имеют достаточно высокую значимость, что видно из характерной формы Парето-диаграммы с отсутствием выраженной "полочки" (рисунок 13):

CopyRiglit (с) Scientific ft industrial enterprise AIDOS, Russia, 1981-2001. Russian Patent N0 940217. All Rights Reserued.

СЕЛЕКТИВНАЯ СИЛА СИСТЕМЫ ПРИЗНАКОВ

iU

і и И іU I

ш

I

ь

ї

ш

ш

U

Признаки б поря дке убывания селективном силы

Рисунок 13. Парето-диаграмма атрибутов (накопительная, т.е. логистическая, кривая значимости атрибутов)

Проверка адекватности семантической информационной модели

Верификацию модели предлагается проверить путем расчета внутренней дифференциальной и интегральной валидности [1].

Необходимо отметить, что внутренняя валидность варианта семантической информационной модели, не учитывающей сделанные выше замечания к общему описанию задачи, составляет 100 %.

Для измерения валидности модели выполняются следующие действия:

1. Скопировать обучающую выборку в распознаваемую в подсистеме: 'Т2 Обучение - ввод корректировка обучающей информации - Б5

Об.инф.->Расп.анк. - Б2 Перезапись БД распознаваемых анкет - Б1 Копировать всю БД".

2. Выполнить пакетное распознавание в подсистеме: 'Т4 Распознавание - Пакетное распознавание - Критерий сходства 1-й (корреляция)".

3. Измерить внутреннюю интегральную и дифференциальную валидность информационной модели в подсистеме: 'Т6 Анализ".

Результаты измерения внутренней валидности семантической информационной модели приведены в таблице 2:

Таблица 2 - ИЗМЕРЕНИЕ ВАЛИДНОСТИ ______СЕМАНТИЧЕСКОЙ ИНФОРМАЦИОННОЙ МОДЕЛИ_________________

ВСЕГО анкет ( физических/логических ): 101/101 Распознано верно: 86 Распознано ошибочно: 15 ВАЛИДНОСТЬ Системы распознавания: 85.1485%

21-10-04 17:25:14 г.Краснодар

! N 1 п/п 1 Код | і класса j Наименования классов і Всего | і анк.лог| Распозн верно Распозн ошибочн Валидность j Системы(%)|

1 1 1 2 | ПТИЦЫ 1 20 | 20 1 0 | | 100.0000 |

1 з 1 4 | РЫБЫ 1 із | 13 1 0 | | 100.0000 |

1 5 1 5 | ЗЕМНОВОДНЫЕ 1 4 | 4 1 0 1 | 100.0000 |

1 7 1 6 | НАСЕКОМЫЕ 1 8 | 8 1 0 1 | 100.0000 |

1 9 1 1 1 МЛЕКОПИТАЮЩИЕ... 1 41 | 35 1 6 1 | 85.3659 |

1 11 1 3 | ПРЕСМЫКАЮЩИЕСЯ?. 1 5 | 4 1 1 1 | 80.0000 |

1 із 1 7 | МНОГОНОГИЕ 1 ю | 2 1 8 | | 20.0000 |

Универсальная когнитивная аналитическая система______________НПП *ЭЙДОС*

Обобщенные результаты распознавания представлены в таблице 3. Красным цветом и жирным шрифтом отмечены ошибочно идентифицированные объекты.

Таблица 3 - ИТОГОВЫЕ РЕЗУЛЬТАТЫ ИДЕНТИФИКАЦИИ

22-10-04 10:35:33 г.Краснодар

І N° І анкеты Наим.физ. источника Распозн.как класс Код j Наименование Фактический класс Код j Наименование Процент сходства Интегр. І кач-во

І 1 aardvark 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 45.153 58.327

І 2 antelope 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.860 72.096

І 3 4 РЫБЫ 4 РЫБЫ 69.091 69.802

І 4 bear 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 45.153 58.327

І 5 boar 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

І 6 buffalo 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.860 72.096

І 7 calf 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 50.381 79.729

І в carp 4 РЫБЫ 4 РЫБЫ 56.509 60.908

І 9 4 РЫБЫ 4 РЫБЫ 69.091 69.802

І 10 cavy 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 44.637 49.336

І 11 cheetah 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

І 12 chicken 2 ПТИЦЫ 2 ПТИЦЫ 68.532 81.600

І 13 4 РЫБЫ 4 РЫБЫ 69.091 69.802

4 1 clam з 3 ПРЕСМЫКАЮЩИЕСЯ 7 МНОГОНОГИЕ 39.293 22.4б0

5 1 crab 5 5 ЗЕМНОВОДНЫЕ ... 7 МНОГОНОГИЕ 56.552 5б.270

б 1 crayfish 5 5 ЗЕМНОВОДНЫЕ ... 7 МНОГОНОГИЕ 31.918 14.бб9

І 17 crow 2 ПТИЦЫ 2 ПТИЦЫ 61.940 73.682

І 18 deer 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.860 72.096

І 19 І dogfish dolphin 4 РЫБЫ 4 РЫБЫ 57.215 71.018

0 2 4 4 РЫБЫ 1 МЛЕКОПИТАЮЩИЕ . 45.813 59.973

І 21 dove 2 ПТИЦЫ 2 ПТИЦЫ 68.532 81.600

І 22 duck 2 ПТИЦЫ 2 ПТИЦЫ 62.602 69.240І

І 23 elephant 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.860 72.096

І 24 flamingo 2 ПТИЦЫ 2 ПТИЦЫ 58.945 78.981

І 25 flea 6 НАСЕКОМЫЕ 6 НАСЕКОМЫЕ 57.880 53.753

І 26 frog 5 ЗЕМНОВОДНЫЕ ... 5 ЗЕМНОВОДНЫЕ... 56.991 58.285

І 27 frog 5 ЗЕМНОВОДНЫЕ ... 5 ЗЕМНОВОДНЫЕ... 74.297 59.241

2 00 fruitbat 2 2 ПТИЦЫ 1 МЛЕКОПИТАЮЩИЕ . 29.712 33.413

І 29 giraffe 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.860 72.096

30 girl 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 37.676 59.877

31 gnat goat 6 НАСЕКОМЫЕ 6 НАСЕКОМЫЕ 70.170 62.829

32 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 50.381 79.729j

33 gorilla 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 34.549 50.131

34 gull 2 ПТИЦЫ 2 ПТИЦЫ 53.136 62.059

35 4 РЫБЫ 4 РЫБЫ 72.286 74.190j

36 hamster 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 45.203 61.201

37 hare 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 41.787 52.991

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

38 hawk 2 ПТИЦЫ 2 ПТИЦЫ 61.940 73.682

39 herring honeybee housefly kiwi 4 РЫБЫ 4 РЫБЫ 69.091 69.802

40 6 НАСЕКОМЫЕ 6 НАСЕКОМЫЕ 77.866 63.618

41 6 НАСЕКОМЫЕ 6 НАСЕКОМЫЕ 68.475 65.459

42 2 ПТИЦЫ 2 ПТИЦЫ 45.650 56.201

43 ladybird lark 6 НАСЕКОМЫЕ 6 НАСЕКОМЫЕ 46.561 40.244

44 2 ПТИЦЫ 2 ПТИЦЫ 72.585 82.063

45 leopard 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

46 lion 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

47 lobster 5 ЗЕМНОВОДНЫЕ... 7 МНОГОНОГИЕ 31.918 14.669

48 lynx 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

49 mink 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 37.537 54.433

50 mole 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 40.754 51.203

51 mongoose 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

52 6 НАСЕКОМЫЕ 6 НАСЕКОМЫЕ 68.475 65.459

53 newt 5 ЗЕМНОВОДНЫЕ... 5 ЗЕМНОВОДНЫЕ... 31.652 34.274

54 octopus 7 МНОГОНОГИЕ .... 7 МНОГОНОГИЕ 32.232 37.177j

55 opossum 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 40.754 51.203

56 oryx 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.860 72.096

57 ostrich 2 ПТИЦЫ 2 ПТИЦЫ 42.539 65.476j

58 parakeet 2 ПТИЦЫ 2 ПТИЦЫ 68.532 81.600

59 penguin 2 ПТИЦЫ 2 ПТИЦЫ 25.030 42.429

60 pheasant 2 ПТИЦЫ 2 ПТИЦЫ 72.585 82.063

61 pike piranha pitviper 4 РЫБЫ 4 РЫБЫ 57.215 71.018

62 4 РЫБЫ 4 РЫБЫ 69.091 69.802

63 3 ПРЕСМЫКАЮЩИЕСЯ 3 ПРЕСМЫКАЮЩИЕСЯ 66.439 56.486

64 platypus 5 ЗЕМНОВОДНЫЕ... 1 МЛЕКОПИТАЮЩИЕ . 14.210 31.316

65 polecat 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

66 pony 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 50.381 79.729j

67 porpoise 4 РЫБЫ 1 МЛЕКОПИТАЮЩИЕ . 45.813 59.973

68 puma 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

69 pussycat 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 49.870 80.029

70 raccoon 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

71 reindeer 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 50.381 79.729j

72 rhea 2 ПТИЦЫ 2 ПТИЦЫ 33.019 56.339

73 scorpion 3 ПРЕСМЫКАЮЩИЕСЯ 7 МНОГОНОГИЕ 41.478 34.054

74 4 РЫБЫ 4 РЫБЫ 72.286 74.190j

75 seal 4 РЫБЫ 1 МЛЕКОПИТАЮЩИЕ . 42.257 46.155

76 sealion 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 22.089 34.131

77 seasnake 3 ПРЕСМЫКАЮЩИЕСЯ 3 ПРЕСМЫКАЮЩИЕСЯ 52.601 33.745

78 seawasp 5 ЗЕМНОВОДНЫЕ... 7 МНОГОНОГИЕ 51.925 13.781

79 skimmer 2 ПТИЦЫ 2 ПТИЦЫ 53.136 62.059

80 skua 2 ПТИЦЫ 2 ПТИЦЫ 53.136 62.059

81 slowworm 3 ПРЕСМЫКАЮЩИЕСЯ 3 ПРЕСМЫКАЮЩИЕСЯ 38.461 37.271

82 slug 4 РЫБЫ 4 РЫБЫ 32.953 16.992

83 4 РЫБЫ 4 РЫБЫ 72.286 74.190j

84 sparrow 2 ПТИЦЫ 2 ПТИЦЫ 72.585 82.063

85 squirrel 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 29.979 36.725

86 starfish 7 МНОГОНОГИЕ 7 МНОГОНОГИЕ 48.217 40.232

87 stingray swan 4 РЫБЫ 4 РЫБЫ 51.509 40.028

88 2 ПТИЦЫ 2 ПТИЦЫ 50.226 66.336

89 6 НАСЕКОМЫЕ 6 НАСЕКОМЫЕ 57.880 53.753

90 toad 5 ЗЕМНОВОДНЫЕ... 5 ЗЕМНОВОДНЫЕ... 56.315 55.604

91 tortoise 5 ЗЕМНОВОДНЫЕ... 3 ПРЕСМЫКАЮЩИЕСЯ 0.892 15.775

92 tuatara 3 ПРЕСМЫКАЮЩИЕСЯ 3 ПРЕСМЫКАЮЩИЕСЯ 20.568 22.593

93 4 РЫБЫ 4 РЫБЫ 57.215 71.018

94 vampire 2 ПТИЦЫ 1 МЛЕКОПИТАЮЩИЕ . 29.712 33.413

95 vole 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 41.787 52.991

96 vulture 2 ПТИЦЫ 2 ПТИЦЫ 49.581 73.319j

97 wallaby 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 35.494 57.713

98 wasp wolf 6 НАСЕКОМЫЕ 6 НАСЕКОМЫЕ 80.325 60.030

99 1 МЛЕКОПИТАЮЩИЕ. 1 МЛЕКОПИТАЮЩИЕ. 46.057 71.045

100 worm 4 РЫБЫ 7 МНОГОНОГИЕ 32.953 16.992

101 wren 2 ПТИЦЫ 2 ПТИЦЫ 72.585 82.063

Низкая достоверность идентификации класса многоногих, по-видимому, обусловлена тем, что в этот класс включены представители нескольких различных видов. Если их разделить на разные классы, то адекватность модели возрастет. Аналогичное предположение можно высказать по классу, который мы условно назвали "Пресмыкающиеся". Возможно, автор задачи разрабатывал ее с определенной долей иронии. Вместе с тем это никак не отражается на методике, предлагаемой в данной статье.

Что касается класса "Млекопитающие", то, по-видимому, необходимо включить в модель дополнительные атрибуты, характерные именно для этого класса. Это следует из анализа результатов идентификации летучей мыши и дельфина (рисунки 13 и 14). Летучая мышь отнесена к птицам, а дельфин - к рыбам, т.к. по совокупности использованных в модели атрибутов они оказались наиболее похожими на обобщенные образы именно этих классов. Это подтверждают информационные портреты классов "Vampir" и "Dolphin", приведенные на рисунках 15 и 16. Вместе с тем необходимо обратить внимание на то, что в обоих случаях на втором месте по уровню сходства стоит правильный класс "Млекопитающие".

RASP • RASP

-Ш1

ю к is g| Нем ШІЖІ0 AJ

Универсальная когнитивная аналитическая система 14:36 (с) НПП »ЭИД0С«

ЇЇ1 t

№анкеты:

Наим.физ.источника:

Качество:

33. U3

%

Код

Наименование класса

Гистограмма сходств/различий

ПТИЦЫ

МЛЕКОПИТАЮЩИЕ

НАСЕКОМЫЕ

30

U

5

ПРЕСМЫКАЮЩИЕСЯ?

РЫБЫ

ЗЕМНОВОДНЫЕ

МНОГОНОГИЕ

1

-10

-26

-41

Г1 Стр.Т F2Ctp.1 ГЗПечать карточки Г4Печать всех карточек ПіПечать сводной формы

Рисунок 14. Результаты идентификации летучей мыши

”3 RASP • RASP

-Ш1

10

no nH IbI Ш ЖІ0 AJ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Универсальная когнитивная аналитическая система 9:26 (с) НПП -ЗИД0С-

1 Г

№анкеты:

Наим.физ.источника:

dolphin

Качество:

59.973

%

Код

Наименование класса

Гистограмма сходств/различий

РЫБЫ

МЛЕКОПИТАЮЩИЕ

46

7

ПРЕСМЫКАЮЩИЕСЯ?

ЗЕМНОВОДНЫЕ

МНОГОНОГИЕ

ПТИЦЫ

НАСЕКОМЫЕ

-1

-5

-25

-36

-37

Г1 Стр.Т F2Ctp.1 ГЗПечать карточки Г4Печать всех карточек ПіПечать сводной формы

Рисунок 15. Результаты идентификации дельфина

CopuRight (с) Scientific & industrial enterprise fllDOS, Russia, 19B1-2001. Russian Patent Mo 940217. All Tlights Reserued.

Информационный портрет класса распознавания: [1]-МЛЕКОПИТАЮЩИЕ <[0]->

Фильтр: Й11, Fositiue

ffl Milk haip ^ 1 egs-4 -|{Ц cats і ze ||j{ too tiled

doMestic W breathes | backbone

Рисунок 16. Информационный портрет класса: "Млекопитающие"

CopyRiglit (с) Scientific & industrial enterprise AIDOS, Russia, 1981-2001. Russian Patent Mo 940217. All Ttights Reserued.

Информационный портрет класса распознавания:

[2]-ПТИЦЫ <[□]-)

Фильтр: till, Fositiue

ЦЦ £ eathers ptl 1 e cf s — 2 ai rborne 9 eggs ЙЙ tail

^ breathes фф backbone m io«cstic

_______Рисунок 17. Информационный портрет класса: "Птицы"___________

Анализ семантической информационной модели

Так как модель показала достаточно высокую степень адекватности, то исследование модели может корректным образом в определенных отношениях заменить изучение реального объекта (предметной области). В задачи данной статьи не входит освещение всех возможностей анализа модели, т.к. они подробно освещены в монографии [2]. Поэтому здесь мы ограничимся описанием лишь некоторых возможностей.

Результаты кластерно-конструктивного анализа классов представлены в графической форме семантической сети (рисунок 18).

Из этого рисунка видно, что млекопитающие в используемой системе признаков в наибольшей степени отличаются от рыб (конструкт: "Млекопитающие - рыбы", коды 1 и 4), а земноводные очень похожи на пресмыкающихся (кластер: коды 3 и 5).

Внутренняя структура любой линии на рисунке 18 может быть расшифрована и представлена в виде когнитивной диаграммы, одна из которых (в качестве примера) показана на рисунке 19:

CopuRiglit (с) Scientific fi industrial enterprise AIDOS, Russia, 19B1-2001. Russian Patent Mo 940217. All Ttights Reserued.

КОГНИТИВНЫЕ ДИАГРАММЫ КЛАССОВ РАСПОЗНАВАНИЯ:

ш

Я

0 с

з

ш

к

1

о

3

а

г

Наименоб.признакоб:

Признаки: 1-25

Отношения сходства:

[21-ПТИЦЫ [11-М ЛЕКОПИ ТЙЮИ1ИЕ

K0R=-33.17^ _________Наименоб.признакоб:

КОП=0 КПП=3 I=0.66BiT 1=23 .5в/.

КОП=0 КПП=16 I =0 .53Bit I =18 .98Х

КОП=0 КПП=6 I=0.49Bif 1=17 .39Х

КОП=0 КПП=4 1=0.20Bit 1=7.2в/.

КОП=0 КПП=7 I = “0 .10Bit I = -3 .50Z

КОП=0 Кпп=25 I = -0 .iSBiT 1 = -6 .53^

различия:

Коп=0 КПП=5 =0 .33Bit =11.58 X

Коп=0 КПП=2 =0 .28Bit =10.11/.

КОП=0 КПП=9 =0 .ISBit =5 .22V.

КОП=0

Кпп=16 = -0.25Bit = -8.77 V.

КОП=0 КПП=7 = -0.43Bit = -15 АТА

КОП=0 КПП=Н = -0.54Bit = -19.12 ^

КОП=0 Кпп=6 = -0.73Bit = -25 .ЬЬУ.

КОП=0 КПП=4 = -1.40Bit = -49.88 У.

Признаки: 1-25

Сила сбязи - толщина линии

Рисунок 19. Расшифровка вклада атрибутов в сходство-различие классов: "Млекопитающие" и "Птицы"

Результаты кластерно-конструктивного анализа атрибутов приведены в графической форме семантической сети на рисунке 20:

Из рисунка 20 видно, что атрибуты "Milk - eggs" (коды 5 и 4) образуют конструкт, как и, например, "наличие шерсти и отсутствие ног" (коды 2 и 14).

Заключение

Таким образом, можно сделать вывод о том, что приведенная в статье методика обеспечивает решение поставленной задачи, т.е. оценку качества математических моделей систем искусственного интеллекта путем использования баз данных репозитария UCI.

Аналогичный подход может быть эффективен и в случае использования других источников исходных данных (не UCI), а также других систем искусственного интеллекта (не системы "Эйдос"). Репозитарий UCI, семантическая информационная модель и реализующая ее универсальная когнитивная аналитическая система "Эйдос" рассмотрены в статье в качестве примеров для демонстрации основных элементов предлагаемой типовой методики. В случае необходимости данная методика может быть развита или адаптирована для других случаев.

Список литературы

1. Lutsenko E.V. Conceptual principles of the sistem (emergent) information theory & its application for the cognitive modelling of the active objects (entities) //2002 IEEE International Conference on Artificial Intelligence System (ICAIS 2002).-Computer society, IEEE, Los Alamos, California, Washington-Brussels-Tokyo, p.268-269.

2. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-

психологических, технологических и организационно-технических систем): Монография (научное издание). -Краснодар: КубГАУ. 2002. -605 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.