Научная статья на тему 'Использование экспертных систем определения принадлежности сущности к определённому классу в распознавании символов'

Использование экспертных систем определения принадлежности сущности к определённому классу в распознавании символов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
82
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пикалов Иван Юрьевич, Тарасюк В. Б

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование экспертных систем определения принадлежности сущности к определённому классу в распознавании символов»

УДК 681.5; 621.398; 681.3

ИСПОЛЬЗОВАНИЕ ЭКСПЕРТНЫХ СИСТЕМ ОПРЕДЕЛЕНИЯ ПРИНАДЛЕЖНОСТИ СУЩНОСТИ К ОПРЕДЕЛЁННОМУ КЛАССУ В РАСПОЗНАВАНИИ СИМВОЛОВ

© 2018 И. Ю. Пикалов1, В. Б. Тарасюк2

1 канд. пед. наук, доцент, доцент кафедры компьютерных технологий и информатизации образования e-mail: pikalov a kursksii.ru 2 канд. техн. наук, доцент, доцент кафедры компьютерных технологий и информатизации образования e-mail: tarasuk. vladimir a mail. ru

Курский государственный университет

В работе рассматривается решение задачи распознавания десятичных цифр с использованием экспертных систем определения принадлежности сущности к определенному классу.

Ключевые слова: экспертная система, распознавание символов, весовые характеристики атрибутов.

Экспертные системы позволяют заменить человека-эксперта при решении задач определенной предметной области. Они могут предлагать как конечное решение поставленной перед ними задачи, так и рекомендации по дальнейшим действиям при поиске ответа на поставленный вопрос. Кроме того, многие экспертные системы способны объяснить ход рассуждений при выборе решений.

Отдельно можно выделить экспертные системы распознавания образов. Экспертные системы применяются в сочетании с базами данных для обеспечения распознавания образов по такому же принципу, как это делает человек [Джарратано, Райли 2007].

Нами предложено два метода построения экспертной системы, позволяющей определять принадлежность сущности к определенному классу. При этом на классы сущностей никаких условий не накладывается, достаточно просто определиться с атрибутами классов сущностей, позволяющих классифицировать распознаваемую сущность.

Вначале рассмотрим метод определения принадлежности сущности к определенному классу с использованием вектора решений [Пикалов, Тарасюк 2017].

Задача 1. Определить, какой цифрой является введенный символ. Допустимый вид символов показан на рисунке 1.

Сформулируем задачу, применив терминологию экспертной системы определения принадлежности сущности к определенному классу с использованием вектора решений: определить принадлежность сущности к определенному классу сущностей.

Система должна быть обучена распознавать 10 классов сущностей - это цифры от 0 до 9.

Рис. 1. Образец начертания цифр для задач 1 и 2

И

и

Следующим шагом будет определение количества атрибутов, их имен и значений. У нас будет выделено 9 атрибутов, их расположение показано на рисунке 2, а их имена и значения указаны в таблице 1.

3

6

Рис. 2. Расположение атрибутов образцов цифр при описании в экспертной системе

Таблица 1

Атрибуты классов сущностей задачи 1 и их значения

№ п/п Имя атрибута Классы сущностей и значения атрибутов

0 1 2 3 4 5 6 7 8 9

1 1 1 0 0 0 0 0 1 1 1 0

2 2 1 0 0 0 1 1 0 0 1 1

3 3 1 0 1 1 0 1 0 1 1 1

4 4 1 1 1 0 1 0 0 0 1 1

5 5 1 1 0 0 1 1 1 0 1 0

6 6 1 0 1 0 0 1 1 0 1 0

7 7 0 0 1 1 0 0 0 0 0 1

8 8 0 0 0 1 1 1 1 0 1 1

9 9 0 1 0 1 0 0 1 1 0 0

Для обучения и дальнейшего распознавания сущностей будем использовать экспертную систему определения принадлежности сущности к определенному классу GlobalExpert 1.0 (свидетельство о регистрации № 2017619727, дата государственной регистрации в реестре программ для ЭВМ 01 сентября 2017 г.).

Для обучения системе GlobalExpert 1.0 понадобилось 8 циклов (7 циклов система непосредственно обучалась, а 8-й цикл подтвердил, что система обучена распознаванию всех классов сущностей).

Максимальное количество проходов (18) оказалось во втором цикле обучения. Как и подтверждающий 8-й цикл, 7-й цикл также содержал 10 проходов, и в нем были переопределены 4 значения id, а 6 были подтверждены.

В результате эксперимента было доказано, что все 10 классов сущностей определяются безошибочно. Если дело касается определения сущности, описание которой в базе отсутствует, то система выдает сообщение: «Данная сущность не относится ни к одному классу». Это может быть в случае, когда атрибуты указаны ошибочно.

На практике часто встречается ситуация, когда одна цифра имеет несколько вариантов начертания (рис. 3). Решить указанную проблему рассматриваемым способом можно, добавив в систему несколько классов сущностей, соответствующих одному символу. Тогда некоторым цифрам будет соответствовать один класс сущностей (это цифры 0 и 8), некоторым - два (цифры 1, 4, 5, 6 и 9), а некоторым - три (цифры 2, 3 и 7). Несмотря на кажущуюся простоту и очевидность, этот подход содержит ряд недостатков. Во-первых, это приведет к несоответствию реальной ситуации той, которая будет заложена в систему. Во-вторых, это приведет к

увеличению заложенных в систему классов распознаваемых сущностей с 10 до 21, что

увеличит и ввод информации в систему, и время и количество циклов обучения.

Теперь рассмотрим использование для задачи определения принадлежности сущности к определенному классу метода, который основывается на учете весов атрибутов распознаваемых сущностей [Пикалов, Тарасюк 2017а].

Задача 2. Используя экспертную систему определения принадлежности сущности к определенному классу сущностей, основанную на учёте весов атрибутов сущностей, опишем метод распознавания цифр, показанных на рисунке 1.

В этой задаче количество классов сущностей также будет 10. Количество атрибутов, как и в задаче 1, тоже будет равно 9, и их значения показаны в таблице 1.

Отсортированные по невозрастанию атрибуты и их веса показаны в таблице 2. При расчете весов будем использовать формулу = 2я, где w - вес атрибута, я = 0, 1, ..., т. При этом я увеличивается при переходе от одного значения частоты к другому.

Таблица 2

Распределение весов атрибутов для задачи 2

№ п/п Имя атрибута Частота встреч Вес атрибута

1 3 7 1

2 4 6 2

3 5 6 2

4 8 6 2

5 2 5 4

6 6 5 4

7 1 4 8

8 9 4 8

9 7 3 16

Эксперимент показал, что при применении данного метода все цифры, за исключением 8, были угаданы. При распознавании цифры 8 после рассмотрения всех атрибутов группа рассматриваемых классов сущностей имела вид {0, 4, 5, 8}. Это связано с тем, что написание цифр 0, 4 и 5 присутствует в 8 и система не смогла удалить эти группы сущностей из группы рассматриваемых классов сущностей. Для указанных входных данных точность распознавания сущностей составляет 90 %.

Таблица 3

Атрибуты классов сущностей и их значения для задачи 3

№ п/п Имя атрибута 0 1 2 3 4 5 6 7 8 9

1 1 1 0 1 0 0 0 1 1 1 0

2 2 1 0 1 0 1 1 1 0 1 1

3 3 1 0 1 1 0 1 1 1 1 1

4 4 1 1 1 1 0 1 1 1

5 5 1 1 0 1 1 1 1 1 1 1

6 6 1 0 1 1 0 1 1 0 1 1

7 7 0 0 1 1 0 1 1 0 1

8 8 0 0 1 1 1 1 1 0 1 1

9 9 0 1 0 1 1 0 1 1 0 0

Задача 3. Используя экспертную систему определения принадлежности сущности к определенному классу, основанную на учёте весов атрибутов сущностей, опишем метод распознавания цифр, начертание которых показано на рисунке 3.

В этой задаче количество классов сущностей также будет 10. Количество атрибутов, как и в задачах 1 и 2, тоже будет равно 9, но при описании конкретного набора значений атрибутов класса сущностей мы будем использовать объединение наборов атрибутов всех начертаний цифр. Для данной задачи атрибуты и их значения представлены в таблице 3.

Для нашего примера отсортированные по невозрастанию атрибуты и их веса, рассчитанные по формуле = 2я, описанной в примере 1, показаны в таблице 4.

Таблица 4

Распределение весов атрибутов

№ п/п Имя атрибута Частота встреч Вес атрибута

1 5 9 1

2 3 8 2

3 4 8 2

6 2 7 4

4 6 7 4

5 8 7 4

7 1 5 8

8 7 5 8

9 9 5 8

При распознавании нуля при обработке четвертого атрибута с весом, равным 4 (это будет при четвертом проходе по группе рассматриваемых классов сущностей), в группе останется один класс сущностей - класс сущностей 0, и система выдаст верное предположение: «Сущность относится к классу 0».

При распознавании цифры 1, у которой набор атрибутов имеет вид {0 0 0 1 1 0 0 0 1}, верное решение также будет получено при обработке четвертого атрибута.

Если же начать распознавание цифры 1 с набором атрибутов {0 0 0 1 1 0 0 0 0}, то уже при обработке первого атрибута с именем 9 и весом, равным 8, из группы рассматриваемых классов сущностей будет удалена группа сущностей 1, и в итоге система сообщит, что принадлежность сущности не определена. В группе рассматриваемых классов сущностей не останется ни одного класса уже при рассмотрении 3-го по счету атрибута. Несложно предположить, что аналогичным образом не будут распознаны цифры 2, 3, 4, 5, 5, 7, 9.

Проведенные эксперименты ещё раз подтверждают, что ни один из методов искусственного интеллекта не позволяет успешно справиться со всеми проблемами и лучше использовать комбинацию методов [Джарратано, Райли 2007].

Таким образом, в ходе работы было показано, что, во-первых, метод определения принадлежности сущности к определенному классу с использованием вектора решений справляется с задачей распознавания десятичных чисел. Его также можно использовать для распознавания чисел, которые имеют разное начертание, вводя новый класс сущностей для каждого начертания символа.

Во-вторых, для распознавания чисел можно использовать экспертную систему определения принадлежности сущности к определённому классу, использующую метод, основанный на учете весов атрибутов распознаваемых сущностей.

В-третьих, при использовании метода определения принадлежности сущности к определённому классу с учетом весов атрибутов распознаваемых сущностей в случае, когда различные начертания цифр учитываются указанием всех возможных вариантов атрибутов, метод дает правильность распознавания только в 20% и требует улучшения. Тогда как при проведении распознавания не символов с разными возможными начертаниями, а реальных объектов, содержащих типичные для класса сущностей атрибуты [Пикалов, Тарасюк 2017а], метод дал хороший результат, который учитывал наличие у распознаваемых объектов нетипичных атрибутов.

Библиографический список

Джарратано Дж., Райли Г. Экспертные системы: принципы разработки и программирование. 4-е изд.: пер. с англ. М.: ООО «И. Д. Вильямс», 2007. 1152 с.

Пикалов И.Ю., Тарасюк В.Б. Построение обучающего модуля экспертной системы определения принадлежности сущности к определённому классу // Auditorium. Электронный научный журнал Курского государственного университета. 2017. № 1 (13) URL: http://auditorium.kursksu.ru/pdf/013-014.pdf (дата обращения: 12.03.2018)

Пикалов И.Ю., Тарасюк В.Б. Метод построения экспертной системы определения принадлежности сущности к определённому классу с учетом весов атрибутов распознаваемых сущностей // Auditorium. Электронный научный журнал Курского государственного университета. 2017а. № 3 (15). URL: http://auditorium.kursksu.ru/pdf/015-006.pdf (дата обращения: 12.03.2018)

i Надоели баннеры? Вы всегда можете отключить рекламу.