Научная статья на тему 'Использование модели голосования в рамках решения задач коллективной классификации объектов'

Использование модели голосования в рамках решения задач коллективной классификации объектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
229
58
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛЬ / КЛАССИФИКАЦИЯ / РАСПОЗНАВАНИЕ / КОЛЛЕКТИВ / РЕШАЮЩАЯ ФУНКЦИЯ / ГОЛОСОВАНИЕ / ВЫБОР / КОЭФФИЦИЕНТ ДОВЕРИЯ / АДАПТАЦИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сикулер Денис Валерьевич

Представлена модель классификации объектов на базе применения совокупности различных методов распознавания. Рассмотрены сложности, возникающие в связи с использованием коллектива методов для решения задачи классификации. Предложены способы формирования множества решающих функций (правил) и получения итогового результата распознавания при их применении.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование модели голосования в рамках решения задач коллективной классификации объектов»

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» №2/2016 ISSN 2410-700Х_

Интеллектуальный анализ данных можно использовать для решения бизнес-проблем, в которых фигурирует изменяющаяся с течением времени информация. Примерами таких проблем являются:

1. Увеличение прибыльности подразделения или целого предприятия.

2. Анализ желаний и потребностей.

3. Идентификация клиентов, приносящих прибыль, и приобретение новых.

4. Сохранение клиентов и повышение лояльности.

5. Увеличение отдачи от инвестиций (ROI) и снижение расходов на продвижение товаров и услуг.

6. Продажа дополнительных товаров и услуг существующим клиентам.

7. Выявление случаев мошенничества, нерационального и нецелевого расходования средств.

8. Оценка кредитных рисков.

9. Повышение пропускной способности торговой единицы и оптимизация распределения товаров для увеличения продаж.

10. Общий мониторинг эффективности бизнеса.

Существующие методики промышленных предприятий постоянно совершенствуются, но главными недостатками современных подходов являются: высокая стоимость данных разработок, длительный процесс внедрения, а также ограниченность в выбранных направлениях совершенствования. Следовательно, главной задачей становится разработка эффективной комплексной методики совершенствования бизнес-процессов промышленных предприятий с использованием возможностей технологий Data Mining.

Для решения этой проблемы понадобится провести оценку современных бизнес-процессов. Это позволит создать планы и решения выявленных проблем. На основе полученной информации необходимо описать методы к решению текущих проблем и разработать комплексную методику для совершенствования бизнес-процессов. Использование технологии Data Mining в ходе решения проблем и производственных задач позволит контролировать технический процесс и держать отклонения в заранее известных пределах, что говорит о стабильности. Таким образом, создание эффективной системы улучшения БП на предприятиях представляет собой сложную задачу, требующую использования различных подходов. Комплексное решение этих вопросов позволит создать на промышленных предприятиях высокоэффективную систему улучшения БП.

Список использованной литературы:

1. Крюкова, А.А. Процесс обеспечения принятия решений в телекоммуникационной компании с учетом жизненного цикла клиентов / А.А. Крюкова // Экономика и управление: анализ тенденций и перспектив развития. - 2012. - №1-2. - С. 116-120.

2. Богомолова, М.А. Интеллектуализация систем принятия управленческих решений по взаимодействию с клиентами / М.А. Богомолова // Экономика и социум. - 2014. - №3-1 (12). - С. 264-266.

© Салмин А.А., Кистанова И.А., 2016

УДК 004.93; 004.8

Сикулер Денис Валерьевич

к.т.н., доцент РГПУ им. А.И. Герцена г. Санкт-Петербург, РФ

ИСПОЛЬЗОВАНИЕ МОДЕЛИ ГОЛОСОВАНИЯ В РАМКАХ РЕШЕНИЯ ЗАДАЧ КОЛЛЕКТИВНОЙ КЛАССИФИКАЦИИ ОБЪЕКТОВ

Аннотация

Представлена модель классификации объектов на базе применения совокупности различных методов распознавания. Рассмотрены сложности, возникающие в связи с использованием коллектива методов для

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» №2/2016 ISSN 2410-700Х_

решения задачи классификации. Предложены способы формирования множества решающих функций (правил) и получения итогового результата распознавания при их применении.

Ключевые слова

Модель, классификация, распознавание, коллектив, решающая функция, голосование, выбор, коэффициент

доверия, адаптация.

Осуществление эффективного и целенаправленного управления невозможно без накопления, хранения и использования поступающей в управляющую систему информации, что приводит к необходимости исследования комплекса проблем, связанных с обработкой информации в контексте поддержки принятия решений [9]. Возрастание количества и разнородность информации, усложнение функций, расширение возможностей и обеспечение гибкости управляющей системы, выводят на передний план одну из таких задач — проблему по упорядочиванию, систематизации и классификации данных, иначе называемую задачей распознавания образов. Под способностью осуществлять распознавание в данной работе будем понимать определение, узнавание того или иного объекта, явления, процесса или ситуации, т.е. классификацию объекта, выделение его как элемента некоторого множества (класса) объектов, обособленного по каким-то отличительным характеристикам составляющих класс элементов. Таким образом, распознавание по своей сути представляет собой процесс причисления рассматриваемого объекта на основании некоторых имеющихся данных к одному из классов, набор которых, как правило, известен.

Представим проблему решения задачи распознавания в рамках следующей модели [2, 3, 4, 6]. Задано множество S объектов, которое в соответствии с некоторыми условиями или целями разбито на конечное

_ qc

число непустых и непересекающихся подмножеств (классов) C-, i = 1, qc, ^ C- С S . Каждый объект seS

i=1

определяется конечным набором числовых характеристик (признаков) х;, ] = 1, ЦХ, т.е. объекту 5

соответствует описание х(5)=(х1(5), ..., х^)), где в общем случае х;(5)=х;е(-да, +<х>) представляет собой значение некоторой функции (например, функции распределения случайной величины). Разделение исходного множества на классы определено не полностью. Известна лишь принадлежность к конкретным классам элементов конечного множества (обучающей выборки) Гс5, т.е. задано значение вектора

принадлежности Ут(Г)=(п1, ..., щ) где пк=/т^к), tkеГ, к = 1 , ф, пк — номер класса, к которому относится объект tk, /т — функция принадлежности. Задача распознавания заключается в том, чтобы для объекта 5е Ц=МГ и набора классов С={С1, ..., Сдс} по обучающей информации, включающей описанияХ(Г)=(х^\), ..., x(tqt)) объектов множества Г и вектор принадлежности Ут(Г), а также описанию распознаваемого объекта х(5) вычислить значение неизвестной функции принадлежности /т(5):

/т(5)=пе{1, 2, ..., qc}, где п — номер класса, к которому относится распознаваемый объект 5.

Исходя из данной модели, задачу распознавания будем рассматривать как задачу аппроксимации неизвестной функции принадлежности /т(5) функцией От^), построенной на основе обучающей информации [2, 10]. Функцию ат(5) назовем решающей функцией (правилом) и определим следующим образом:

\и е {1, 2, ..., цс} - номер класса,

ат СО = ат (х(Чл ^ е &

[0 - неизвестно ,

Несмотря на большое разнообразие разработанных методов распознавания, ни один из них не позволяет получить оптимальные результаты решения для любой задачи классификации при заданных ограничениях на ресурсы. Это связано с тем, что в зависимости от задачи аппроксимируемая функция принадлежности/т(5) может иметь самый разнообразный вид и сложность, в то время как в большинстве из существующих методов распознавания аппроксимирующая решающая функция ат(5) ищется в строго определенном виде, который может значительно отличаться от вида неизвестной функции принадлежности. Частично устранить недостаток применения отдельных методов классификации позволяет модель

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» №2/2016 ISSN 2410-700Х_

коллективного распознавания [1, 2, 7], в рамках которой для решения задачи используется множество разных методов (решающих правил).

Коллективом методов распознавания будем называть конечное подмножество M множества P всех возможных методов (алгоритмов) распознавания, McP, M={Mi, M2, ..., Mqm}, образованное для решения

некоторой задачи распознавания (qm - размерность коллектива методов). Каждый метод Mi, i = 1,qm позволяет получить одну или несколько (в зависимости от алгоритма работы и набора параметров)

решающих функций О^ (¿") = О^ (х(5")), ] = 1, Щ . Коллективом решающих правил (функций) будем

называть подмножество А множества Я всех возможных при использовании данного коллектива методов

цт

распознавания М решающих функций, Я=Я(М), АсЯ, А = (ат^), а^^), ..., а^^)}, ЦО = ^Щ ,

I=1

образованное для формирования коллективного решающего правила [2, 7] (да - размерность коллектива решающих правил). В соответствии с этим задачу принятия коллективного решения формально определим следующим образом:

От (*)=ед^), от», ..., о?о)(*)),

где О — некоторая процедура формирования конечного решения задачи на основе результатов, выдаваемых отдельными представителями коллектива решающих правил.

Одним из вариантов реализации процедуры коллективного принятия решения О является использование функции голосования g, которую представим следующим образом: £(5) = скэБ^Х g2(s), ..., £<?С(5)Х

gt (s) = ХРУ : dmfis) = i, Ру e[0,1], i = 1, qc, j = 1, qa,

j

, , . Ik, если 3k: Vl ^ k >u,, k,l = 1,m,

class^ Vm) = in

[0, иначе,

где gi(s) — голосующая функция i-го класса, Pj — нормированный весовой коэффициент j-го решающего правила, который далее будем называть коэффициентом доверия j-му решающему правилу, class — функция формирования конечного решения на множестве значений голосующих функций.

Выделим два основных вида функции голосования: равноправное и взвешенное голосование [1, 2, 5]. Равноправное голосование целесообразно в тех случаях, когда решающие функции эквивалентны по критерию минимума величины эмпирического риска, т.е. Vj р;~р. Оно является частным случаем взвешенного голосования, которое применяется тогда, когда решающие правила отличаются по показателю ошибок классификации на обучающей выборке.

В контексте использования модели коллективного распознавания возникают следующие две основные задачи, требующие решения:

1. формирование коллектива M методов распознавания и построение на его основе множества A решающих правил;

2. построение процедуры G принятия коллективного решения на множестве A решающих правил (в рассматриваемом случае — выбор способа вычисления коэффициентов р;).

При подборе методов (первая задача) приходится руководствоваться в основном эвристическими соображениями, направленными на обеспечение оптимальности собираемого коллектива. Оставим за рамками данной работы рассмотрение эвристик, которые могут использоваться для формирования коллектива методов распознавания [4, 8]. Для построения коллектива решающих правил на основе выбранного множества методов будем использовать подход, основанный на идеях адаптации решающего правила. Обозначим через Wi={wj} множество параметров i-го метода распознавания, влияющих на получаемое посредством данного метода решающее правило, а через Wi вектор конкретных значений этих параметров. Пусть n — число решающих функций, полученных с помощью i-го метода. Сгенерируем случайным образом значения всех параметров метода, учитывая область допустимых значений каждого

МЕЖД УНАРОД НЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ»

№2/2016

ISSN 2410-700Х

параметра и заданные ограничения, и используем сформированный вектор для получения решающего

правила а(1)(. Выполнив эту процедуру п раз, получим случайное множество решающих функций,

соответствующих 7-му методу распознавания. При необходимости сформированное множество можно модифицировать и дополнить детерминированными решающими правилами, значения параметров которых выбраны на основе априорных соображений и данных о задаче. Применение данной процедуры для всех методов распознавания позволит получить используемый для решения задачи коллектив решающих правил. В нем могут оказаться как правила, минимизирующие величину эмпирического риска, так и правила, приводящие к большому числу ошибок классификации. Однако при использовании для формирования конечного решения процедуры взвешенного голосования на множестве частных решений, итоговая решающая функция позволяет получить минимальное или близкое к нему значение величины эмпирического риска. Более того, при увеличении числа решающих правил, коллективная решающая функция будет все более приближаться к оптимальной решающей функции, обеспечивающей близкое к минимальному значение величины среднего риска [2]. Для вычисления коэффициентов доверия решающих правил будем использовать следующее выражение:

1 - Е -

р- =--, - =1 да,

да

где Еу — нормированная величина эмпирического риска при использовании у-го решающего правила на обучающей выборке Т.

Использование в процедуре голосования всех решающих правил бывает нецелесообразным, т.к. большое количество «плохих» (обеспечивающих высокий уровень ошибок на обучающей выборке) правил может привести к значительному снижению качества распознавания получаемой решающей функции. Для того чтобы устранить этот недостаток модифицируем процедуру голосования следующим образом: будем использовать для формирования конечного решения не все доступные решающие правила, а только те, коэффициент доверия которых не меньше некоторого заданного порога Р тап.

ß, =

1 - E

если

qa 0, иначе,

1 - E __

qa

_ =1 qa

Структурная схема получаемого таким образом процесса коллективного распознавания представлена на рисунке 1.

Рисунок 1 - Схема процесса коллективного решения задачи распознавания с использованием функции

голосования на множестве решающих правил

<

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» №2/2016 ISSN 2410-700Х_

Список использованной литературы:

1. Барабаш Ю.Л. Коллективные статистические решения при распознавании. — М.: Радио и связь, 1983. — 224 с.

2. Глаз А.Б. Параметрическая и структурная адаптация решающих правил в задачах распознавания. — Рига: Зинатне, 1988. — 167 с.

3. Горелик А.Л., Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания: Некоторые аспекты. — М.: Радио и связь, 1985. - 160 с.

4. Интеллектуальные информационные системы: Интеллектуальная информационная технология. Экспертные системы: Учеб. пособие / Д.В. Гаскаров, Д.В. Сикулер, В.В. Фомин, И.К. Фомина. — СПб.: СПГУВК, 2004. — 362 с.

5. Обучающиеся системы обработки информации и принятия решений: непараметрический подход / А.В. Лапко, С.В. Ченцов, С.И. Крохов, Л.А. Фельдман. — Новосибирск: Наука. Сибирская издательская фирма РАН, 1996. — 296 с.

6. Распознавание образов: состояние и перспективы / К. Верхаген, Р. Дёйн, Ф. Грун и др.; пер. с англ. — М.: Радио и связь, 1985. — 104 с.

7. Растригин Л.А., Эренштейн Р.Х. Метод коллективного распознавания. — М.: Энергоиздат, 1981. — 80 с.

8. Сикулер Д.В. Библиотека методов распознавания // Сб. науч. тр. «Информационные системы на транспорте»; под ред. проф. А.С. Бутова. — СПб.: Судостроение, 2002. — С. 264-271.

9. Флегонтов А.В., Фомин В.В. Система интеллектуальной обработки данных // Известия Российского государственного педагогического университета имени А. И. Герцена. № 154. — СПб., 2013. — С. 41-48.

10.Фомин Я.А., Тарловский Г.Р. Статистическая теория распознавания образов. — М.: Радио и связь, 1986. — 264 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

© Сикулер Д.В., 2016

УДК 004.67

Толстунов Владимир Андреевич

канд. техн. наук КемГУ, г. Кемерово, РФ E-mail: vat@bk.ru

СГЛАЖИВАЮЩИЕ ФИЛЬТРЫ С ГАУССОВСКИМ И ПОКАЗАТЕЛЬНО - СТЕПЕННЫМ

ПРЕОБРАЗОВАНИЯМИ

Аннотация

Предлагаются алгоритмы цифровых сглаживающих фильтров с гауссовским и показательно - степенным преобразованиями входных данных. Приведены результаты цифрового моделирования работы данных фильтров в случае, когда мешающий шум является суммой гауссовских и импульсных помех.

Ключевые слова

Сглаживающий фильтр, мешающий шум, погрешность фильтрации, цифровое моделирование.

На практике для восстановления информационных сигналов широкое использование нашли сглаживающие фильтры [1, с. 131, 228]. При этом алгоритмы пространственных фильтров используют, как правило, различные операции усреднения отсчетов входного сигнала. Однако, как показали исследования [2,3], можно получить хорошие результаты восстановления сигналов путем усреднения функционально -преобразованных отсчетов входного сигнала.

i Надоели баннеры? Вы всегда можете отключить рекламу.