Научная статья на тему 'Новые технологии анализа и извлечения данных на основе нечетких гибридных методов'

Новые технологии анализа и извлечения данных на основе нечетких гибридных методов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
232
81
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ / ИЗВЛЕЧЕНИЕ ДАННЫХ / ИНТЕЛЛЕКТУАЛЬНЫХ ТЕХНОЛОГИИ / ВЫЧИСЛИТЕЛЬНЫЙ ИНТЕЛЛЕКТ / INTELLECTUAL ANALYSIS / DATA MINING / INTELLECTUAL TECHNOLOGIES / COMPUTING INTELLIGENCE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гладков Л. А., Гладкова Н. В.

В статье приводится постановка задачи и основные проблемы, связанные с интеллектуальным анализом и извлечением данных (Data Mining). Приводится обзор основных направлений и подходов к решению подобных задач и предлагается новый подход к их решению на основе использования гибридных интеллектуальных технологий и методов вычислительного интеллекта.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

New Technologies of the Data Mining on the basis of Fuzzy Hybrid Methods

In article statement of a task and the basic problems connected to the intellectual analysis and extraction of the data (Data Mining) is resulted. The review of the basic directions and approaches is resulted in the decision of similar problems and the new approach to their decision is offered on the basis of use of hybrid intellectual technologies and methods of computing intelligence.

Текст научной работы на тему «Новые технологии анализа и извлечения данных на основе нечетких гибридных методов»

Из этого утверждения, в частности, вытекает, что, если X удовлетворяет указанному выше свойству, то для любого разбиения X = X1 u X2 справедливо

min{«(GXj),р( GX2)} < /и(GX) < max{«(GXt),р( GX2)}.

Заключение. Основным результатом данной работы является определение

меры сходства множества элементов изображения, параметризованное группой

преобразований. Выбирая в качестве группы группу отражений или вращений изо, .

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Henk J. A.M. Heijmans and Alexander Tuzikov. Similarity and Symmetry Measures for Convex Shapes Using Minkowski Addition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20(9):980-993, 1998.

2. D. Geiger and T. Liu and A. Yuille. Segmenting by seeking the symmetry axis. 1998.

3. Stephane Derrode and Faouzi Ghorbel. Shape Distance For Rotation Estimation And Rotational Symmetry Detection In Gray-Level Images.

4. Tat-Jen Cham and Roberto Cipolla. Skewed symmetry detection through local skewed symmetries. BMVC 94: Proceedings of the conference on British machine vision (vol. 2), pages 549--558, Surrey, UK, UK, 1994. BMVA Press.

5. V. Di Gesu and C. Valenti. The Discrete Symmetry Transform in computer vision. 1995.

6. Ming Li andXin Chen andXin Li and Bin Ma and Paul Vit6nyi. The similarity metric. SODA '03: Proceedings of the fourteenth annual ACM-SIAM symposium on Discrete algorithms, pages 863-872, Philadelphia, PA, USA, 2003. Society for Industrial and Applied Mathematics.

7. Горбань AC., Каркищенко A.H. Инвариантные характеристики в задачах обнаружения симметрии изображений // Вторая Международная конференция «Системный анализ и информационные технологии» САИТ-2007 (10-14 сентября 2007г., Обнинск, Россия):

. 2:210-212, 2007.

УДК 519.712.2

Л А. Гладков, Н.В. Гладкова

НОВЫЕ ТЕХНОЛОГИИ АНАЛИЗА И ИЗВЛЕЧЕНИЯ ДАННЫХ НА ОСНОВЕ НЕЧЕТКИХ ГИБРИДНЫХ МЕТОДОВ*

В настоящее время проблемы повышения качества и сложности создаваемых автоматизированных устройств и систем в различных областях науки и техники связывают с возможностью их интеллектуализации, т.е. придания создаваемым техническим объектам и системам ряда функций обычно выполняемых человеком. Такими функциями можно считать работу по анализу и принятию решений в усло-, , -ление в массивах входной информации ранее неизвестных, нетривиальных, но практически полезных закономерностей, их оценка и интерпретация. В этом смысле одной из важнейших задач является создание эффективных средств обработки и интеллектуального анализа данных, извлечения знаний, а также средств поиска закономерностей для использования их в системах принятия решений.

Проблема интеллектуального анализа и извлечения знаний (Data Mining) из имеющихся массивов данных сегодня чрезвычайно актуальна. Data Mining - это

* Работа выполнена при поддержке: РФФИ (грант № 07-01-00174), РНП 2.1.2.3193, РНП 2.1.2.2238, г/б № Т.12.8.08.

.

Тематический выпуск

процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей [1]. Методы Data Mining дают весьма ценную информацию, однако им присущ ряд недостатков, основными из которых являются достаточно вы, , -шого количества недостоверных результатов.

Отличительная особенность Data Mining - это гибкое сочетание возможностей математических методов и последних разработок в области создания интеллектуальных информационных систем [1]. В Data Mining широко применяются такие инструменты как искусственные нейронные сети, кластерный анализ, байе, , визуализации данных и др.

Разработку новых теоретических и прикладных подходов к решению данной проблемы можно объединить в отдельную междисциплинарную область, в которой нашли применение некоторые аспекты других научных направлений: вычислительного интеллекта, мягких вычислений, теории баз данных и т.д. Такой междисциплинарный характер, отсутствие четких границ проблемной области, и, наконец, использование соответствующего инструментария, позволяет рассматривать данную научную задачу в качестве одного из направлений более крупной междисциплинарной научной области - искусственного интеллекта.

С концептуальной точки зрения, создаваемые получения и обработки информации можно классифицировать как смешанные искусственные системы, т.е. системы созданные человеком и объединяющие искусственные и естественные подсистемы [2].

Они также являются целеориентированными системами, т.е. системами основой функционирования которых является факторы целесообразности [3]. Как целеориентированные системы они, как правило, могут быть представлены общей схемой управления (рис. 1), состоящей из управляющей части и части, подлежащей управлению. При этом для выработки управления требуется модель системы [4]. х \/ ^

Рис. 1. Схема управления системой

Для модели системы в общем случае выход системы у(і) является реакцией на управляемые и(і) и неуправляемые у(і) входы. Данная реакция может быть представлена в виде совокупности двух процессов:

ХТ = (х(0) и ¥Т = (КО), і є Т.

Безусловно данная модель представляет собой простейший вариант описания любой системы. При рассмотрении сложных современных информационных сис-

І04

тем необходимо разрабатывать новые эффективные модели систем, адекватно отражающие моделируемые свойства.

Как уже отмечалось, одним из наиболее эффективных и распространенных на сегодняшний день инструментариев при обработке больших массивов информации являются нечеткие гибридные методы, модели и алгоритмы. К числу таких методов относятся генетические, эволюционные, бионические, адаптивные и другие .

, -

лена в следующем виде [4]:

SYS = (GN, KD, MB, EV, FC, RP),

где GN - генетическое начало (создание стартового множества решений); KD -

условия существования; MB - обменные явления (эволюционные и генетические

); EV - ( ); FC - -

ние; RP - репродукция.

Как показывает практика использования различных информационных систем, разработка математически обоснованных четких моделей и методов, либо эконо-, . , функционирующие на основе использования интегрированных, нечетких гибридных механизмов и моделей, прекрасно зарекомендовали себя при решении такого рода задач и представляют собой наиболее разумный компромисс.

В этой связи перспективным представляется использование для решения дан, : -

, , алгоритмы. Эти технологии, с одной стороны, позволяют эффективно работать с нечеткой, плохо формализованной информацией, с другой стороны, они имеют серьезную математическую основу, обеспечивающую достаточный запас прочности. Важным фактором является также то, что технологии вычислительного интеллекта уже давно и эффективно используются при решении различных задач анализа и принятия решений в условиях нечеткой, плохо формализованной входной ин-.

Интеграция различных направлений и методов вычислительного интеллекта и создание на этой основе новых гибридных технологий решения слабоформализо-ванных задач одно из основных направлений исследований в области искусствен. -четкости и противоречивости используемых данных, гибкость и относительно низкая себестоимость [4].

Примерами таких гибридных технологий являются нечеткие нейронные сети, нечеткие генетические, эволюционные и адаптивные алгоритмы и т.д. Активная разработка новых форм и направлений подобной интеграции сейчас активно ведется как России, так и за рубежом.

ББИЛИОГРАФИЧЕСКИЙ СПИСОК

1. Чубукова КА. Data Mining. Учебное пособие. - М.: Интернет-Университет Информационных Технологий; БИНОМ, Лаборатория знаний, 2006.

2. Пере гудов Ф.И., Тарасенко Ф.П. Введение в си стемный анализ. - М.: Высшая школа, 1989. '

3. Прангишвили КВ. Системный подход и общесистемные закономерности. - М.:

, 2000.

4. . ., . ., . . . - .: -

Телеком, 2007.

i Надоели баннеры? Вы всегда можете отключить рекламу.