Оптимизация обработки данных нестационарных объектов на основе синтеза нейронных сетей и нечетких генетических алгоритмов

Бекмуродов Зохид Толибович

Список литературы / References

1. Top ten password cracking techniques. [Электронный ресурс]. Режим доступа: http://www.alphr.com/features/371158/top-ten-password-cracking-techniques/ (дата обращения: 24.04.2017).

2. Баширов А.В., Ханов Т.А., Сыздык Б.К., Оразметов Н.С. Оценка риска информационной безопасности подразделения // Современные научные исследования и разработки, 2016. № 6 (61). [Электронный ресурс]. Режим доступа: http://olimpiks.ru/zhurnal-sovremennyye-nauchnyye-issledovaniya-irazrabotki/ (дата обращения: 23.04.2017).

3. Предотвратить НЕЛЬЗЯ поймать! [Электронный ресурс]. Режим доступа: http://www.ntks-it.ru/products/perimetrix/article1/ (дата обращения: 25.04.2017).

ОПТИМИЗАЦИЯ ОБРАБОТКИ ДАННЫХ НЕСТАЦИОНАРНЫХ ОБЪЕКТОВ НА ОСНОВЕ СИНТЕЗА НЕЙРОННЫХ СЕТЕЙ И НЕЧЕТКИХ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ Бекмуродов З.Т. Email: [email protected]

Бекмуродов Зохид Толибович — ассистент, кафедра информационных технологий, Самаркандский государственный университет, г. Самарканд, Республика Узбекистан

Аннотация: в статье представлены результаты исследования и разработки методов и алгоритмов повышения качества идентификации и оптимизации обработки данных нестационарных объектов на основе разделения признакового пространства решения задач на параллельные сегменты с целью уменьшения времени поиска локальных экстремумов и регулирования значений параметров моделей на основе генетических алгоритмов. Предложен метод синтеза и обобщения возможностей алгоритмов сегментации, извлечения свойств данных, регулирования длины начальной и конечной популяции поколений, уровня расположения и ширины границ фильтрации нестационарных составляющих случайных временных рядов на основе нечетких правил. Спроектирован программный комплекс, ориентированный на использование встроенных сервисов, баз данных и знаний, традиционных и нечетких генетических алгоритмов.

Ключевые слова: нестационарный объект, генетический алгоритм, нечеткое множество, нечеткие выводы, идентификация, сегментация, настройка параметров, фильтрация, ширина границ, программный комплекс.

OPTIMIZATION OF PROCESSING OF DATA OF NON-STATIONARY OBJECTS BASED ON SYNTHESIS OF NEURAL NETWORKS AND FUZZITIC GENETIC ALGORITHMS Bekmurodov Z.T.

Bekmurodov Zohid Tolibovich — Assistant, INFORMATION TECHNOLOGIES DEPARTMENT, SAMARKAND STATE UNIVERSUTY, SAMARKAND, REPUBLIC OF UZBEKISTAN

Abstract: the article presents the results of research and development of methods and algorithms for improving the quality of identification and optimization of non-stationary objects data processing on the basis of separation of feature space for solving problems into parallel segments with the aim of reducing the time of searching for local extrem and adjusting the values of model parameters based on genetic algorithms. The proposed method synthesis and generalizes the capabilities of algorithms for segmentation, extracting data properties, regulating the length of initial and final population of generations, level of location and width of filtering boundaries for nonstationary components of random time series based on fuzzy rules. The software package oriented to use embedded services, databases and knowledge bases, traditional and fuzzy genetic algorithms is designed. Keywords: non-stationary object, genetic algorithm, fuzzy set, fuzzy conclusions, identification, segmentation, parameter adjustment, filtering, width of borders, software.

УДК 658.512.011

Актуальность темы. В настоящее время уделяется большое внимание разработке методов идентификации для построения приложений интеллектуального анализа и обработки данных в автоматизированных системах управления технологическими процессами с нестационарными объектами, которые основываются на совмещении возможностей и обобщении свойств нечетких множеств и логики, нейронных сетей (НС) и генетических алгоритмов (ГА) [1, 2]. Существующие исследования посвящены, в основном, методам оптимизации обработки данных, направленным на решение задач поиска локальных оптимумов в чрезмерно широком пространстве признаков нестационарных объектов, представляемых в виде случайных временных рядов (СВР) с применением многоитеративных алгоритмов, характеризующихся значительным увеличением времени установления точного значения экстремума и менее точными результатами идентификации [2].

Настоящая работа посвящена разработке методов и алгоритмов повышения качества идентификации и оптимизации обработки данных нестационарных объектов на основе разделения признакового пространства решения задач на параллельные сегменты с целью уменьшения времени поиска локальных экстремумов и регулирования значений параметров моделей на основе ГА [3].

Принципы повышения качества идентификации на основе регулирования параметров моделей с помощью ГА. Предлагаемые методы адаптивной идентификации и обработки данных с регуляцией параметров модели СВР основываются на применение следующих принципов эволюционного моделирования: искусственного отбора наилучшей особей (генотипов) в поколение популяции; адаптации параметров поколения популяции особи; введение блоков нечеткого моделирования; оптимизация и принятие решения по результатам обработки данных [1]. Методы регуляции параметров моделей для повышения качества идентификации и оптимизации обработки данных с помощью эволюционного моделирования основываются на результаты решения следующих задач [3]:

- повышение вероятности искусственного отбора особи в поколении популяции, когда потомок имеет расстояние меньшее по Хэммингу, чем расстояние в популяции;

- модификация оператора кроссинговера, когда с большей вероятностью нарушаются устоявшиеся сочетания генов и требуется учет случайных вариаций, а также расширение пространства признаков для задач поиска;

- формирование базы данных (БД) и базы знаний (БЗ) в начале популяции, которые адаптируются по мере расширения операторов ГА в соответствии с изменением ФП.

Особенностью совершенствования генетических операторов является использование БД по аллелям лучшего представителя поколений особи из всей популяции целиком, искусственный отбор на принципе конкуренции между генами за попадание в следующее поколение популяции особей, получение ФП для оценки стабильности значений генов в процессе смены в поколениях популяции.

Алгоритм извлечения свойств информации для адаптивной обработки данных. Для повышения адаптирующей способности алгоритмов в условиях ограниченности априорных сведений и наличия неопределенности в параметрах моделей идентификации предлагается применение стохастического моделирования путем формирования генетического набора особей и применения способов извлечения свойств нестационарности, которые позволяют обойтись без расширенной предыстории СВР.

Разработанный алгоритм реализует один из подходов к извлечению свойств СВР для включения в БД и представляется в следующих шагах [3].

Шаг 1. Формируются тестирующие, обучающие, контрольные наборы измерений СВР нестационарных объектов.

Шаг 2. Формируются двумерные матрицы данных размерностью N х 2, где N - длина набора измерений СВР. Первой строкой матрицы данных являются вектор оценок параметра модели идентификации, вторая строка - время, затрачиваемое на идентификацию.

Шаг 3. Выявляется подходящая трендовая модель СВР по широкому спектру аналитических функций аппроксимации на основе оптимизации по методу наименьших квадратов. Если такая необходимость отсутствует, то ограничиваются расчетом медианы.

Шаг 4. Рассчитывается среднеквадратичное отклонение от среднего значения СВР либо значения трендовой функции.

Шаг 5. Проверяется гипотеза о стационарности процесса. Если в пределах критерия + Ъо находится значение измерений СВР с гарантийной вероятностью более чем 0.7, то временный

ряд считается стационарным, т.е. стабильным. При более жестких требованиях значение СВР контролируется в пределах границ + 2о .

Шаг 5.1. Запускается процедура регулирования для настройки параметров модели до достижения требуемого качества идентификации СВР.

Основным критериальным требованием к оптимизации идентификации и обработки СВР является обеспечение минимальной среднеквадратической погрешности расчетов на основе включения механизма эвристического регулирования и настройки параметров алгоритма.

Получены выражения для оценок оптимальных границ для контроля точности фильтрации СВР и минимальной среднеквадратической погрешности обработки данных в условиях изменения статистических параметров, динамических характеристик, функций корреляции и распределения вероятностей.

Для дальнейшего совершенствования и развития подходов к извлечению свойств информации, оптимизации идентификации и обработки данных в условиях нестационарности параметров многокомпонентности СВР предложено использование механизмов регуляции и настройки параметров на основе нечетких выводов и ГА как в самостоятельном, так и в совмещенном вариантах.

Другим подходом к модификации операторов ГА является использование нечетких выводов и дополнительного оператора рекомбинации параметров в поколении популяции особей, а также синтез одного из вышеизложенных алгоритмов извлечения свойств данных.

Особенностью метода оптимизации идентификации и обработки данных на основе ГА является регулирование уровня расположения и ширины границ фильтрации нестационарных составляющих СВР.

Следует отметить, что преимущество извлечения свойств данных на основе разработанных алгоритмов и процедур регулирования параметров достигается при жестких границах фильтрации СВР для формирования начальной популяции эволюционного моделирования.

Результаты реализации программного комплекса. Исследования проводились для выяснения оптимальных значений параметров функции приспособленности операторов: вероятностей скрещивания и мутации модифицированного ГА; расчета численности особей в поколении конечной популяции; необходимого количества поколений.

Проведен сопоставительный анализ эффективности реализации программных модулей извлечения свойств информации на основе статистических критериев, пороговых алгоритмов на основе статистических моделей, алгоритмов адаптивного регулирования уровня расположения и ширины границ фильтрации нестационарных составляющих СВР при эвристических стратегиях, вычислительных схемах классических и модифицированных нечетких ГА по критерию минимальной среднеквадратической погрешности идентификации и обработки данных.

Подтверждено, что нечеткий ГА имеет на 15 -20% выше сходимости, чем классический. Модифицированные операторы ГА существенно сокращают время приближения к оптимуму целевой функции и позволяют частично избежать захвата популяции локальным аттрактором, оставляя в репродуктивном поколении особи не только с большим, но и с низким значением ФП.

Список литературы / References

1. Ярушкина Н.Г. Основы теории нечетких и гибридных систем / Учебное пособие. М.: Финансы и статистика, 2004.

2. Курейчик В.М. Генетические алгоритмы // Учебник для вузов. Таганрог. Таганрог ТРТУ, 2002.

3. Djumanov O.I., Kholmonov S.M. Methods and algorithms of selection the informative attributes in systems of adaptive data processing for analysis and forecasting // Applied Technologies and Innovations. Prague, 2012. Volume 8. November 2012. Р. 45-55.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бекмуродов Зохид Толибович

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бекмуродов Зохид Толибович

Текст научной работы на тему «Оптимизация обработки данных нестационарных объектов на основе синтеза нейронных сетей и нечетких генетических алгоритмов»