Научная статья на тему 'Описание и идентификация темпоральных закономерностей для нечеткого временного ряда с применением гибридных ОЛС-паттернов'

Описание и идентификация темпоральных закономерностей для нечеткого временного ряда с применением гибридных ОЛС-паттернов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
135
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФОРМАЛИЗАЦИЯ ЭКСПЕРТНЫХ ЗНАНИЙ / ОБНАРУЖЕНИЕ ЗАКОНОМЕРНОСТЕЙ / ГИБРИДНЫЙ ПОДХОД / ОЛС-ПАТТЕРН ПОВЕДЕНИЯ / ЭКСПЕРТНЫЕ СИСТЕМЫ / FORMALISATION OF EXPERT KNOWLEDGE / REGULARITY DETECTION / HYBRID APPROACH / OLS BEHAVIOUR PATTERN / EXPERT SYSTEMS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дульцев Денис Вячеславович, Сучкова Лариса Иннокентьевна

Резюме Цель. Цель исследования сводится к разработке принципа хранения шаблонов данных с учетом их темпоральной природы, позволяющего сократить время принятия решений. Для описания и идентификации темпоральных закономерностей поведения нечетко заданных временных рядов в режиме реального времени поставлена задача разработать гибридную структуру данных, позволяющую учитывать последовательности нечетких значений, формируемых из четких наблюдаемых данных, длину этих последовательностей и возможные неравномерные временные промежутки между наблюдениями. Метод. В статье рассматривается подход к формализации описания временных причинно-следственных связей между событиями на объекте и в окружающей его среде, основанный на множестве односвязных списков триплетов. Каждый триплет содержит нечеткий терм лингвистической переменной, продолжительность его наблюдения и допустимый интервал наблюдения незначимых данных. Результат. Разработан алгоритм обнаружения паттернов базы знаний в реальном времени с учетом возможности временного сдвига при наблюдении длинных последовательностей идентичных значений наблюдаемой величины. Учтена возможность частичного перекрытия данных, соответствующих триплетам разных паттернов. Предложенный гибридный паттерн позволяет ускорить обнаружение темпоральных закономерностей в данных.Вывод. Научные результаты представляет разработанная структура хранения информации о темпоральных закономерностях в данных, основанная на односвязном линейном списке, а также алгоритм поиска закономерностей в данных наблюдений с применением набора ОЛС-паттернов. Преимуществом данной структуры и алгоритма по сравнению с известными способами хранения и анализа темпоральных данных является сокращение объема памяти, необходимой для хранения шаблонов в базе знаний, а также возможность применения ОЛС-паттернов для принятия решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Дульцев Денис Вячеславович, Сучкова Лариса Иннокентьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DESCRIPTION AND IDENTIFICATION OF TEMPORAL REGULARITIES FOR FUZZY TIME SERIES WITH APPLICATION OF HYBRID OLS-PATTERNS

Objectives The aim of the research is to develop the principle of storing data templates to take their temporal natureinto account, making it possible to reduce decision-making times.In order to describe and identify temporal patterns in fuzzy time series behaviour in real time, the task was set to develop a hybrid data structure that allows for a consideration of sequences of fuzzy values formed from clear observable data as well as a determination of the length of these sequences and possible uneven time intervals between the observations. Methods The article discussesan approach to formalising the description of temporal cause-effect relationships between events occurring at the object location as well as that of its environment, based on a set of singly-connected lists of triplets. Each triplet contains a fuzzy linguistic variable, the duration of its observation and the permitted interval of observation of insignificant data. Results An algorithm for detecting knowledge base patterns in real time was developed, taking into account the possibility of a time shift in observing long sequences of identical values of the observed value. The possibility of partial data overlapping corresponding to triplets of different patterns is taken into account. The proposed hybrid pattern makes it possible to accelerate the detection of temporal regularities in the data. Conclusion Scientific results are presented by the developed structure for storing information on temporal regularities in data, based on a singly linked linear list, as well as an algorithm for finding regularities in observational data using a set of OLS-patterns. The advantage of this structure and algorithm in comparison with the known ways of storing and analysing temporal data is a reduction in the amount of memory necessary for storing templates in the knowledge base, as well as the possibility of applying OLS patterns for decision-making purposes.

Текст научной работы на тему «Описание и идентификация темпоральных закономерностей для нечеткого временного ряда с применением гибридных ОЛС-паттернов»

Для цитирования: Дульцев Д.В., Сучкова Л.И. Описание и идентификация темпоральных закономерностей для нечеткого временного ряда с применением гибридных олс-паттернов. Вестник Дагестанского государственного технического университета. Технические науки. 2018;45 (2):104-113. DOI: 10.21822/2073-6185-2018-45-2-104-113

For citation: Dultsev D.V, Suchkova L.I. Description and identification of temporal regularities for fuzzy time series with application of hybrid ols-patterns. Herald of Daghestan State Technical University. Technical Sciences. 2018; 45(2):104-113. (In Russ.) D0I:10.21822/2073-6185-2018-45-2-104-113

ТЕХНИЧЕСКИЕ НАУКИ ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ

УДК 004.8

DOI: 10.21822/2073 -6185-2018-45-2-104-113

ОПИСАНИЕ И ИДЕНТИФИКАЦИЯ ТЕМПОРАЛЬНЫХ ЗАКОНОМЕРНОСТЕЙ ДЛЯ НЕЧЕТКОГО ВРЕМЕННОГО РЯДА С ПРИМЕНЕНИЕМ ГИБРИДНЫХ ОЛС-ПАТТЕРНОВ

Дульцев Д.В.2, Сучкова Л.И.1

1'2Алтайский государственный технический университет им. И.И. Ползунова,

1-2656038, г. Барнаул, пр. Ленина, 46, Россия,

1e-mail: li.suchkova@yandex.ru, 2e-mail: Lloid92@yandex.ru

Резюме Цель. Цель исследования сводится к разработке принципа хранения шаблонов данных с учетом их темпоральной природы, позволяющего сократить время принятия реше-ний.Для описания и идентификации темпоральных закономерностей поведения нечетко заданных временных рядов в режиме реального времени поставлена задача разработать гибридную структуру данных, позволяющую учитывать последовательности нечетких значений, формируемых из четких наблюдаемых данных, длину этих последовательностей и возможные неравномерные временные промежутки между наблюдениями.Метод. В статье рассматривается подход к формализации описания временных причинно-следственных связей между событиями на объекте и в окружающей его среде, основанный на множестве односвязных списков триплетов. Каждый триплет содержит нечеткий терм лингвистической переменной, продолжительность его наблюдения и допустимый интервал наблюдения незначимых данных. Результат. Разработан алгоритм обнаружения паттернов базы знаний в реальном времени с учетом возможности временного сдвига при наблюдении длинных последовательностей идентичных значений наблюдаемой величины. Учтена возможность частичного перекрытия данных, соответствующих триплетам разных паттернов. Предложенный гибридный паттерн позволяет ускорить обнаружение темпоральных закономерностей в данных.Вывод. Научные результаты представляет разработанная структура хранения информации о темпоральных закономерностях в данных, основанная на односвязном линейном списке, а также алгоритм поиска закономерностей в данных наблюдений с применением набора ОЛС-паттернов. Преимуществом данной структуры и алгоритма по сравнению с известными способами хранения и анализа темпоральных данных является сокращение объема памяти, необходимой для хранения шаблонов в базе знаний, а также возможность применения ОЛС-паттернов для принятия решений.

Ключевые слова: формализация экспертных знаний, обнаружение закономерностей, гибридный подход, ОЛС-паттерн поведения, экспертные системы

TECHNICAL SCIENCE COMPUTER SCIENCE, COMPUTER ENGINEERING AND MANAGEMENT

DESCRIPTION AND IDENTIFICATION OF TEMPORAL REGULARITIES FOR FUZZY TIME SERIES WITH APPLICATION OF HYBRID OLS-PATTERNS

Denis V.Dultsev2, Larisa I.Suchkova1

12Polzunov Altai State Technical University,

1'246 Lenina Ave., Barnaul 656038, Russia,

1e-mail: li.suchkova@yandex.ru, 2e-mail: Lloid92@yandex.ru

Abstract Objectives The aim of the research is to develop the principle of storing data templates to take their temporal natureinto account, making it possible to reduce decision-making times.In order to describe and identify temporal patterns in fuzzy time series behaviour in real time, the task was set to develop a hybrid data structure that allows for a consideration of sequences offuzzy values formed from clear observable data as well as a determination of the length of these sequences and possible uneven time intervals between the observations. Methods The article discussesan approach to formalising the description of temporal cause-effect relationships between events occurring at the object location as well as that of its environment, based on a set of singly-connected lists of triplets. Each triplet contains a fuzzy linguistic variable, the duration of its observation and the permitted interval of observation of insignificant data. Results An algorithm for detecting knowledge base patterns in real time was developed, taking into account the possibility of a time shift in observing long sequences of identical values of the observed value. The possibility of partial data overlapping corresponding to triplets of different patterns is taken into account. The proposed hybrid pattern makes it possible to accelerate the detection of temporal regularities in the data. Conclusion Scientific results are presented by the developed structure for storing information on temporal regularities in data, based on a singly linked linear list, as well as an algorithm for finding regularities in observational data using a set of OLS-patterns. The advantage of this structure and algorithm in comparison with the known ways of storing and analysing temporal data is a reduction in the amount of memory necessary for storing templates in the knowledge base, as well as the possibility of applying OLS patterns for decision-making purposes.

Keywords: formalisation of expert knowledge, regularity detection, hybrid approach, OLS behaviour pattern, expert systems

Введение. В современном мире существует большое количество областей деятельности человека, которые контролируются информационно-измерительными системами. В основе таких систем лежат механизмы принятия решений, связанных с процессами выработки информирующих сообщений и управления. При принятии решений система опирается на первичные данные, полученные с датчиков или программируемых логических контроллеров, однако анализа только первичных текущих данных для формирования управляющих воздействий недостаточно, так как часто приходится учитывать ранее полученную информацию. Первичные данные помимо информационной части могут включать темпоральную составляющую, которая фиксирует, в какой момент времени данные были получены и/или обработаны.

Наиболее общим типом представления темпоральных данных являются временные ряды (ВР). ВР представляют собой наиболее высокий уровень темпоральной детализации данных, а уменьшение степени детализации ВР за счет описания темпоральных явлений в лингвистической форме, предоставляемой экспертами, позволяет находить новые знания об объекте управления и о закономерностях в данных [1- 3]. Формирование описания темпоральных явлений в лингвистической форме осуществляется с помощью лингвистических переменных, каждой из которых соответствует некоторое количество лингвистических термов (словесных значений), соответствующих различным интервалам числовых значений ВР и задаваемых с помощью функции принадлежности [4]. Преимуществом нечетко представленных временных рядов

(НВР) по сравнению с их традиционным описанием является возможность учёта неопределенности или неполноты информации о происходящем событии в условиях недостаточности объема статистической базы, необходимой для применения традиционных вероятностных методов [5- 6].

Теории нечетких ВР были посвящены многие исследования, среди которых можно отметить следующие работы как зарубежных авторов Q. Song и B. Chisom [7], Н.Тапака [8], J. Kacprzyk [9], W. Pedrycz, M.H. Smith [10], так и отечественных ученых Н.Г. Ярушкиной, Афанасьевой Т.В., Новака В. [5, 11], И.З. Батыршина [12], С.М. Ковалева [13 - 17] и др. Одной из первых нечетких моделей являются предложенные Q. Song и B. Chisom нечеткие модели детерминированных и авторегрессионных временных рядов первого порядка, которые были применены для прогнозирования количества регистрирующихся студентов университета штата Алабама (США) [7]. В работах школы Н.Г. Ярушкиной [5, 11] раскрыты основные подходы к интеллектуальному анализу временных рядов (Time Series Data Mining), в числе которых присутствуют нечеткие модели и технологии анализа именно НВР, однако алгоритмы принятия решений при анализе предыстории генеза наблюдаемых величин подробно не рассмотрены.

И.З. Батыршиным в работе [12] рассмотрены перцептивные паттерны, основанные на восприятии понятий человеком. В них допустимы операции с числовой и лингвистической информацией, с трендами изменения значений ряда и его производных. Между паттернами восприятия существуют временные соотношения, которые могут быть выражены через отношения Аллена. ВР представляется как последовательность примитивных перцептивных паттернов, каждый из которых описывает форму тренда ряда в зависимости от знаков первой и второй производной отсчетов. Однако анализ последовательностей описаний геометрических форм для применения в информационно-измерительных системах должен быть дополнен анализом числовых коэффициентов, характеризующих параметры функций, соответствующих геометрическим формам. Учеными школы С.М. Ковалева предлагается новый подход для идентификации и прогнозирования процессов, протекающих на объекте технологического мониторинга. Указанный подход объединяет нечетко-темпоральный и лингвистический аспекты описания зависимостей в группе временных рядов [13]. В работе [14] рассмотрена задача обнаружения особых типов темпоральных паттернов во временных рядах, а именно предлагается метод анализа данных наблюдений, основанный на обучении без учителя марковской модели исследуемой системы. Также предлагается методология обнаружения аномалий на объекте наблюдения с помощью темпоральных данных, которая базируется на анализе динамики вероятностных значений аномалии с поступлением каждого нового отсчета в потоке данных. Однако для применения данной методологии необходимо накопление значительного объема данных с целью вычисления вероятностей аномалий.

Одним из способов хранения темпоральных шаблонов для группы четких и нечетких ВР является матричный паттерн [18], включающий матрицу-шаблон, матрицу-прогноз и матрицу-дескриптор шаблона. Однако наличие в матрице-шаблоне незначащих элементов повышает временные издержки на операцию сравнения реальных данных с шаблоном.

Проблема, которая решается в настоящей работе, сводится к разработке принципа хранения шаблонов данных с учетом их темпоральной природы, позволяющего сократить время принятия решений. Под темпоральностью данных понимаются такие их характеристики, как время начала наблюдения данных, длительность промежутков наблюдения одинакового значения, следование временных промежутков наблюдения различных значений, наличие временных промежутков, когда данные незначимы для принятия решений по результатам наблюдений. В качестве структуры данных для хранения темпоральных закономерностей в группе ВР в работе предлагается гибридный паттерн, представляющий собой один или группу односвязных линейных списков (ОЛС). ОЛС включает элементы, каждый из которых содержит информационную часть и указатель - адрес следующего элемента. Признаком конца ОЛС в нашем случае служит отрицательное число (например, -1) в поле элемента, отведенном для хранения указателя.

Постановка задачи. Для описания и идентификации темпоральных закономерностей поведения нечетко заданных временных рядов в режиме реального времени необходимо разра-

ботать гибридную структуру данных, позволяющую учитывать последовательности нечетких значений, формируемых из четких наблюдаемых данных, длину этих последовательностей и возможные неравномерные временные промежутки между наблюдениями. Кроме того, при анализе онлайновых данных должна обеспечиваться корректировка частоты проявления темпоральной закономерности в реальных наблюдаемых данных. Алгоритм идентификации закономерностей должен иметь невысокую временную сложность, порядок временной сложности при анализе данных на соответствие одному шаблону должен быть линейным. Для простоты рассмотрим одиночный временной ряд вида ^ = ^п* ••• > с шагом дискретизации dt . Шаг дискретизации может соответствовать либо периоду измерения некоторой величины, либо периоду вычисления величины по данным текущих или прошлых измерений. Будем считать, что

темпоральная закономерность проявляется для S + 1 отсчетов ВР-

Методы исследования. Рассмотрим способ хранения информации о темпоральных закономерностях в нечетко представленных данных в виде линейного гибридного паттерна, а также процесс формирования новых и применения множества существующих паттернов для идентификации последовательностей событий, связанных с анализом нечеткого временного ряда, представленного в виде последовательности термов. В четком временном ряду

X = Х9, Xlf ... , Xs, с шагом дискретизации dt каждое значение-^i, где ! = $, соответствует моменту времени, равному ! * dt Четким значениям после фаззификации с применением некоторой функции принадлежности будут соответствовать термы лингвистической переменной, сопоставленной с рядом, то есть будет сформирован нечеткий временной ряд. Для простоты будем считать, что при фаззификации четкому значению соответствует терм с максимальным значением функции принадлежности. Закономерность чередования термов во времени в этом ряду можно задать односвязным линейным списком:

Р=р0-> (1)

где:

- количество элементов списка;

Vi - текущий элемент списка, представляющий триплет вида

Триплет состоит из нечеткого терма числа шагов дискретизации с величиной

шага дискретизации dl ^ интервала времени до появления в НВР следующего элемента списка Pi+i. При задании темпоральной закономерности чередования термов в НВР сначала

определяется шаг дискретизации анализа данных измерений d I Он выбирается исходя из периодичности измерения или расчета реальных данных таким образом, чтобы было возможно

анализировать отсчеты НВР на промежутках времени, превышающих временной шаг ряда d t В общем случае шаг дискретизации для анализа термов d I больше либо равен шагу дискретизации при наблюдении реальных данных ^ , и он в совокупности с величиной характеризует продолжительность времени наблюдения нечетких термов й i некоторого параметра.

Нечеткое значение й i представляет собой терм лингвистической переменной, полученный при фаззификации числовых данных наблюдений в соответствии с функцией принадлежности лингвистической переменной, сопоставленной с НВР, при этом результат фаззификации соответствует максимальному значению функции. Поскольку возможны ситуации, когда соседние отсчёты НВР будут иметь одинаковое нечеткое значение й i, то длина односвязного линейного списка ' не превышает s .

Так как анализируемые последовательности термов не обязательно следуют подряд друг за другом, а могут быть разделены временными промежутками, в течение которых наблюдаются незначимые для изменения термы, то в триплет - элемент списка Р введена величина временного интервала , указывающего минимальное и максимальное количество незначащих

Вестник Дагестанского государственного технического университета. Технические науки. Том 45, №2, 2018 Heraldof Daghestan State Technical University.TechnicalSciences. Vol.45, No.2, 2018 _http://vestnik.dgtu.ru/ISSN (Print) 2073-6185 ISSN (On-line) 2542-095Х_

отсчетов НВР. Этот элемент триплета может использоваться также для определения конца линейного списка. Задав список триплетов согласно (1), получим описание темпоральной закономерности генеза величины, наблюдаемой в чётком ВР и представленной в лингвистической форме. Можно утверждать, что (1) соответствует одному шаблону изменения для одного

наблюдаемого параметра и одного НВР. Односвязный список триплетов ^ , описывающий закономерность смены термов НВР, соответствующую некоторому состоянию или являющуюся предвестником состояния объекта, будем далее называть ОЛС-паттерном. Таким образом, ОЛС-паттерну сопоставляется состояние объекта, данные о котором анализируются в НВР. Для одного НВР можно задать несколько ОЛС-паттернов, так как при его анализе возможно выявление нескольких состояний объекта наблюдения.

Обсуждение результатов. Примеры ОЛС-паттернов приведены на рис.1. Рассмотрен нечеткий ряд, состоящий из термов А, B, C, D, каждый терм соответствует моменту времени, кратному шагу дискретизации, равному трем. С использованием одинарной, двойной и штрихпунктирной линий показано вхождение терма или последовательности термов в ОЛС-паттерн. Допустимо вхождение термов в несколько паттернов одновременно. Все ОЛС-паттерны на рисунке 1 содержат по три триплета. Первый паттерн связывает в список последовательности термов A, C и D. Длина последовательности термов А и С одинакова и равна двум, длина последовательности термов D равна трем. Между последовательностью термов А и С допускается два незначимых терма. Второй паттерн связывает две последовательности термов В и терм С. Третий паттерн связывает две последовательности термов С и последовательность термов D, причем между второй последовательностью С и термами D временной промежуток, где могут быть незначимые термы, не допускается.

Рис.1. Примеры ОЛС-паттернов Fig.1. Examples of single-linked linear lists patterns

Рассмотрим применение ОЛС-паттерна для идентификации событий в системе принятия решений информационно-измерительного комплекса, одной из целей которого является онлайновая идентификация нештатных ситуаций на контролируемых объектах [19-20]. В состав базы знаний системы принятия решений включаются описания ОЛС-паттернов, характерных для последовательностей событий НВР, каждому паттерну сопоставляется состояние контролируемого объекта. Для принятия решений в режиме онлайн требуется сопоставить реальные данные измерений с имеющимися ОЛС-паттернами.

Рассмотрим алгоритм поиска подходящего паттерна из набора ОЛС-паттернов, существующих в базе знаний. Алгоритм работы с массивом паттернов в базе при сопоставлении данных измерений ОЛС-паттерну в реальном времени приведен на рис. 2 в виде блок-схемы.

Рис.2. Алгоритм поиска ОЛС-паттерна в базе знаний Fig.2. Algorithm for searching the single-linked linear lists pattern in the knowledge base

Он включает следующие этапы:

1. Начальное заполнение массива указателей Т*к и 0 к адресами первых триплетов ОЛС-паттернов в базе, то есть адресами содержащими где ^ - номер паттерна, к= 1, ...,Т1 ^ П _ количество рассматриваемых паттернов. Массив указателей ^к на протяжении всей работы алгоритма остается неизменным, а массив указателей 0 к изменяется, причем изменяется не число элементов массива, а сами элементы, указывающие на текущий рассматриваемый триплет ОЛС-паттернов. Начальная настройка ^к и 0к для трех паттернов показана на рис. 3.

2. Инициализация нулевыми значениями массивов хранящих соответственно допустимый временной промежуток наблюдения терма для текущего триплета к-того паттерна и допустимый временной промежуток наблюдения незначимых данных, следующих за текущим триплетом. Так как нечеткий терм триплета может наблюдаться в течение промежутка времени, превышающего число шагов дискретизации по времени, указанного в первом триплете паттерна, то для каждого паттерна требуется запоминать число шагов ^к, для которых

наблюдается терм ^Те ГШ^ чтобы была возможность сместить по времени момент старта наблюдений, соответствующий терму первого триплета к-того паттерна.

Рис.3. Инициализация указателей на ОЛС-паттерны (n=3) Fig.3. Initializing pointers to single-linked linear lists patterns (n = 3)

Для каждого наблюдаемого значения х осуществляется циклический перебор паттернов, имеющихся в базе знаний. Для текущего k-того паттерна выполнить пункт 4, после исчерпания паттернов получить следующее значение х.

3. В соответствии с указателем Qk анализируется текущий триплет я/ пг, 7/k-того OJIC-паттерна на соответствие текущему наблюдаемому значению X, а также на соответствие времени наблюдения темпоральным компонентам триплета. Если x совпадает с термом a в текущем триплете и его не нужно пропускать, то выполняются следующие действия, иначе переход к п.5:

а) корректируется рассматриваемая длина последовательности одинаковых термов для возможного сдвига времени начала наблюдения терма первого триплета паттерна;

б) если терм триплета наблюдается впервые (Р^ k ~ 0 ), то вычисляется потенциальная длительность наблюдения этого терма Р^к ~ х ^L'. Так как один терм уже анализируется, то длительность уменьшается на величину ^ ^ .

в) определяется, укладывается ли время появления х в продолжительность действия текущего триплета. Если время наблюдения терма исчерпано, то проверяется, не является ли текущий элемент последним в данном ОJIC-паттерне по значению ^ik. Если это так, то к-тый

паттерн обнаружен в потоке данных, и указатель 0к на текущий триплет k-того OJIC-паттерна сбрасывается на первый триплет этого паттерна ). Иначе вычисляется продолжительность временного промежутка , в течение которого могут наблюдаться незначимые термы = х Г,г Если эта продолжительность равна нулю, то необходимо перейти к следующему триплету k-того ОЛС-паттерна, полученного по указателю Qk = Qк

4. Если наблюдаемое значение является частью длинной последовательности одинаковых термов, то увеличивается количество термов в последовательности иначе считаем, что длинная последовательность закончилась и можно в дальнейшем оперировать запомненным количеством ее элементов для сдвига точки начала идентификации терма первого триплета паттерна. В случае, когда допустим пропуск незначимого значения, то оно пропускается с уменьшением временного промежутка пропуска незначащих значений ^к, при исчерпании которого происходит переход к следующему триплету k-того ОЛС-паттерна (Qk = Qk Y№Xt )•

Если пропустить значение нельзя, и оно не принадлежит к длинной последовательности одинаковых термов, то либо сдвигаем время старта появления терма в последовательности одинаковых термов, либо сбрасываем указатель на текущий триплет ОЛС-паттерна на его первый триплет. После сброса снова может быть запущена проверка к-того ОЛС-паттерна на соответствие текущим наблюдаемым данным, начиная с первого триплета.

Вывод. Разработанный алгоритм позволяет выполнять анализ данных в онлайновом режиме работы и выявлять соответствие поступающей от объекта информации ОЛС-паттернам, имеющимся в базе знаний. Так как ОЛС-паттерну сопоставлено состояние объекта наблюде-

110

ния, то обнаружение указанного соответствия может быть использовано для оперативного принятия решений.

Для тестирования алгоритма на языке С было разработано программное обеспечение, позволяющее генерировать файлы, содержащие заданные пользователем паттерны, и выполнять их обнаружение. В результате проверки алгоритма на 500 сгенерированных файлах с 20 типами ОЛС-паттернов установлено, что все паттерны были обнаружены.

Шучные результаты представляет разработанная структура хранения информации о темпоральных закономерностях в данных, основанная на односвязном линейном списке, а также алгоритм поиска закономерностей в данных наблюдений с применением набора ОЛС-паттернов. Достоинством использования данной структуры и алгоритма по сравнению с известными способами хранения и анализа темпоральных данных является сокращение объема памяти, необходимой для хранения шаблонов в базе знаний, а также возможность применения ОЛС-паттернов для принятия решений.

Библиографический список:

1. Ковалев С.М. Модели представления и поиска нечетких темпоральных знаний в базах временных рядов [Текст] I С.М. Ковалев II Труды XI Hациональной конференции по искусственному интеллекту с международным участием. - Дубна, 2008.

2. Антипов С. Г. Методы диагностики динамических объектов на основе анализа временных рядов [Текст] I С. Г. Антипов, В. H. Вагин, М. В. Фомина II ИШОУ: информационные технологии в науке, образовании и управлении, 2017. - №2 (2). - C. 3-i2.

3. Антипов С. Г. Проблема обнаружения аномалий в наборах временных рядов [Текст] I С. Г. Антипов, М. В. Фомина II Программные продукты и системы, 2Gi2. - №2. - C. 7S-S2.

4. Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных реше-ний[Текст] I Л.А. Заде - М.: Мир, 1976. - 165 с.

5. Афанасьева Т.В. ^четкое моделирование временных рядов и анализ нечетких тенденций [Текст] I Т. В. Афанасьева, H. Г. Ярушкина. - Ульяновск: УлГТУ, 2009. - 299 с.

6. Староверова К. Ю. Мера различия временных рядов, основанная на их характеристиках [Текст] I К. Ю. Староверова, В. М. Буре II Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления, 2017. - Т. 13. Вып. 1. - С. 51-6g.

7. Song, Q. Forecasting enrollments with fuzzy time series - Part I [Text] I Q. Song, B. Chissom II Fuzzy Sets Systems, i993. - Vol. 54. - P. i-9.

S. Tanaka, H. Linear Regression Analysis with Fuzzy Model [Text] I H. Tanaka, S. Uejima, K. Asai II IEEE Transactions on Systems, Man and Cybernetics. - i982. - Vol. i2. - P.9G3-9G7.

9. Kacprzyk J. Linguistic Summarization of Time Series by Using the Choquet Integral [Text] I J. Kacprzyk, A. Wilbik, S. Zadrozny II Proceedings of 12th Fuzzy Systems Association World Congress (IFSA'2007, Cancun, Mexico, June i8-2i, 2GG7) Theoretical Advances and Applications of Fuzzy Logic. - N-Y.: Springer Verlag, 2GG7.

10. Pedrycz W. Granular ^H-elation Analysis in Data Mining [Text] I W. Pedrycz, M.H. Smith II Proceedings of IEEE International Fuzzy Systems Conference, Korea. - i999. - Vol.III. - IH-1240.

11. №вак, В. Интегральный метод принятия решений и анализа нечетких временных рядов I Швак В., Перфильева И.В., Ярушкина HX., Афанасьева Т.В. II Программные продукты и системы. - 2GGS. - № 4(84). - С. 65-68.

12. Batyrshin, I. Perception based time series data mining in intelligent decision making systems I Batyrshin I., Sheremetov L. - IPEK YOLU. CollectionofarticlesofAzerbaijanUniversity. - 2GG9. - № 2. - pp.68-72.

13. Ковалев С.М. Гибридные нечетко-темпоральные модели временных рядов в задачах анализа и идентификации слабо формализованных процессов [Текст] I С.М. Ковалев II Интегрированные модели и мягкие вычисления в искусственном интеллекте. Труды IV-й Международной научно-практической конференции (Коломна, 28-3G мая 2007 г.): в 4 т. - М.: Физматлит, 2007. - Т.1. - С. 26-4i.

14. Ковалев С.М. Обнаружение особых типов паттернов во временных рядах на основе гибридной стохастической модели [Текст] I С.М. Ковалев, А. В. Суханов II Известия ЮФУ. Технические науки. - 2014. - №4 (i53). - С. 142-i49.

15. Ковалев С.М. Методы многошагового предсказания аномалий в темпоральных данных [Текст] I С.М. Ковалев II Известия ЮФУ. Технические науки. - 2Gi3. - №7 (144). - С. 85-9i.

16. Ковалев С.М. Упреждающее распознавание нечетких темпоральных паттернов в потоковых данных на основе адаптивных марковских моделей [Текст] I С.М. Ковалев II XIII национальная конференция по искусственному интеллекту с международным участием КИИ-2012 (i6-20 октября 2012 г., Белгород, Россия): труды конференции в 4 т. - Белгород: Изд-во БГТУ, 2012. - Т.2. - С. 313-322.

17. Ковалев С.М. Формирование ассоциативных темпоральных правил в базах данных временных рядов на основе темпоральных сетевых моделей [Текст] I С.М. Ковалев II XII национальная конференция по искусствен-

ному интеллекту с международным участием КИИ-2010 (20-24 сентября 2010 г., Тверь, Россия): труды конференции в 4 т. - М: Физматлит, 2010. - Т.3. - С. 321-329.

18. Сучкова Л.И. Подход к прогнозированию нештатных ситуаций в системах мониторинга с использованием паттернов поведения группы временных рядов [Текст] / Л.И. Сучкова // Ползуновский вестник. - 2013. - №2. - С. 88-92.

19. Бучацкая В. В. Обработка аномальных значений уровней временного ряда как этап комплексной оценки информации в подсистеме прогнозирования для ситуационного центра [Текст] / В. В. Бучацкая// Вестник Адыгейского государственного университета. Серия 4: Естественно-математические и технические науки, 2013. - №3 (122). - C. 105-110.

20. Вульфин А. М. Нейросетевая модель анализа технологических временных рядов в рамках методологии Data Mining [Текст] / А. М. Вульфин, А. И. Фрид // Информационно-управляющие системы, 2011. - №5. - С. 31-38.

References:

1. Kovalev S.M. Modeli predstavleniya i poiska nechetkikh temporal'nykh znanii v bazakh vremennykh ryadov. Trudy XI Natsional'noi konferentsii po iskusstvennomu intellektu s mezhdunarodnym uchastiem. Dubna; 2008. [Kovalev S.M. Models for presenting and searching for fuzzy temporal knowledge in time series bases. Proceedings of the 11th National conference on artificial intelligence with international participation. Dubna; 2008. (in Russ.)]

2. Antipov S.G., Vagin V.N., Fomina M.V. Metody diagnostiki dinamicheskikh ob"ektov na osnove analiza vremennykh ryadov. ITNOU: informatsionnye tekhnologii v nauke, obrazovanii i upravlenii. 2017;2(2):3-12. [Antipov S.G., Vagin V.N., Fomina M.V. Methods for diagnosing dynamic objects based on time series analysis. ITNOU: informatsionnye tekhnologii v nauke, obrazovanii i upravlenii. 2017;2(2):3-12. (in Russ.)]

3. Antipov S.G., Fomina M.V. Problema obnaruzheniya anomalii v naborakh vremennykh ryadov. Programmnye produkty i sistemy. 2012;2:78-82. [Antipov S.G., Fomina M.V. The problem of detecting anomalies in sets of time series. Software and systems. 2012;2:78-82. (in Russ.)]

4. Zade L.A. Ponyatie lingvisticheskoi peremennoi i ego primenenie k prinyatiyu priblizhennykh reshenii. M.: Mir; 1976. 165 s. [Zade L.A. The concept of a linguistic variable and its application to the adoption of approximate solutions. M.: Mir; 1976. 165 p. (in Russ.)]

5. Afanas'eva T.V., Yarushkina N.G. Nechetkoe modelirovanie vremennykh ryadov i analiz nechetkikh tendentsii. Ul'yanovsk: UlGTU; 2009. 299 s. [Afanas'eva T.V., Yarushkina N.G. Fuzzy modeling of time series and analysis of fuzzy trends. Ul'yanovsk: UlGTU; 2009. 299 p. (in Russ.)]

6. Staroverova K.Yu., Bure V.M. Mera razlichiya vremennykh ryadov, osnovannaya na ikh kharakteristikakh. Vestnik Sankt-Peterburgskogo universiteta. Prikladnaya matematika. Informatika. Protsessy upravleniya. 2017;13(1):51 -60. [Staroverova K.Yu., Bure V.M. A measure of the difference in time series based on their characteristics. Vestnik of St. Petersburg State University. Series 10. Applied Mathematics. Computer Science. Control Processes. 2017;13(1):51-60. (in Russ.)]

7. Song Q., Chissom B. Forecasting enrollments with fuzzy time series. Part I. Fuzzy Sets Systems. 1993;54:1-9.

8. Tanaka H., Uejima S., Asai K. Linear regression analysis with fuzzy model. IEEE Transactions on Systems, Man and Cybernetics. 1982;12:903-907.

9. Kacprzyk J., Wilbik A., Zadrozny S. Linguistic summarization of time series by using the Choquet integral. Proceedings of 12th Fuzzy systems association world congress (IFSA'2007, Cancun, Mexico, June 18-21, 2007). Theoretical advances and applications of fuzzy logic. N-Y.: Springer Verlag; 2007.

10. Pedrycz W., Smith M.H. Granular correlation analysis in data mining. Proceedings of IEEE International Fuzzy Systems Conference, Korea. 1999;III:IH-1240.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

11. Novak V., Perfil'eva I.V., Yarushkina N.G., Afanas'eva T.V. Integral'nyi metod prinyatiya reshenii i analiza nechetkikh vremennykh ryadov. Programmnye produkty i sistemy. 2008;4(84):65-68. [Novak V., Perfil'eva I.V., Yarushkina N.G., Afanas'eva T.V. Integral method of decision-making and analysis of fuzzy time series. Software and systems. 2008;4(84):65-68. (in Russ.)]

12. Batyrshin I., Sheremetov L. Perception based time series data mining in intelligent decision making systems. IPEK YOLU. Collection of articles of Azerbaijan University. 2009;2:68-72.

13. Kovalev S.M. Gibridnye nechetko-temporal'nye modeli vremennykh ryadov v zadachakh analiza i identifikatsii slabo formalizovannykh protsessov. Trudy IV-i Mezhdunarodnoi nauchno-prakticheskoi konferentsii "Integrirovannye modeli i myagkie vychisleniya v iskusstvennom intellekte" v 4 t. T.1. (Kolomna). M.: Fizmatlit; 2007. S. 26-41. [Kovalev S.M. Hybrid fuzzy-temporal models of time series in problems of analysis and identification of weakly formalized processes. Proceedings of the IVth International Scientific and Practical Conference "Integrated Models and Soft Computing in Artificial Intelligence" in 4 volumes. Vol.1. (Kolomna). M.: Fizmatlit; 2007. P. 26-41. (in Russ.)]

14. Kovalev S.M., Sukhanov A.V. Obnaruzhenie osobykh tipov patternov vo vremennykh ryadakh na osnove gibridnoi stokhasticheskoi modeli. Izvestiya YuFU. Tekhnicheskie nauki. 2014;4(153):142-149. [Kovalev S.M., Sukhanov A.V. Detection of special types of patterns in time series based on a hybrid stochastic model. Izvestiya SFedU. Engineering sciences. 2014;4(153):142-149. (in Russ.)]

15. Kovalev S.M. Metody mnogoshagovogo predskazaniya anomalii v temporal'nykh dannykh. Izvestiya YuFU. Tekhnicheskie nauki. 2013;7(144):85-91. [Kovalev S.M. Methods of multi-step prediction of anomalies in temporal data. Izvestiya SFedU. Engineering sciences. 2013;7(144):85-91. (in Russ.)]

16. Kovalev S.M. Uprezhdayushchee raspoznavanie nechetkikh temporal'nykh patternov v potokovykh dannykh na osnove adaptivnykh markovskikh modelei. XIII natsional'naya konferentsiya po iskusstvennomu intellektu s mezhdunarodnym uchastiem KII-2012 (16-20 oktyabrya 2012 g., Belgorod, Rossiya): trudy konferentsii v 4 t. Belgorod: Izd-vo BGTU; 2012;2:313-322. [Kovalev S.M. Predictive recognition of fuzzy temporal patterns in streaming data based on adaptive Markov models. XIII National conference on artificial intelligence with international participation KII-2012 (October 1620, 2012, Belgorod, Russia): Proceedings of the conference in 4 volumes. Belgorod: Izd-vo BGTU; 2012;2:313-322. (in Russ.)]

17. Kovalev S.M. Formirovanie assotsiativnykh temporal'nykh pravil v bazakh dannykh vremennykh ryadov na osnove temporal'nykh setevykh modelei. XII natsional'naya konferentsiya po iskusstvennomu intellektu s mezhdunarodnym uchastiem KII-2010 (20-24 sentyabrya 2010 g., Tver', Rossiya): trudy konferentsii v 4 t. M: Fizmatlit; 2010;3:321-329. [Kovalev S.M. Formation of associative temporal rules in time series databases on the basis of temporal network models. XII National Conference on artificial intelligence with international participation KII-2010 (September 20-24, 2010, Tver, Russia): Proceedings of the conference in 4 vol. M: Fizmatlit; 2010;3:321-329. (in Russ.)]

18. Suchkova L.I. Podkhod k prognozirovaniyu neshtatnykh situatsii v sistemakh monitoringa s ispol'zovaniem patternov povedeniya gruppy vremennykh ryadov. Polzunovskii vestnik. 2013;2:88-92. [Suchkova L.I. Approach to forecasting abnormal situations in monitoring systems using the behavior patterns of a group of time series. Polzunovsky vestnik. 2013;2:88-92. (in Russ.)]

19. Buchatskaya V.V. Obrabotka anomal'nykh znachenii urovnei vremennogo ryada kak etap kompleksnoi otsenki infor-matsii v podsisteme prognozirovaniya dlya situatsionnogo tsentra. Vestnik Adygeiskogo gosudarstvennogo universiteta. Seriya 4: Estestvenno-matematicheskie i tekhnicheskie nauki. 2013;3(122):105-110. [Buchatskaya V.V. Treatment of the anomalous values of the time series levels as a stage of complex information evaluation in the forecasting subsystem for the situational center. The Bulletin of the Adyghe State University, the series "Natural-Mathematical and Technical Sci-ences".2013;3(122):105-110. (in Russ.)]

20. Vul'fin A.M., Frid A.I. Neirosetevaya model' analiza tekhnologicheskikh vremennykh ryadov v ramkakh metodologii Data Mining. Informatsionno-upravlyayushchie sistemy. 2011;5:31-38. [Vul'fin A.M., Frid A.I. Neural network model of the analysis of technological time series within the framework of the Data Mining methodology. Information and Control Systems. 2011;5:31-38. (in Russ.)]

Сведения об авторах:

Дульцев Денис Вячеславович - аспирант, кафедра информатики, вычислительной техники и информационной безопасности.

Сучкова Лариса Иннокентьевна - доктор технических наук, профессор, кафедра информатики, вычислительной техники и информационной безопасности. Information about the authors.

Denis V. Dultsev -Graduate Student, Department of Computer Science, Computer Engineering and Information Security.

Larisa I.Suchkova - Dr.Sci. (Technical), Prof., Department of Computer Science, Computer Engineering and Information Security.

Конфликт интересов. Conflict of interest.

Авторы заявляют об отсутствии конфликта интересов. The authors declare no conflict of interest. Поступила в редакцию 23.03.2018. Received 23.03.2018.

Принята в печать 28.04.2018. Accepted for publication 28.04.2018.

i Надоели баннеры? Вы всегда можете отключить рекламу.