УДК 519.68 Дата подачи статьи: 01.07.16
DOI: 10.15827/0236-235X. 115.029-035
ВЫЧИСЛИТЕЛЬНЫЕ ПРОЦЕДУРЫ ОБРАБОТКИ НЕТОЧНОЙ ВРЕМЕННОЙ ИНФОРМАЦИИ
B.В. Фомин,, д.т.н.., профессор, [email protected];
C.В. Мальцев, аспирант, [email protected]
(Российский государственный педагогический университет им.. А.И. Герцена, наб. реки Мойки, 48, г. Санкт-Петербург, 191186, Россия)
В статье представлены результаты обширного исследования, обусловленного практической потребностью повышения эффективности методов представления, алгоритмов извлечения, обработки нечетких темпоральных данных. Акцент делается на онтологических моделях процессов прогнозирования и интерпретации при взаимодействии с неточной временной информацией. Предлагаются методология хранения данных, а также модели и унифицированные процедуры извлечения нечеткой информации. Непосредственно затрагивается вопрос о прагматике алгоритмов представления темпоральных данных через новый инструмент так называемой возможностной темпоральной информации в аналитических системах, где параметры неточности и оперативности являются критическими условиями в принятии бизнес-решений. Предлагаются решения проблем хранения и извлечения неточной временной информации за счет построения модели обработки нечетко-темпоральных отношений между временными точками и/или интервалами. Представлена концепция анализа и представления нечеткой темпоральности в рамках развития модели темпоральных реляционных БД с учетом критериев неточности, неоднозначности, неопределенности. Разработана алгебра возмож-ностных отношений точек и/или интервалов, в ее рамках определены понятия возможностной временной точки и воз-можностного интервала, введены соответствующие значения возможностных временных точек и интервалов. Представлен фрагмент формализованного алгоритма реализации алгебры на примере расширения одного из отношений. Предлагается подход к разработке и моделированию нечеткого темпорального домена и отношений между возмож-ностными интервалами и моментами времени. Дано описание реализованной библиотеки алгоритмов обработки отношений возможностных временных точек и/или интервалов, а также соответствующих процедур и функций на платформе стандарта SQL. Представлены результаты внедрения библиотеки алгоритмов при реализации коммерческого проекта аналитической системы для телекоммуникационной компании, а также определены направления дальнейшего развития прикладного инструментария, основанного на теории нечетко-темпоральной модели.
Ключевые слова: темпоральные БД, временная неопределенность, программы и алгоритмы.
В общем смысле под темпоральностью понимается связь фактов, событий или явлений и их временных показателей. Факты в явном виде могут не иметь никакой принадлежности к временным показателям, но в неявном виде всегда существует и может быть определена их зависимость от времени. Можно сказать, что любая деятельность реального мира тем или иным образом связана со временем. Темпоральность подразумевает временную сущность фактов, определение времени их совершения или динамики их движения и изменения по временной шкале.
Время является неотъемлемой частью многих областей деятельности человека. Для решения задач, связанных со временем, эффективным аналитическим показателем [1] является коэффициент неточности - интервальная метрика, позволяющая обобщать и гранулировать периоды, использующая неопределенность в интерпретации времени, достаточная для соблюдения семантических особенностей интерпретации фактов.
Таким образом, неточность во времени образует новое направление для исследований - так называемую нечеткую темпоральность, которая подразумевает наличие неопределенности, неоднозначности или отсутствие информации о времени как таковом. Если говорить, что темпоральная БД - это организованная структура, построенная на основе темпоральной модели данных и содержа-
щая темпоральные данные, то нечетко-темпоральная БД - это структура, построенная на совокупности алгоритмов и унифицированных процедур хранения, извлечения и обработки нечетких темпоральных данных.
Теоретические достижения и значимость исследований в области обработки нечетко-темпоральных данных отражены в научно-технических публикациях [2-4]. Прикладные системы обработки нечетко-темпоральных данных востребованы в различных прикладных областях [5-8] и являются одной из индустриальных задач информационных технологий.
Проведение исследования вызвано отсутствием необходимых средств в системах различного назначения для использования и обработки нечетко-темпоральной информации с целью ее дальнейшей обработки и интерпретации. Приведем примеры таких систем.
1. Системы планирования и прогнозирования. Фиксирование нечеткой временной информации в календаре или в планировщике задач, в частности, фиксация/планирование/смещение задач с учетом погрешности во времени.
2. Фиксирование исторических неточных фактов или данных.
3. Последовательная цепочка выполнения задач, где каждый последующий процесс зависит от факта и времени выполнения предыдущего.
Потребность в использовании темпоральной модели хранения данных актуализировалась с появлением темпоральной поддержки [9] в стандарте SQL:2011. С появлением стандарта разработчики аналитических систем стали активно добавлять в свои продукты темпоральную поддержку, реализация которой способствовала активному внедрению на предприятиях для решения задач, связанных с учетом времени. Темпоральная поддержка в стандарте SQL:2011 ограничивается в решении вопросов обработки нечетких темпоральных данных. Необходимость использования нечеткой логики в обработке темпоральной информации вызвана возможным наличием неточности в исходных данных, где периоды начала/завершения действия интервалов или событий могут быть неточно определены или не определены вообще. Расширенными возможностями, прорабатываемыми в новой модели, являются следующие:
- рассмотрение и проработка не только исторических темпоральных фактов, но и фактов, которые могут наступить в предположительное время в будущем, от времени выполнения которых могут зависеть другие задачи;
- изучение не только неточных интервалов, но и временных точек, принимающих множество значений;
- рассмотрение погрешности во временных точках, а также в диапазонах значений интервалов;
- изучение и проработка нетемпоральных периодов (например integer и string);
- изучение применения неточности в нескольких временных измерениях;
- рассмотрение методов конвертации исторических данных, хранящихся в действующих реляционных структурах, в возможностно-темпораль-ные.
Построение модели обработки неточной временной информации
В темпоральной модели данных выделяются следующие типы нечеткости [4].
Неопределенность. Какая-либо часть темпоральной информации неизвестна или определена неточно. Например, дата рождения Сократа -«около 469 год д.н.э.».
Субъективность, двусмысленность. Темпоральные события или периоды могут быть субъективно или неоднозначно определены. Например, «эпоха нового времени» или в сфере грузоперевозки «даты начала или завершения транспортировки груза».
Неясность, расплывчатость. События могут быть определены с различной гранулярностью или нечеткостью. Например, «доставка груза в течение дня».
С целью реализации модели, рассматривающей и обрабатывающей темпоральные данные, в кото-
рых присутствуют неопределенность, субъективность или неясность, необходимо ввести понятие возможностной временной точки.
Возможностная временная точка р) - предполагаемая временная отметка (или момент времени) на временной оси, значение которой неизвестно либо неточно определено.
Введем следующие значения возможностных временных точек.
1. Значение определено с возможным отклонением. Предполагаемое значение временной точки принимает степень возможности 1, значения воз-можностного отклонения от времени наступления находятся в диапазоне [0, 1]. Вид: ^, pt - а, pt + Р], где pt Е T - возможностная временная точка, предполагаемый момент времени на временном отрезке Т; а и р - значения возможностного отклонения от наступления (рис. 1).
Значения отклонения должны быть заданы с соответствующей гранулярностью а и р, то есть в единицах времени из существующих форматов: ss, mi, hh24, dd, mm, уууу.
2. Значение в диапазоне не определено. Значения в диапазоне имеют одинаковую степень возможности наступления PExtent.
Вид: [^, pty}, PExtent], где ^, pty} Е T- диапазон значений возможностных временных точек предполагаемого момента времени на временном отрезке Т; ptx и pty могут принимать пустое значение. В таком случае (рис. 2) предполагается диапазон значений в виде: [{р4, да}, PExtent] V [{да, р PExtent].
3. Значение не определено. Любые значения имеют одинаковую степень возможности наступления = 0. Вид: [undefined, 0].
Возможностные отношения временных точек и интервалов
Одной из наиболее распространенных моделей учета временной неопределенности является темпоральная алгебра Аллена. Дж.Ф. Аллен определил набор из 13 качественных отношений, которые могут существовать между двумя временными интервалами [10]. Алгебра Аллена ограничивается использованием отношений между периодами (отрезками, интервалами) времени и характеризуется мерой длительности временных отрезков.
Однако практика временных отношений базируется не только на временных интервалах, но и на понятиях временных точек. Временная точка и временной интервал являются неотъемлемой составляющей реализации темпорального анализа данных.
Для построения модели, рассматривающей воз-можностные отношения между точками и/или интервалами, темпоральная алгебра Аллена была расширена путем декомпозиции интервальных отношений до отношений между двумя точками, а также точками и интервалами. Введенные отношения отражены в таблице 1.
На основании темпоральных отношений между точками и/или интервалами, а также введенных значений возможностных временных точек была разработана алгебра возможностных отношений точек и/или интервалов.
Рассмотрим фрагмент алгебры на примере расширения одного отношения «Перед» (Before) (табл. 1) до трех типов отношений (табл. 2).
Для учета эффекта неопределенности применяется функция принадлежности теории нечетких множеств, которая позволяет определить степень принадлежности элементов фундаментального множества пространства рассуждения нечеткому множеству. За основу меры степени принадлежности взяты введенные Л. Заде [1] вещественные числа в интервале от 0 до 1 : 0 означает, что элемент не включен в нечеткое множество, 1 - описывает полностью включенный элемент. Значения между 0 и 1 характеризуют нечетко включенные элементы.
Данное отношение предназначено для определения признака наступления возможностной временной точки a до b и принимает следующий вид: PosBefore (a, b[, PExtentIN]), где a и b - обязательные сравниваемые значения временных точек; PExtent_INE [0, 1] (опционально) - степень, требуемая для выполнения условия.
Отношение возвращает (PExtent_OUT[, boolean]), где PExtent OUTE [0, 1] - результирующая
Таблица 1
Введенные отношения временных точек и интервалов
Table 1
Input dependencies between time points and intervals
Отношение Точки A, B и интервал J Визуализация
Перед (Before) A перед J A перед B At < Sj At < Bt A J B -►t
После (After) A после J A после B At > Ej At > Bt B J A -►t
Равен (Equal) А равен В At = Bt A. -IB--t
Содержит (Contains) J содержит А Sj < At < Ej A. J -►t
Начинает (Starts) A начинает J Sj = At < Ej A. J -►t
Завершает (Finishes) A завершает J Sj < At = Ej J A. -►t
Таблица 2
Отношения возможностных точек и интервалов «Before»
Table 2
Dependencies between probabilistic points and intervals "Before"
Отношение Точки a, b, интервалы IPeriod, JPeriod Вид
Точки a перед b PosBefore (a, b[, PExtent IN])
Интервалы IPeriod перед JPeriod PosBefore (IPeriod, JPeriod[, PExtent IN])
Точки-Интервалы a перед IPeriod PosBefore (a, IPeriod.startdate)
1
0.69
' ~ /
/А/ /
, / ! / -
/ \ / 4
\
ч
b_a a b b_e
PosBefore (a, b) = 0.69 PosBefore (a, b, 0.4) = {0.69, true}
Рис. 3. Отношение «Перед: значение точки b определено с возможным отклонением»
Fig. 3. Relation "Before: b point value is determined with possible deviation "
0.45 0.41
0.18 0
b_a a b_e
PosBefore (a, b) = 0.41*0.45=0.18 PosBefore (a, b, 0.4) = {0.18, fa be}
Рис. 4. Отношение «Перед: значение точки b в диапазоне не определено»
Fig. 4. Relation "Before: b point value in a range is not determined"
возможностная степень выполнения; boolean -признак выполнения: true, если PExtentOUT > > PExtent_IN, или false, если PExtent OUT < PEx-tent_IN.
Варианты использования отношения «Перед» для двух введенных значений возможностных временных точек.
1. Точное значение точки a.
1.1. Точное значение точки b:
PosBefore =
0, b < a,
[1, b > a.
1.2. Значение точки b определено с возможным
отклонением:
PosBefore =
0, а > b _ ß,
1 _ /2, b _ b _ а
a _ b
b а < a < b,
1 _-
/2, b < a < b _ß,
Ь _ р-й^ 1, а <Ь _ а.
Возможностная точка Ь с периодами возможного отклонения наступления Ь_а и Ь_в (рис. 3).
1.3. Значение точки Ь в диапазоне не определено.
Возможностная точка Ь с возможностным диапазоном времени наступления Ь_а и Ь_в и возмож-ностной степенью b_PExtent_IN (рис. 4):
0* b PExtent а _ b
1 _-
а
IN, b _ß< a, b PExtent IN,
PosBefore = <!l b _ p- b _ a
b _ a< a < b _ p, 1*b_PExtent_IN, a <b_a.
В случаях, когда b_a и/или b_p принимают пустое значение, для проведения корректных расчетов подставляются даты начала или завершения значениями по умолчанию (d_sd и d_ed), которые должны быть определены в соответствии с предметной областью.
При b_a = null и b_p<>null: |0, b _ p< a, a - d sd
PosBefore =
1 _-
b _ ß_d _ sd /
d _ sd < a < b _ ß,
* b PExtent IN,
1* b _ PExtent _ IN При b_a <>null и b_ß = null:
f1* b PExtent _ IN a _ b о
PosBefore =
1 _-
d _ ed — b _ a b_a< a< d_ 0* b _ PExtent _ IN. При b_a = null и b_ßß = null: 0, d _ ed< a,
a — d sd
* b _ ed
a < d _ sd.
a < b _ а, PExtent _ IN,
d ed < a.
PosBefore =
1 _-
* b PExtent IN,
ed,
d _ ed - d _ sd __ d _ sd < а < d _ 1* Ь _ РЕх1еМ _ N, а < d _ sd.
1.4. Значение точки Ь не определено.
Возможностная точка Ь с неизвестным временем наступления.
Отношение возвращает исходное значение РЕх-tent_IN, которое принимает значение 0.
2. Точка а - значение определено с возможным отклонением.
2.1. Точное значение точки Ь: 0, Ь< а а,
PosBefore =
1 _ a_t±/2,
1 _
a _ ß_ a
a _ b
a < b < a _ ß,
/2,
а < b < a,
а - а _ а у 1, Ь > а _ р.
Возможностная точка а с периодами возможного отклонения наступления а и р (рис. 5).
2.2. Значение точки Ь определено с возможным отклонением.
Возможностная точка а с периодами возможного отклонения наступления а_а и а_р. Возмож-ностная точка Ь с периодами возможного отклонения наступления Ь_а и Ь_р (рис. 6).
0
1
1
c.89
/ \
\
a_a a b о_Р
PosBefore (a, b) = 0.89 PosBefore (a, b, 0.4) = {0.89, true}
Рис. 5. Отношение «Перед: значение точки b не определено»
Fig. 5. Relation "Before: b point value is not determined "
/ \ / \
' 4 / \ / у \
т/, vffliïs.
! \
a_a a b_a b a_p b_$
PosBefore (a, b) = avg(1+1+0.46) = 0.82 PosBefore (a, b, 0.4) = {0.82, true} Рис. 6. Отношение «Перед: значение точки b определено с возможным отклонением»
Fig. 6. Relation "Before: b point value is determined with possible deviation "
Для каждого ajxEÁ, где A = {a, a_a, a_P), выполняется следующий расчет степени posextent: 0, a _ x > b _ p,
pos _ extent = <
a _ x - b _ а 1--/ 2,
l-
b - b _ а a_x-b
b а < a x < b,
/2, b < a_x < b_ß,
b _ p-b, 1, a _ x < b _ a.
Степень возможности наступления а до b вы-считывается при помощи среднего значения полученных pos extent: PosBefore =A VG (pos extent (a), pos extent (a_a), pos extent (a_P)).
2.3. Значение точки b в диапазоне не определено.
Возможностная точка a с периодами возможного отклонения наступления a_a и a_p. Возмож-ностная точка b с возможностным диапазоном времени наступления b_a и b_p и возможностной степенью b_PExtent_IN (рис. 7).
Для каждого ajxEA, где A = {a, a_a, a_P}, выполняется следующий расчет степени pos extent: 0, a x > b _ p, x — b
pos _ extent =
1 —
* b PExtent IN,
b_ß-b_аy b _ а < a _ x < b _ ß, 1* b PExtent IN, a x < b
Степень возможности наступления а до b вы-считывается при помощи среднего значения полученных aextent: PosBefore =AVG (pos extent (a), pos extent (a_a), pos extent (a_ß)).
2.4. Значение точки b не определено.
Возможностная точка b с неизвестным временем наступления.
Отношение возвращает исходное значение PEx-tentIN, которое принимает значение 0.
3. Значение точки a в диапазоне не определено.
3.1. Точное значение точки b.
Возможностная точка a с возможностным диапазоном времени наступления a_a и a_ß и возможностной степенью a_PExtent_IN (рис. 8): 0 , a a > b,
PosBefore =
Ib - a а
* a PExtent IN,
a_p-a_a,
a _ a < b < a _ p, 1* a _ PExtent _ IN, a _ p< b.
3.2. Значение точки b определено с возможным отклонением.
Возможностная точка a с возможностным диапазоном времени наступления а_а и a_p и возможностной степенью aPExtentIN (рис. 9).
Возможностная точка b с периодами возможного отклонения наступления b_a и b_p.
Для каждого ajxEA, где A = {a_a, a_P}, выполняется следующий расчет степени pos extent: 0, a _ x > b _ p,
1 - a_X-b_a /2*a PExtent IN,
pos _ extent = <
l-
b - b _ а
b _ а < a x < b a_x-b
/2*a PExtent IN,
b_ß-by
b < a _ x < b _ ß, 1*a PExtent IN, a x <b а.
i
c.86
c.31
b
ц = c.3S|
a_a a b_a a_p b_p
PosBefore (a, b) = avg(1*0.35+1*0.35+0.86*0.35) = 0.34 PosBefore (a, b, 0.4) = {0.34, false}
Рис. 7. Отношение «Перед: значение точки b в диапазоне не определено»
Fig. 7. Relation "Before: b point value in a range is not determined"
c
l
c.46
c
c
a_a b a_ß
PosBefore (a, b) = 0.86*0.89=0.76 PosBefore (a, b, 0.4) = {0.76, true}
Рис. 8. Отношение «Перед: точное значение точки b» Fig. 8. Relation "Before: b point precise value "
a_a b_a o_p b bp
PosBefore (a, b) = avg(1*0.76+0.88*0.76) = 0.72 PosBefore (a, b, 0.4) = {0.72, true}
Рис. 9. Отношение «Перед: значение точки b определено с возможным отклонением»
Fig. 9. Relation "Before: b point value is determined with possible deviation "
1
0.87
0.43
Г Ц = о" •' •f.-' a 77 b
—г------- ! ц = 0.49| 1 1 - 1 1 1 ^
PosBefore (a, b) = avg(1*0.49+0.87*0.49) = 0.46 PosBefore (a, b, 0.4) = {0.45, true}
Рис. 10. Отношение «Перед: значение точки b в диапазоне не определено»
Fig. 10. Relation "Before: b point value in a range is not determined"
Степень возможности наступления а до Ь вы-считывается при помощи среднего значения полученных ро&'_ех1еп1:
Ра'Бе^уге= AVG(pos_extent(a_a), pos_extent(a_f>)).
3.3. Значение точки Ь в диапазоне не определено.
Возможностная точка а с возможностным диапазоном времени наступления а_а и а_р и возмож-ностной степенью а_РЕх1е^_Ш. Возможностная точка Ь с возможностным диапазоном времени наступления Ь_а и Ь_р и возможностной степенью Ь_РЕх1еЫ_Ш (рис. 10).
Для а_хбА, где А = {а_а, а_Р}, выполняется следующий расчет степени ро^'_ех1еп1:
1 * min ( a _ PExtent _ IN, b _ PExtent _ IN ), a _ x < b a, j a x - b
pos _ extent = <ü b _ ß-b _
xmin (a _ PExtent _ IN, b _ PExtent _ IN),
b _ a < a _ x < b _ ß, 0, b _ ß< a _ x.
Степень возможности наступления а до b вы-считывается при помощи среднего значения полученных posextent:
PosBefore =A VG (pos extent (a_a),pos extent (a_ß)).
3.4. Значение точки b не определено.
Возможностная точка b с неизвестным временем наступления.
Отношение возвращает исходное значение PEx-tent_IN, которое принимает значение 0.
По аналогии с представленным отношением «Перед» формализованы все заданные отношения интервалов Аллена [10] и расширенные отношения в таблице 1.
Библиотека алгоритмов
Алгебра отношений возможностных временных точек и/или интервалов была реализована в виде библиотеки алгоритмов на основе средств языка pl/sql. Разработанная библиотека алгоритмов дополняет и расширяет возможности языка SQL для обработки информации на базе реляционных моделей данных в развитие теории темпоральных моделей данных. В перспективе разработка отдельного инструментария систем управления БД для работы с темпоральными БД.
Апробация библиотеки алгоритмов возмож-ностных временных точек и/или интервалов проводилась в телекоммуникационной компании. Библиотека была интегрирована в модуль анализа работы биллинговых систем оператора связи и их взаимодействия со смежными системами. Модуль позволяет выявлять процессы, в которых присутствуют неопределенность и неточность в информации, связанной с временными показателями.
Разработанная библиотека алгоритмов возмож-ностных временных точек и/или интервалов была применена в системе мониторинга работы биллин-говой системы при решении задачи управления программами лояльности, в том числе:
- прогнозирование и фиксирование предполагаемых дат оплаты счетов абонентами на основании показателей прошлых периодов;
- анализ временных периодов внесения платежей абонентами и их сопоставление с возможност-ными датами оплаты непогашенных счетов;
- прогнозирование предполагаемой даты завершения биллингового расчетного периода -сбора счетов и платежей абонентов за предыдущий месяц;
1
о
0
a a
- расчет и хранение возможностных дат предоставления премиальных пакетов абонентам за пользование услугами связи.
На основании изложенного сделаем следующие выводы. Построение и реализация модели обработки темпоральных данных, в которых присутствует неточность или неопределенность, а также разработка процедур на основе подхода возмож-ностных отношений позволяют решить ряд практических задач анализа и прогнозирования временных данных.
В дальнейшем исследовании планируется продолжить развитие нечетко-темпоральной модели:
- расширить класс возможных отношений между возможностными временными точками и интервалами;
- интегрировать в модель возможностные нетемпоральные периоды и применение нескольких возможностных временных осей в одном отношении;
- реализовать процедурную модель для языков определения и манипулирования данными.
В целом исследования направлены на изучение и построение моделей извлечения информации в задачах с темпоральной неопределенностью, с опорой на развитый и массово используемый аппарат реляционных моделей данных. Унификация такого подхода, разработка методов и алгоритмов на базе теории реляционной алгебры и их программная реализация в отдельных продуктах (библиотеки,
классы, языки, инструментарии) могут быть эффективно применены в различных прикладных областях и технологиях обработки данных.
Литература
1. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. 162 с.
2. Burney A., Mahmood N., Jilani T., Saleem H. Conceptual fuzzy temporal relational model (ftrm) for patient data. WSEAS Transactions on Information Science and Applications, 2010, vol. 7, no. 5, рp. 725-734.
3. Garrido C., Marin N., Pons O. Fuzzy intervals to represent fuzzy valid time in a temporal relational database. Int. Journ. of Uncertainty, Fuzziness and Knowlege-Based Systems, 2009, vol. 17 (suppl. 1), pp. 173-192.
4. Nagyp'al G., Motik B. A fuzzy model for representing uncertain, subjective, and vague temporal knowledge in ontologies. On The Move to Meaningful Internet Systems 2003: CoopIS, DOA and ODBASE, OTM Confed. Int. Conf., 2003, pp. 906-923.
5. Pons J., Billiet C., Pons O., De Tré G. Aspects of dealing with imperfect data in temporal databases. Flexible approaches in data, information and knowledge management. Springer Int. Publ., Swetzerland, 2014, vol. 497, part. 3, pp. 189-220.
6. Galindo J., Urrutia A., Piattini M. Fuzzy databases: modeling, design and implementation. Idea Group Publ., Hershey, USA, 2006, pp. 150-151.
7. Pons J.E. Fuzzy temporal information treatment in relational databases. Thesis, Granada, Univ. Granada, 2014, 257 p.
8. Snodgrass R.T. Developing time-oriented database applications in SQL. Morgan Kaufmann Publ., Inc., SF, 1999, 504 p.
9. Kulkarni K.G., Michels J.-E. Temporal features in SQL: 2011. ACM SIGMOD Record, 2012, vol. 41, no. 3, pp. 34-43.
10. Allen J.F. Maintaining Knowledge about Temporal Intervals. Commun. ACM, 1983, vol. 26, no. 11, pp. 832-843.
DOI: 10.15827/0236-235X. 115.029-035 Received 01.07.16
IMPRECISE TEMPORAL INFORMATION PROCESSING
1Fomin V.V., Dr.Sc. (Engineering), Professor, [email protected]; 1Maltsev S.V., Postgraduate Student, [email protected] 1 Herzen State Pedagogical University of Russia, Reki Moyki Quay 48, St. Petersburg, 191186, Russian Federation
Abstract. The article presents the results of extensive research resulting from a practical need in improving the effectiveness of representation methods, extraction algorithms, processing fuzzy temporal data. The authors focus on ontological models of prediction and interpretation during interaction with imprecise temporal information. They propose a data storage methodology as well as models and unified procedures for extracting fuzzy information. The pragmatic of temporal data representation algorithms is considered using a new so-called possibilistic temporal information in analytical systems, where the parameters of inaccuracy and efficiency are crucial for making business decisions. The article proposes solutions for the problems of imprecise temporal information storage and retrieval by constructing a model of processing fuzzy temporal relations between time points and/or intervals. The concept of fuzzy temporal information analysis and presentation is described within development of temporal relational databases framework taking into account the criteria of inaccuracies, ambiguity and uncertainty. The authors developed he algebra of possibilistic relations between points and/or intervals. It defines the concept of possibilistic time point, possibilistic interval and corresponding values of possibilistic time points and intervals. The example of extension of one of the relations describes the fragment of a formalized algorithm of algebra implementation. The authors propose an approach to design and modeling a fuzzy temporal domain as well as the relations between possibilistic intervals and time points. The article describes an implemented library of algorithms for processing relations between possibilistic time points and/or intervals, as well as corresponding procedures and functions on SQL platform. At the end, the article describes the results of integration of the library of algorithms in a commercial project of analysis system for a telecommunication company. It also describes areas for further development of application tools based on the theory of a fuzzy-temporal model.
Keywords: temporal databases, temporal uncertainty, programs and algorithms.
References
1. Zadeh L.A. Ponyatie lingvisticheskoy peremennoy i ego primenenie k prinyatiyu priblizhennykh resheny [The Concept of a Linguistic Variable and its Application to Approximate Reasoning]. Moscow, Mir Publ., 1976, 162 p.
2. Burney A., Mahmood N., Jilani T., Saleem H. Conceptual fuzzy temporal relational model (ftrm) for patient data. WSEAS Transactions on Information Science and Applications. 2010, vol. 7, no. 5, pp. 725-734.
3. Garrido C., Marin N., Pons O. Fuzzy intervals to represent fuzzy valid time in a temporal relational database. Int. Journ. of Uncertainty, Fuzziness and Knowlege-Based Systems. 2009, vol. 17 (suppl. 1), pp. 173-192.
4. Nagyp'al G., Motik B. A fuzzy model for representing uncertain, subjective, and vague temporal knowledge in ontologies. On The Move to Meaningful Internet Systems 2003: CoopIS, DOA, and ODBASE, OTM Confed. Int. Conf. 2003, pp. 906-923.
5. Pons J., Billiet C., Pons O., De Tre G. Aspects of dealing with imperfect data in temporal databases. Flexible Approaches in Data, Information and Knowledge Management. Springer Int. Publ., Swetzerland, 2014, pp. 189-220.
6. Galindo J., Urrutia A., Piattini M. Fuzzy Databases: Modeling, Design and Implementation. Idea Group Publ., Hershey, USA, 2006, pp. 150-151.
7. Pons J.E. Fuzzy Temporal Information Treatment in Relational Databases. Thesis, Granada, Univ. Granada, 2014, 257 p.
8. Snodgrass R.T. Developing Time-oriented Database Applications in SQL. Morgan Kaufmann Publ., Inc., SF, 1999, 504 p.
9. Kulkarni K.G., Michels J.-E. Temporal features in SQL: 2011. ACM SIGMOD Record. 2012, vol. 41, no. 3, pp. 34-43.
10. Allen J.F. Maintaining Knowledge about Temporal Intervals. Commun. ACM. 1983, vol. 26, no. 11, pp. 832-843.