Научная статья на тему 'Сильная согласованность в задаче восстановления зависимостей при интервальной неопределенности данных'

Сильная согласованность в задаче восстановления зависимостей при интервальной неопределенности данных Текст научной статьи по специальности «Математика»

CC BY
95
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ЗАДАЧА ВОССТАНОВЛЕНИЯ ЗАВИСИМОСТЕЙ / СОГЛАСОВАНИЕ ПАРАМЕТРОВ И ДАННЫХ / СИЛЬНОЕ СОГЛАСОВАНИЕ / STRONG COMPATIBILITY / ИНТЕРВАЛЬНАЯ СИСТЕМА УРАВНЕНИЙ / INTERVAL SYSTEM OF LINEAR EQUATIONS / ДОПУСКОВОЕ МНОЖЕСТВО РЕШЕНИЙ / РАСПОЗНАЮЩИЙ ФУНКЦИОНАЛ / RECOGNIZING FUNCTIONAL / НЕДИФФЕРЕНЦИРУЕМАЯ ОПТИМИЗАЦИЯ / CONVEX NONSMOOTH OPTIMIZATION / DATA FITTING PROBLEM / COMPATIBILITY BETWEEN DATA AND PARAMETERS / TOLERABLE SOLUTION SET

Аннотация научной статьи по математике, автор научной работы — Шарый Сергей Петрович

Для задачи восстановления зависимостей по данным с интервальной неопределенностью вводится понятие сильной согласованности данных и параметров. Показано, что получающаяся усиленная формулировка задачи сводится к исследованию непустоты и дальнейшему оцениванию так называемого допускового множества решений для интервальной системы уравнений, построенной по обрабатываемым данным. Предложена вычислительная технология решения задачи восстановления линейной зависимости по интервальным данным с учетом требования сильной согласованности. Рассмотрены обобщения понятия сильного согласования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Strong compatibility in data fitting problem under interval data uncertainty

The data fitting problem is a popular and practically important problem in which a functional dependency between “input” and “output” variables is to be constructed from empirical data. At the same time, the measurements are almost always subject to uncertainties due to data inadequacy and errors in real-life situations. Traditionally, when processing the measurement results, models of probability theory are used, which is not always adequate to the problems under study. An alternative way to describe data inaccuracy is to use methods of interval analysis, based on specifying interval bounds of the measurement results. Data fitting problems under interval uncertainty are being solved for about half a century. Most studies in this field rely on the concept of compatibility between parameters and measurement data in which any measurement result is a kind of a large point “inflated” to a box (rectangular parallelepiped with facets parallel to the coordinate axes). The graph of the constructed function passing through such a “point” means a nonempty intersection of the graph with the box. However, in some problems, this natural concept turns out unsatisfactory. In this work, for the data fitting under interval uncertainty, we introduce the concept of strong compatibility between data and parameters. It is adequate to the situations when measurements of input and output variables are broken in time, and we strive to uniformly take into account the interval results of output measurements. The paper gives a practical interpretation of the new concept. It is shown that the modified formulation of the problem reduces to recognition and further estimation of the so-called tolerable solution set to interval systems of equations constructed from the processed data. We propose a computational technology for the solution of the data fitting problem under interval uncertainty that satisfies strong compatibility requirement. Finally, we consider generalizations of the concept of strong compatibility.

Текст научной работы на тему «Сильная согласованность в задаче восстановления зависимостей при интервальной неопределенности данных»

Вычислительные технологии Том 22, № 2, 2017

Сильная согласованность в задаче восстановления зависимостей при интервальной неопределенности данных

С. П. ШАРЫй

Институт вычислительных технологий СО РАН, Новосибирск, Россия Контактный e-mail: shary@ict.nsc.ru

Памяти моей любимой жены Ирины

Для задачи восстановления зависимостей по данным с интервальной неопределенностью вводится понятие сильной согласованности данных и параметров. Показано, что получающаяся усиленная формулировка задачи сводится к исследованию непустоты и дальнейшему оцениванию так называемого допускового множества решений для интервальной системы уравнений, построенной по обрабатываемым данным. Предложена вычислительная технология решения задачи восстановления линейной зависимости по интервальным данным с учетом требования сильной согласованности. Рассмотрены обобщения понятия сильного согласования.

Ключевые слова: задача восстановления зависимостей, согласование параметров и данных, сильное согласование, интервальная система уравнений, допусковое множество решений, распознающий функционал, недифференцируемая оптимизация.

Введение

Предметом настоящей работы является развитие методов анализа данных, которые неточны и имеют интервальную неопределенность.

Рассмотрим задачу восстановления линейной зависимости вида

Ь = а\Х\ + а2х2 + ... + апхп,

в которой а\, а2, ... , ап — независимые переменные (называемые также входными или предикторными переменными); Ь — зависимая переменная (называемая также выходной или критериальной переменной); х\, х2, ... , хп — некоторые коэффициенты. Эти неизвестные коэффициенты должны быть определены на основе ряда измерений значений а\, а2, ... , ап и Ь.

Результаты измерений не являются точными, и мы предполагаем, что они являются некоторыми интервалами, которые дают двусторонние границы точных значений измеренных величин. Таким образом, в результате г-го измерения получаем такие интервалы ац, а,г2, ..., а,гП, что истинное значение а\ лежит в ац, истинное значение а2 лежит в щ2 и т.д. вплоть до Ь, истинное значение которого лежит в

ИВТ СО РАН, 2017

Всего имеется т измерений, так что индекс г принимает значения из множества {1, 2,... , т}. Необходимо найти или оценить коэффициенты х^, ] = 1, 2,... , п, для которых выписанная выше линейная функция "наилучшим образом" приближала бы данные. При этом идеальным является, конечно, случай, когда график восстанавливаемой зависимости "проходит через все точки измерений", т. е. когда приближение данных в самом деле полное, совершенно так же, как, например, в задаче интерполирования.

Но в условиях неточности данных, когда каждое измерение-наблюдение вместо точки представляет собой целое множество возможных значений рассматриваемой величины, само понятие "прохождение через точки наблюдений" должно быть переосмыслено. Дело в том, что теперь множества неопределенности измерений приобретают структуру, которая вызывает необходимость различать те или иные случаи прохождения графика функции через эти множества. Это вызывается, в частности, тем, что входы и выходы системы (соответствующие независимым аргументам функции и зависимым переменным) отличаются друг от друга по функциональному назначению и их измерения могут выполняться отличным друг от друга способом или даже в разное время.

В связи с необходимостью учета этих новых реалий мы вводим понятия слабого сог-ласования и сильного согласования данных и параметров восстанавливаемой зависимости. Множество всех параметров, имеющих слабое согласование с данными, образует множество, которое в интервальном анализе известно как объединенное множество решений для интервальной системы уравнений, построенной по данным измерений. Множество параметров модели, удовлетворяющих условиям сильного согласования, является так называемым допусковым множеством решений для интервальной системы уравнений, построенной по данным наблюдений. Допусковое множество решений для интервальных систем линейных алгебраических уравнений сравнительно хорошо изучено. Оно всегда является выпуклым полиэдральным множеством. Существуют практичные методы для распознавания пустоты или непустоты допускового множества решений, а также для его внутреннего и внешнего оценивания. Интересно также отметить, что распознавание пустоты/непустоты допускового множества решений для интервальной линейной системы алгебраических уравнений является полиномиально сложной задачей, тогда как распознавание других множеств решений чаще всего КР-трудно.

В настоящей работе обсуждаются практические методы нахождения оценок параметров зависимостей, удовлетворяющих условию сильной согласованности с данными, рассматриваются их свойства. Мы опираемся на технику, использующую так называемый распознающий функционал для допускового множества решений интервальной системы линейных уравнений, построенных по данным наблюдений. В заключительном разделе работы кратко обсуждается самый общий случай обработки интервальных данных, когда некоторые измерения, требующие сильной согласованности, сочетаются с измерениями, где достаточна согласованность в обычном смысле (которую можно назвать слабой). Тогда задача восстановления зависимостей становится еще более сложной, а ее решение приводит к необходимости рассмотрения так называемых АЕ-реше-ний и множеств АЕ-решений для интервальных систем уравнений. Соответствующая теория в действительности уже построена, имеются и вычислительные методы для решения задач распознавания и оценивания множеств АЕ-решений.

Настоящая работа является продолжением и дополнением статьи [1], а система обозначений в ней соответствует неформальному международному стандарту [2]. В частности, интервалы и интервальные объекты в работе обозначаются жирным шрифтом, тогда как неинтервальные (точечные) объекты никак специально не выделяются.

1. Постановка задачи

Задача восстановления зависимостей — это популярная и практически важная задача, в которой по эмпирическим данным требуется построить зависимость заданного вида между "входными" и "выходными" величинами. Далее в работе подробно рассматривается простейшая линейная зависимость вида1

Ь = ахХх + а2х2 + ... + апхп, (1)

хотя многие конструкции и выводы справедливы и в общем случае. Необходимо определить неизвестные коэффициенты хг, чтобы получившаяся линейная функция "наилучшим образом" соответствовала заданному набору значений независимых аргументов и зависимой переменной

а^, а?\ ..., аЩ), Ъ(1),

(2) "1 ,

(2)

(2) аП ,

&<2),

(т)

а\ ,

(т)

(т)

аП ,

Ь(т).

Нередко эту задачу называют также задачей идентификации параметров объекта.

Подставляя данные (2) в равенство (1), после переобозначения а, — ~(г) получаем систему уравнений

Н]

а^ и Ьг := Ь(г)

ацХ1 + 0,12X2 + ... + а1пХп = 61, а21Х1 + а22Х2 + ... + а2пХп = &2,

+ &т2%2 + ... +

или, кратко,

Ах = Ь

с т х п-матрицей А = (а^) и т-вектором Ь = ( Ьг). Ее решение, обычное или в обобщенном смысле, принимается за оценку параметров ж1, х2, ... , хп. Наглядная графическая иллюстрация задачи восстановления зависимости показана на рис. 1: требуется найти прямую, проходящую через начало координат, которая "наилучшим образом" приближает множество точек с координатами (2).

Но в практических задачах восстановления зависимостей данные почти всегда неточны, поскольку на результаты измерений влияют внешние неконтролируемые факторы, сами измерительные приборы не являются абсолютно точными и т. д. и т. п. Таким образом, реально мы должны иметь дело с той или иной неопределенностью — состоянием частичного знания об измеряемой величине, когда известно какое-то ее значение, но оно приближенное и имеется также некоторая информация (качественная или количественная) о погрешности этого значения.

Как описывать эту неопределенность? Иными словами, какую "модель неопределенности" данных мы принимаем? Традиционный выбор — это теоретико-вероятностная

хДпя удобства изучается однородная линейная зависимость без свободного члена, хотя это никак не ограничивает общность наших результатов. При желании можно добавить свободный член в выражение (1) и работать с матрицами данных, имеющими на один столбец больше.

ь

т

Рис. 1. Иллюстрация задачи восстановления линейной зависимости

модель ошибок, основы которой заложили на рубеже XVIII и XIX вв. К.Ф. Гаусс и П.С. Лаплас. Согласно этому подходу погрешности измерений и наблюдений являются случайными величинами, адекватно описываемыми математическим аппаратом теории вероятностей, и нам (более-менее) известны характеристики этих случайных величин. Теоретико-вероятностная модель ошибок за прошедшие два века получила очень большое развитие и популярность, сделавшись основным инструментом обработки данных. Тем не менее ее приложение вызывает необходимость ответа на многие нетривиальные вопросы, и эти ответы подчас не вполне удовлетворительны.

В целом при приемлемости теоретико-вероятностного описания погрешностей часто удобнее работать с неопределенностями и неточностями в данных с помощью методов интервального анализа. При этом вместо вероятностных распределений заданными считаются интервальные оценки результатов измерений величин, т. е. их принадлежности некоторым интервалам или, что равносильно, указаны наименьшая и наибольшая границы возможных значений интересующих нас величин. В частности, в рассматриваемой задаче оценивания параметров линейной зависимости мы считаем, что даны интервальные оценки для а^ и к:

Н]

е а

1]

[ Ш,, а>и]

и

к е Ы

[Ьг, Ьг].

Пионером нового подхода к обработке данных в 1962 г. выступил Л.В. Канторович в статье [3], в которой были кратко намечены постановка новой задачи и методы ее решения. В дальнейшем в развитие теории восстановления зависимостей с интервальными неопределенностями данных значительный вклад внесли многие отечественные исследователи, в частности М.Л. Лидов [4], С.И. Спивак [5, 6], А.П. Вощинин [7, 8], А.П.Вощинин и А.Ф. Бочков [9], Н.М. Оскорбин [10], С.И. Носков [11], С.И.Жилин [12-14], Б.Т. Поляк и С.А.Назин [15]. Из зарубежных работ отметим исследования Дж.П. Нортона, М. Миланезе, Дж. Бельфорте, Л. Пронцато, Э. Вальтера и других [16, 17]. Этому же вопросу посвящены работы автора [18-20], развивающие так называемый метод максимума согласования.

В постановке Л.В. Канторовича и его последователей задача восстановления зависимостей по неточным данным имела не самый общий вид. неопределенности во входных данных предполагались отсутствующими, т.е. а^ = а^. Тогда (рис. 2)

Рис. 2. Иллюстрация согласования параметров линейной модели и интервальных данных измерений

п

Ь < ацХз < Ъц (3)

3=1

г = 1, 2,... ,т. Согласование параметров и данных следует понимать при этом как прохождение графика восстанавливаемой зависимости через все коридоры неопределенности данных для выходной переменной.

Этот частный случай тем не менее практически очень важен, и именно его тщательное решение способствовало широкому распространению новых подходов. Математически соотношения (3) образуют систему линейных неравенств, которую можно решать, к примеру, методами линейного программирования (именно это и предлагалось в [3]). В общем случае, когда интервальную неопределенность имеют как входные, так и выходные данные, естественным представляется следующее определение.

Определение 1. Набор параметров Х\, х2, ..., хп объекта согласуется с интервальными экспериментальными данными (аг1, аг2, ..., агп, Ьг), г = 1, 2,...,т, если для каждого наблюдения г в пределах измеренных интервалов найдутся такие представители ац Е ац, аг2 Е аг2, ..., агп Е агп и Ьг Е Ьг, что

ац Х\ + а^2%2 + ... + а>т%п = к.

В соответствии с этим определением данные каждого замера представляют собой как бы большие точки, "раздувшиеся" до брусов в пространстве Кп+1, а прохождение графика конструируемой зависимости через такую точку понимается как ее пересечение с этим брусом (рис. 3).

С использованием формального языка логики предикатов определение множества наборов параметров х = (х1,х2,... ,хп)Т, которые согласуются с данными, выглядит следующим образом:

[х Е Еп | (Зап Е ап) • • • (Эаы Е а,1п)(ЭЬ1 Е Ь1)(апХ1 +-----+ аыХп = к)

& (Эа21 Е 0,21) • • • (Эа2п Е а,2п)(ЗЬ2 Е Ь2)(а21Х1 +-----+ а2ПХп = Ь2)

& ...... •••

& (Зйт1 Е ат1) • • • (Эатп Е Е Ьт)(ат1 Х1 + • • • + &тп%п Ьт) ^.

Рис. 3. Иллюстрация согласования параметров линейной модели и интервальных данных измерений

Преобразуем выделяющий предикат, т. е. логическую формулу, стоящую после вертикальной черты в выписанном определении множества.

Прежде всего отметим, что множества переменных, входящих в отдельные члены конъюнкции, не пересекаются друг с другом. По этой причине, несмотря на то что в общем случае (Эх Р(х)) & (Зж Q(x)) не эквивалентно Эх (Р(х) & Q(x)), мы все же можем воспользоваться более слабой эквивалентностью логических формул

(Эх Р(х)) & (Эу Я(у)) ^ Эх Эу (Р(х) & Я(у)). Как следствие, получаем равносильную выделяющему предикату формулу

(Эап е ап) (Эа21 е 021)

(Эа1п е 01п) (Э61 е 61) (Эа2п е а2п) (Э&2 е 62)

(Эат1 е ат 1) ■ ■ ■ (Эатп е атп) (ЭЬт е Ьт) ( («11^1 +-----+

Ь1)

& (0,21X1 +----+ 02пХп = Ы

&

& (^т1^1 + ' ' ' + ^тпХ'п Ьт^^ .

Если из данных задачи организовать тхп-матрицу А = (а^) и т-вектор Ь = (Ьг), то большую кванторную приставку выписанной формулы можно записать кратко в виде

(ЭА е А)(ЭЬ е Ь),

где А — т х п-матрица с элементами а^, а Ь = (Ьг) — т-вектор. Таким образом, вместо большой формулы (4) запишем

(ЭА е А)(ЭЬ е Ь) ( (апХ1 +-----+ аыХп = 61)

& (021X1 + ■■ ■ + 02пХп = Ы & .........

& (От1Х1 + ■ ■ ■ + ОтпХп Ьт) ^ .

Но получившаяся конъюнкция равенств — это не что иное, как векторное равенство Ах = Ь. Поэтому окончательно заключаем, что множество параметров, согласующихся с данными в смысле первого определения, — это множество, определяемое как

{ж G Rra | ( ЗА G А )( ЗЬ G b )( Лг = b ) }.

В интервальном анализе оно называется объединенным множеством решений Suni (A, b) интервальной линейной системы уравнений Ах = b и неформально описывается как

Suni (A, b) = [х G R | Ах = b для некоторых A G А и b G b }.

Важным новым обстоятельством является то, что "раздувшиеся" точки-брусы данных приобретают уже дополнительную структуру, которой не было у исходных бесконечно малых точек. Они становятся прямыми декартовыми произведениями интервалов, имеющих разный содержательный смысл, отвечающих входным (независимым) переменным и выходу (зависимой переменной). Как следствие, различные грани бруса неопределенности замера имеют разное значение (на рис. 3 это вертикальные и горизонтальные стороны прямоугольников), а задача восстановления зависимостей по неточным данным приобретает иной контекст. Становится важным, как именно график восстанавливаемой зависимости проходит через брус неопределенности, на что впервые было обращено внимание, по-видимому, в работе [21].

Если процесс измерения значений входа и выхода разорван во времени и разделен на этапы, когда выходы измеряются после фиксации значений входов, то более адекватно другое понимание "согласования", при котором ограничение на выходе должно выполняться равномерно при любых значениях входов. Формально эта ситуация описывается следующим определением.

Определение 2. Набор параметров Х\, х2, ..., хп объекта сильно согласуется с интервальными экспериментальными данными (ац, ai2, ..., щп, bi), г = 1, 2,... ,т, если для каждого наблюдения г для любых значений ац G ац, щ2 G ai2, ..., щп G ain в пределах измеренных интервалов найдется такое bi G bi, что

ац Х\ + ai2X2 + ... + ainxn = bi.

Наглядная иллюстрация понятий сильного и слабого согласования приведена на рис. 4 и 5. Множество параметров, сильно согласующихся с данными, согласно второму определению, на формальном языке описывается следующим образом:

{х G Rra | (Van G ап) • • • (Уаы G аы)(ЗЬi G bi)(anxi +-----+ aVnxn = bi)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

& (Va2i G tt2i) • • • (Va2n G а2П)(Зbi G bi)(a2iXi +-----+ a2nxn = 62) (5)

& ......

& (Vami G ami) • • • (Vamn G атп)(Зbi G bi)( amiXi +-----+ amnxn = bm)}.

Выполним с выделяющим предикатом этого множества равносильные преобразования, аналогичные тем, что были проведены выше для определения 1, используя дополнительно эквивалентность

(VxP(х)) & [VyQ(y)) ^ Vx Vy (Р(x)&Q(y)).

данных измерений

Получается, что множество (5) совпадает с множеством, которое задается как

{ж е Г1 | (У А е А)(ЗЬ е Ь)(Аж = Ь ) },

где А — т х п-матрица с элементами а^, а Ь = (Ьг) — т-вектор. В интервальном анализе это множество называется допусковым множеством решений (А, Ь) интервальной линейной системы уравнений Ах = Ь, так как исторически оно возникло из решения практических задач, в которых фигурируют "допуски" на параметры объекта [22-24]. Неформально

(А, Ь) = { х е Кга | для любой А е А выполнено включение Ах е Ь }.

Отметим, что решение задачи восстановления зависимости по данным с интервальной неопределенностью, использующее переход к допусковому множеству решений, было выполнено в диссертации [25], но никаких объяснений или мотиваций оно не содержало. Продолжения этой работы, к сожалению, также не последовало.

Рис. 5. Иллюстрация слабого (а) и сильного (б) согласования параметров нелинейной модели и интервальных данных измерений

Особенностью традиционной задачи восстановления зависимостей, когда мы оперируем точечными значениями измерений и наблюдений, является тот факт, что согласование параметров модели и данных — это исключительное событие, которое почти никогда не имеет места. Кроме того, оно разрушается при сколь угодно малом возмущении данных. Но при существенной интервальной неопределенности множество параметров, согласующихся с данными, в типичных ситуациях имеет ненулевую меру и устойчиво к малым возмущениям в данных.

Решение задачи восстановления зависимостей по неточным данным мы будем вести по следующей общей схеме:

1) вводится количественная "мера сильного согласования" параметров и данных;

2) оценкой параметров берется точка (или точки) максимума этой меры.

Ясно, что при достаточно разумном выборе "меры согласования" оценка параметров по данному способу всегда будет получена. Но совершенно необязательно, что реальное согласование полученных параметров и данных в самом деле будет иметь место. Иными словами, как и в традиционном неинтервальном случае, иногда может не существовать набора параметров, согласующихся с данными, т. е. линии, проходящей через все брусы неопределенности замеров в нужном нам смысле, обычном или сильном.

Основной вопрос, возникающий в связи с намеченным планом, состоит в том, какой взять "меру сильного согласования / несогласования" параметров и данных?

Существуют естественные требования, которым эта мера должна удовлетворять. При непустом множестве решений она должна быть положительной или, по крайней мере, неотрицательной для точек из этого множества, на которых "сильное согласование" в самом деле достигается. Для точек вне множества решений, на которых "сильного согласования" нет, она может быть отрицательной.

2. Интервальные линейные системы уравнений

Рассмотрим подробнее интервальные линейные системы уравнений, т. е. основной объект, возникающий при решении задачи восстановления линейной зависимости по данным с интервальной неопределенностью.

Интервальная система линейных алгебраических уравнений имеет вид

ацх\ + а\2Х2 + ... + а,1пхп =

а2\Хг + 0,22X2 + ... + Ы2пХп = .

+ + ... +

или, кратко,

Ах = Ь

с интервальными т х п-матрицей А = (а^) и т-вектором Ь = (Ьг). Это формальная запись, обозначающая семейство точечных линейных систем Ах = Ь той же структуры с А е А и Ь е Ь. Каждая система линейных алгебраических уравнений Ах = Ь, матрица которой взята из интервальной матрицы А, а правая часть Ь — из Ь, может иметь решения, которые во многих практических ситуациях имеет смысл рассматривать совместно, единой совокупностью, т. е. взяв их объединение. На этом пути получаем так называемое объединенное множество решений

БиПъ (А, Ь) = { х е Еп | существуют такие А е А и Ь е Ь, что Ах = Ь }

Ъи

Ь2,

bт,

(англоязычный термин — united solution set). Оно формализует, по-видимому, наиболее простое и естественное понимание "решения" интервальной системы уравнений. Этому множеству и различным способам его нахождения и оценивания посвящено огромное количество работ.

Сильное согласование параметров и данных диктует другое понимание решений интервальной системы уравнений. Ему соответствует так называемое допусковое множество решений интервальной линейной системы уравнений — множество, определяемое как

Stoi (А, Ь) = { х G Rra | для любой А G А справедлива принадлежность Ах G b }

(англоязычный термин — tolerable solution set). Это множество решений всевозможных точечных систем Ах = Ь, для которых произведение Ах при любых А G А попадает в интервалы правых частей Ь.

Допусковое множество решений может оказаться пустым, если интервалы правой части слишком узки в сравнении с интервалами элементов матрицы. Тогда произведение Ах получает "большой размах", который может не уместиться в коридоры правых частей системы. Например, у интервального уравнения [1, 2]х = [2, 3] допусковое множество решений пусто, так как для любого неотрицательного вещественного у произведения [1, 2]t = [t, 2t] отношение правого конца к левому равно 2, тогда как для правой части это отношение — всего 3/2.

Нетрудно понять, что

S toi (A, b) Ç (A, b),

т. е. допусковое множество решений всегда является подмножеством объединенного множества решений. В терминах задачи восстановления зависимостей это означает, что если имеет место сильное согласование параметров и данных, то тогда тем более справедливо обычное согласование. Существует несколько результатов, дающих аналитические описания допускового множества решений.

Теорема И. Рона [24, 26, 27]. Точка х G R принадлежит допусковому множеству решений интервальной линейной системы уравнений Ах = b тогда и только тогда, когда х = х'—х" для некоторых векторов х', х" G Rra, которые удовлетворяют системе линейных неравенств

Ах — Ах'' < Ь, —Ах' + Ах" < —Ь, х', х" > 0.

Теорема И.А.Шарой [28]. Пусть Ai: — i-я строка интервальной матрицы А и vert Ai: — множество вершин этого интервального вектора. Для интервальной m х п-системы линейных алгебраических уравнений Ах = b допусковое множество решений Stoi(A, b) представимо в виде

m

Etol(A, b) = П П {х G 1ах G Ьг},

i=1 «Gvert Ai:

т. е. как пересечение гиперполос Rra. Если через | ■ | обозначено количество элементов

m

множества, то число гиперполос не превосходит Y1 I vert Ai:\ и тем более не превос-

г=1

ходит m ■ 2п.

Каждое из включений ах Е Ьг для а Е Аг:, задающее гиперполосу в Кп, равносильно двустороннему линейному неравенству

Поэтому теорема И.А. Шарой фактически дает представление допускового множества решений в виде решения системы двусторонних линейных неравенств, количество которых существенно меньше общего числа крайних ("угловых") неравенств интервальной

Коль скоро задача решения систем линейных неравенств разрешима за полиномиальное время [29], из теоремы И.Рона следует, что в общем случае распознавание пустоты/непустоты допускового множества решений ИСЛАУ — также полиномиально разрешимая задача.

В качестве наглядного примера рассмотрим интервальную линейную систему уравнений

Ее объединенное и допусковое множества решений изображены на рис. 6.

Выразительный трехмерный пример дает интервальная система линейных алгебраических уравнений, которая является частным случаем тестовой параметрической системы, предложенной автором в [30]:

Ьг < ацХ\ + аг2Х2 + ... + агпхп < Ьг.

системы, равное 2т(п+1\

(6)

/ [2, 3] [-0.75, 0.65] [-0.75,0.65] \ / [-2, 2] \

[-0.75,0.65] [2,3] [-0.75,0.65] ж = [-2,2] \ [-0.75, 0.65] [-0.75, 0.65] [2, 3] / \ [-2, 2] /

ПХ2

3

XI

-3

Рис. 6. Объединенное и допусковое множества решений интервальной системы линейных уравнений (6)

а

б

0.8

Рис. 7. Объединенное (а) и допусковое (б) множества решений интервальной системы (7)

Ее объединенное и допусковое множества решений, построенные с помощью пакета [31], изображены на рис. 7.

3. Метод распознающего функционала

Результаты, приведенные в предшествующем разделе, — теорема И. Рона и теорема И.А. Шарой, в принципе, дают инструменты для исследования допускового множества решений и работы с ним. В одних ситуациях более удобен и предпочтителен первый результат, в других — второй. Тем не менее представление допускового множества решений через систему линейных неравенств имеет определенные недостатки. В частности, желательно исследовать допусковое множество решений и работать с ним в терминах целостных интервалов данных задачи, а не с отдельными их концами, многократно входящими в системы неравенств.

Приведем известные результаты о допусковом множестве решений, опубликованные ранее в [22-24]. Далее нам понадобится классическая интервальная арифметика Ж — алгебраическая система, образованная интервалами х = [ х, х ] С М так, что для любой арифметической операции "из множества { + , — , •, / } результат операции между интервалами определяется как

Развернутые конструктивные формулы для арифметических операций выглядят следующим образом:

X + у = [х + у, X + у],

X — У = [х — у, х — у], х • у = [шт{ху, ху, ху, ху}, ш&х{ху, ху, ху, ху}],

х/у = х • [\/у, 1/у] для у^ 0.

Отправной точкой дальнейших конструкций является следующая характеризация точек из допускового множества решений: для интервальной системы линейных алгебраических уравнений Ах = Ь точка х Е Кга принадлежит допусковому множеству решений Ею1 (А, Ь) тогда и только тогда, когда

А • х С Ь, (8)

где " • " интервальное матричное умножение. Справедливость этой характеризации следует из свойств интервального матрично-векторного умножения и определения допус-кового множества решений. Придадим включению (8) другую, аналитическую форму.

Прежде всего перепишем (8) в виде равносильной системы покомпонентных включений. Поскольку по определению

(А • x)i = ^^ aij Xj, i = 1, 2,...,т,

3 = 1

вместо (8) можно написать

У^ a^jXj С bi, г = 1, 2,... ,т.

3 = 1

Представим правые части этих включений в виде суммы средней точки mid bi и уравновешенного интервала [—rad bi, rad bi\:

^^aij Xj С mid bi + [-rad bi, rad bi], i = 1, 2,...

3 = 1

Добавляя теперь к обеим частям включений по (-midbi), получим

п

У^ aij Xj — mid bi С [-rad bi, rad bi\, i = 1, 2,...,

m.

3 = 1

Но включение интервала в уравновешенный интервал [—rad bi, rad Ь^ можно эквивалентным образом записать как неравенство на абсолютное значение:

'У ] ^3

3 = 1

ацXi — mid bi

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

< rad bi, i = 1, 2,... ,m,

что равносильно

rad bi —

У^ aij Xj — mid bi

3 = 1

> 0, i = 1, 2,... ,m.

Поэтому

Ax С b <=?• rad bi —

mid bi — ^^ a

3 = 1

•гз Xj

> 0, i = 1, 2,... ,m.

Наконец, можно свернуть по г конъюнкцию неравенств в правой части полученной логической эквивалентности:

Ах С b ^

!

min rad bi —

1< i<m

mid bi — ^^ a i=i

гз Xj

}

> 0.

Мы пришли к следующему результату.

Теорема. Пусть А — интервальная тх п-матрица, Ь — интервальный т-вект,ор. Тогда выражением

Tol (х, А, b) = min ( rad bi —

1< i<m

{

mid bi — ^^ а

3 = 1

гз X3

1

задается отображение То1 : Ега х Етхга х Ет ^ К, такое что принадлежность точки х Е Кга допусковому множеству решений (А, Ь) интервальной линейной системы уравнений Ах = Ь равносильна неотрицательности в х отображения То1, т. е.

X е ^tol (А, Ь)

Tol (х, А, Ь) > 0.

Таким образом, допусковое множество решений ^toi(А, Ь) интервальной линейной системы является множеством уровня

{ ж е Rn | Tol (х, А, Ь) > 0 }

отображения Tol. Назовем это отображение "распознающим функционалом" допуско-

2

вого множества решений, так как оно принимает значения на вещественной оси, а посредством знака своих значений Tol "распознает" принадлежность точки множеству ¿ш (А, Ь).

Конспективно изложим ниже свойства распознающего функционала. Их подробные доказательства можно найти в [22 - 24].

Предложение 1. Функционал Tol непрерывен по Липшицу.

Предложение 2. Функционал Tol — вогнутый по х всюду в Rra.

Предложение 3. Функционал Tol (х, А, Ь) — полиэдральный, т. е. его подграфик — полиэдральное множество.

Предложение 4. Функционал Tol (х, А, Ь) достигает конечного максимума на всем пространстве Rra.

В качестве иллюстрации на рис. 8 изображен график распознающего функционала допускового множества решений для интервальной системы (6).

Предложение 5. Если Tol (х, А, Ь) > 0, то х — точка топологической внутренности int Htol (А, b) допускового множества решений.

Поясним, что точка топологической внутренности — это точка множества, принадлежащая ему вместе с некоторым шаром (относительно какой-то нормы), имеющим центр в этой точке. Следовательно, точки из внутренности множества остаются принадлежащими этому множеству даже при их малых "шевелениях", что подчас бывает важно на практике.

2В математике функционал — это отображение, заданное на произвольном множестве и имеющее числовую область значений, обычно множество вещественных чисел R или комплексных чисел C.

Рис. 8. График распознающего функционала допускового множества решений системы (6)

Предложение 6. Пусть интервальная линейная система уравнений Ах = b такова, что для каждого индекса г = 1, 2,... ,т в г-й строке матрицы А существует, хотя бы один ненулевой элемент или же не равен нулю ни один из концов соответствующей компоненты правой части bi. Тогда из принадлежности х Е int Etoli{А, b) следует строгое неравенство Tol {х, А, Ь) > 0.

Как следствие сформулированных результатов, с помощью распознающего функционала можно выполнить исследование пустоты/непустоты допускового множества решений интервальной системы линейных алгебраических уравнений по следующей схеме.

Для интервальной системы Ах = b решаем задачу безусловной максимизации распознающего функционала Tol {х, А, Ь). Пусть U = max^Rn Tol {х, А, Ь) и достигается в точке т Е Rra. Тогда:

• если U > 0, то т Е Stoi {А, Ь) = 0, т. е. допусковое множество решений системы Ах = b непусто и т лежит в нем;

• если U > 0, то т Е int Etoi{А, b) = 0 и принадлежность точки т множеству решений устойчива к малым возмущениям А и b;

• если U < 0, то Stoi{А, Ь) = 0, т. е. допусковое множество решений интервальной системы уравнений Ах = b пусто.

4. Метод максимума согласования для "сильного" случая

Результаты, приведенные в предшествующем разделе, могут быть положены в основу подхода к нахождению таких решений задачи восстановления зависимостей по неточным данным, которые удовлетворяют требованию сильной согласованности данных и параметров. Для обычного согласования этот путь был проделан раньше в работах [18-20].

В соответствии с планом, намеченным в конце первого раздела работы, нам необходимо ввести "меру сильного согласования / несогласования" параметров и данных. Ясно, что при непустом допусковом множестве решений она должна быть положительной для точек из этого множества, на которых "сильное согласование" в самом деле достигается. Для точек вне допускового множества решений, на которых "сильного согласования" нет, она может быть отрицательной. Таким образом, на роль меры согласования очень подходит распознающий функционал То1. В частности, предложения 5 и 6 из предыдущего раздела показывают, что То1 различает границу и внутренность допускового множества решений.

Мы приходим к методу оценивания параметров линейной зависимости по неточным данным, который будем называть методом максимума согласования:

Оценкой параметров берем точку, в которой достигается наибольшее значение распознающего функционала То1.

Как следствие теории, изложенной в разд. 3,

• если max Tol > 0, то найденная точка лежит во множестве параметров, сильно согласующихся с данными;

• если max Tol < 0, то множество параметров, имеющих сильное согласование с данными, пусто, но найденная точка минимизирует несогласованность параметров и данных.

Содержательная интерпретация метода максимума согласования в случае пустого множества решений Stoi(А, Ь) может быть, например, такой: оценка параметров, т.е. аргумент, на котором достигается max Tol, — это первая точка, которая появится в непустом допусковом множестве решений при равномерном уширении вектора правой части относительно его середины.

В самом деле, рассмотрим выражение для распознающего функционала Tol:

( " )

< rad bi — mid bi — ^^ a^ Xj >

То1 (х, А, Ь) = тт < rаd Ь* —

1<г<т 1

Величины rad Ьг входят слагаемыми во все выражения, по которым берется минимум тт^^ при вычислении окончательного значения функционала. Поэтому, если обозначить

е = ([-1,1],..., [-1,1])Т,

то для системы Ах = Ь + Се с уширенной правой частью, радиусы компонент которой стали равны rad bi + С, г = 1, 2,... ,т, имеем (рис. 9)

Tol (х, A, b + Се) = Tol (х, А, Ь) + С.

Как следствие,

max Tol (х, A, b + Се) = max Tol (х, А, Ь) + С,

X X

откуда и вытекает сделанное утверждение.

Для случая точечных данных усиленный метод максимума согласования, как и обычный, совпадает с так называемым чебышёвским сглаживанием данных, которое давно и успешно применяется при обработке данных (см., к примеру, [5]).

Рис. 9. Уширение брусов неопределенности данных, сравнительно большее по выходной переменной, приводит к появлению сильного согласования

В самом деле, если матрица входных данных А и вектор выходных данных Ь — точечные (неинтервальные), т.е. А = А = (а^) и Ь = Ь = то для всех г,]

rad bj = 0,

mid bj = bi

При этом распознающий функционал множества решений принимает вид

Tol (х, А, b) = min < —

1<г<т 1

!

Ь - £

3 = 1

1

= — max

1<i<m

bi "У ] a,ij Xj

3 = 1

— max I (Ax)i — bi I = — \\Ax — b ||

1< i<m

Здесь посредством || ■ обозначается чебышёвская норма (то-норма) вектора в конечномерном пространстве Rm, которая определяется как ||у||те = max Тогда

1<г<т

max Tol (х) = max (— \\Ах — &||оо) = — min II Ar — b\\oo,

коль скоро max(—f (х)) = — min f (x). В этом случае максимизация распознающего функционала равносильна минимизации чебышёвской нормы невязки решения.

5. Реализация

Развитая в предшествующих разделах теория будет практичной и реально полезной лишь в том случае, когда в нашем распоряжении имеются эффективные методы для нахождения максимума распознающего функционала допускового множества решений, т. е. max Tol. Рассмотренные в разд. 3 свойства распознающего функционала являются достаточно благоприятными для применения эффективных численных методов оптимизации.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В общем случае задача вычисления max Tol — это задача безусловной максимизации вогнутой негладкой целевой функции. Ее решение может опираться на методы негладкой выпуклой оптимизации, интенсивно развиваемые в течение нескольких десятилетий, например, научной школой Н.З.Шора в Киеве [33, 34].

Уже более десятилетия автором свободно распространяется программа tolsolvty, которая находится, в частности, на сайте "Интервальный анализ и его приложения" — http://www.nsc.ru/interval (раздел "Программное обеспечение" и далее "Некоторые интервальные программы на ScilabV и "Некоторые интервальные программы на МАТЬАВ'е"). Программа предназначена для численного нахождения безусловного максимума распознающего функционала Tol и использует в качестве основы код ralgb5 П.И. Стецюка (Институт кибернетики НАН Украины). Этому алгоритму, в частности, посвящена статья [35] из настоящего журнала. Фактически tolsolvty — очень хорошая и проверенная временем реализация метода максимума согласования в сильном смысле, которую можно рекомендовать для решения практических задач.

Сравнительно недавно появилась возможность использовать для нахождения максимума распознающего функционала Tol методы отделяющих плоскостей, предложенные Е.А. Нурминским [36] и развитые далее Е.А.Воронцовой [37, 38]. На сайте "Интервальный анализ и его приложения" выложена свободная программа tolspaclip, реализующая метод отделяющих плоскостей с дополнительным отсечением, предназначенная для тех же целей, что и tolsolvty.

6. Обобщения

Представим ситуацию, когда в некоторых измерениях требуется сильное согласование параметров с данными, а в других измерениях достаточно обычного согласования. На формальном математическом языке это означает, что к части входных переменных применяются логические кванторы "V', а к другой части — логические кванторы " 3".

Тогда вместо объединенного или допускового множеств решений естественно приходим к таким множествам решений, в которых кванторы разного смысла, действующие на различные входные переменные, перемешаны друг с другом. Это так называемые множества кванторных решений интервальных систем уравнений, построенных по данным задачи. Можно показать, что в действительности здесь возникают даже не самые общие кванторные решения, а их частный случай — так называемые AE-решения интервальных систем уравнений [24, 39, 40].

Для множеств АЕ-решений также можно построить "распознающие функционалы", обладающие свойствами, которые аналогичны свойствам функционала Tol для допускового множества решений. Эта работа проделана в [41], где общие распознающие функционалы сконструированы на основе идеи рассмотрения "резерва" так называемого характеристического включения для соответствующих множеств AE-решений. В целом эти функционалы могут служить для измерения степени совместности (согласования) параметров и данных в случае более общих требований к решению. Найдя безусловный максимум такого распознающего функционала, мы получим точку, в которой достигается максимум согласования, так что она может быть взята в качестве искомой оценки параметров. Такова общая схема решения задачи, которую, конечно, необходимо конкретизировать и снабдить эффективными вычислительными алгоритмами.

Заключение

В задачах восстановления зависимостей по данным с интервальной неопределенностью следует различать различные типы согласования интервальных данных с параметрами восстанавливаемой зависимости. В частности, имеет смысл ввести понятия сильного и слабого согласования данных и параметров, которые соответствуют различной роли входных (предикторных) и выходных (критериальных) переменных в процессе измерения.

Метод максимума согласования — перспективный метод идентификации параметров систем и восстановления зависимостей для данных с интервальными неопределенностями, основанный на максимизации распознающего функционала множества решений задачи. Он является обобщением метода чебышевского сглаживания и может служить хорошей альтернативой традиционным методам регрессионного анализа, использующим теоретико-вероятностные модели ошибок данных. В работе предложена его модификация на случай сильного согласования параметров и данных.

Интересен открытый вопрос: какова теоретико-вероятностная интерпретация метода максимума согласования для сильного случая?

Для случая слабого согласования параметров и данных в работе [42] дана вероятностная интерпретация метода максимума согласования, согласно которой он оказывается не чем иным, как методом максимума правдоподобия для равномерных распределений на интервалах данных. Крайне полезно было бы получить подобный результат для сильного согласования.

Список литературы / References

[1] Ш!арый С.П. Сильная согласованность в задачах восстановления зависимостей по интервальным данным // Вестн. ЮУрГУ. Математика. Механика. Физика. 2017. Т. 9, № 1. С. 39-48. D01:10.14529/mmph170105.

Shary, S.P. Strong compatibility in data fitting problems based on interval data // Bulletin of the South Ural State Univ. Mathematics. Mechanics. Physics. 2017. Vol. 9, No. 1. P. 39-48. (In Russ.)

[2] Kearfott, R.B., Nakao, M., Neumaier, A., Rump, S., Shary, S.P., van Henten-ryck, P. Standardized notation in interval analysis // Comput. Technologies 2010. Vol. 15, No. 1. P. 7-13.

[3] Канторович Л.В. О некоторых новых подходах к вычислительным методам и обработке наблюдений // Сиб. матем. журн. 1962. Т. 3, № 5. С. 701-709.

Kantorovich, L.V. On some new approaches to numerical methods and processing of observation data // Siberian Math. J. 1962. Vol. 3, No. 5. P. 701-709. (In Russ.)

[4] Лидов М.Л. Минимаксные методы оценивания. Москва, 2010. 87 с. (Препр. / РАН. ИПМ им. М.В.Келдыша № 71.)

Lidov, M.L. Minimax estimation methods. Moscow, 2010. 87 p. (Prepr. / RAN. Keldysh Institute of Applied Mathemetics No. 71.) (In Russ.)

[5] Спивак С.И., Тимошенко В.И., Слинько М.Г. Применение метода выравнивания по П.Л. Чебышеву при построении кинетической модели сложной химической реакции // Докл. Академии наук. 1970. Т. 192, № 3. С. 580-582.

Spivak, S.I., Timoshenko, V.I., Slin'ko, M.G. Application of Chebyshev alignment for the construction of kinetic model of complex chemical reaction // Doklady Academii Nauk. 1970. Vol. 192, No. 3. P. 580-582. (In Russ.)

[6] Спивак С.И., Кантор О.Г., Юнусова Д.С., Кузнецов С.И., Колесов С.В. Оценка погрешности и значимости измерений для линейных моделей // Информатика и ее применения. 2015. Т. 9, вып. 1. С. 87-97.

Spivak, S.I., Kantor, O.G., Yunusova, D.S., Kuznetsov, S.I., Kolesov, S.V. Evaluation of measurement accuracy and significance for linear models // Informatics and its Applications. 2015. Vol. 9, iss. 1. P. 87-97. (In Russ.)

[7] Вощинин А.П. Интервальный анализ данных: развитие и перспективы // Заводская лаборатория. 2002. Т. 68, № 1. С. 118-126.

Voshchinin, A.P. Interval data analysis: development and perspectives // Industrial Laboratory. 2002. Vol. 68, No. 1. P. 118-126. (In Russ.)

[8] Вощинин А.П. Задачи анализа с неопределенными данными — интервальность и/или случайность? // Рабочее совещание по интервальной математике и методам распространения ограничений ИМР0'04, Новосибирск, 21-22 июня 2004 г. Тр. Междунар. конф. по вычисл. математике МКВМ-2004. Рабочие совещания / Под ред. Ю.И. Шокина, А.М. Федотова, С.П. Ковалева, Ю.И. Молородова, А.Л. Семенова, С.П. Шарого. Новосибирск: ИВМиМГ СО РАН, 2004. С. 147-158.

Voschinin, A.P. Data analysis under uncertainty — intervals and/or randomness? // Workshop on Interval Mathematics and Constraint Propagation Methods, Novosibirsk, 21-22 June 2004. Proc. of the Intern. Conf. on Computational Mathematics ICCM-2004. Workshops / Eds Yu.I. Shokin, A.M. Fedotov, S.P. Kovalyov, Yu.I. Molorodov, A.L. Semenov, S.P. Shary. Novosibirsk: IVMiMG SO RAN, 2004. P. 147-158. (In Russ.)

[9] Вощинин А.П., Бочков А.Ф., Сотиров Г.Р. Метод анализа данных при интервальной нестатистической ошибке // Заводская лаборатория. 1990. Т. 56, № 7. С. 76-81. Voshchinin, A.P., Bochkov, A.F., Sotirov, G.R. A method for data analysis under interval nonstatistical error // Industrial Laboratory. 1990. Vol. 56, No. 7. P. 76-81. (In Russ.)

[10] Оскорбин Н.М., Максимов А.В., Жилин С.И. Построение и анализ эмпирических зависимостей методом центра неопределенности // Изв. Алтайского гос. ун-та. 1998. № 1. С. 37-40.

Oskorbin, N.M., Maksimov, A.V., Zhilin, S.I. Construction and analysis of empirical dependences using the uncertainty center method // Izvestiya of Altai State Univ. J. 1998. No. 1. P. 37-40. (In Russ.)

[11] Носков С.И. Технология моделирования объектов с нестабильным функционированием и неопределенностью в данных. Иркутск: Облинформпечать, 1996. 320 с.

Noskov, S.I. Modeling technology for objects with nonstable functioning and data uncertainty. Irkutsk: Oblinformpechat', 1996. 320 p. (In Russ.)

[12] Жилин С.И. Нестатистические модели и методы построения и анализа зависимостей: Дис. ...канд. физ.-мат. наук. Барнаул: АлтГУ, 2004. 119 с. Адрес доступа: http://www.nsc.ru/interval/Library/ApplDiss/Zhilin.pdf

Zhilin, S.I. Nonstatistical models and methods for construction and analysis of dependences: PhD thesis. Barnaul: AltGU., 2004. 119 p. (In Russ.)

[13] Zhilin, S.I. On fitting empirical data under interval error // Reliable Computing. 2005. Vol. 11, No. 5. P. 433-442.

[14] Zhilin, S.I. Simple method for outlier detection in fitting experimental data under interval error // Chemometrics and Intellectual Laboratory Systems. 2007. Vol. 88. No. 1. P. 60-68.

[15] Поляк Б.Т., Назин С.А. Оценивание параметров в линейных многомерных системах с интервальной неопределенностью // Проблемы управления и информатики. 2006. № 1. С. 103-115.

Polyak, B.T., Nazin, S.A. Estimation of parameters in linear multidimensional systems under interval uncertainty // J. of Automat. and Inform. Sci. 2006. Vol. 38, iss. 2. P. 19-33.

[16] Bounding Approaches to System Identification / M. Milanese, J. Norton, H. Piet-Lahanier, E. Walter (Eds). New York: Plenum Press, 1996. 567 p.

[17] Ж!олен Л., Кифер М., Дидри О., Вальтер Э. Прикладной интервальный анализ. М.; Ижевск: РХД, 2007. 468 с.

Jaulin, L., Kieffer, M., Didrit, O., Walter, E. Applied interval analysis. London: Springer, 2001. 379 p.

[18] Ш!арый С.П. Разрешимость интервальных линейных уравнений и анализ данных с неопределенностями // Автоматика и телемеханика. 2012. № 2. С. 111-125.

Shary, S.P. Solvability of interval linear equations and data analysis under uncertainty // Automation and Remote Control. 2012. Vol. 73, No. 2. P. 310-322. D0I:10.1134/S0005117912020099.

[19] ШШарый С.П., ШШарая И.А. Распознавание разрешимости интервальных уравнений и его приложения к анализу данных // Вычисл. технологии. 2013. Т. 18, № 3. С. 80-109. Shary, S.P., Sharaya, I.A. Recognizing solvability of interval equations and its application to data analysis // Comput. Technologies. 2013. Vol. 18, No. 3. P. 80-109. (In Russ.)

[20] Shary, S.P. Maximum consistency method for data fitting under interval uncertainty // J. of Global Optimization. 2015. Vol. 62, No. 3. 16 p.

[21] Gutowski, M.W. Interval experimental data fitting // Focus on Numerical Analysis / J.P. Liu. (Ed.) New York: Nova Science Publ., 2006. P. 27-70.

[22] Shary, S.P. Solving the linear interval tolerance problem // Mathematics and Computers in Simulation. 1995. Vol. 39. P. 53-85.

[23] ШШарый С.П. Решение интервальной линейной задачи о допусках // Автоматика и телемеханика. 2004. № 7. С. 147-162.

Shary, S.P. An interval linear tolerance problem // Automation and Remote Control. 2004. Vol. 65, iss. 10. P. 1653-1666. D0I:10.1023/B:AURC.0000044274.25098.da.

[24] ШШарый С.П. Конечномерный интервальный анализ: Электр. книга. Новосибирск: Изд-во XYZ, 2016. 617 c. Адрес доступа: http://www.nsc.ru/interval/Library/InteBooks Shary, S.P. Finite-dimensional interval analysis: E-book. Novosibirsk: XYZ Press, 2016. 617 p. Available at: http://www.nsc.ru/interval/Library/InteBooks (In Russ.)

[25] Ляпин Д.С. Программно-математические средства моделирования системных связей на основе анализа интервальных данных: Дис. ... канд. техн. наук. Москва: Моск. гос. ун-т приборостроения и информатики, 2006. 121 с.

Lyapin, D.S. Software and mathematical tools for modeling system relations based in interval data analysis: PhD thesis. Moscow: Moscow State Univ. of Instrument Engineering and Informatics, 2006. 121 p. (In Russ.)

[26] Rohn, J. Inner solutions of linear interval systems // Interval Mathematics 1985: Lecture Notes in Computer Science 212 / K. Nickel. (Ed.) Berlin: Springer-Verlag, 1986. P. 157-158.

[27] Rohn, J. A handbook of results on interval linear problems: E-book. 2005. 80 p. Available at: http://www.nsc.ru/interval/Library/Surveys/ILinProblems.pdf

[28] ШШарая И.А. Строение допустимого множества решений интервальной линейной системы // Вычисл. технологии. 2005. Т. 10, № 5. С. 103-119.

Sharaya I.A. Structure of the tolerable solution set of an interval linear system // Comput. Technologies. 2005. Vol. 10, No. 5. P. 103-119. (In Russ.)

[29] Схрейвер А. Теория линейного и целочисленного программирования. Т. 1. М.: Мир, 1991. 360 с.

Schrijver, A. Theory of linear and integer programming. Chichester; New York: Wiley, 1998. 484 p.

[30] Shary, S.P. On optimal solution of interval linear equations // SIAM J. on Numerical Analysis. 1995. Vol. 32, No. 2. P. 610-630.

[31] ШШарая И.А. Пакет IntLinIncR3 для визуализации множеств решений интервальных линейных систем с тремя неизвестными: Программное обеспечение. Адрес доступа: http://www.nsc.ru/interval/Programing

Sharaya, I.A. IntLinInc3D, software package for visualization of solution sets to interval linear 3D systems. Available at: http://www.nsc.ru/interval/sharaya

[32] Ремез Е.Я. Основы численных методов чебышевского приближения. Киев: Наукова думка, 1969. 624 с.

Remez, E.Ya. Fundamentals for numerical methods of Chebyshev approximation. Kiev: Naukova Dumka, 1969. 624 p. (In Russ.)

[33] Шор Н.З., Журбенко Н.Г. Метод минимизации, использующий операцию растяжения пространства в направлении разности двух последовательных градиентов // Кибернетика и системный анализ. 1971. № 3. С. 51-59.

Shor, N.Z., Zhurbenko, N.G. Minimization method using operation of space dilatation in the direction towards difference of two sequential gradients // Kibernetika and Systems Analysis. 1971. No. 3. P. 51-59. (In Russ.)

[34] Стецюк П.И. Методы эллипсоидов и r-алгоритмы. Кишинэу: Эврика, 2014. 488 с. Stetsyuk, P.I. Ellipsoids methods and r-algorithms. Kishineu: Evrika, 2014. 488 p. (In Russ.)

[35] Отецюк П.И. Субградиентные методы ralgb5 и ralgb4 для минимизации овражных выпуклых функций // Вычисл. технологии. 2017. Т. 22, № 2. C. 127-149.

Stetsyuk, P.I. Subgradient methods ralgb5 and ralgb4 for minimization of ravine convex functions // Comput. Technol. 2017. Vol. 22. No. 2. P. 127-149. (In Russ.)

[36] Nurminski, E.A. Separating plane algorithms for convex optimization // Math. Programming. 1997. Vol. 76. P. 373-391.

[37] Vorontsova, E. Extended separating plane algorithm and NSO-solutions of PageRank problem // Proc. of 9th Intern. Conf. "Discrete Optimization and Operations Research" DOOR 2016, Vladivostok, Russia, Sept. 19-23, 2016: Lecture Notes in Computer Science, vol. 9869 / Y. Kochetov, M. Khachay, V. Beresnev, E. Nurminski, P. Pardalos (Eds). Cham, Switzerland: Springer Intern., 2016. P. 547-560. DOI:10.1007/978-3-319-44914-2.43.

[38] Воронцова Е.А. Линейная задача о допусках для интервальной модели межотраслевого баланса // Вычисл. технологии. 2017. Т. 22, № 2. С. 67-84.

Vorontsova, E.A. Linear tolerance problem for input-output models with interval data // Comput. Technologies. 2017. 2017. Vol. 22, No. 2. P. 67-84 (In Russ.)

[39] ШШарый С.П. Алгебраический подход к анализу линейных статических систем с интервальной неопределенностью // Изв. РАН. Теория и системы управления. 1997. № 3. С. 51-61.

Shary, S.P. Algebraic approach to analysis of linear static systems under interval uncertainty // Proc. of the Academy of Sciences. Control Systems and Theory. 1997. No. 3. P. 51-61. (In Russ.)

[40] Shary, S.P. A new technique in systems analysis under interval uncertainty and ambiguity // Reliable Computing. 2002. Vol. 8, No. 5. P. 321-418.

[41] Sharaya, I.A., Shary, S.P. Reserve of characteristic inclusion as recognizing functional for interval linear systems // Scientific Computing, Computer Arithmetic, and Validated Numerics: 16th Intern. Symp., SCAN 2014, Wurzburg, Germany, Sept. 21-26, 2014: Revised Selected Papers / M. Nehmeier, J.W. von Gudenberg, W. Tucker (Eds). Heidelberg: Springer, 2016. P. 148-167.

[42] Kreinovich, V., Shary, S.P. Interval methods for data fitting under uncertainty: a probabilistic treatment // Reliable Computing. 2016. Vol. 23. P. 105-140. Available at: http://interval.louisiana.edu/reliable-computing-journal/volume-23/reliable-computing-23-pp-105-140.pdf

Поступила в редакцию 10 марта 2017 г.

Strong compatibility in data fitting problem under interval data uncertainty

Shary, Sergey P.

Institute of Computational Technologies SB RAS, Novosibirsk, 630090, Russia Corresponding author: Shary, Sergey P., e-mail: shary@ict.nsc.ru

The data fitting problem is a popular and practically important problem in which a functional dependency between "input" and "output" variables is to be constructed from empirical data. At the same time, the measurements are almost always subject to uncertainties due to data inadequacy and errors in real-life situations.

Traditionally, when processing the measurement results, models of probability theory are used, which is not always adequate to the problems under study. An alternative way to describe data inaccuracy is to use methods of interval analysis, based on specifying interval bounds of the measurement results. Data fitting problems under interval uncertainty are being solved for about half a century. Most studies in this field rely on the concept of compatibility between parameters and measurement data in which any measurement result is a kind of a large point "inflated" to a box (rectangular parallelepiped with facets parallel to the coordinate axes). The graph of the constructed function passing through such a "point" means a nonempty intersection of the graph with the box. However, in some problems, this natural concept turns out unsatisfactory.

In this work, for the data fitting under interval uncertainty, we introduce the concept of strong compatibility between data and parameters. It is adequate to the situations when measurements of input and output variables are broken in time, and we strive to uniformly take into account the interval results of output measurements. The paper gives a practical interpretation of the new concept. It is shown that the modified formulation of the problem reduces to recognition and further estimation of the so-called tolerable solution set to interval systems of equations constructed from the processed data.

We propose a computational technology for the solution of the data fitting problem under interval uncertainty that satisfies strong compatibility requirement. Finally, we consider generalizations of the concept of strong compatibility.

Key words: data fitting problem, compatibility between data and parameters, strong compatibility, interval system of linear equations, tolerable solution set, recognizing functional, convex nonsmooth optimization.

Received 10 March 2017

© ICT SB RAS, 2017

i Надоели баннеры? Вы всегда можете отключить рекламу.