Научная статья на тему 'Построение и анализ эмпирических зависимостей методом центра неопределённости'

Построение и анализ эмпирических зависимостей методом центра неопределённости Текст научной статьи по специальности «Математика»

CC BY
840
82
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Оскорбин Николай Михайлович, Максимов Александр Васильевич, Жилин Сергей Иванович

В статье дается теоретическое обоснование метода построения и анализа зависимостей, использующего оценки интервалов ошибок наблюдений за входными и выходными переменными. Дается модельное представление, описывается программное обеспечение и опыт применения рассматриваемого подхода в зада¬чах эмпирического моделирования

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Construction and analysis of empirical dependencies using indeterminancy center method

The article presents theoretical foundation of dependencies construction and analysis method based upon interval estimations of errors of input and output variables. The model, the software and the developed approach application techniques in the empirical modeling are described.

Текст научной работы на тему «Построение и анализ эмпирических зависимостей методом центра неопределённости»

УДК 519.8

ILM Оскорбин. A.B. Максимов. С.И. Жилин

Построение и анализ эмпирических зависимостей методом центра неопределенности

Рассматривается задача построения и анализа эмпирической зависимости у = /(а, х) скалярной переменой у, (у G Л) и факторами х G Rn, проводимых с использованием данных (yj,Xj), j = 1,... ,N, полученных в N наблюдениях. Наряду с наблюдениями имеется доступная для использования дополнительная (априорная) информация о виде зависимости у = /(а, х) и ее свойствах, условиях наблюдения, характере изменения переменных и др. Задача построения зависимости сводится к выбору на основе всей имеющейся непротиворечивой информации вида функции / и определению оценок вектора параметров а.

Задача анализа зависимости включает в себя выявление и устранение противоречий в исходных данных, проверку гипотез о виде искомой зависимости (линейная, квадратичная и др.), ее свойствах и оценку степени работоспособности найденной функции, т.е. пригодности эмпирической зависимости на практике. Представляют интерес также количественные или качественные суждения о ценности совокупности имеющейся информации и отдельных ее составляющих, о скорости ее старения, способах обновления исходных данных и т.д.

Перечисленные задачи анализа эмпирических зависимостей в настоящее время еще далеки от точных математических постановок. Эти постановки могут быть получены с использованием концепции информационных систем [1-3]. В работе [3] приведены способы выявления противоречий в совокупности информации, что позволяет выделять ситуации при построении эмпирических моделей, в которых форма зависимости или уровни погрешностей измерения переменных выбраны неверно. Очевидно, что прежде чем проводить обработку, необходимо устранить противоречивость наблюдений и исходных предположений. В данной работе рассматривается фрагмент общей задачи построения и анализа зависимостей, который включает определение оценок параметров искомой зависимости в рамках фиксированной ее структуры и интервалов достоверности найденных значений этих параметров.

Традиционно задачи построения и анализа эмпирических зависимостей решаются метода-

ми теории вероятностей и математической статистики, в частности, методами регрессионного анализа. В этом случае предполагается, что вид функции искомой зависимости задан верно, а невязки е = у — /(а, х) имеют нормальное распределение. Эти предположения во многих прикладных задачах не выполняются [1, с. 140]. Кроме того, недостаточно полно используется априорная информация. Устранение противоречий в исходной информации не проводится. Выявлено, что в регрессионном анализе оценки пригодности найденной эмпирической зависимости искажаются условиями проведения эксперимента [1, с. 147]. Эти и другие обстоятельства ограничивают область применимости вероятностных методов в задачах обработки результатов наблюдений.

В данной работе используется нестатистический подход к построению эмпирических зависимостей, который предложен Л.В. Канторовичем [2, с. 701], развит в работах [3-10] и использует возможности линейного программирования для записи условий обработки данных с учетом всех имеющихся информационных соотношений между значениями наблюдаемых переменных. Вся совокупность способов обоснований и приемов построения и анализа эмпирических зависимостей на основе предлагаемого подхода названа методом центра неопределенности (МЦН) [3, с. 64-69].

В этом методе оценки ô,-, (г = 0,1,..., п) вектора неизвестных коэффициентов а = (ао, се\,... , ап) искомой линейной многофакторной зависимости

/(a, х) = ад + се\Х\ + ... + а„шЯ) х G X (1)

отыскиваются по таблице экспериментальных данных, полученных в N наблюдениях

(yiyXij,... , xnj), j = 1,... , N, (2)

в каждом из которых значение искомой функции /(a, Xj) при фиксированных значениях вектора факторов Xj = (x\j,x2j,... , xnj) удовлетворяет неравенству

Vj - ej < Да, Xj) < У1 + s+, j = 1,... , N. (3)

Здесь (yj —ej), (ijj + ef ) — соответственно оценки нижнего и верхнего значений выходной пере-

менной у в точке а е~, е+ — соответственно нижняя и верхняя оценки невязок уравнения (1), найденные по условиям ^'-го наблюдения за входными и выходной переменными.

Далее предполагается, что у — количественный показатель, а факторы Ж | ^ » * . ^ Ж У], В отдельности могут быть количественными и (или) качественными (принимающими значение 1, 2,... , ш, 1 < ш < п). Они могут отражать комплексные, нелинейные и сочетанные эффекты влияния факторов моделируемого процесса. Обозначим через А(Н) множество значений вектора коэффициентов а, удовлетворяющих системе неравенств (3). Основным принципом обработки наблюдений в рассматриваемом методе является равнозначность всех элементов множества А(Н), т.е. разных значений коэффициентов а искомой зависимости (1). Термин для А(Н) — "множество неопределенности значений а" — подчеркивает этот принцип [3]. Отдельные точки множества А(Н), в частности, каким-либо образом задаваемый "центр неопределенности" [3], могут выступать в виде характеристик части или всех точек множества А(Н), удобных для анализа или практического использования искомой зависимости (1). Отметим, что указанный подход лежит в рамках естественнонаучной традиции обработки результатов наблюдений.

Информационная суть VI1111 выясняется в сравнении его с методом наименьших квадратов (МНК) при поиске значений коэффициентов и регрессионным и корреляционным анализами при проверке гипотез (доверительных интервалов оценок коэффициентов а и значений переменной у в заданной точке х, наличии выбросов в исходных данных и др.). В МНК этапы оценки коэффициентов и этап анализа уравнения разделены и проводятся на разных математических моделях, а для проведения анализа эмпирических зависимостей необходимо достаточное число разнообразных наблюдений (Н > п), выполнимость предположений о нормальности, независимости и др. [1, с. 140]. В случае невыполнения этих предположений МНК не содержит способов их контроля. Используемый в этом методе анализ остатков теоретически не обоснован и не гарантирует даже обнаружения выбросов.

В отличие от МНК в МЦН этапы построения модели и ее анализ не разделяются и выполняются с использованием системы неравенств (3) методами линейного программирования. При наличии противоречий в исходных данных решения задач оценки параметров и анализ не проводят, поскольку в этом случае система не-

равенств (3) становится несовместной (A(JV) — пустое множество), и предпринимаются усилия по устранению противоречий либо делаются выводы о несоответствии принятого вида функции информационным взаимосвязям моделируемого объекта. Это обстоятельство используется для проверки и других гипотез. Таким образом, в вероятностном подходе используется информация о согласованности наблюдений (принцип максимального правдоподобия), а в МЦН — информация о их непротиворечивости.

Сформулируем далее две задачи обработки данных МЦН: задачу оценивания значения функции /(а, х) при любом фиксированном х £ X и задачу оценивания значения любого из коэффициентов а,-, i = 0,... , п. Первая задача сводится к нахождению двух функций уп(х) и ув(х) путем решения следующих двух задач линейного программирования:

уп(х) = min (ао + а\Х\ + ... + апхп); aeA(N)

(4)

ув(х) = тах (ао + а\Х\ + ... + апхп). aeA(N)

При решении второй задачи — задачи оценивания параметров зависимости (1) — находим af и af из условий

af = min а,-;

aeA(N)

i = 0,1,... , п. (о)

af = max а,-, aeA(N)

Для искомых величин в сформулированных двух задачах имеем:

ун(х) < /(а, х) < ув(х)./ х 6 X-,

(6)

af < а,- < af, i = 0,1,... , п.

Неравенства (6) являются простым следствием системы неравенств (3). Если при решении задачи (4) (или (о)), выяснится, что система неравенств (3) несовместна (A(iV) — пустое множество), то исходные предпосылки и (или) результаты наблюдений в совокупности противоречивы. Анализ противоречивых данных — особый раздел рассматриваемого метода.

Системе неравенств (3) могут удовлетворять также бесконечно удаленные точки. В этом случае исходной информации для построения искомой зависимости недостаточно и необходимо либо продолжить экспериментальное изучение объекта моделирования, либо привлечь дополнительные сведения априорного характера об объекте моделирования. В частном случае задачи поиска интервальной оценки коэффициента

а в зависимости у(х) = 1 + ах из выражений (о) имеем при > О, ] = 1,N следующие конечные формулы [4, с. 143]:

ан = тах

а = тт

1)/а

(7)

(ад +4 - 1)/^ .

Рассмотрим далее две особенности обработки данных в VI1111. Первая касается способов учета априорных сведений об объекте моделирования. Пусть, например, при построении зависимости (1) известно, что коэффициент а\ <= а^. Тогда указанное ограничение на выбор допустимых значений коэффициентов а непосредственно включается в систему неравенств (3) и множество неопределенности А(Н) может сократиться. Степень такого сокращения при включении любой строки с номером ] связана с уровнем информационной нагрузки, соответствующей 3 -й "порции информации". К априорной информации, кроме вышеприведенных неравенств, могут быть отнесены требования ограниченности информационной нагрузки всех или части наблюдений.

Вторая особенность относится к способу представления множества неопределенности А(Н), точное описание которого является сложной задачей. Предложено использовать [3] простые аппроксимации этого множества, в частности, в виде гиперпрямоугольника

А(Н) = {а | а™ < а,- < а?, г' = 0,1,... ,п}, (8)

где а", а?, г = 0,1,... , п находим решением 2(п+1) задач линейного программирования (о). Существенно отметить, что аппроксимация А(Н) включает исходное множество А(Н), и тем самым, при замене множества А(Н) на множество А(Н) не вносится ложной информации. Наглядной характеристикой множества А(Н) является его представление с использованием 2(п+ 1) чисел а,-, Да,-, г = 0,1,... , гг [3], где

а,-= £(«?+а?);

Да,- = Н

Здесь точку а = (ао, а\,... , а„) можно рассматривать в качестве точечных оценок искомых параметров зависимости (1) при симметричных в (3) невязках, т.е. при = ] = 1,... , N.

Точечную оценку параметра а можно отыскивать также по точечной зависимости /¿(а,ш), если она линейна по параметрам а, используя решение задач (4):

Ма,х) = -(у"(х) + 1Г(х)).

Для несимметричных невязок понятие точечных оценок необходимо специально определить. Рассмотрим систему неравенств

Уз~кез < /(а,^) < У] к > 0, ) = 1,...

(10)

которая при к = 1 совпадает с (3). Пусть ко - минимальное значение параметра к, при котором (10) имеет решение, а А(Ы, ко) — соответствующее множество неопределенности. Если А(Ы, ко) содержит только единственную точку а, то эту точку примем в качестве точечной оценки коэффициентов зависимости (1).

В иных случаях предлагается использовать метод получения точечных оценок при симметричных невязках, используя в задачах (4), (о) множества А(Ы, ко). В заключение отметим, что вопросы использования VI1111 и его исследования рассмотрены в работах [5-11]. Сравнение VI1111 с вероятностными методами проведено в [5,9]. Вопросы теоретического обоснования метода и его связи с интервальной математикой, методами выравнивания данных по П.Л. Чебы-шеву рассматривались в [10], применения для обработки выборок большого объема в [11]. Аспекты практического использования затронуты в работах [4-8, 10, 12].

Рассмотренный метод реализован в пакете программ МС1\Т, который разработан и используется с 1987 г. в Алтайском государственном университете [11].

Литература

Люблинский Р.Н., Оскорбин Н.М. Методы декомпозиции при оптимальном управлении непрерывными производствами. Томск, 1979.

Канторович Л.В. О некоторых новых подходах к вычислительным методам и обработке наблюдений // Сиб. мат. журнал. 1962 Т. 3.

N 5.

3. Оскорбин Н.М. Некоторые задачи обработки информации в управляемых системах // Синтез и проектирование многоуровневых иерархических систем. Барнаул, 1983.

4. Алгазин А.И., Шойхет Я.Н., Киселев В.И.,

Оскорбин Н.М. Оценка риска радиационного заражения населения Алтайского края // Семипалатинский полигон - Алтай. 1997. N 8.

5. Гузеев В.В., Суханов В.А., Белов В.М. Математическое обеспечение кинетического метода в аналитической химии // Математические методы и ЭВМ в аналитической химии: Программа конференции. М.. 1986.

6. Белов В.М., Суханов В.А., Унгер Ф.Г. Метод центра неопределенности при расчете линейных градуировочных графиков и метрологических характеристик результатов химического анализа: Препринт / АН СССР. Сибирское отделение. Институт химии нефти. N 59. Томск,1989.

7. Белов В.М., Суханов В.А., Гузеев В.В., Унгер Ф.Г. Оценивание параметров линейных физико-химических зависимостей прямоугольником метода центра неопределенности // Известия вузов. Физика. 1991. N 8.

8. Вогцинин А.П., Сотиров Г.Р. Оптимизация в

условиях неопределенности. Москва; София, 1989.

9. Вогцинин А.П., Бочков А.Ф., Сотиров Г.Р. Метод анализа данных при интервальной нестатистической ошибке // Заводская лаборатория. Т. 56. 1990. N 7.

10. Белов В.М., Суханов В.А., Унгер Ф.Г. Теоретические и прикладные аспекты метода центра неопределенности. Новосибирск, 1995.

11. Ерохин Г.Н., Камышников А.И., Оскорбин Н.М. Обработка больших баз данных методами линейного программирования // Управление, математическое моделирование и оптимизация на базе ПЭВМ: Межвуз. сб. науч. раб. Барнаул, 1993.

12. Жилин С.И. Решение задачи трансформации векторных и растровых изображений с использованием методов линейного программирования // Проблемы предотвращения деградации земель Западной Сибири и осуществление государственного контроля за их использованием и охраной. М.. 1997.

i Надоели баннеры? Вы всегда можете отключить рекламу.