УДК 519.8
ILM Оскорбин. A.B. Максимов. С.И. Жилин
Построение и анализ эмпирических зависимостей методом центра неопределенности
Рассматривается задача построения и анализа эмпирической зависимости у = /(а, х) скалярной переменой у, (у G Л) и факторами х G Rn, проводимых с использованием данных (yj,Xj), j = 1,... ,N, полученных в N наблюдениях. Наряду с наблюдениями имеется доступная для использования дополнительная (априорная) информация о виде зависимости у = /(а, х) и ее свойствах, условиях наблюдения, характере изменения переменных и др. Задача построения зависимости сводится к выбору на основе всей имеющейся непротиворечивой информации вида функции / и определению оценок вектора параметров а.
Задача анализа зависимости включает в себя выявление и устранение противоречий в исходных данных, проверку гипотез о виде искомой зависимости (линейная, квадратичная и др.), ее свойствах и оценку степени работоспособности найденной функции, т.е. пригодности эмпирической зависимости на практике. Представляют интерес также количественные или качественные суждения о ценности совокупности имеющейся информации и отдельных ее составляющих, о скорости ее старения, способах обновления исходных данных и т.д.
Перечисленные задачи анализа эмпирических зависимостей в настоящее время еще далеки от точных математических постановок. Эти постановки могут быть получены с использованием концепции информационных систем [1-3]. В работе [3] приведены способы выявления противоречий в совокупности информации, что позволяет выделять ситуации при построении эмпирических моделей, в которых форма зависимости или уровни погрешностей измерения переменных выбраны неверно. Очевидно, что прежде чем проводить обработку, необходимо устранить противоречивость наблюдений и исходных предположений. В данной работе рассматривается фрагмент общей задачи построения и анализа зависимостей, который включает определение оценок параметров искомой зависимости в рамках фиксированной ее структуры и интервалов достоверности найденных значений этих параметров.
Традиционно задачи построения и анализа эмпирических зависимостей решаются метода-
ми теории вероятностей и математической статистики, в частности, методами регрессионного анализа. В этом случае предполагается, что вид функции искомой зависимости задан верно, а невязки е = у — /(а, х) имеют нормальное распределение. Эти предположения во многих прикладных задачах не выполняются [1, с. 140]. Кроме того, недостаточно полно используется априорная информация. Устранение противоречий в исходной информации не проводится. Выявлено, что в регрессионном анализе оценки пригодности найденной эмпирической зависимости искажаются условиями проведения эксперимента [1, с. 147]. Эти и другие обстоятельства ограничивают область применимости вероятностных методов в задачах обработки результатов наблюдений.
В данной работе используется нестатистический подход к построению эмпирических зависимостей, который предложен Л.В. Канторовичем [2, с. 701], развит в работах [3-10] и использует возможности линейного программирования для записи условий обработки данных с учетом всех имеющихся информационных соотношений между значениями наблюдаемых переменных. Вся совокупность способов обоснований и приемов построения и анализа эмпирических зависимостей на основе предлагаемого подхода названа методом центра неопределенности (МЦН) [3, с. 64-69].
В этом методе оценки ô,-, (г = 0,1,..., п) вектора неизвестных коэффициентов а = (ао, се\,... , ап) искомой линейной многофакторной зависимости
/(a, х) = ад + се\Х\ + ... + а„шЯ) х G X (1)
отыскиваются по таблице экспериментальных данных, полученных в N наблюдениях
(yiyXij,... , xnj), j = 1,... , N, (2)
в каждом из которых значение искомой функции /(a, Xj) при фиксированных значениях вектора факторов Xj = (x\j,x2j,... , xnj) удовлетворяет неравенству
Vj - ej < Да, Xj) < У1 + s+, j = 1,... , N. (3)
Здесь (yj —ej), (ijj + ef ) — соответственно оценки нижнего и верхнего значений выходной пере-
менной у в точке а е~, е+ — соответственно нижняя и верхняя оценки невязок уравнения (1), найденные по условиям ^'-го наблюдения за входными и выходной переменными.
Далее предполагается, что у — количественный показатель, а факторы Ж | ^ » * . ^ Ж У], В отдельности могут быть количественными и (или) качественными (принимающими значение 1, 2,... , ш, 1 < ш < п). Они могут отражать комплексные, нелинейные и сочетанные эффекты влияния факторов моделируемого процесса. Обозначим через А(Н) множество значений вектора коэффициентов а, удовлетворяющих системе неравенств (3). Основным принципом обработки наблюдений в рассматриваемом методе является равнозначность всех элементов множества А(Н), т.е. разных значений коэффициентов а искомой зависимости (1). Термин для А(Н) — "множество неопределенности значений а" — подчеркивает этот принцип [3]. Отдельные точки множества А(Н), в частности, каким-либо образом задаваемый "центр неопределенности" [3], могут выступать в виде характеристик части или всех точек множества А(Н), удобных для анализа или практического использования искомой зависимости (1). Отметим, что указанный подход лежит в рамках естественнонаучной традиции обработки результатов наблюдений.
Информационная суть VI1111 выясняется в сравнении его с методом наименьших квадратов (МНК) при поиске значений коэффициентов и регрессионным и корреляционным анализами при проверке гипотез (доверительных интервалов оценок коэффициентов а и значений переменной у в заданной точке х, наличии выбросов в исходных данных и др.). В МНК этапы оценки коэффициентов и этап анализа уравнения разделены и проводятся на разных математических моделях, а для проведения анализа эмпирических зависимостей необходимо достаточное число разнообразных наблюдений (Н > п), выполнимость предположений о нормальности, независимости и др. [1, с. 140]. В случае невыполнения этих предположений МНК не содержит способов их контроля. Используемый в этом методе анализ остатков теоретически не обоснован и не гарантирует даже обнаружения выбросов.
В отличие от МНК в МЦН этапы построения модели и ее анализ не разделяются и выполняются с использованием системы неравенств (3) методами линейного программирования. При наличии противоречий в исходных данных решения задач оценки параметров и анализ не проводят, поскольку в этом случае система не-
равенств (3) становится несовместной (A(JV) — пустое множество), и предпринимаются усилия по устранению противоречий либо делаются выводы о несоответствии принятого вида функции информационным взаимосвязям моделируемого объекта. Это обстоятельство используется для проверки и других гипотез. Таким образом, в вероятностном подходе используется информация о согласованности наблюдений (принцип максимального правдоподобия), а в МЦН — информация о их непротиворечивости.
Сформулируем далее две задачи обработки данных МЦН: задачу оценивания значения функции /(а, х) при любом фиксированном х £ X и задачу оценивания значения любого из коэффициентов а,-, i = 0,... , п. Первая задача сводится к нахождению двух функций уп(х) и ув(х) путем решения следующих двух задач линейного программирования:
уп(х) = min (ао + а\Х\ + ... + апхп); aeA(N)
(4)
ув(х) = тах (ао + а\Х\ + ... + апхп). aeA(N)
При решении второй задачи — задачи оценивания параметров зависимости (1) — находим af и af из условий
af = min а,-;
aeA(N)
i = 0,1,... , п. (о)
af = max а,-, aeA(N)
Для искомых величин в сформулированных двух задачах имеем:
ун(х) < /(а, х) < ув(х)./ х 6 X-,
(6)
af < а,- < af, i = 0,1,... , п.
Неравенства (6) являются простым следствием системы неравенств (3). Если при решении задачи (4) (или (о)), выяснится, что система неравенств (3) несовместна (A(iV) — пустое множество), то исходные предпосылки и (или) результаты наблюдений в совокупности противоречивы. Анализ противоречивых данных — особый раздел рассматриваемого метода.
Системе неравенств (3) могут удовлетворять также бесконечно удаленные точки. В этом случае исходной информации для построения искомой зависимости недостаточно и необходимо либо продолжить экспериментальное изучение объекта моделирования, либо привлечь дополнительные сведения априорного характера об объекте моделирования. В частном случае задачи поиска интервальной оценки коэффициента
а в зависимости у(х) = 1 + ах из выражений (о) имеем при > О, ] = 1,N следующие конечные формулы [4, с. 143]:
ан = тах
а = тт
1)/а
(7)
(ад +4 - 1)/^ .
Рассмотрим далее две особенности обработки данных в VI1111. Первая касается способов учета априорных сведений об объекте моделирования. Пусть, например, при построении зависимости (1) известно, что коэффициент а\ <= а^. Тогда указанное ограничение на выбор допустимых значений коэффициентов а непосредственно включается в систему неравенств (3) и множество неопределенности А(Н) может сократиться. Степень такого сокращения при включении любой строки с номером ] связана с уровнем информационной нагрузки, соответствующей 3 -й "порции информации". К априорной информации, кроме вышеприведенных неравенств, могут быть отнесены требования ограниченности информационной нагрузки всех или части наблюдений.
Вторая особенность относится к способу представления множества неопределенности А(Н), точное описание которого является сложной задачей. Предложено использовать [3] простые аппроксимации этого множества, в частности, в виде гиперпрямоугольника
А(Н) = {а | а™ < а,- < а?, г' = 0,1,... ,п}, (8)
где а", а?, г = 0,1,... , п находим решением 2(п+1) задач линейного программирования (о). Существенно отметить, что аппроксимация А(Н) включает исходное множество А(Н), и тем самым, при замене множества А(Н) на множество А(Н) не вносится ложной информации. Наглядной характеристикой множества А(Н) является его представление с использованием 2(п+ 1) чисел а,-, Да,-, г = 0,1,... , гг [3], где
а,-= £(«?+а?);
Да,- = Н
Здесь точку а = (ао, а\,... , а„) можно рассматривать в качестве точечных оценок искомых параметров зависимости (1) при симметричных в (3) невязках, т.е. при = ] = 1,... , N.
Точечную оценку параметра а можно отыскивать также по точечной зависимости /¿(а,ш), если она линейна по параметрам а, используя решение задач (4):
Ма,х) = -(у"(х) + 1Г(х)).
Для несимметричных невязок понятие точечных оценок необходимо специально определить. Рассмотрим систему неравенств
Уз~кез < /(а,^) < У] к > 0, ) = 1,...
(10)
которая при к = 1 совпадает с (3). Пусть ко - минимальное значение параметра к, при котором (10) имеет решение, а А(Ы, ко) — соответствующее множество неопределенности. Если А(Ы, ко) содержит только единственную точку а, то эту точку примем в качестве точечной оценки коэффициентов зависимости (1).
В иных случаях предлагается использовать метод получения точечных оценок при симметричных невязках, используя в задачах (4), (о) множества А(Ы, ко). В заключение отметим, что вопросы использования VI1111 и его исследования рассмотрены в работах [5-11]. Сравнение VI1111 с вероятностными методами проведено в [5,9]. Вопросы теоретического обоснования метода и его связи с интервальной математикой, методами выравнивания данных по П.Л. Чебы-шеву рассматривались в [10], применения для обработки выборок большого объема в [11]. Аспекты практического использования затронуты в работах [4-8, 10, 12].
Рассмотренный метод реализован в пакете программ МС1\Т, который разработан и используется с 1987 г. в Алтайском государственном университете [11].
Литература
Люблинский Р.Н., Оскорбин Н.М. Методы декомпозиции при оптимальном управлении непрерывными производствами. Томск, 1979.
Канторович Л.В. О некоторых новых подходах к вычислительным методам и обработке наблюдений // Сиб. мат. журнал. 1962 Т. 3.
N 5.
3. Оскорбин Н.М. Некоторые задачи обработки информации в управляемых системах // Синтез и проектирование многоуровневых иерархических систем. Барнаул, 1983.
4. Алгазин А.И., Шойхет Я.Н., Киселев В.И.,
Оскорбин Н.М. Оценка риска радиационного заражения населения Алтайского края // Семипалатинский полигон - Алтай. 1997. N 8.
5. Гузеев В.В., Суханов В.А., Белов В.М. Математическое обеспечение кинетического метода в аналитической химии // Математические методы и ЭВМ в аналитической химии: Программа конференции. М.. 1986.
6. Белов В.М., Суханов В.А., Унгер Ф.Г. Метод центра неопределенности при расчете линейных градуировочных графиков и метрологических характеристик результатов химического анализа: Препринт / АН СССР. Сибирское отделение. Институт химии нефти. N 59. Томск,1989.
7. Белов В.М., Суханов В.А., Гузеев В.В., Унгер Ф.Г. Оценивание параметров линейных физико-химических зависимостей прямоугольником метода центра неопределенности // Известия вузов. Физика. 1991. N 8.
8. Вогцинин А.П., Сотиров Г.Р. Оптимизация в
условиях неопределенности. Москва; София, 1989.
9. Вогцинин А.П., Бочков А.Ф., Сотиров Г.Р. Метод анализа данных при интервальной нестатистической ошибке // Заводская лаборатория. Т. 56. 1990. N 7.
10. Белов В.М., Суханов В.А., Унгер Ф.Г. Теоретические и прикладные аспекты метода центра неопределенности. Новосибирск, 1995.
11. Ерохин Г.Н., Камышников А.И., Оскорбин Н.М. Обработка больших баз данных методами линейного программирования // Управление, математическое моделирование и оптимизация на базе ПЭВМ: Межвуз. сб. науч. раб. Барнаул, 1993.
12. Жилин С.И. Решение задачи трансформации векторных и растровых изображений с использованием методов линейного программирования // Проблемы предотвращения деградации земель Западной Сибири и осуществление государственного контроля за их использованием и охраной. М.. 1997.