Научная статья на тему 'Проблемы параметрической идентификации в математическом моделировании процессов'

Проблемы параметрической идентификации в математическом моделировании процессов Текст научной статьи по специальности «Математика»

CC BY
561
65
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ / PARAMETER IDENTIFICATION / МОДЕЛЬНАЯ СТРУКТУРА / MODEL STRUCTURE / ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА / EXPERIMENTAL DESIGN / ЛОКАЛЬНАЯ И ГЛОБАЛЬНАЯ ИДЕНТИФИЦИРУЕМОСТЬ / LOCAL AND GLOBAL IDENTIFIABILITY / ПАРАМЕТРИЧЕСКОЕ ПРОСТРАНСТВО / PARAMETER SPACE

Аннотация научной статьи по математике, автор научной работы — Авдеенко Татьяна Владимировна

Рассматриваются основные этапы построения математических моделей по экспериментальным данным. На каждом этапе выделяются основные проблемы параметрической идентификации, приводящие к недостоверной модели. Особое внимание уделяется свойству идентифицируемости модельной структуры. Неидентифицируемая модельная структуры содержит набор параметров, который нельзя определить однозначно на основе экспериментальных данных, каким бы идеальным не был проводимый эксперимент. В этом случае результаты моделирования становятся сомнительными. Приводятся примеры неидентифицируемой модельной структуры, а также рекомендации по решению данной проблемы

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Авдеенко Татьяна Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Parameter identification problems in Mathematical modelling of processes

The main stages of constructing mathematical models based on experimental data are considered. At each stage the main problems of parametric identification leading to inadequate models are indicated. Special attention is paid to the property of model structure identifiability. Unidentified model structure contains a set of parameters that cannot be uniquely determined from experimental data, even for the ideal experiment. In this case the results of modeling become questionable. Illustrative examples of non-identifiable model structure are given, as well as recommendations for solving this problem

Текст научной работы на тему «Проблемы параметрической идентификации в математическом моделировании процессов»

УДК 681.5.015

ПРОБЛЕМЫ ПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ В МАТЕМАТИЧЕСКОМ МОДЕЛИРОВАНИИ ПРОЦЕССОВ

Татьяна Владимировна Авдеенко,д.т.н., профессор Тел.: + 7 383 3460679, e-mail: tavdeenko@mail.ru Новосибирский государственный технический университет http://ciu.nstu.ru/kaf/persons/818

Рассматриваются основные этапы построения математических моделей по экспериментальным данным. На каждом этапе выделяются основные проблемы параметрической идентификации, приводящие к недостоверной модели. Особое внимание уделяется свойству идентифицируемости модельной структуры. Неидентифицируемая модельная структуры содержит набор параметров, который нельзя определить однозначно на основе экспериментальных данных, каким бы идеальным не был проводимый эксперимент. В этом случае результаты моделирования становятся сомнительными. Приводятся примеры неидентифи-цируемой модельной структуры, а также рекомендации по решению данной проблемы.

Ключевые слова: параметрическая идентификация, модельная структура, планирование эксперимента, локальная и глобальная идентифицируемость, параметрическое пространство

Работа поддержана грантом Минобрнауки РФ по проекту ТП-8.536.2011 «Разработка интеллектуальных технологий, средств компьютерного моделирования и эффективных методов оптимизации, как функционального наполнения информационно-аналитических систем поддержки принятия решений»

Введение

Со второй половины прошлого столетия в самых различных областях человеческой деятельности началось широкое применение математических методов. Возникло

понятие математического моделирования как описания свойств реальных объектов и систем на формальном языке математики. Однако реальные объекты неисчерпаемы по своему богатству и многообразию, поэтому математическая модель может отразить лишь ограниченное количество свойств объекта, которые должны отбираться на основе тщательного системного анализа решаемой задачи и цели, для которой проводится моделирование.

Математические модели различаются по формальному аппарату, который используется для описания. Это могут быть графические или аналитические модели; модели, представляемые одной аналитической формулой или системой уравнений, решение которой описывает траекторию развития реального объекта. Уравнения системы могут быть алгебраическими, дифференциальными или алгебро-дифференциальными. Дифференциальные уравнения могут учитывать сосредоточенный или распределённый аспект в виде использования частных производных по пространственным переменным. Модель может быть чисто детерминированной, или учитывать неопределённость с использованием аппарата теории вероятности.

Сегодня построение математических моделей охватывает обширные области знания и выработало немало принципов и подходов, носящих достаточно общий характер. Одним из таких общих принципов является соотнесение модели реальным процессам, на основе чего мы можем говорить о ее соответствии или, наоборот, несоответствии реальности. Только в случае соответствия модели реальному процессу (адекватности модели) можно говорить о возможности ее последующего использования для объясне-

ния изучаемых процессов, прогнозирования показателей, а также возможного управления данной системой.

В зависимости того, как исследователь относится к реальным данным в процессе построения модели, различают два способа моделирования. Первый способ - это собственно моделирование, предполагающее тщательный системный анализ проблемной области, выделение и формализацию законов развития системы. Данный способ предполагает активное использование априорных знаний об изучаемой системе в виде законов сохранения и их применения в конкретных условиях существования исследуемой системы. Реальные данные о системе в этом случае обычно используются на последнем этапе моделирования для проверки соответствия построенной модели реальной системе, т.е. для проверки адекватности модели.

Второй способ моделирования называетсяидентификацией [1]. Под идентификацией понимается такой способ построения модели, в котором непосредственно участвуют реальные данные, получаемые в результате наблюдения за изучаемой системой. При этом данные не только используются на этапе соотнесения математической модели с реальностью, в результате чего устанавливается соответствия модели реальному процессу, данные могут непосредственно инициировать структуру модели. В качестве характерного примера, когда данные наблюдений могут инициировать структуру модели, можно привести класс моделей АШМА для временных рядов [2]. Для стационарных временных рядов на основе исследования оценок автокорреляционной и частной автокорреляционной функций, полученных по данным наблюдений, можно выбрать либо класс чисто авторегрессионных моделей АВ.(р), если частная автокорреляционная функциястановится незначимой после р-го лага, либо класс моделей скользящего среднего МА(д), если оценки автокорреляционной функции становятся незначимыми после ^-го лага, либо смешанную модель АВМА(р,д), если указанные свойства незначимости автокорреляций после некоторого количества лагов не имеют места. Также на основе оценок автокорреляционной функции, полученных по данным наблюдений, можно обосновать включение в модель АШМАкомпонент, позволяющих учесть нестационарность, сезонность, интервенции и т.д.

Несмотря на широкое распространение методов построения моделей на основе экспериментальных данных, исследователи часто допускают ошибки, связанные с выбором модельной структуры, не соответствующей схеме проведения эксперимента по сбору данных. В результате модельная структура оказывается локально или глобально неидентифицируемой, что ведет к неоднозначности получения оценок неизвестных параметров модели. В работе приводится последовательность этапов при построении математической модели по экспериментальным данным, указываются проблемы, характерные для каждого этапа. Особое внимание уделено свойству идентифицируемости как основополагающему свойству модельной структуры, рассматриваемому при параметрической идентификации. Приводятся конструктивные определения локальной и глобальной структурной идентифицируемости, подходы к исследованию этих свойств, даются иллюстративные примеры их использования.

Параметрическая идентификация как способ построения моделей

Построение математической модели на основе реальных данных предполагает выполнение следующих этапов, представленных на рис. 1:

1. Сбор экспериментальных данных;

2. Формирование множества моделей-кандидатов, на котором ищется модель, наилучшим образом соответствующая данным эксперимента;

3. Выбор критерия оценки степени соответствия испытываемой моделиэкспе-риментальным данным.

4. Решение задачи оптимизации - нахождение модели, соответствующей минимуму рассогласования экспериментальных и расчетных данных.

На этапе сбора экспериментальных данных происходит формирование выборки, включающей достаточное количество наблюдений за входными и выходными переменными рассматриваемой системы. Сбор данных может быть пассивным, когда никаких действий для улучшения свойств выборки не предпринимается, а также активным, когда используются процедуры планирования эксперимента.

На этапе выбора множества моделей-кандидатов исследователь обычно сосредотачивается на определённом классе моделей. Выбранный класс моделей зависит от множества факторов, характеризующих исследуемую систему. Статический или динамический характер имеет решаемая задача? Являются ли зависимости линейными? Возможно ли однократное или повторное воспроизведение моделируемой ситуации, и т.д.? Например, модель ищется в классе линейных регрессионных моделей, если мы ограничиваемся одной эндогенной (зависимой) переменной, или в классе структурных эконометрических моделей, если есть необходимость рассмотрения нескольких эндогенных переменных, взаимодействующих друг с другом. В случае учета динамики системы можно рассматривать класс моделей авторегрессии со скользящим средним, если мы интересуемся пассивным развитием системы без активного воздействия на нее, или класс линейных динамических моделей в пространстве состояний, если необходимо явно ввести переменные управления в модель.

Естественным способом получения множества моделей в выбранном классе - введение параметризации, т.е. зависимости рассматриваемых модельных структур от неизвестных параметров. Таким образом, на этапе выбора множества моделей-кандидатов таким множеством может быть класс моделей, имеющих одинаковую структуру, но отличающихся друг от друга значениями неизвестных параметров-констант.

В качестве констант параметризации удобно выбирать величины, имеющие конкретный физический смысл из рассматриваемой проблемной области. Однако, как будет показано в дальнейшем, часто такой выбор приводит к проблеме неидентифицируемости модельной структуры, особенно, если количество неизвестных констант достаточно велико в сравнении с количеством информации, получаемой из наблюдений за системой.Поэтому часто выбор констант для оценивания регламентируется какой-либо строго заданной формой модели, что не вполне удобно для их дальнейшей интерпретации.

После выбора множества моделей-кандидатов необходимо найти критерий - правило оценки соответствия построенной модели реальной системе. В качестве такого критерия чаще всего принимается некоторый функционал от разностей значений переменных, вычисленных из математической модели, и соответствующих переменных реальной системы. Если модель хорошо согласуется с реальной системой, то различие в значениях наблюдаемых переменныхсистемы и переменных, вычисленных из модели, должно быть минимальным. Функционалом от рассогласований экспериментальных и расчётных данных (функцией потерь, ¡оббАдпсРоп) может служить сумма квадратов или сумма модулей разностей.

Если предыдущих этапах собраны экспериментальные данные, выбрано множество моделей, отличающихся друг от друга значениями вектора параметров, и сформирован вид функции потерь, то на последнем этапе происходит непосредственное решение

Рис. 1. Этапы построения модели с использованием данных наблюдений.

оптимизационной задачи - нахождение оценок параметров, доставляющих минимум критерию оптимальности, т.е. нахождение наилучшей модели.

Реальная система отличается от построенной математической модели, т.е. мир математического описания отделен от реального мира. Мы можем говорить о хорошем соответствии модели реальному объекту, но никогда не можем гарантировать их точного совпадения. В практическом плане говорят о достоверности (адекватности) модели, когда имеют в виду соответствие реальности.

Таким образом, после построения модели необходимо провести исследование её достоверности - степени соответствия построенной модели реальной системе. Если устанавливается недостаточная достоверность модели, то необходимо вернуться на предшествующие этапы для пересмотра полученных результатов. Самый простой случай, если неадекватное решение получено в результате некорректного решения оптимизационной задачи. Здесь возможна ситуация, когда полученное решение не является оптимальным (например, вместо глобального минимума получен локальный минимум) вследствие выбора неподходящего метода оптимизации. В этом случае использование альтернативных методов оптимизации позволяет справиться с этой проблемой.

Если решение оптимизационной задачи корректно, т.е. мы действительно получили глобальный минимум, а модель все ещё недостоверна, то, возможно, причина заключается в неправильном выборе критерия оптимальности, определяющем, в конечном счёте, метод оценивания неизвестных параметров. Например, минимизация суммы квадратов отклонений расчётных и наблюдаемых значений, воплощающая известный метод наименьших квадратов (МНК), даёт оценки параметров, обладающих «хорошими» свойствами несмещённости, состоятельности, эффективности для класса линейных регрессионных моделей, а также для класса моделей авторегрессии ЛВ.(р). Однако для более общего класса моделей временных рядов ЛВМЛ(р,д), д>0, содержащих компоненты скользящего среднего, МНК-оценки неизвестных параметров не являются не только несмещёнными, но и не являются состоятельными оценками, т.е. даже для больших объёмов наблюдений они не сходятся к истинным значениям неизвестных параметров. В этом случае для решения вопроса о неадекватности модели надо пересмотреть используемый метод оценивания. Для моделей ЛВМЛ(р,д), д>0, более успешным методом является метод условного или безусловного максимального правдоподобия, дающий состоятельные оценки неизвестных параметров.

Если критерий оптимальности выбран таким образом, что оценки неизвестных параметров обладают «хорошими» свойствами для данного класса моделей, то при поиске причин недостоверности модели необходимо подняться к ещё более раннему этапу - пересмотру класса моделей, среди которых ищется наилучшая. Может оказаться, что множество моделей оказалось неполноценным в том смысле, что в нем не существует достаточно хорошего описания реальной системы. Например, мы ограничились классом линейных регрессионных моделей, однако исследование выявило существенную нелинейную связь, описываемую логарифмической зависимостью между отдельными регрессорами и выходной переменной. Для получения достоверной модели необходимо расширить класс рассматриваемых моделей, дополнив его необходимыми нелинейными зависимостями.

Наконец, предположим, что класс моделей выбран таким образом, что в нем существует хорошее описание реальной системы. Тогда причину неадекватности следует искать ещё выше - на этапе сбора экспериментальных данных. Данную проблему можно сформулировать в общем виде следующим образом: множество собранных данных оказывается недостаточно информативным, чтобы можно было обеспечить построение по ним хорошей модели.

Сформулированная проблема о недостаточной информативности экспериментальных данных является более глубокой, чем кажется на первый взгляд. Часто оказывается недостаточным просто увеличить объем выборки для того, чтобы добиться

существенного улучшения свойств модели. Мы можем увеличивать объёмы используемых данных до бесконечности, но не получить желаемого результата. Дело здесь может быть не в количестве, а в качестве и структуре используемых данных.

Говоря о качестве данных, имеется в виду их информационное наполнение. Мерой информационной насыщенности данных может выступать функционал от информационной матрицы Фишера, который мы максимизируем при выполнении процедур планирования экспериментов [3]. Чем больше, скажем, определитель информационной матрицы Фишера, тем больше информации об оцениваемых параметрахсодержится в наблюдениях за системой. Не любая система может быть подвергнута активному экспериментированию с использованием методологии планирования эксперимента. Но если это можно сделать, это делать весьма и весьма желательно.

Однако не всегда методы планирования эксперимента могут помочь в ситуации неинформативности данных. Здесь мы имеем случай, когда информационная матрица Фишера является вырожденной, причём варьирование эксперимента в пределах выбранной схемы его проведения не приводит к увеличению определителя информационной матрицы. Речь здесь идёт о структуре данных и её несоответствии структуре модели.

На этапе сбора данных о системе мы, вообще говоря, можем ещё не знать класс моделей, с которым будем работать. Поэтому вполне возможной может оказаться ситуация, когда построенная на втором этапе модельная структура чересчур сложна для той схемы данных, согласно которой формируется выборка для оценивания парамет-ров.Количественно это выражается в том, что число неизвестных параметров модели оказывается больше, чем число уравнений в системе идентифицирующих уравнений, при этом определитель информационной матрицы остаётся равным нулю.

Проблема несоответствия структуры модели и схемы данных приводит к неоднозначности получения оценок неизвестных параметров (неоднозначности решения задачи параметрической идентификации), когда одной и той же выборке экспериментальных данных одинаково хорошо соответствует не одна, а сразу множество моделей с выбранной параметрической структурой. Такая ситуация свидетельствует о неидентифицируемости модельной структуры.

Что такое неидентифицируемость? Какие бывают виды неидентифицируемости? Что делать в ситуации неидентифицируемости модельной структуры? Эти вопросы рассматриваются в следующем разделе.

1. Проверка априорной идентифицируемости модельной структуры

Понятие «идентифицируемость» впервые было сформулировано для систем структурных уравнений, используемых в эконометрике.Одна из первых работ, где речь шла об однозначности определения параметров модели, состоящей из двух экономет-рических уравнений предложения и спроса, была опубликована ещё в 1927 году [4]. Большой успех имела изданная в 1966 году книга Ф.Фишера [5], в значительной мере посвящённая проблеме анализа идентифицируемости моделей эконометрии.

По существу независимо стали развиваться исследования по анализу идентифицируемости моделей динамических систем, сформулированных в пространстве состояний. Принято считать, что исследования по анализу идентифицируемости динамических моделей ведут своё начало с работы Р. Беллмана и К. Острема [6], которую нередко причисляют к классическим работам. Именно в этой статье проблема очерчена наиболее отчётливо и впервые введён термин «структурная идентифицируемость», обозначающая идентифицируемость не отдельно взятой модели, а целого семейства моделей. Данная работа положила начало целому потоку исследований, проводившихся как в России, так и за рубежом. В монографии [7] приводится краткий обзор зарубежных и отечественных исследований в данной области.

Актуальностьисследования свойства идентифицируемости для двух приведённых выше классов моделей можно объяснить следующими соображениями. В системах структурных уравнений, применяющихся в эконометрике, в качестве неизвестных параметров, подлежащих оцениванию, используются коэффициенты, непосредственно фигурирующие в том или ином структурном уравнении. Эти коэффициенты имеют известный экономический смысл(например, эластичность по спросу и предложению), и именно их значения в первую очередь интересуют исследователей. Однако если попытаться оценить все коэффициенты структурного уравнения, то в общем случае этого сделать не удаётся, так как количество коэффициентов превышает число доступных уравнений для их оценивания. Если же оценивать не коэффициенты структурных уравнений, а коэффициенты соответствующих им приведённых форм, то ситуация будет идеальная в смысле идентифицируемости. Однако дать экономическую интерпретацию коэффициентам приведённой формы весьма затруднительно.

Аналогичная ситуация имеет место и с системами динамических уравнений в пространстве состояний. Такие модели часто используются в исследовании кинетики химических реакций, фармакокинетических исследованиях, теории автоматического управления. Коэффициенты матриц состояния таких систем имеют известный смысл -это, например, кинетические константы, определяющие скорости отдельных стадий химической реакции. Если число наблюдений и управлений в системе меньше числа состояний, то определение всех кинетических констант, представляющих интерес для исследователя, в общем виде затруднительно. Если же в этом случае использовать канонические формы - специальный вид уравнений в пространстве состояний - то все параметры таких моделей будут идентифицируемыми. Но опять, как и в предыдущем случае, при оценивании канонических форм мы не получаем всей информации, нужной исследователю для интерпретации получаемых результатов.

Вообще говоря, свойство идентифицируемости может быть сформулировано и рассмотрено и для других классов моделей. Например, пусть мы имеем модель в следующем виде:

где у - вектор наблюдаемых откликов (эндогенных переменных), п - некоторая в общем случае нелинейная вектор-функция, х - вектор незави-у = п(х, 0) + £, симых факторных (экзогенных) переменных, 0е О - вектор (1)

неизвестных параметров, подлежащих оцениванию, £ - вектор некоррелированных случайных ошибок с нулевым математическим ожиданием.

Различают априорную (теоретическую) и апостериорную (практическую) идентифицируемость. В первом случае под идентифицируемостью подразумевается принципиальная возможность однозначного определения параметров модели. Анализ априорной идентифицируемости проводится на основе качественного исследования структуры модели и схемы задуманного или предполагаемого идеального эксперимента. Никаких результатов реального эксперимента не требуется. Когда говорят об идеальном эксперименте, имеется в виду, что все измеряемые величины являются детерминированными и не содержат ошибок. В схеме эксперимента должно быть чётко оговорено, какие факторы предполагается варьировать. Считается, что объем выборки может быть сколь угодно большим.

Анализ апостериорной идентифицируемости, напротив, проводится на основании данных реализованного эксперимента. Эта процедура носит численный характер и сводится к отысканию оценок параметров и их ошибок. В результате устанавливается, какие оценки параметров можно признать статистически значимыми.

Мы рассматриваем априорную идентифицируемость как принципиальное свойство модели допускать однозначное оценивание неизвестных параметров. Применительно к модели (1) при априорном анализе мы не обращаем внимания на случайную ошибку е. Для определения априорной идентифицируемости введем понятие модельной структуры. Под модельной структурой M (•) понимается дифференцируемое ото-

бражение из связного открытого множества О во множество моделей М = {М(9): ВеО}. Таким образом, множеством значений модельной структуры является множество моделей М, отдельный элемент которого однозначно определяется значениями вектора параметров 9 и представляет собой конкретную модель М(9). Процедура параметрической идентификации начинается собственно с построения модельной структуры, для чего используется некоторая априорная информация об исследуемом процессе.

*

Определение 1. Две модели М(9) и М(9 ) с одинаковой модельной структурой

*

М (•) называются неразличимыми по выходу (обозначим это свойство М(9) « М (9 ),

*

9,9 еО), если модели имеют одинаковые выходы (векторы наблюдения):

*

п(х, 9) = п(х, 9 ), для любого допустимого х . В противном случае модели называются различимыми по выходу.

Определение 2. Параметр 9, (одна из компонент вектора 9еО) называется

*

структурно локально идентифицируемым (СЛИ), если почти для любого 9 е О суще*

ствует окрестность у(9 ), такая что

*

9 е у(9 ) сО, *

^ 9,- =9,-.

& 1 1

М(9)« М(9 )

Определение 3. Параметр 9- называется структурно глобально идентифицируе-

*

мым (СГИ), если почти для любого 9 е О (за исключением, возможно, точек, составляющих множество меры ноль)

Г9еО,

* ^ 9,- =9*. |М(9)«М(9 )

Определение 4. Параметр, не являющийся СГИ или СЛИ, является неидентифи-цируемым (СНИ).

Определение 5. Модель называется СЛИ (СГИ), если все её параметры 9, являются СЛИ (СГИ).

Определение 6. Модель называется СНИ, если хотя бы один из параметров модели является СНИ.

В приведённых определениях фигурирует слово «структурно». Это связано с тем, что данное свойство модели справедливо не в какой-то определённой, а в произвольной точке параметрического пространства, то есть данное свойство присуще модельной структуре. Структурности свойства соответствует оговорка «почти для любого», которая означает, что данное свойство должно иметь место во всех точках указанной области за исключением может быть точек множества нулевой меры.

Таким образом, локальная идентифицируемость обеспечивает единственность решения задачи параметрической идентификации в некоторой окрестности точки параметрического пространства, а глобальная идентифицируемость - единственность решения этой задачи во всем параметрическом пространстве. Очевидно, что локальная идентифицируемость является необходимым условием глобальной идентифицируемости. И наоборот, глобальная неидентифицируемость является необходимым условием локальной неидентифицируемости.

Структурная локальная (глобальная) неидентифицируемость обусловлена тем, что отклик не чувствителен (является инвариантом) по отношению к непрерывным (дискретным) вариациям параметров. Можно дать истолкование основных понятий идентифицируемости на языке обратных задач математического моделирования.

Структурная локальная неидентифицируемость модели влечёт за собой существование непрерывного множества точек параметрического пространства (множества неразличимости), в которых достигается одно и то же наименьшее значение меры рассогласования экспериментальных и расчётных значений (например, суммы квадратов отклонений при оценивании по методу наименьших квадратов). В случае если модель является СГНИ, в параметрическом пространстве будет существовать некоторое множество изолированных точек, в которых достигается одинаковое минимальное значение меры рассогласования. Если модель является СГИ, то в параметрическом пространстве будет одна точка минимума меры рассогласования.

Анализ априорной структурной идентифицируемости отличается для различных классов модельных структур. Однако можно сформулировать общие подходы к анализу локальной и глобальной идентифицируемости. Для ответа на вопрос об идентифицируемости достаточно исследовать функцию п(х<0) модели (1) на предмет однозначности обратного отображения вП.

Необходимое и достаточное условие локальной идентифицируемости модели (1) состоит в том, что вектор-столбцы матрицы производных отображения

тг т эп(х,0)

должны быть линейно независимыми. Матрицу|(х, 0) называют матрицей чувствительности. Условие линейной независимости вектор-функций———означает, что не

существует таких коэффициентов ау(0), не равных одновременно нулю, что

2^а,(0) = О. (2)

Для анализа глобальной идентифицируемости недостаточно рассмотреть матрицу чувствительности, здесь надо исследовать систему уравнений неразличимости, записанную на основе неразличимости моделей по выходу. Для модели (1) система уравнений неразличимости выглядит следующим образом:

*

П(х, 9) = п(х, 9 ), для любого допустимого х . (3)

Использование системы уравнений в виде (3) затруднительно в силу зависимости от х. Здесь целесообразно перейти к другой системе, например, представив п(х, 0) в виде разложения по базисным функциям элементов вектора х , а затем записав соответствующие равенства для коэффициентов этого разложения. В результате приходим к системе уравнений, не зависящих от х :

5(0) = 5(0*) . (4)

Для анализа глобальной идентифицируемости надо установить число решений системы (4). Если имеется лишь одно тождественное решение в* = в, это означает, что из условия неразличимости моделей по выходу следует равенство каждого элемента вектора параметров, что соответствует определениям 3,5, свидетельствующим о глобальной идентифицируемости модели. Если имеется конечное или счетное число решений системы (3), и они являются изолированными точками в параметрическом пространстве, то модель является лишь локально идентифицируемой. Если же мы имеем континуальное (непрерывное) множество точек в параметрическом пространстве, неразличимых по выходу, и, соответственно, континуальное число решений системы (3), то налицо ситуация локальной неидентифицируемости (вырожденности) модельной структуры.

Приведем примеры, иллюстрирующие вышеприведенные подходы к анализу модельной структуры.

Пример 1.Предположим, имеется следующая модельная структура

У = (01+02х1)(03 + 04х2)+£.

чувствительности, выражаемая вектором а(б) =

такая что——— = 0.

дВ

Для исследования локальной идентифицируемости вычислим матрицу чувствительности

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Кх,е) = [е3 + е4х2; е3х1 + е4х1х2; е1 + е2х1; е1х2 + е2х1х2].

Легко убедиться, что существует одна линейная связь между столбцами матрицы

ех 1

е2 -е3

-е4]

Таким образом, данная модельная структура не является даже локально идентифицируемой. В пространстве параметров существует непрерывное множество точек, неразличимых с точки зрения данных, получаемых в результате наблюдения за системой. Информационная матрица Фишера в этом случае получается вырожденной, и никакой план эксперимента не позволит улучшить ситуацию без привнесения дополнительной информации о неизвестных параметрах в модельную структуру. Данная информация может быть представлена в виде ограничений типа равенств на неизвестные параметры. В данном случае достаточно добавить одно ограничение.

Пример 2. Предположим, имеется следующая модельная структура

у = (1 + е!х)(1 + е2х) + 8

Легко убедиться, что данная модель локально идентифицируема. Рассмотрим систему идентифицирующих уравнений для решения вопроса о глобальной идентифицируемости

(1 + е;х)(1 + е2х) = (1 + ехх)(1 + е2х) для всех х, или 1+(е; + е2)х+е:[е|х2 = 1 + (ех + е2)х + ехе2х2.

Приравнивая коэффициенты при линейно независимых функциях(1, х, х2), получаем систему уравнений

ге; + е2 = е^ + е2

) о* о* _о о ,

I ехе^ — ехе2

решая которую, получаем две изолированные точки в параметрическом пространстве

0* _ о /-с\* _ о

1 — о 1 (е^ — о2

0* _ о и I О* _ О .

2 — е2 1е2 — е1

Для решения проблемы неидентифицируемости в данном случае можно обойтись добавлением к системе более мягкого ограничения в виде неравенства е! > е2 или е! < е2, ограничиваясь лишь одним решением системы идентифицирующих уравнений. Заметим, что в случае глобальной неидентифицируемости общий подход к решению проблемы заключается в нахождении сепараторов параметрического пространства - гиперповерхностей, разделяющих параметрическое пространство на отдельные связные области, каждая из которых содержит в точности одно решение задачи параметрической идентификации [8]. В данном случае уравнением сепаратора, очевидно, является е! = е2.

Таким образом, мы рассмотрели основные этапы параметрической идентификации, проблемы, характерные для каждого этапа. Особое внимание мы уделили построению идентифицируемой модельной структуры, так как нарушение этого свойства приводит к несоответствию модельной структуры экспериментальным данным. В результате для одного и того же набора данных мы имеем целое семейство эквивалентных моделей, что свидетельствует о сомнительности процедуры оценивания неизвестных параметров.

Литература

1. Льюнг Л. Идентификация систем. Теория для пользователя / под ред. Я.З. Цыпкина. -М.: Наука. 1991. - 432 с.

2. Авдеенко Т.В. Компьютерные методы анализа временных рядов и прогнозирования: учеб.пособие. -Новосибирск: изд-во НГТУ, 2008. - 272 с.

3. Федоров В. В. Теория оптимального эксперимента (планирование регрессионных экспериментов). - М.: Наука. 1971.

4. Working E.J. // Quart. Journal of Economics. 1927. V.41. № 1.

5. Фишер Ф. Проблема идентификации в эконометрии. - М.: Статистика, 1978. - 224 с.

6. BellmanR., AstromKJ.OnStructuralldentifiability // Math. Biosci. 1970. V. 7. № 3/4.P. 329339.

7. Авдеенко Т.В., Горский В.Г. Построение динамических моделей в пространстве состояний. Анализ структурной идентифицируемости: монография. -Новосибирск: изд-во НГТУ, 2007.-292 с.

8. Авдеенко Т.В., Каргин С.А. Анализ глобальной идентифицируемости линейных динамических моделей с использованием сепараторов параметрического пространства // Сибирский журнал индустриальной математики. 2006. Т. 9. № 3(27). С. 3-16.

Parameter identification problems in Mathematical modelling of processes

Tat'ana Vladimirovna Avdeenko,Doct. of Sci., Professor Novosibirsk State Technical University

The main stages of constructing mathematical models based on experimental data are considered. At each stage the main problems of parametric identification leading to inadequate models are indicated. Special attention is paid to the property of model structure identifiability. Unidentified model structure contains a set of parameters that cannot be uniquely determined from experimental data, even for the ideal experiment. In this case the results of modeling become questionable. Illustrative examples of non-identifiable model structure are given, as well as recommendations for solving this problem.

Key words: parameter identification, model structure, experimental design, local and global identifia-bility, parameter space

УДК 51-72

МОДЕЛЬ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ НАНОМАТЕРИАЛЫ

Ирина Леонидовна Артемьева, д.т.н., проф., зав. кафедрой прикладной математики, механики, управления и программного обеспечения Тел.: 8 423 2681526, e-mail:iartemeva@mail.ru Наталья Валентиновна Рябченко, к.т.н., доцент кафедры прикладной математики, механики, управления и программного обеспечения

Тел.: 8 914 6522293, e-mail:barison@mail.ru Дальневосточный федеральный университет http://www.dvfu.ru

Использование интеллектуальных систем моделирования, позволяющих объяснять результаты полученных вычислений в терминах предметной области, дает дополнительные возможности специалистам этой области по сравнению с программными системами других классов. Наличие формально описанной онтологии области, определяющей однозначную интерпретацию используемой терминологии, позволяет создавать интеллектуальные системы моделирования, интегрирующие знания и данные разных разделов этой области, а также программные системы для решения прикладных задач. Нанонаука носит междисциплинарный характер, что предполагает необходимость вовлечения знаний из различных дисциплин, т.е. в состав ее онтологии входят онтологии других предметных областей. Целью данной работы является определение математической модели онтологии сложноструктурированной предметной области «Наноматериалы», использующей терминологию из онтологий органической и физической химии.

i Надоели баннеры? Вы всегда можете отключить рекламу.