Научная статья на тему 'МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОЦЕНКИ ОТЧЕТНЫХ ДАННЫХ ПРОМЫСЛА НА РЫБОЛОВНЫХ УЧАСТКАХ'

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОЦЕНКИ ОТЧЕТНЫХ ДАННЫХ ПРОМЫСЛА НА РЫБОЛОВНЫХ УЧАСТКАХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
6
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
рыболовные участки / промысловая отчетность / авторегрессионная модель / алгоритм фильтрации Калма-на / вычислительные процедуры / fishing areas / fishing report / autoregressive model / Kalman filtering algorithm / computational procedures

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — И Г. Проценко, И А. Кобзарь

В статье предлагается алгоритм фильтрации ошибок отчетных данных о вылове на рыболовных участках. Оценка качества отчета основана на сравнении прогностического значения величины улова, полученного на основе математической модели и фактического значения, представленного в промысло-вом отчете. Алгоритм относится к классу алгоритмов фильтрации Калмана и применяется для оптимизации и ускорения вычислительных процедур.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MATHEMATICAL MODEL FOR ASSESSING CATCH REPORTING DATA IN FISHING AREAS

The algorithm for filtering errors of catch reporting data in fishing areas is suggested in the article. The assessment of the report quality is based on a comparison of the predictive value of the catch value obtained on the basis of a mathematical model and the actual value presented in the fishing report. The algorithm belongs to the class of Kalman filtering algorithms and is used to optimize and accelerate computational procedures.

Текст научной работы на тему «МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОЦЕНКИ ОТЧЕТНЫХ ДАННЫХ ПРОМЫСЛА НА РЫБОЛОВНЫХ УЧАСТКАХ»

УДК 004.91:639.2

И.Г. Проценко, И.А. Кобзарь

Камчатский государственный технический университет, Петропавловск-Камчатский, 683003 e-mail: ip1954@list.ru

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОЦЕНКИ ОТЧЕТНЫХ ДАННЫХ ПРОМЫСЛА

НА РЫБОЛОВНЫХ УЧАСТКАХ

В статье предлагается алгоритм фильтрации ошибок отчетных данных о вылове на рыболовных участках. Оценка качества отчета основана на сравнении прогностического значения величины улова, полученного на основе математической модели и фактического значения, представленного в промысловом отчете. Алгоритм относится к классу алгоритмов фильтрации Калмана и применяется для оптимизации и ускорения вычислительных процедур.

Ключевые слова: рыболовные участки, промысловая отчетность, авторегрессионная модель, алгоритм фильтрации Калмана, вычислительные процедуры.

I.G. Protsenko, I.A. Kobzar

Kamchatka State Technical University, Petropavlovsk-Kamchatsky, 683003 e-mail: ip1954@list.ru

MATHEMATICAL MODEL FOR ASSESSING CATCH REPORTING DATA

IN FISHING AREAS

The algorithm for filtering errors of catch reporting data in fishing areas is suggested in the article. The assessment of the report quality is based on a comparison of the predictive value of the catch value obtained on the basis of a mathematical model and the actual value presented in the fishing report. The algorithm belongs to the class of Kalman filtering algorithms and is used to optimize and accelerate computational procedures.

Key words: fishing areas, fishing report, autoregressive model, Kalman filtering algorithm, computational procedures.

Мониторинг водных биоресурсов основан на постоянном наблюдении и проведении контрольных мероприятий за деятельностью рыбодобывающих компаний и физических лиц на рыболовных судах и участках. Этот процесс в своей основе базируется на отраслевой системе мониторинга (ОСМ) [1]. ОСМ - это система, которая создана специально для решения задачи реализации наблюдения за местоположением и промысловой деятельностью судов и за добычей рыбы на рыбопромысловых (рыболовных) участках (сокращенно РПУ). Как результат, в системе формируются показатели состояния водных биоресурсов: вылов на усилие и площади промысловых скоплений. Эти данные позволяют оперативно отслеживать реализацию выделенных квот вылова, интенсивность промысла и его влияние на состояние рыбных запасов.

Конечной целью проведения мониторинга является поддержание уровня численности биоресурсов в размерах, необходимых для их воспроизводства и последующего использования. Сведения ОСМ являются источником актуальной информации для органов рыбоохраны. Они осуществляют проверку правильности ведения отчетности, контролируют соответствие результатов промысла выделенным квотам.

Результаты промысловых операций - это основа для формирования информационной базы ОСМ. Выражаться они могут в нескольких основных показателях, но главным тут следует отметить объемы выловленной рыбы. Именно эти сведения, ежесуточно передающиеся промысловыми судами и РПУ, служат для подробнейшего анализа. Сам процесс изучения и анализа вклю-

чает в себя первичную обработку, служащую для преобразования формата входящих данных во внутренний формат ИС, их последующий синтаксический и семантический разбор, сохранение проверенных показателей промысла в базу данных, дальнейшая подготовка и рассылка аналитического материала пользователям ОСМ [2].

Логично, что арендующее РПУ лицо имеет право осуществлять промысел только на своем участке. При этом в разрешении на вылов всегда четко указаны орудия лова (ставные или закидные невода, реже ставные сети), которые можно применять, а также график определенных дней для промысла, согласно которому возможно осуществлять добычу. Также вероятны ситуации, при которых в разрешениях на добычу для выбранного РПУ заранее устанавливается максимальный объем вылова.

Предоставляя отчет о вылове, пользователь РПУ обязан обеспечить требуемое качество данных по параметрам полноты, достоверности и точности. Но эти требования не всегда удается выполнить в полном объеме: отчеты, формируемые на участках, могут быть так или иначе искажены во время подготовки или передачи. Также не стоит исключать случаев, при которых искажение отчета носит злонамеренный характер. Этот фактор значительно понижает качество информационного ресурса ОСМ, что, в свою очередь, создает затруднения при его использовании в процессе управления промыслом. Следовательно, первоочередной задачей, которую стоит рассматривать для эффективного использования ОСМ, нужно обозначить разработку и использование надежного инструмента для обнаружения, классификации и устранения этих ошибок до того, как аналитические материалы будут использованы.

Для предварительной оценки качества данных предлагается использование широкого класса математических, в частном случае авторегрессионных, моделей.

Если считать, что в наличии уже есть отчетные данные предыдущих отчетов по конкретному РПУ, имеет смысл построение прогностической модели, таким образом, получится достоверно провести расчеты согласно имеющимся данным по критерию минимума дисперсии ошибки на один шаг вперед по времени (1 сутки).

Вылов учитываемых водных биоресурсов на РПУ за отчетные сутки £ можно обозначить как хг. Тогда будем рассматривать его как сумму пары элементов: первой части, являющейся функцией всех значений до выбранных суток г - 1, и второй, которая будет обозначать случайную составляющую wt:

*,=/(*,-!>«>«,) + *',• (!)

В данном случае х1_1 — это совокупность данных вектора л",, которые были получены ранее

настоящего момента времени, а именно: = (дс/_1,дс/_2,...); а - вектор неизвестных коэффициентов модели; и - некоторый показатель улова, который рассчитывается согласно сведениям, поступающим от находящихся в этом регионе участков; wt - шум, погрешность, которая должна отразить совокупность неучитываемых факторов и ошибок, возникающих при случайном или умышленном искажении размеров объема улова, а также погрешности при выборе неизвестного пока вида детерминированной функции /.

В векторно-матричном представлении уравнение (1) для га-мерного векторного процесса X = [х1 хт 1]Т можно записать в следующей форме:

М : х = г?, а + = 1,...,т, (2)

г, , г, , — 1 г г, , ' ' ' V ^

где аг - «¿-мерный вектор;

т

а = [аТ ,■■■,аТт] - «0-мерный вектор п0 = ^п ;

1=1

= , = К,—]Т - бельш шум;

г? 1 - имеет размерность п и составляется в виде функции из компонент векторов х, х-т\, и(, ..., и -т2';

иг = иг, í [М1, ..., и„, - данные уловов с других участков.

Методом подбора вида функции / и вектора коэффициентов модели а осуществляется процесс минимизации влияния шума:

г Е г Е

<г = ЕЪ = Е(хи - )2 ^ т1П. (3)

]=1 ]=1

Что дает выражение в виде [2]:

а,(0 = ^ПЕ^-,хи]. (4)

¡=1 ¡=1

В ряде случаев, когда Wi, г и и;, г статистически независимы, оценка квазимаксимального правдоподобия совпадает с оценкой условного максимального правдоподобия, а значит, является состоятельной и асимптотически несмещенной. Оценка а на основе ограниченной информации является состоятельной, но не всегда эффективной.

Важное преимущество метода оценивания на основе ограниченной информации состоит в том, что он позволяет находить состоятельную оценку а даже в условиях отсутствия знания а21. Данный метод позволяет осуществлять декомпозицию задачи оценивания на ряд автономных задач оценивания для отдельных уравнений системы, что существенно упрощает задачу в вычислительном аспекте.

При расчете согласно формуле (4) необходима вся совокупность наблюдений [х, у у = 1, ..., г] до момента времени г. Важно отметить, что если поступают данные за новые сутки, формулу (4), содержащую в т. ч. обращение матриц, нужно всегда пересчитывать и с растущим с числом г. Это, в свою очередь, приведет к росту затрат на поиск и отбор записей наблюдений [хг; у; у = = 1, 2, ..., г] при машинной реализации.

Для того чтобы минимизировать ресурсы, необходимые для расчета, следует воспользоваться алгоритмом семейства алгоритмов фильтрации Калмана [3]. Таким образом, сама процедура по расчету оценки коэффициентов модели будет реализована в реальном масштабе времени.

Рассмотрим матрицу Х {■

г

Si,, = [Еги-1 ги-1]-1. (5)

¡=1

В таком случае для вектора коэффициентов модели выражение будет иметь вид:

г

«м = в,, [Е*и-1 хи ]. (6)

¡=1

Алгоритм вычисления а г представим в следующем виде:

г г-1

&1■, = Уг. , = г. , , + Е г. . ,2Т. , = г. , , + в,. (7)

г,г / , ,,¡-1 г,,-1 г, г-1 г,г-1 / , ,,¡-1 г,¡-1 г, г-1 г,г-1 г,г-1 V /

¡ = 1 ¡ = 1

Откуда:

г-1

1 = Хи ]. (8)

¡=1

Таким образом, выражение аг-, г будет принимать следующий вид:

а, = в ,7 ,х + в Л-, а, ,. (9)

г,г г, г г, г-1 г, г г, г г, г-1 г, г-1 4 '

Если заменить Х г, то выражение (9) преобразуется следующим образом:

а = 8. ,ъ. , ,х. , + а , , -8 , ,ъ. , ,хт, ,а , , /(1 + 7, а-, .7 ,). (10)

г, г г, г г, г-1 г, г г, г-1 г, г-1 г, г-1 г, г-1 г, г-1 V г, г-1 г, г-1 г, г-1^ V /

В реальном масштабе времени оценка дисперсии шума а2 (:

= О2 г-! + (х,( - ^-1Л<, г-1)". (11)

аг, г

Прогноз на один шаг вперед по времени можно производить по формуле:

х. , = z , ,а., (12)

г, t|t-1 г, t-1 г, t-1 ^ '

Если использовать данные измерений, имеющиеся на момент времени t - 1, то это уравнение может быть использовано для получения линейной оценки x процесса Xi, t. Оптимальным

оценивание состояния x t\t с учетом полученных на момент времени t измерений Xi, t будет линейная оценка, которая принимает вид:

e

xi, t|t = xi, t|t - 1 + YjG k (xk, t - xk, t|t - 1 ). (13)

k = \

Минимизация данного выражения, в свою очередь, приводит к матричному уравнению Винера - Хопфа относительно (m х /)-мерной матрицы Gi, k. Решение этого уравнения будет иметь следующий вид:

k = Pi,j, t|t - 1P k, k, t|t -1 , (14)

где P J (|(_j = E{(x t -x At_j)(x t -Xj t\t_ J} - ковариационная матрица ошибки оценки x At_x.

Ковариационная матрица p ^ ошибки оптимальной оценки x ^ с учетом предыдущих соотношений равна:

t

j = Pi,j,t,t-1 - ^pi, k, tlt-1Pk, i, t|t-1 Pk, k, t-1. (15) k = 1

Для численной реализации на каждом временном шаге процедуры оптимальной оценки производится изменение этого алгоритма, которое предполагает последовательное усвоение каждой компоненты вектора состояния по рекуррентным формулам:

h=PCI; (16)

x<r) = xf-1) + h[xk -xf-1)]; (17)

pi^) = pi^-1) - pr-цh. (18)

Индекс / пробегает на одном шаге по времени значения от 1 до т. Начальные условия:

х(0) = х р(о) = р

х хг\г -1,р рг\1-\-

Для контроля входных данных отчет проверяется на соответствие прогнозируемому значению. На основе поступающих сведений для каждого участка осуществляется прогнозирование следующего вероятного значения. Это не константное значение, а интервал, точность которого может варьироваться в зависимости от разниц величин вылова предыдущих дней. Если сведения за отчетные сутки попадают в этот интервал, считается, что отчет достоверен. При выходе за установленные границы подается сигнал о необходимости проведения анализа поступившего отчета на предмет их искажения. Когда проходит исправление и подтверждение правильности передаваемых сведений, коэффициенты математической модели и ковариационная матрица ошибок рассчитываются заново (согласно новым данным) и записываются в базе данных системы.

Литература

1. Проценко И.Г. Информационная система мониторинга рыболовства // Рыбное хозяйство. - 2001. - Спец. выпуск. - С. 3-18.

2. Мониторинг рыболовства 2005. Инструкции и рекомендации экипажам промысловых судов и судовладельцам / Под общ. ред. д.т.н. И.Г. Проценко. - Петропавловск-Камчатский: ФГУП «Камчатский центр связи и мониторинга». - 2005. - 264 с.

3. Кашьяп Р.Л., Рао А.Р. Построение динамических стохастических моделей по экспериментальным данным / Пер. с англ. - М.: Наука, 1983.

i Надоели баннеры? Вы всегда можете отключить рекламу.