УДК 639.2
И.Г. Проценко, И.С. Кобзарь
Камчатский государственный технический университет, Петропавловск-Камчатский, 683003 e-mail: [email protected]
КОНТРОЛЬ КАЧЕСТВА ПРОМЫСЛОВОЙ ОТЧЕТНОСТИ НА ОСНОВЕ СРАВНЕНИЯ ПРОГНОСТИЧЕСКОГО И ФАКТИЧЕСКОГО
ЗНАЧЕНИЙ УЛОВА
Статья посвящена оценке качества промысловой отчетности в промышленном рыболовстве на основе прогностической модели процесса вылова рыбы. Оценка основана на сравнении прогностического значения улова с фактическими данными промыслового отчета. Применение математической модели позволяет уменьшить доверительный интервал ошибок отчетности и проводить эффективный контроль качества поступающих отчетных данных о вылове. Использование рекуррентных формул фильтра Калмана дает возможность реализовать вычисления в реальном масштабе времени. В совокупности применение данного подхода обеспечит пользователей информационной рыбопромысловой системы качественной аналитической информацией.
Ключевые слова: информационная рыбопромысловая система, промысловая отчетность, авторегрессионная модель, фильтр Калмана, численные эксперименты.
I.G. Protsenko, I.S. Kobzar
Kamchatka State Technical University, Petropavlovsk-Kamchatskу, 683003 e-mail: [email protected]
QUALITY CONTROL OF FISHERIES REPORTING BASED ON COMPARING FORECAST AND ACTUAL CATCH VALUES
The article is devoted to the assessment of the quality of fishery reporting in industrial fisheries based on a predictive model of the fish catching process. The estimate is based on a comparison of the predicted catch value with the actual data from the fishery report. The use of a mathematical model makes it possible to reduce the confidence interval of reporting errors and to carry out effective quality control of the reported catch data. The use of the recurrent formulas of the Kalman filter makes it possible to implement calculations in real time. Taken together, the application of this approach will provide users of the fishery information system with high-quality analytical information.
Key words: fishery information system, fishery reporting, autoregressive model, Kalman filter, numerical experiments.
Отраслевая система мониторинга (ОСМ) предназначена для мониторинга водных биоресурсов на основе непрерывного наблюдения и контроля за выловом, транспортировкой и обработкой рыбы и морепродуктов [1, 2]. Решение данной задачи обеспечивается путем наблюдения за промысловой деятельностью на судах и рыболовных участках, местоположением судов и получения на этой основе косвенных показателей состояния водных биоресурсов: вылов на усилие и площади промысловых скоплений. Эти показатели позволяют оперативно отслеживать реализацию выделенных квот вылова, интенсивность промысла и его влияние на состояние рыбных запасов.
Конечной целью функционирования ОСМ является сохранение численности биоресурсов в размерах, необходимых для их воспроизводства и последующего использования в течение длительного срока. На основе поступающей в ОСМ информации формируются выходные формы и другие аналитические материалы, позволяющие решать широкий комплекс задач по управле-
нию рыболовством, в том числе осуществлять контроль за местонахождением и промысловой деятельностью судов, следить за полнотой и достоверностью судовой промысловой отчетности и отчетности, поступающей от рыболовных участков.
Информация ОСМ является источником для органов рыбоохраны, которые проверяют правильность ведения отчетности, контролируют соответствие результатов промысла выделенным квотам.
Основными данными в ОСМ являются результаты промысловых операций, выраженные в объемах выловленной рыбы - отчет - сведения, которые ежесуточно передаются с промысловых судов и рыболовных участков. Источником этих сведений является промысловый журнал, который ведется на судне или участке. Помимо сведений о суточном улове и количестве рыбы, отгруженной по квитанции на транспорт или завод для дальнейшей обработки улова, в журнал заносятся более подробные сведения о промысловых операциях с указанием времени начала и окончания операции, ее результатах, орудиях лова и пр.
Процесс обработки входных данных ОСМ после того, как они поступили в центр мониторинга, включает в себя первичную обработку, в процессе которой выполняется преобразование формата исходных данных во внутренний формат информационной системы, комплексный анализ, выполняющий синтаксический и семантический разбор данных, и подготовка аналитического материала, ввод в базу данных, рассылка информации другим пользователям [3].
Проверка данных, поступающих в ОСМ, необходима, так как встречаются ошибки случайного и умышленного характера, когда пользователь ВБР хочет скрыть реальную цифру вылова. Несмотря на то, что ошибки в основном неумышленные, факты браконьерства еще имеют место на промысле.
Контроль объема вылова [4] - сложная задача, т. к. величина улова зависит от многих причин: состояния сырьевой базы, погодных условий, технологических особенностей судна или участка - и может меняться от нуля до максимальной в производственном смысле величины (т. е. зависит от производительности оборудования обработки сырца). Поэтому к величине вылова, который указан в отчете, устанавливается доверительный интервал, в который величина улова должна с высокой вероятность укладываться. В общем случае, как это выше упоминалось, в доверительный интервал входят все возможные значения вылова, что на практике снижает эффективность контроля за отчетными данными величины улова.
Снизить доверительный интервал предлагается за счет использования математической модели расчета величины вылова на отчетные сутки, т. е. за счет прогноза величины улова по времени на 1 шаг вперед, после даты предыдущего отчета. Это спрогнозированное значение улова сравнивается с отчетным значением. А условием удовлетворительного качества поступившего отчета является попадание отчетного значения в доверительный интервал прогноза. Предполагается, что можно построить модель, в которой дисперсия ошибки прогноза будет меньше, чем дисперсия самого процесса, а значит и доверительный интервал будет давать эффективный контроль отчетных данных. Снизить доверительный интервал можно также за счет включения в модель отчетов с ближайших судов и рыболовных участков, так картина изменений промысловой обстановки (уловистости) имеет очевидную пространственную корреляцию.
В ОСМ тысячи судов и рыболовных участков, и понятно, что нужно построить тысячи моделей, т. к. объекты отчетности отличаются друг от друга, что в вычислительном плане непростая задача, поэтому для расчета параметров математической модели будут привлекаться эффективные алгоритмы.
Отчетную величину суточного улова на рыболовном участке х( за указанные сутки t можно рассматривать как сумму двух частей: части, являющейся функцией всех значений до выбранных суток t - 1, и чисто случайной составляющей wt [5]:
х,=Ях,_1га,и,) + -м;„ (1)
где х(1 =(х(1, х( 2, ...) - совокупность данных вектора Л", до момента времени / - 1 включительно; а - вектор неизвестных коэффициентов модели; ut - управляющее воздействие либо экзогенный фактор; wt - последовательность независимых одинаково распределенных величин; / - детерминированная функция.
Ввод в уравнение шума wt отражает допущенные погрешности при случайном или умышленном искажении величины улова, а также поиске неизвестного вида функции f.
Перепишем (1) в векторно-матричном виде. Система уравнений M - для га-мерного векторного процесса xt = [xt t,...,хт t]T :
М: xi,, = <,-iai + wt,t i = 1, . ., m, (2)
m
где at - «¿-мерный вектор; a = [aT,...,aT] - «о-мерный вектор n0 = En; wt = wt t = [wl t,...,wm t]T
i = i
- случайные гауссовы возмущения типа белого шума; а] = а], = E{w\ t} - дисперсия вектора шумов. zTt имеет размерность n; и составляется в виде функции из компонент векторов x,...,xt_m„u,...,ut-m2; U = U Xu\ t,...,un tiT - наблюдаемый входной вектор.
Класс многомерных динамических моделей представляется тройкой: (M, A, W), где M -уравнение (3), содержащее n0 -мерный вектор a; A - множество всех значений, которые может принимать вектор a; W- множество всех положительно определенных матриц шума w.
Предположим, что к моменту времени t накоплена совокупность наблюдений процессов Xt и Ut:
ZT (t) = (xT ,..., xT , xT ,..., xT_ml, U UT_2m ) . (3)
Требуется найти оценки параметров вектора at и матрицы аисходя из вектора наблюдений z(t) и заданного критерия. Поскольку мы ввели в правую часть уравнения (3) шум wt, t чтобы компенсировать недостатки модели, то естественно за счет подбора вида функции f и вектора коэффициентов модели at сделать влияние шума минимальным, а в качестве критерия выбрать минимум дисперсии шума w;, t:
t Е t Е
a2,t = Ew2 j = Е(х^ j zTj-i« f ^ mm. (4)
j=i j=i
Минимизация (4) дает выражение для вектора at в виде:
« (t)=zl TinEjXu ]. (5)
j=i j=i
Из (5) видно, что вектор коэффициентов модели для 7-го уравнения рассчитывается без учета остальных уравнений. Такую оценку для вектора коэффициентов модели называют оценкой квазимаксимального правдоподобия на основе ограниченной информации (не учитываются другие уравнения модели).
Для математического ожидания и дисперсии at справедливы следующие асимптотические выражения:
Eiait)} = ai+ o(1/1112) . (6)
В ряде случаев, когда w;, t и u;, t статистически независимы, оценка квазимаксимального правдоподобия совпадает с оценкой условного максимального правдоподобия, а значит является состоятельной и асимптотически несмещенной. Оценка at на основе ограниченной информации является состоятельной, но не всегда эффективной (см. работы [6-10]).
Важное преимущество метода оценивания на основе ограниченной информации состоит в том, что он позволяет находить состоятельную оценку at в условиях отсутствия знания a]t.
Данный метод позволяет осуществлять декомпозицию задачи оценивания на ряд автономных задач оценивания для отдельных уравнений системы, что существенно упрощает задачу в вычислительном аспекте.
г г
Расчет по формуле а. (г) = 2Ти_ 2и-1х, ^ требует необходимости запоминания
¡=1 ¡=1
всей совокупности наблюдений [х ;= 1,..., г] до момента времени г. При мониторинге, т. е.
непрерывном отслеживании динамики показателей, характеризующих процесс, необходим пересчет оценки в новые оценки аи с использованием наблюдений х . Проведение подобных
расчетов требует выполнения растущего с числом ^ количества суммирований, а при реализации на ЭВМ возрастают затраты на поиск и отбор записей наблюдений [х ■,} = 1,2,..., г].
Можно воспользоваться алгоритмом, принадлежащим семейству алгоритмов фильтрации Калмана и реализующим процедуру вычислений оценки коэффициентов модели в реальном масштабе времени.
Суть алгоритма, реализующего Калмановскую фильтрацию, заключается в согласовании наблюдений и физических моделей.
Введем в рассмотрение матрицу (:
г
, =стм j -1 21 -1]_1. (7)
3 = 1
Оценку вектора коэффициентов модели можно записать в виде:
г
«и, = Я, [^J -1Х-, у ]. (8)
з = 1
Алгоритм вычисления оценки а , можно получить исходя из описанных соотношений и представить в следующем виде:
г г -1
, = 72.. ,2Т, , = 2. , ,2-, , + / ■ , = ^ ' , + Я-1 ,. (9)
г,г / , - 1 г,г - 1 г,г- 1 г,г - 1 /, г - 1 г,] - 1 г,г- 1 г ,г- 1 г ,г- 1 V /
¡=1 ¡ =1
Из этого выражения можно получить соотношение:
г -1
«м-1 = -, -, х , ]. (10)
} = 1
Тогда выражение для а 1 перепишется следующим образом:
аг, г = Л, г + 1«,г- 1. (11)
Алгоритм контроля входных отчетных данных выглядит следующим образом. По модели конкретного промыслового участка делается прогноз на один шаг вперед по времени и это значение сравнивается с поступившим на эту дату отчетом о вылове. Если расхождение укладывается в доверительный интервал, то значит поступивший отчет скорее всего достоверен и нет причин подозревать пользователя ВБР в его искажении. Если же расхождение велико, то это прямой сигнал к проведению анализа поступивших данных на предмет их ошибочности или умышленного искажения. После исправления ошибок отчета коэффициенты модели и ковариационная матрица ошибок пересчитывается и сохраняется в базе данных.
Применение математической модели рыбопромыслового участка позволяет проводить контроль качества поступающих отчетных данных о вылове. В свою очередь, количество участков, как и количество соответствующих им моделей, велико, поэтому применение рекуррентных формул фильтра Калмана весьма целесообразно. В совокупности применение данного подхода повысит качество промысловой информации ОСМ, которая в свою очередь обеспечит пользователей системы качественной аналитической информацией.
Литература
1. Мониторинг рыболовства 2005. Инструкции и рекомендации экипажам промысловых судов и судовладельцам / Под общ. ред. д.т.н. Проценко И.Г. - Петропавловск-Камчатский: ФГУП «Камчатский центр связи и мониторинга», 2005. - 264 с.
2. Кошкарева Л.А. Алгоритм контроля расхода сырца при выпуске рыбной продукции на основе данных промысловой отчетности // Материалы междунар. науч. чтений «Приморские зори - 2005». - Владивосток: ТАНЭБ, 2005. - Выпуск второй. - 286 с.
3. Проценко И.Г. Информационная система мониторинга рыболовства // Рыбное хозяйство. - 2001. - Спец. выпуск. - С. 3-18.
4. Проценко И.Г. Оптимизация обработки входной информации в отраслевой системе мониторинга рыболовства // Международный научно-исследовательский журнал. - 2019. - № 8 (86). - Часть 1, Август. - Екатеринбург.
5. Кашьяп Р.Л., Рао А.Р. Построение динамических стохастических моделей по экспериментальным данным // Пер. с англ. - М.: Наука, 1983.
6. Браммер К., Зиффлинг Г. Фильтр Калмана-Бьюси. - М.: Наука, 1982 [Электронный ресурс]. - URL: https://www.twirpx.com/file/21556/ (дата обращения: 15.03.2021).
7. Калман Р.Л., Фалб., Арбиб М. Очерки по математической теории систем. - М.: Мир, 1971.
8. Калман Р.Э. Новые методы в теории Винеровской фильтрации // Proc. Symp. Eng. Appl. Random Functious. - Нью-Йорк: Wiley, 1963.
9. Петерсен Д.П. О концепции и реализации последовательного анализа для линейных случайных полей // Теллис. - 1968. - Т. 20, № 4. - С. 673-686.
10. Эпстейн Эд. С. Стохастические динамические предикаты // Теллус. - 1969. - Гл. 21. -С. 739-759.