ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2023 Управление, вычислительная техника и информатика № 65
Tomsk: State University Journal of Control and Computer Science
Научная статья УДК 519.246.5 doi: 10.17223/19988605/65/9
Две естественно-научные задачи статистической оценки при наличии мешающего параметра
Гурами Шалвович Цициашвили1, Владимир Николаевич Бочарников2
1 Институт прикладной математики ДВО РАН, Владивосток, Россия, [email protected] 2 Тихоокеанский институт географии ДВО РАН, Владивосток, Россия, [email protected]
Аннотация. Рассматриваются две задачи статистической оценки при наличии мешающего параметра. Первая задача состоит в оценке общего числа осколков метеорита по числу осколков, извлеченных в первом, втором и последующих годах. Мешающими параметрами являются вероятности нахождения осколков в разные годы. Качество оценки определяется отношением оценки числа осколков к точному значению и стремится к единице по вероятности при устремлении к бесконечности общего числа осколков. Вторая задача состоит в определении числа посещений животными солонца по наблюдениям с фотоловушки. Основная трудность задачи в том, что один и тот же зверь может регистрироваться и учитываться несколько раз как разные звери. Общее число животных, пришедших к солонцу, определяется формулой для стационарного распределения числа заявок в системе массового обслуживания с бесконечным числом приборов. Мешающим параметром берется интенсивность обслуживания. Задача решается с помощью эргодичности процесса обслуживания. В системах с различной интенсивностью потока зверей отношение интенсивностей определяется отношением числа наблюдений с фотоловушки.
Ключевые слова: мешающий параметр; эргодичность; система массового обслуживания.
Для цитирования: Цициашвили ГШ., Бочарников В.Н. Две естественно-научные задачи статистической оценки при наличии мешающего параметра // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2023. № 65. С. 89-94. doi: 10.17223/19988605/65/9
Original article
doi: 10.17223/19988605/65/9
Two natural science problems of statistical evaluation in the presence of an interfering parameter
Gurami Sh. Tsitsiashvili1, Vladimir N. Bocharnikov2
1 Institute for Applied Mathematics, FEB ofRAS, Vladivostok, Russian Federation, [email protected]
2 Institute of Pacific Ocean Geography, FEB of RAS, Vladivostok, Russian Federation, [email protected]
Abstract. The paper considers two tasks of statistical evaluation in the presence of an interfering parameter. The first task is to estimate the total number of meteorite fragments by the number of fragments recovered in the first, second, etc. years. The interfering parameters are the probabilities of finding fragments in different years. The quality of the estimate is determined by the ratio of the estimate of the number of fragments to the exact value and tends to unity in probability with an aspiration to infinity of the total number of fragments. The second task is to determine the number of visits to the animals of the salt lake from observations from a camera trap. The main difficulty of the task is that the same animal can be registered and counted several times as different animals. The total number of animals that came to solonets is determined by the formula for the stationary distribution of the number of applications in a queuing system with an infinite number of devices. The interfering parameter is the intensity of service. The problem is solved using the ergodicity of the service process. In systems with different intensity of the flow of animals, the intensity ratio is determined by the ratio of the number of observations from the camera trap.
Keywords: interfering parameter; ergodicity; queuing system.
© ГШ. Цициашвили, В.Н. Бочарников, 2023
For citation: Tsitsiashvili, G.Sh., Bochamikov, V.N. (2013) Two natural science problems of statistical evaluation in the presence of an interfering parameter. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitelnaja tehnika i informatika - Tomsk State University Journal of Control and Computer Science. 65. pp. 89-94. doi: 10.17223/19988605/65/9
Введение
Оценивание параметров статистической выборки при наличии мешающего параметра является важной статистической задачей [1, 2]. Эта задача нашла свое применение в квантовой физике, где обычно мешающие параметры называются скрытыми параметрами [3-5]. Она решалась и при создании квантовых компьютеров [6]. Методы решения задачи о мешающих параметрах применялись при анализе следов тигра в Приморье в 2005 г. [7]. В работе в качестве мешающего параметра выбрана вероятность обнаружения следа. Такой выбор мешающего параметра позволяет воспользоваться теоремой о раскраске точек пуассоновского потока [8] для оценки параметра пуассоновского распределения относительного числа точек потока в заданной области.
Однако в науках о Земле возникают и другие задачи, требующие включения мешающих параметров в вероятностные модели наблюдений. В настоящей работе рассматриваются две такие задачи. Первая задача - оценка числа осколков метеорита по многократным наблюдениям за числом извлекаемых осколков. Вторая задача - оценка интенсивности посещений животных, регистрируемых фотоловушками, установленными на подкормочных площадках или зверовых солонцах. Обе эти задачи требуют использования аппарата комбинаторной теории вероятностей и теории массового обслуживания. В первой задаче мешающим параметром является вероятность обнаружения осколка метеорита.
Во второй задачей мешающий параметр характеризует среднее время пребывания животного в системе, связанной с солончаком. Подсчет общего числа животных не может быть сделан без серьезных ошибок, если выполнять его по частоте регистраций фотоловушкой. Причина в том, что невозможно доказать различие копытных животных, следовательно, один и тот же зверь может регистрироваться несколько раз и учитываться как разные животные. Если предположить, что животное может подходить к солонцу раз в день и его последовательные подходы будут ежедневными до состояния насыщения, то тогда время пребывания животного у солонца можно интерпретировать как время обслуживания, а число каналов можно считать бесконечным, поскольку конкуренцией животных за подобный ресурс можно пренебречь. Наконец, время пребывания животного в системе, связанной с солончаком, с достаточной долей погрешности можно считать одинаковым для различных отрезков времени (месяцев). Это позволяет оценивать отношение числа животных, приходящих в разные периоды времени (разные месяцы) в систему, связанную с солончаком, через отношение числа животных, фиксированных фотоловушкой в разные периоды времени.
1. Задача об оценке числа осколков метеорита
В 1947 г. на территорию Приморья упал Сихоте-Алиньский метеорит. С этого момента начались наблюдения за осколками этого метеорита. В 1997 г. членом-корреспондентом РАН В.П. Коробейни-ковым во Владивостоке была организована научная конференция, посвященная этому событию, с выездом участников на место падения метеорита. Во время конференции обсуждалась задача оценки числа осколков метеорита по информации о числе осколков, найденных и извлеченных из земли в ходе нескольких экспедиций. Для решения этой задачи в данной работе предложена специальная вероятностная модель оценки общего числа осколков метеорита с анализом погрешностей предлагаемой оценки.
Пусть имеется выборка из N объектов (в нашем случае осколков метеорита). На первом шаге извлечено из выборки N1 объектов с вероятностью p1 каждый. На втором шаге из неизвлеченных объектов извлечено N2 объектов с вероятностью p2 каждый и т.д. Пусть на (m - 1)-м шаге извлечено Nm-1 объектов, а на m-м шаге Nm объектов с вероятностью pm = pmm > 1, каждый. Требуется по известным
значениям N1, ..., Nm построить оценку N общего числа объектов выборки N. Здесь вероятности p\, ...,рш-2,Pm-l извлечения объектов на шагах 1, 2, ..., т неизвестны и могут быть различны. Тогда эти вероятности можно назвать мешающими параметрами.
Задачу решим методом моментов. Обозначим п\, ...,Пк математические ожидания случайных величин Л']. ...,Ык соответственно и <:/, = 1 — /?,./ = 1.. ...т. Тогда имеют место равенства
п1=М-р1, п2=дгр2, пт_1=Ч1-...-Чт_2-рт_1, пт=дг...-дт_гРт_1.
Докажем, что выполняется равенство
т—2
N = 2 Щ
т—1
1=1
эквивалентное при рт—1 = рт равенству
Пт—1 Пт
2 т—2 ^
Рт—1 П Ч 2
т—2 г—1 ±т—1 1-
Лт = 2 Р, П ч- +-о—--5—
т т—2 т—1
' = - = Рт—1 П Ч- — Рт—1 П Ч-
-=1 -=1
= 1.
Действительно,
Лт = 2 Рг П Ч-
2 тТЛ 2
3 г_1 Рт-1 ш_3 м ш_2
- =1 -
Отсюда получаем формулу, которая позволяет построить оценку ^т) параметра N по набору наблюдений N1, ..., Nm при выполнении равенстварш = Рш-1 методом моментов:
т—2
N(т)= 2 N1 +
г=1
N
т—1
Nm—1 — ^т
(1)
Из формулы (1) следует равенство
N(т) _ т-2 N , (Nm—1/ N)2
' = 2 "Т7"
N г=1 N Nm—1/ N — Nm / N В свою очередь, из закона больших чисел в форме Чебышева получаем сходимости по вероятности
N р
(2)
г—1
N
-+Р, П Ч,, N ^да, г = 1,...,т. -=1
(3)
Соединяя формулы (2), (3) приходим к сходимости по вероятности
N (т) р
N
-^Лт = 1, N ^да.
2. Задача об оценке числа животных по наблюдениям с фотоловушки
Задача обработки данных по времени пребывания и частоте посещения животными фотоловушек в последнее время становится все более актуальной. Фото и видео автоматической регистрации животных (данные фотоловушек) позволяют хорошо идентифицировать некоторые редкие виды, например крупных кошек (тигр, леопард), по их индивидуальной окраске (сочетание полос и пятен на шкуре зверя). Для фото и видео наиболее ценных копытных животных (изюбрь, косуля, лось) персональная идентификация зверей не является возможной. Исключением может быть краткий период (полтора-два месяца в году), когда взрослых самцов (быков) можно отличать по конфигурации рогов. Поэтому фотоловушки фиксируют подход таких животных, но без их индивидуализации. Это затрудняет учет числа животных, зафиксированных фотоловушкой в течение некоторого интервала
2
2
времени. Чтобы преодолеть эту трудность, необходимо воспользоваться элементами теории массового обслуживания применительно к системе с бесконечным числом приборов. В частности, такая система возникает при подсчете подходе животных к солонцам. Если предположить, что животное может подходить к солонцу раз в день и ее последовательные подходы будут ежедневными до состояния насыщения, то тогда время пребывания животного у солонца можно интерпретировать как время обслуживания, а число каналов можно считать бесконечным, поскольку конкуренцией животных за подобный ресурс можно пренебречь. Наконец, время пребывания животного у солонца с достаточной долей погрешности можно считать одинаковым для различных отрезков времени (месяцев).
Это позволяет получить информацию о степени общего использования солонца зверями для удовлетворения их потребностей, что сопоставимо с числом заявок в системе массового обслуживания с бесконечным числом приборов. Для такой системы в ряде случаев нетрудно рассчитать предельное распределение и установить эргодичность этой системы в смысле равенства среднего (числа животных) по ансамблю и среднего по траектории большой длины. Первую характеристику можно рассчитать по стационарному распределению процесса числа заявок в системе обслуживания (у солончака), а вторую характеристику можно рассчитать по наблюдениям с фотоловушки.
Подсчет общего числа животных не может быть сделан без серьезных ошибок, если выполнять его по частоте регистраций фотоловушкой. Причина в том, что невозможно доказать различие копытных животных, следовательно, один и тот же зверь может регистрироваться несколько раз и учитываться как разные животные. Не помогают в этих расчетах и фиксированные сведения о дате и времени пребывания, что также фиксируется фотоловушкой. Необходимо убирать мешающий параметр и строить данные по встречам животных как относительное число, фактически совпадающее с общим числом регистраций всех животных по месяцам. Эти параметры выражают средние значения суточных и сезонных посещений животными солонцов [9-11].
Рассмотрим систему массового обслуживания М | М | да с бесконечным числом приборов, интенсивностью пуассоновского входного потока X и интенсивностью обслуживания на отдельном приборе ц. Обозначим x(t) число заявок в этой системе в момент времени t. Известно, что случайный процесс x(t) является процессом гибели и рождения, а его предельное распределение является пуас-соновским [12. Гл. III, 3] с параметром р = X/ц :
—р к
НтР(х(0 = к) = ——, к = 0,1,...
Случайный процесс x(t) является эргодическим. На физическом уровне строгости это означает: среднее по ансамблю равно среднему по траектории. Математически строго такая эргодичность выражается соотношением: при Т ^ да среднее значение процесса x(t) по реализации длины T сходится по вероятности к среднему значению его стационарного распределения. В нашем случае, пользуясь, например, [13. Гл. V, 2], это соотношение можно представить следующим образом:
АТТ) = —>р, Т ^да.
Предположим, что имеется две системы массового обслуживания М | М | да , которые описываются процессами гибели и рождения x1(t), x2(t) с интенсивностями входных потоков Х1, Х2 и одинаковой интенсивностью обслуживания ц Тогда отношение средних по времени на отрезке [0, T] процессов Xl(t), X2(t) сходится при Т ^ да по вероятности к отношению интенсивностей входных потоков:
Ш —Д, Т -*«. (4)
А2(Т) X, 1 '
Обозначим В(Т) = ТА(Т), тогда из формулы (4) получаем
В'(Т) X-, Т-*«.
В2 (T ) X
2
Остается оценить Bx(T), B2(T) суммарным числом Сг наблюдений за животными, подошедшими к фотоловушке в течение отрезка времени T (месяц). Можно построить приближенную оценку отношения
A,jT С ^2T С2
Здесь X1T, X2T - параметры пуассоновского распределения числа точек потоков интенсивности X1, X2 соответственно. Эти параметры выражают средние значения числа приходов животных в систему, связанную с солончаком.
Заключение
В настоящей статье решаются две естественно-научные статистические задачи, в которые включены мешающие параметры. Первая задача посвящена оценке числа N осколков метеорита по наблюдениям за числом обнаруженных и извлеченных осколков в последовательные моменты времени. В предположении, что вероятности обнаружения осколков в моменты 1, ... m равны
p1, p2,..., pm _1, pm, причем pm_1 = pm, построена оценка N (m) параметра N. Вероятности
p1,p2,...,pm_i,pm, полагаются мешающими параметрами, значения которых не оцениваются. Доказа-
N (m)
но, что отношение ——— при N ^да сходится по вероятности к единице и, значит, относительная
ошибка предложенной оценки стремится к нулю (по вероятности).
Решена задача об оценке числа приходов животных к солончаку по наблюдениям с фотоловушки, установленной у солончака. Для решения этой задачи построена математическая модель системы массового обслуживания с бесконечным числом каналов, описывающая число приходов животных к солончаку. Предполагается, что животные непрерывно посещают солончак, находясь в его окрестности, в течение показательно распределенного случайного времени. Параметр этого распределения ц полагается мешающим параметром. Для оценки интенсивности потока животных, поступающих в систему, связанную с солончаком, используется пуассоновское распределение числа заявок в системе массового обслуживания с бесконечным числом каналов. Параметром этого распределения является отношение р интенсивности входного потока X к мешающему параметру ц. Используя эргодичность процесса, характеризующего число заявок в описанной системе обслуживания, можно по наблюдению с фотоловушки в течение достаточно длительного интервала времени T (порядка месяца), оценить параметр р, а затем по этим оценкам в разные интервалы времени (месяцы) оценить отношение интенсивностей прихода заявок (животных) в систему солончака в разные месяцы. Учитывая, что отношение интенсивностей потоков в разные месяцы совпадает с отношением числа заявок, приходящих в систему, можно оценить отношение числа животных, пришедших в систему солончака в разные месяцы.
Список источников
1. Кокс Д., Хинкли Д. Теоретическая статистика. М. : Мир, 1978. 560 с.
2. Young G.A., Smith R.L. Essentials of Statistical Inference. Cambridge : Cambridge University Press, 2005. x, 225 р.
3. Jie Z., Hai-Lin F. Consistent estimation of ordinary differential equation when transformation parameter is unknown // Statistics
and Probability Letters. 2016. V. 115. P. 60-69.
4. Lixin M., Jiwei Z., Xue Z., Guozhong F. Bayesian estimation of time-varying parameters in ordinary differential equation models
with noisy time-varying covariates // Communications in Statistics - Simulation and Computation. 2021. V. 50 (3). P. 708-723.
5. Холево А.С. Статистические структуры квантовой механики и скрытые параметры. М. : Знание, 1985. 32 с.
6. Холево А.С. Квантовые системы, каналы, информация. М. : МЦНМО, 2010. 327 с.
7. Цициашвили Г.Ш., Бочарников В.Н., Краснопеев С.М. Метод устранения мешающего параметра в статистике пуассонов-
ского потока точек // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2023. Т. 62, № 1. С. 101-106.
8. Кингман Дж. Пуассоновские процессы. М. : МЦНМО, 2007. 136 с.
9. Лукаревский В.С., Лукаревский С.В. Оценка численности дальневосточного леопарда (Panthera pardus) в России // Зооло-
гический журнал. 2019. Т. 98, № 5. C. 567-577.
10. Огурцов С.С. Обзор программного обеспечения для обработки данных с фотоловушек: последние новинки, работа с видео и ГИС. Nature Conservation Research // Заповедная наука. 2019. Т. 4, № 2. С. 95-124.
11. Калинкин Ю.Н. Суточная активность копытных на солонцах Алтайского заповедника. Полевые исследования в Алтайском биосферном заповеднике // Зоология. 2023. № 5. C. 6-14.
12. Ивченко Г.И., Каштанов В.А., Коваленко И.Н. Теория массового обслуживания : учеб. пособие для вузов. М. : Высшая школа, 1982. 256 с.
13. Калашников В.В. Качественный анализ поведения сложных систем. М. : Наука, 1978. 247 с.
References
1. Cox, D. & Hinckley, D. (1978) Teoreticheskaya statistika [Theoretical Statistics]. Translated from English. Moscow: Mir.
2. Young, G.A. & Smith, R.L. (2005) Essentials of Statistical Inference. Cambridge: University Press, UK.
3. Jie, Z. & Hai-Lin, F. (2016) Consistent estimation of ordinary differential equation when transformation parameter is unknown.
Statistics and Probability Letters. 115. pp. 60-69.
4. Lixin, M., Jiwei, Z., Xue, Z. & Guozhong, F. (2021) Bayesian estimation of time-varying parameters in ordinary differential equa-
tion models with noisy time-varying covariates. Communications in Statistics - Simulation and Computation. 50(3). pp. 708-723.
5. Holevo, A.S. (1985) Statisticheskie struktury kvantovoy mekhaniki i skrytye parametry [Statistical Structures of Quantum Mechanics
and Hidden Parameters]. Moscow: Znanie.
6. Holevo, A.S. (2010) Kvantovye sistemy, kanaly, informatsiya [Quantum Systems, Channels, Information]. Moscow: ICNMO.
7. Tsitsiashvili, G.Sh., Bocharnikov, V.N. & Krasnopeev, S.M. (2023) The method of eliminating the interfering parameter in the
statistics of the Poisson flow of points. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science. 62(1). pp. 101-106.
8. Kingman, J. (2007) Puassonovskieprotsessy [Poisson Processes]. Translated from English. Moscow: ICNMO.
9. Lukarevsky, V.S. & Lukarevsky, S.V. (2019) Estimation of the number of the Far Eastern leopard (PANTHERA PARDUS)
in Russia. Zoologicheskiy zhurnal - Zoological Journal. 98(5). pp. 567-577.
10. Ogurtsov, S.S. (2019) Review of software for processing data from camera traps: The latest novelties, working with video and GIS. Nature Conservation Research. Zapovednaya nauka. 4(2). pp. 95-124.
11. Kalinkin, Yu.N. (2023) Daily activity of ungulates on the salt flats of the Altai Reserve. Field research in the Altai Biosphere Reserve. Zoologiya - Zoology. 5. pp. 6-14.
12. Ivchenko, G.I., Kashtanov, V.A. & Kovalenko, I.N. (1982) Teoriya massovogo obsluzhivaniya [The Theory of Queuing]. Moscow: HSE.
13. Kalashnikov, V.V. (1978) Kachestvennyy analiz povedeniya slozhnykh sistem [The Qualitative Analysis of the Behavior of Complex Systems]. Moscow: Nauka.
Информация об авторах:
Цициашвили Гурами Шалвович - профессор, доктор физико-математических наук, главный научный сотрудник Института прикладной математики ДВО РАН (Владивосток, Россия). E-mail: [email protected]
Бочарников Владимир Николаевич - доктор биологических наук, ведущий научный сотрудник Тихоокеанского института географии ДВО РАН (Владивосток, Россия). E-mail: vboc [email protected]
Вклад авторов: Цициашвили Г.Ш. построил вероятностные модели и оценки их параметров. Бочарников В.Н. дал детальное описание работы фотоловушек при наблюдениях за животными, неразличимыми по снимкам, и сформулировал содержательную задачу обработки этих данных Авторы заявляют об отсутствии конфликта интересов.
Information about the authors:
Tsitsiashvili Gurami Sh. (Doctor of Physical and Mathematical Sciences, Main Researcher of Institute for Applied Mathematics, FEB RAS, Vladivostok, Russian Federation) E-mail: [email protected]
Bocharnikov Vladimir N. (Doctor of Biological Sciences, Leading Researcher of Institute of Pacific Ocean Geography FEB RAS, Vladivostok, Russian Federation). E-mail: [email protected]
Contribution of the authors: Tsitsiashvili G.Sh. built probabilistic models and estimates of their parameters. Bocharnikov V.N. gave a detailed description of the work of camera traps when observing animals indistinguishable from images and formulated a meaningful task ofprocessing these data. The authors declare no conflicts of interests.
Поступила в редакцию 22.08.2023; принята к публикации 08.12.2023
Received 22.08.2023; accepted for publication 08.12.2023