Известия Кабардино-Балкарского научного центра РАН № 4 (96) 2020
- МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ЭКОНОМИКИ-
УДК: 330.42(045), 51-77(045)
MSC: 62H30; 62P20; 91B42
DOI: 10.35330/1991-6639-2020-4-96-78-88
МОДЕЛИРОВАНИЕ И ВОССТАНОВЛЕНИЕ ПРЕДПОЧТЕНИЙ ПОКУПАТЕЛЕЙ МЕЖДУ ДВУМЯ АЛЬТЕРНАТИВНЫМИ ТОВАРАМИ С ПОМОЩЬЮ ЕМКОСТНОГО МЕТОДА АНАЛИЗА РЕДКИХ СОБЫТИЙ В ЭКОНОМИКЕ* (Часть 2)
Ю.А. КОРАБЛЕВ
Финансовый университет при Правительстве Российской Федерации (Финуниверситет) 125993, г. Москва, Ленинградский проспект, 49 E-mail: academy@fa.ru
В статье предложен подход для классификации событий завершения запаса потребителя из данных покупок двух альтернативных товаров в случае, если покупки происходят, когда любой из товаров закончился. Такое распознавание событий необходимо для дальнейшего восстановления динамики изменения предпочтения потребителя между этими двумя товарами, которое осуществляется с помощью емкостного метода анализа редких событий. Определить, произошла ли покупка вследствие завершения запаса или нет, помогает наблюдение за средней скоростью расхода продукции. В статье описано, на что надо обратить внимание при таком распознавании.
Ключевые слова: редкие события, емкостный метод, скорость потребления, восстановление, предпочтение, альтернативные товары, распознавание, классификация.
Введение
В первой части данного исследования [1] мы рассмотрели способ восстановления динамики изменения предпочтений покупателя между двумя альтернативными товарами. Данный подход базируется на емкостном методе анализа редких событий, в котором события анализируются с точки зрения процессов, происходящих в источниках событий и приводящих к возникновению этих событий [2]. Оказывается, что события, которые образуются в результате процессов потребления, схожих с процессами наполнения и опустошения емкости, можно исследовать с помощью метода восстановления функции по интегралам [3].
Для исследования возможности восстановления предпочтения покупателя между двумя альтернативными товарами были рассмотрены 4 схемы образования редких событий. Первая: потребитель совершает независимые покупки тех товаров, запасы которых закончились, причем он и не пополняет запасы тех товаров, которые еще не закончились. При этой схеме поведения восстановление происходит элементарно, не требуется никакой дополнительной обработки данных, достаточно рассматривать покупки каждого товара отдельно, после чего применить восстановление по интегралам. Во второй схеме покупатель не пополняет запасы до тех пор, пока оба товара не закончатся (когда запасы одного товара заканчиваются, потребитель начинает потреблять запасы другого товара до тех пор, пока и другой товар не закончится, и только потом
* Статья подготовлена по результатам исследований, выполненных за счет бюджетных средств по государственному заданию Финуниверситета 2020 года
пополняет запасы обоих товаров). При второй схеме без введения дополнительных предположений, к сожалению, не получится восстановить истинные предпочтения потребителя. Нужно вводить дополнительные предположения, например, такие, что потребитель при покупке товара заранее знал, что товар не успеет ему надоесть, тогда объемы покупок и будут выражать предпочтения. В третьей схеме моменты событий пополнения запаса происходят во время других событий, таких как посещение магазина при возвращении с работы. В этой схеме пополнение запаса не связано с завершением запасов. Если ввести предположение, что покупатель не изменяет свой максимальный уровень запасов со временем, то восстановление также происходит достаточно просто, в исходных данных можно произвести сдвиг на одну позицию (объем покупок у^+х отнести к предыдущему моменту времени ^). Наконец, в четвертой схеме, которая самая правдоподобная, потребитель пополняет запасы обоих товаров, если закончились запасы любого из товаров. В этой схеме для восстановления предпочтений необходимо предварительно произвести классификацию событий и определить, какой из товаров закончился в момент пополнения запаса. Цель данной статьи как раз произвести эту классификацию.
Распознавание события, вызванного завершением запаса Рассмотрим модель образования событий, описанную в первой части исследования, попробуем проанализировать, существует ли возможность распознавания того, произошла ли покупка вследствие завершения запасов первого или второго товара. Данные моделирования представлены в таблице 1. Покупки, выделенные желтым, вызваны завершением запаса, причем они успевают закончится к следующему событию; сиреневым - вызванные завершением запаса, но которые не успевают закончиться к следующему событию; оранжевым - покупки, которые не вызваны завершением запаса (т.е. пополнение запаса вызвано другим товаром), но которые успевают закончится к следующему событию.
Таблица 1
Данные моделирования, моменты времени и объемы пополнения запасов
продукции обоих товаров
1 Дата ^ Объем покупки 1 Дата ^ Объем покупки 1 Дата ^ Объем покупки
у! У;2 у! у2 у! у2
1 06.01.2020 613,93 535,82 39 11.01.2021 709,77 328,05 77 15.01.2022 777,14 387,77
2 15.01.2020 783,85 381,90 40 20.01.2021 735,60 423,96 78 25.01.2022 764,90 516,27
3 24.01.2020 705,15 450,28 41 29.01.2021 635,37 509,77 79 03.02.2022 572,27 562,28
4 02.02.2020 597,75 541,25 42 06.02.2021 469,11 531,92 80 11.02.2022 415,01 574,03
5 10.02.2020 436,13 557,89 43 13.02.2021 341,06 518,68 81 18.02.2022 302,30 545,14
6 17.02.2020 316,88 535,62 44 20.02.2021 289,10 553,12 82 25.02.2022 262,76 565,66
7 24.02.2020 272,10 561,96 45 27.02.2021 255,07 567,56 83 04.03.2022 243,27 564,26
8 02.03.2020 246,72 566,96 46 06.03.2021 241,51 559,75 84 11.03.2022 244,17 540,92
9 09.03.2020 241,94 549,70 47 13.03.2021 247,87 530,56 85 19.03.2022 302,72 565,47
10 16.03.2020 255,94 512,34 48 21.03.2021 312,05 548,19 86 28.03.2022 391,94 546,23
11 24.03.2020 327,85 520,32 49 30.03.2021 405,77 523,19 87 08.04.2022 563,87 526,20
12 03.04.2020 478,26 535,92 50 11.04.2021 636,43 537,30 88 21.04.2022 758,33 450,41
13 16.04.2020 726,36 515,24 51 23.04.2021 711,13 389,65 89 03.05.2022 721,98 321,10
14 28.04.2020 723,11 348,34 52 05.05.2021 717,82 314,22 90 16.05.2022 718,88 340,34
15 11.05.2020 753,43 332,97 53 18.05.2021 702,04 346,80 91 01.06.2022 701,68 518,61
16 26.05.2020 729,31 441,98 54 03.06.2021 673,14 537,35 92 14.06.2022 406,80 535,42
17 09.06.2020 501,88 530,26 55 15.06.2021 361,51 504,59 93 25.06.2022 261,46 515,47
18 21.06.2020 313,31 540,87 56 26.06.2021 256,84 519,02 94 06.07.2022 233,25 537,25
19 02.07.2020 237,60 533,88 57 07.07.2021 233,25 537,25 95 17.07.2022 256,84 519,02
20 13.07.2020 242,35 530,20 58 18.07.2021 261,46 515,47 96 29.07.2022 361,51 504,59
21 25.07.2020 328,07 529,68 59 31.07.2021 406,80 535,42 97 13.08.2022 624,37 508,09
22 08.08.2020 526,37 512,90 60 16.08.2021 701,68 518,61 98 27.08.2022 750,81 376,05
23 23.08.2020 753,71 428,29 61 29.08.2021 718,88 340,34 99 08.09.2022 717,82 314,22
24 04.09.2020 703,38 307,20 62 10.09.2021 721,98 321,10 100 20.09.2022 711,13 389,65
25 16.09.2020 721,75 355,50 63 22.09.2021 702,84 409,88 101 02.10.2022 636,43 537,30
26 29.09.2020 718,70 529,53 64 03.10.2021 571,92 512,49 102 11.10.2022 405,77 523,19
27 09.10.2020 470,43 548,90 65 12.10.2021 398,81 534,76 103 19.10.2022 312,05 548,19
28 17.10.2020 322,37 529,84 66 20.10.2021 307,25 556,97 104 26.10.2022 247,87 530,56
29 24.10.2020 252,94 518,75 67 27.10.2021 245,85 535,93 105 02.11.2022 241,51 559,75
30 31.10.2020 241,40 553,48 68 03.11.2021 242,19 562,23 106 09.11.2022 255,07 567,56
31 07.11.2020 249,08 567,62 69 10.11.2021 258,70 566,84 107 16.11.2022 289,10 553,12
32 14.11.2020 277,38 559,44 70 17.11.2021 295,52 549,33 108 23.11.2022 341,06 518,68
33 21.11.2020 324,65 530,31 71 24.11.2021 349,66 512,40 109 01.12.2022 469,11 531,92
34 29.11.2020 446,97 549,44 72 02.12.2021 480,35 522,90 110 10.12.2022 635,37 509,77
35 08.12.2020 610,41 530,71 73 12.12.2021 726,10 549,35 111 19.12.2022 735,60 423,96
36 17.12.2020 715,70 441,19 74 21.12.2021 753,72 408,21 112 27.12.2022 709,77 328,05
37 26.12.2020 789,98 376,53 75 29.12.2021 717,41 321,33
38 03.01.2021 726,34 313,46 76 06.01.2022 724,54 315,05
Взглянем на третью покупку первого товара (см. табл. 1) - у| = 705.15, на самом деле эта покупка была спровоцирована тем, что как раз запасы первого товара закончились. А вот следующая четвертая покупка была вызвана тем, что закончился второй товар, когда первый товар все еще остался. Если мы ошибочно предположим, что четвертая покупка была вызвана завершением первого товара, то получается, что объем у| израсходовался за время от t3 до *:4, но это не так: объем товара у| должен был закончиться позже. Это приведет к тому, что средняя скорость у|/(^ — tз) расхода запасов первого товара окажется завышенной. Другими словами, при переключении событий завершения запаса с одного товара на другой будет наблюдаться увеличение средней скорости расхода запаса того товара, с которого произошло переключение. Причем надо заметить, что само это переключение вызвано тем, что скорость расхода запаса одного товара падает, когда другого возрастает (запас одного товара начал заканчиваться позже, чем начал заканчиваться запас другого товара), то есть средняя скорость расхода должна убывать, но она резко возрастает. Однако не всегда средняя скорость должна показать рост, на деле может оказаться
спад, но этот спад обязательно должен быть меньше, чем в предыдущем наблюдении (то есть скорость снижалась, но затем стала снижаться медленнее). Пояснение этих рассуждений показано на рисунке 1. Это один из маркеров, который показывает, что, начиная со следующего наблюдения, начинает заканчиваться другой товар, когда текущий еще будет оставаться в наличии (произошло переключение событий на другой товар), но есть еще некоторые индикаторы.
\ Дата Покупки Т1 Покупки Т2 УУ(^г^)
1 06.01.2020 613,93 535,82 68,2145 59,5361
2 15.01.2020 783,85 381,90 87,0941 42,4333
3 24.01.2020 705,15 450,28 78,3501 50,0314
4 02.02.2020 597,75 541,25 74,7191 67,6563
5 10.02.2020 436,13 557,89 62,3039 79,698
б 17.02.2020 316,88 535,62 45,2687 76,5166
7 24.02.2020 272,10 561,96 38,8714 80,2797
8 02.03.2020 246,72 566,96 35,2453 80,9939
9 09.03.2020 241,94 549,70 34,5627 4- 78,529
10 16.03.2020 255,94 512,34 31,9929 4-64,0423
11 24.03.2020 327,85 520,32 32,7851 4-52,0325
12 03.04.2020 478,26 535,92 36,7895 4-41,2243
13 16.04.2020 726,36 515,24 60,5303 1 42,9364
14 28.04.2020 723,11 348,34 4,55,6242 26,7955
15 11.05.2020 753,43 332,97 4-50,2285 22,1979
16 26.05.2020 729,31 441,98 1 52,0936 31,5699
17 09.06.2020 501,88 530,26 41,8233 44,1887
18 21.06.2020 313,31 540,87 28,4829 49,1698
19 02.07.2020 237,60 533,88 21,5997 4-48,5346
20 13.07.2020 242,35 530,20 20,1957 4-44,1834
21 25.07.2020 328,07 529,68 23,4332 4-37,8346
22 08.08.2020 526,37 512,90 35,0911 4 34,1933
23 23.08.2020 753,71 428,29 62,8091 35,6909
24 04.09.2020 703,38 307,20 4-58,6153 25,6003
25 16.09.2020 721,75 355,50 4-55,5194 27,3461
26 29.09.2020 718,70 529,53 71,8705 52,9527
27 09.10.2020 470,43 548,90 58,8041 68,612
Рис. 1. Пояснение рассуждений для распознавания событий. Желтым выделены ячейки покупок, спровоцированных завершением запаса соответствующего товара, объем которых при этом завершился к следующему событию. Отмеченные сиреневым цветом ячейки покупок хоть и спровоцированы завершением запаса, но объем этих покупок не закончится к следующему событию. Оранжевым цветом выделены ячейки покупок, объем которых вместе с объемом предшествующих (объединенных) покупок закончится к следующему событию, но сами эти покупки не спровоцированы завершением соответствующего товара
Теперь еще один маркер. Если произошло переключение событий на текущий товар, то есть ранее текущий товар не успевал закончиться, а сейчас именно завершение запаса это-
го товара вызывает событие, то как правило объем покупок этого товара будет больше, чем в то время, когда этот товар не заканчивался. Это приведет к тому, что средняя скорость расхода запаса этого товара подскочит. На рисунке 1 это можно увидеть: в оранжевой ячейке стоит средняя скорость расхода, когда товар еще не успевал закончиться и событие возникало из-за завершения другого товара, а в первой желтой ячейке, следующей за оранжевой, средняя скорость, когда товар успел закончиться к следующему событию. Заметен сильный скачок в средней скорости.
В результате можно построить алгоритм, который из данных покупок двух альтернативных товаров находит моменты, когда происходит переключение события завершения запаса с одного товара на другой, классифицируя все покупки наблюдений между ними как вызванные событием или нет. Но среди данных могут быть такие наблюдения, когда событие пополнения запаса произошло одновременно для обоих товаров. Такое может быть, когда запас продукции обоих товаров закончился в одно и то же время. В данном примере и на рисунке 1 это наблюдение / = 13. Описанный алгоритм отметит только одну из покупок в этом наблюдении как вызванную событием, а надо отметить обе. Тут надо придумать еще какой-нибудь прием и усложнить алгоритм. Но на самом деле ничего страшного не произойдет: не отмеченная покупка всего лишь объединится с предыдущими покупками (в данном случае добавится к сумме Е^У^ и станет 13 элементов), восстановление функции будет происходить по-прежнему корректно, хотя, возможно, с чуть меньшей точностью.
Влияние частоты исходных функций Еще одной проблемой на пути восстановления предпочтений между двумя альтернативными товарами является частота, с которой происходят изменения в исходных функциях. Например, если частота изменения функции предпочтения а (0 очень большая при такой же исходной функции /(^ (рис. 2), то при моделировании описанного в первой части статьи процесса потребления получим данные о моментах времени и объемах пополнения запасов обоих товаров (рисунок 3).
о о 3 2 2 2 2 2 2 2 2 2 2 1—1 2 1 1 1 1 о о 3 2 2 2 2 2 2 2 2 2 2 _ 2 _ _ _ _
1—1 ——1 — — — — — — — — — — ——1 — — — — — — ——1 ——1 — — — — — — — — — — ——1 — — — — — —
1 о о 0 0 1 1_1 о о о о __1 __1 о о о о 1 1 о о о 0 — 1_1 о о о о __1 _ о о о о _ _
— — — — — — — — — — — — — — — — — 2 о1 — — — — — — — — — — — — — — — — — —
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
о о о о оо о о о о о о о о о о о о о о о о о оо о о о о о о о о о о о о о
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
о о о о оо о 1-1 1-1 1-1 1-1 1-1 1-1 2 2 2 2 2 2 о о о о оо о 1-1 1-1 1-1 1-1 1-1 1-1 2 2 2 2 2 2
—ад -границы год - аиад -границы год
Рис. 2. Функция потребности /(£) (шт. в день) и функция предпочтения а(£) (в долях) 82 Известия Кабардино-Балкарского научного центра РАН № 4 (96) 2020
\ Дата Покупки Т1 Покупки Т2 у\/{и+1-и)
1 14.01.2020 1318,76616 1547,60322 69,40875 81,4528 62,76614
2 02.02.2020 917Д8274 1506,3873 38,21595
3 26.02.2020 1398,79943 1516,40492 63,58179 68,9275
4 19.03.2020 1538,7831 922,033225 66,90361 40,0884
5 11.04.2020 799,90115 1514,84836 27,5828 52,23615
6 10.05.2020 1545,90805 998,257094 45,46788 29,3605
7 13.06.2020 1036,57893 1534,95331 28,79386 42,63759
8 19.07.2020 1529Д6087 1008,02514 46,33821 30,54622
9 21.08.2020 986,818351 1503,677 35,24351 53,70275
10 18.09.2020 1516,41045 920,338265 65,93089 40,01471
11 11.10.2020 787,93694 1503,21292 34,25813 65,35708
12 03.11.2020 1550 Д3442 1006,05437 62,00538 40,24217
13 28.11.2020 1478,6705 1553,21437 77,82476 81,74812
14 17.12.2020 917 Д8274 1506,3873 50,9546 83,68818
15 04.01.2021 1528,55748 807,6786 66,45902 35,11646
16 27.01.2021 1444,57903 1515,09394 72,22895 75,7547
17 16.02.2021 929,235144 1547,67486 46,46176 77,38374
18 08.03.2021 1526,60877 801,077074 58,71572 30,81066
19 03.04.2021 1205,61289 1536,71269 37,6754 48,02227
20 05.05.2021 1542,20222 1364,87438 44,06292 38,99641
21 09.06.2021 1190,46123 1505,34523 33,06837 41,81515
22 15.07.2021 1507,94926 1031,75529 45,69543 31,26531
23 17.08.2021 942,574761 1512,23275 33,66338 54,00831
24 14.09.2021 1520,19516 865,922248 63,34146 36,08009
25 08.10.2021 845,0408 1502,70355 35,21003 62,61265
26 01.11.2021 1510,08967 1128,30689 62,9204 47,01279
27 25.11.2021 1521,88442 1367,04902 84,54913 75,94717
Рис. 3. Данные событий пополнения запаса двух альтернативных товаров при высокой частоте изменения функции предпочтения а(р)
В таком наборе данных переключение событий пополнения запаса с одного товара на другой происходит очень часто. Получается так, что чуть ли не каждый раз покупатель выходит из дома, чтобы пополнить запасы другого продукта, не того, который пополнял в прошлый раз. При распознавании событий (к какому товару относится событие завершения запаса, покупки, выделенные сиреневым и желтым цветом), надо учесть дополнительные особенности. Ранее мы получили, что в момент переключения событий завершения запаса на другой товар предполагалось наблюдать резкий скачок (меньший спад) средней скорости расхода продукции по сравнению с предыдущей покупкой, которая была вызвана событием завершения запаса текущего товара (желтой ячейкой). Но у нас тут часто нет предыдущей покупки, которая была вызвана событием (нет желтой ячейки). Однако особых проблем с распознаванием событий все равно не возникает, так как по срав-
нению с предыдущей покупкой, которая не полностью закончилась (оранжевая), каждый раз наблюдается значительный рост. Можно классифицировать события именно по этому значительному росту по сравнению с предыдущей ячейкой.
С классификацией событий из-за частоты изменения функции проблем может не возникнуть, но может возникнуть следующая проблема. Потребитель совершает покупки, пополняя запасы обоих товаров, когда один из товаров закончился. Но объем той покупки, которая была вызвана завершением запаса товара (выделенной сиреневым цветом), не расходуется до следующего события, так как следующее событие вызвано завершением запаса другого товара— В результате надо объединить несколько покупок в одну (на рисунке 3 в одну покупку объединяются все те покупки, которые располагаются от покупки, выделенной сиреневым цветом, до тех, которые выделены оранжевым цветом, объединенные покупки выделены рамкой). В результате будем иметь достаточно мало объединенных покупок. Из этого малого количества объединенных покупок восстановленные функции будут такими, как изображено на рисунке 4.
!60
0
01.01.2020 19.07.2020 04.02.2021 23.08.2021 11.03.2022 27—09—2022 -П -Й -А+£2---ОД -------Г(1)*а1Га(1)----Г(1)*(1-а1Га(1))
Рис. 4. Сравнение восстановленных функций с исходными, высокая частота функции предпочтения а(£)
Функции скорости расхода запаса продукции первого и второго товара /х(0, /2(0 определяются некорректно. Определилась только основная гармоника, которая была заложена в функцию /(0, но не определилась гармоника, которая была заложена в (так как /1(0 = скорость расхода зависит от обеих функций). Дело в том, что вос-
становление функций происходит по интегралам, у^ = Г/1+1 /(0 если на этом периоде
ч
функция часто изменяется, то интеграл показывает суммарное значение, происходит как бы усреднение изменений функции на заданном периоде. Восстановленная по последовательности интегралов функция сможет показать динамику, связанную с изменением самих интегралов, но не способна показать быстрые изменения, которые произошли на каждом
участке интеграла. В результате мы получаем сглаженные скорости расхода продукции первого и второго товара. Чтобы функции восстанавливались корректно, необходимо, чтобы самих событий было больше, то есть чтобы покупатель делал покупки намного чаще, пусть и меньшего объема.
Более высокая частота может быть не только у функции предпочтения, но также и у самой исходной функции потребности /(^ (рис. 5). Однако если количества наблюдаемых покупок (уже после классификации и объединения) достаточно, чтобы объяснить изменения функции, то восстановление происходит относительно корректно (рис— 6)—
-£(1) -границы года -аНа(1;) -границы года
Рис. 5. Функция потребности /(£) (шт. в день) и функция предпочтения а(£) (в долях)
01.01.2020 19.07.2020 04.02.2021 23.08.2021 11.03.2022 27.09.2022 -А -£2 -А+£2---£1)----Г(1)*а1Га(1)----Г(1)*(1-а1Га(1))
Рис. 6. Сравнение восстановленных функций с исходными, высокая частота потребности /(£)
В завершение надо сказать еще несколько слов о распознавании событий, чтобы определить, к какому товару относится завершение запаса. До этого были предложены рекомендации на основе анализа самих ситуаций и процессов, в результате которых происходит событие. Вместо этого можно использовать методы машинного обучения или анализа данных. Для этого надо иметь уже размеченный набор данных, в котором для каждой покупки имеются множество признаков и значения 0 или 1, показывающие, вызвана ли покупка данного товара завершением запаса или нет. В качестве признаков лучше тогда брать не абсолютные значения покупок и даже не абсолютные значения средних скоростей расхода продукции у1 = — ti), а относительное изменение в
средней скорости расхода продукции у(?0 = у1^/у1\_1. Для каждого наблюдения следует использовать последовательность таких признаков, причем не только прошлых, но и будущих, то есть для того, чтобы классифицировать -тое наблюдение, использовать, например, набор признаков У^^-^У^^+х^ч^. Причем по каждому товару для определения, вызвана ли его покупка завершением запаса, лучше использовать набор признаков от обоих товаров. При выборе метода классификации надо учесть то, что появление нулей и единиц может быть вызвано близостью не к одному набору значений признаков, а к нескольким наборам. То есть появление единицы может происходить, когда набор признаков находится либо в одном положении, либо в другом. Другими словами, появление единицы происходит по условию ИЛИ (когда набор признаков близок к одному состоянию либо близок к другому состоянию). В этом случае метод логистической регрессии, в котором строится гиперплоскость, разделяющая пространство признаков на две части и расстояние до которой символизирует вероятность появления единицы или нуля, может не подходить (наблюдения могут быть линейно неразделимы или они будут некорректно разделяться). Какой из методов классификации подходит лучше всего, нужно проводить дополнительное исследование, но нейронные сети из-за своей универсальности должны справляться с этой задачей.
В итоге классификацию можно выполнить либо вручную, самостоятельно анализируя исходные данные, либо воспользовавшись методами машинного обучения. Далее, применяя метод восстановления функции по интегралам, можно получить функцию скорости расхода каждого товара и определить динамику изменения предпочтений потребителя между двумя альтернативными товарами. Даже если классификация будет осуществляться с погрешностью, т.е. небольшая часть наблюдений будет неправильно классифицирована, восстановить функции все равно получится, но с большей погрешностью.
Заключение
Данная статья является продолжением первой части исследования, в котором был разработан механизм восстановления динамики изменения предпочтения между двумя альтернативными товарами. В статье разбирается схема образования событий пополнения запаса, в которой потребитель пополняет запасы как первого, так и второго товара, если закончились запасы любого из товаров. Для успешного восстановления предпочтений необходимо предварительно произвести классификацию событий и распознать завершением запаса какого товара вызвано событие пополнения запаса. Это распознавание можно осуществить, анализируя среднюю скорость расхода товара, отслеживая скачки и падения этой средней скорости. Можно использовать машинное обучение для решения задачи
классификации, при этом входным признаком должен являться вектор относительных значений изменения средней скорости.
Восстановление динамики изменения предпочтения между двумя альтернативными товарами из данных редких событий (покупок) может быть полезно маркетологам, так как не надо будет производить анкетирование и опросы населения. Обычно анкетирование ограничивается несколькими тысячами опрашиваемых людей, тогда как покупки совершают миллионы. Конечно, это восстановление предпочтений из данных покупок будет возможно только для тех товаров, для которых эти данные покупок есть. Не получится восстановить предпочтение по данным для того товара, данных которого вообще нет. В этом случае без анкетирования и опроса граждан не обойтись. А там, где такие данные есть, можно получить ценные для прикладных наук ранее не выявленные закономерности. Вопрос: можно ли воспользоваться этим же подходом для анализа изменения предпочтений между тремя, четырьмя (и т.д.) товарами? Скорее всего, можно, но надо отдельно проводить исследование на эту тему.
ЛИТЕРАТУРА
1. Кораблев Ю.А. Моделирование и восстановление предпочтений покупателей между двумя альтернативными товарами с помощью емкостного метода анализа редких событий в экономике (часть 1) // Известия Кабардино-Балкарского научного центра РАН. Нальчик: Известия КБНЦ РАН. 2020. № 3(95). С. 74-91.
2. Кораблев Ю.А. Емкостный метод определения функции скорости потребления // Экономика и менеджмент систем управления. Воронеж: Изд-во «Научная книга». 2015. № 15(1.1). С. 140-150.
3. Кораблев Ю.А. Метод восстановления функции по интегралам для анализа и прогнозирования редких событий в экономике // Экономика и математические методы. 2020. № 3 (в печати).
REFERENCES
1. Korablev Yu.A. Modelirovaniye i vosstanovleniye predpochteniy pokupateley mezhdu dvumya al'ternativnymi tovarami s pomoshch'yu yemkostnogo metoda analiza redkikh sobytiy v ekonomike (chast' 1) [Modeling and restoration of customer preferences between two alternative products using the capacitive method of analysis of rare events in the economy (part 1)] // News of the Kabardino-Balkarian Scientific Center of the Russian Academy of Sciences. Nalchik: Bulletin of the KBSC RAS. 2020. No. 3 (95). Pp. 74-91.
2. Korablev Yu.A. Yemkostnyy metod opredeleniya funktsii skorosti potrebleniya // Ekonomi-ka i menedzhment sistem upravleniya [Capacitive method for determining the consumption rate function. "Economics and management systems management"]. Voronezh: Scientific Book Publishing House. 2015. No.15 (1.1). Pp. 140-150.
3. Korablev Yu.A. Metod vosstanovleniya funktsii po integralam dlya analiza i prognoziro-vaniya redkikh sobytiy v ekonomike [A method of recovering a function by integrals for analysis and forecasting of rare events in the economy] // Economics and Mathematical Methods. 2020. No. 3 (in press).
MODELING AND RESTORATION OF CUSTOMER PREFERENCES BETWEEN TWO ALTERNATIVE PRODUCTS USING THE CAPACITY METHOD OF RARE EVENTS ANALYSIS IN THE ECONOMY* (Part 2)
Yu.A. KORABLEV
Financial University under the Government of the Russian Federation (Finuniversity) 125993, Russia, Moscow, Leningradsky prospect, 49 Email: academy@fa.ru
The article proposes an approach for classifying the consumer's stock completion events from the purchases data of two alternative goods if purchases occur when any of the goods is out of stock. Such event recognition is necessary to further restoration of the dynamics of changes in consumer preferences between the two products, which is carried out using the capacity method of rare events analysis. To determine whether the purchase has occurred due to the completion of the stock or not, observation of the average rate of products consumption helps. This article describes to what attention should be paid in the process of this recognition.
Keywords: rare events, capacitive method, consumption rate, recovery, preference, alternative products, recognition, classification.
Работа поступила 27.04.2020 г.
Сведения об авторе:
Кораблев Юрий Александрович, к.э.н., доцент кафедры «Системный анализ в экономике» Финансового университета при Правительстве Российской Федерации (Финуниверситет).
125993, г. Москва, Ленинградский проспект, 49.
Тел. 8-916-882-72-43.
E-mail: yura-korablyov@yandex.ru
Information about the author:
Korablev Yuri Alexandrovich, Ph.D., Associate Professor, Financial University under the Government of the Russian Federation (Finuniversity), Department of System Analysis in Economics.
125993, Moscow, Leningradsky prospect, 49.
Ph. 8-916-882-72-43.
Email: yura-korablyov@yandex.ru
* The article was prepared based on the results of studies carried out at the expense of budgetary funds on the state assignment of the Financial University of 2020