ЭКОНОМИКА, УПРАВЛЕНИЕ И УЧЕТ НА ПРЕДПРИЯТИИ ECONOMICS, MANAGEMENT AND ACCOUTING A FIRM
УДК : 658.562.3:004.89 DOI: 10.18413/2409-1634-2021-7-1-0-8
1 Герасименко O.A.,
2 Казыбаева A.M.
Geodata mining - технология интеллектуального анализа пространственных данных_
1 Белгородский государственный национальный исследовательский университет
ул. Победы, 85, г. Белгород, 308015, Россия
2 Алматинский Университет Менеджмента, Программ-лидер ОП «Маркетинг»,
ул. Розыбакиева 227, Алматы, 050060, Республика Казахстан
e-mail: [email protected], [email protected]
Аннотация
В статье исследованы особенности обработки пространственных данных и их роль в формировании стратегических ориентиров планирования открытия компании. Предложено использовать термин GeoData mining в геомаркетинге, как сбор извлечения пространственных данных; показаны приниципальные различия научной методологии GeoData mining и Data mining. Обобщены укрупненные блоки пространственной информации при создании банка данных GeoData mining. На примере открытия магазинов рыбалки в г. Белгороде раскрыты этапы преобразования информации и потенциальные географические территории для пула объектов недвижимости.
Ключевые слова: стратегическое маркетинговое управление, интеллектуальный анализ, геомаркетинг, пространственные данные.
Информация для цитирования: Герасименко О.А., Казыбаева А.М. Geodata mining - технология интеллектуального анализа пространственных данных в области геомаркетинга / Научный результат. Экономические исследования. 2021. Т. 7. № 1. С. 71-79. DOI: 10.18413/2409-1634-2021-7-1-0-8
1 Olga A. Gerasimenko,
2 Ayman M. Kazybayeva
Geodata mining - a technology of intellectual analysis of spatial data_
1 Belgorod State National Research University, 85 Pobedy St., Belgorod, 3G8G15, Russia 2 Almaty University of Management, Programme-Leader OP "Marketing", 227 Rozybakiev St., Almaty, 050060, Republic
of Kazakhstan
e-mail: [email protected], [email protected]
Abstract
The article examines the features of spatial data processing and their role in the formation of strategic guidelines for planning a company opening. It is proposed to use the term GeoData mining in geomarketing, as a collection of extraction of spatial data; the authors demonstrate the municipal differences in the scientific methodology of GeoData mining and Data mining. The enlarged blocks of spatial information are generalized when creating the GeoData mining databank. Using the example of opening fishing shops in Belgorod, the stages of information transformation and potential geographic territories for a pool of real estate objects are summarized.
Key words: strategic marketing management; data mining; geomarketing; spatial data
Information for citation: O.A. Gerasimenko, A.M. Kazybayeva, "Geodata mining -a technology of intellectual analysis of spatial data in the field of geomarketing", Research Result. Economic Research, 2021; 7(1), 71-79, DOI: 10.18413/2409-16342021-7-1-0-8
Введение
Стратегическое маркетинговое
управление - один из основных инструментов изучения и анализа процессов, происходящих в маркетинговой среде. Процессы, как правило, сопряжены с обработкой большого количества разнородных данных, получаемых в результате анкетировании и опросов; в результате изучения динамики каких-либо показателей исследуемого процесса или явления; в результате анализа документов [Шилина М.Г., Левченко В.Ю., 2014]. Совершенствование инструментов сбора информации приводит к тому, что объем данных постоянно увеличивается [Качалов Д.Л., Мишустин А.В., Фархадов М.П., 2017]. Неоднородную, зачастую неструктурированную, быстро поступающую информацию обработать традиционными методами математической статистики становится затруднительно. Необходимо внедрять в практику геомаркетинговых исследований новые технологии обработки и анализа больших массивов разнородных пространственных данных. Систематизируем требования, предъявляемые к этим геомаркетинговым технологиям [Шайтура С.В., 2015; Tsvetkov V.Ya., 2013, 2014]:
• понятность в тиражировании и апробации маркетологами, которые не являются специалистами в области матема-
тического моделирования, искусственного интеллекта и программирования;
• возможность обработки больших объемов как структурированных, так и слабо структурированных и неструктурированных данных, представленных в разных шкалах;
• возможность поиска в массиве первичной информации, новых выводов и закономерностей, поддающихся интерпретации и имеющих практическое значение для решения задачи.
Они позволят повысить как эффективность обработки информации, полученной в результате исследований, так и научную обоснованность получаемых выводов и рекомендаций [Фомина Е.В., 2020]. Таким образом, внедрение современных методов обработки пространственных данных в геомаркетинговую практику является актуальной задачей.
Цель работы исследование узких мест и потенциальных перспектив геомаркетинговых решений стратегической обработки пространственных данных, получаемых в результате интеллектуального анализа GeoData mining, возможность тиражирования на практическом примере.
До 2000-х годов проблема академического исследования пространственных данных имела фрагментарный характер, бизнес-структуры и теоретических иссле-
дования не нуждались в методологическом исследовании. В 2008 г. Клиффорд Линч впервые ввел понятие «большие данные» в научном журнале «Nature», в этот период именно терминологическое определение пространственных данных и Big Data представлялось как синонимы. Практическое применение и тиражирование пространственных данных приходится на 2010 г. в научных публикациях Марц Натан и Уоррен Джеймс [Марц Н., Уоррен Д., 2017].
Научное исследование проведено с использованием следующих методов:
• прогноз, построение математических моделей (инструменты реализации -дерево решений, построение алгоритмов, математической логики, искусственный интеллект);
• статистические, математические методы (корреляционно-регрессионый анализ, анализ временных рядов, компаративный анализ).
Основная часть
Анализ пространственных данных в области геомаркетинга - это обобщенное понятие совокупности технологий (извлечение ранее неизвестных, доступных, полезных информационных источников), для принятия стратегических решений в области бизнес-структур. В научных источниках наиболее встречаемым является понятие Data mining [Berry M.J., Linoff G., 1997], в дальнейшем это сужает проблемное поле исследования. В области геомаркетинга, как инструменте стратегического планирования, авторами предложено использовать термин GeoData mining, позволяющий значительно расширить горизонты научного поля. Среди основных интеллектуально-математических инструментов GeoData mining выделим:
• метод анализа;
• коррелятивный анализ - поиск скрытых зависимостей и связей, выстраивание новых функций, показателей;
• импакт-анализ;
• факторный анализ - группировка пространственных данных по блокам: мар-
кетинговые, географические, доходность бизнеса.
Под пространственными данными в GeoData mining понимается информация об объектах, информационной платформой выступают геоданные (ГИС, маркетинговые исследования, Wi-Fi радары и пр.) [Омельченко А.С., 2006; Цветков В.Я., Домницкая Э.В., 2008]. Дополнительными информационными каналами являются результаты экономического, географического, маркетингового, отраслевого анализа. Пространственные данные GeoData Mining - это комплекс данных, обобщенных информационным ресурсом [Савиных В.П., Цветков В.Я., 2014]. Обратим внимание, что в области геомаркетинга пространственные данные связаны с процессом извлечения информации (вырезка пространственно ограниченной части объекта исследования). GeoData mining - это процесс автоматического поиска больших объемов данных для заданных моделей. В процессах поиска GeoData mining использует вычислительные методы, распознавание образов и методы искусственного интеллекта. Именно поэтому технологию GeoData mining в геомаркетинге относят к технологиям извлечения знаний и называют технологией интеллектуального анализа. Технология Data mining данных может быть определена как «нетривиальный извлечения явных, ранее неизвестных и потенциально полезной информации из данных» [Frawley W., Piatetsky-Shapiro G., Matheus C., 1992] и «наука извлечения полезной информации из больших массивов данных или базы данных» [Hand D., Mannila H., Smyth P., 2001]. Хотя этот термин обычно используется по отношению к анализу данных, тем не менее, большую роль в нем играет искусственный интеллект, что дает основание разграничивать сбор пространственных данных и GeoData mining. Определим различия в сфере применения Data mining и GeoData mining:
• технологические условия: в Data mining при добыче данных итогом является получение новой формы и технологии данных, в GeoData mining - применение и
использование инструмента интеллектуального анализа (получение иных форм пространственных знаний);
• структурные условия: в Data Mining - это совокупность общего числа всех данных, в GeoData mining - это совокупность пространственных данных мар-кеингового и географического характера (передвижение клиентов, загруженность транспортных магистралей, число объектов инфраструктуры и пр.);
• отраслевые условия: в Data Mining -описание любой предметной области (биология, медицина, физика и пр.), в GeoData mining - конкретизация пространственных
явлении, процессов и отношении, совокупность категорий «место», время», «тема». Категория «место» с точки зрения географических особенностей является устоичивои, постояннои, а «время» и «тема» - перманентными, в зависимости от объекта научного исследований. Глобальная устойчивость характеристики «место» и послужила основой интеграции других видов информации на этой основе.
Обобщим структурные блоки пространственной информации, используемой при проведении геомаркетинговых исследований в таблице.
Таблица
Структура аналитической информации, используемой при создании банка пространственных данных GeoData Mining
Table
The structure of analytical information used to create the GeoData Mining spatial data bank
Характеристика пространственных данных Источники информационных потоков Тип хранения пространственных данных
Данные дискретных маркетинговых наблюдений (первичные)
Результаты опросов различных стейкхолдеров (клиенты, представители бизнес-структур, органов региональной и муниципальной власти), интервьюирование, маркетинговые данные фокус-групп и др. Организации, занимающиеся консалтинговыми исследованиями, инициативные центры, Департаменты региональных цифровых исследований Полевые маркетинговые, социологические исследования, скиншоты, фотоснимки и др.
Форма обработки первичных маркетинговых данных
Результаты маркетинговых исследований (анкетирование, опросы, эксперименты), информация, представляемая мобильными компаниями (передвижение клиентов, тепловые карты), инструменты ГИС-анализа, статистические источники информации, отчеты отраслевых исследований и др. Архивы консалтинговых агентств, маркетинговые лаборатории, статистические отделы Карты географического содержания, текстовые и Excel файлы, математические модели, объекты интеллектуальной собственности, ПО
Результаты геомаркетинговых исследований
Результаты научных исследований (модель, механизм, концепция, методологический контур), географические карты с результатами потенциальных к отрытию адресов, гипертекстовые описания, научные публикации Учреждения высшего образования, компании мобильных телесистем, консалтинговые агентства, представители бизнес-структур Научные публикации, цифровые карты, методические рекомендации, учебные пособия
Уточнение информации в результате маркетинговой разведки
Уточненные характеристики - маркетинговая разведка (качество товара, обслуживания) Отдельные предприниматели, союзы предпринимателей Текстурно-структурные показатели
Представим этапы получения и преобразования пространственной информации в GeoData Mining (рис. 1):
• получение контакта с информационным источником и сбор первичных данных;
• обработка данных;
• ранжирование, классификация данных;
• наглядное представление пространственных данных на географической карте.
Маркетинговые/ социологические исследования
Получение данных
Обработка данных
Карта исследуемой территории
\
Классификация данных по событиям Отображение событий
Сторонние системы обработки и отображения данных
Наборы данных, разбитые по критериям
Рис. 1. Этапы преобразования пространственных данных Fig. 1. Stages of transforming spatial data
Апробацию этапов представим на примере магазинов рыбалки, прланируе-мых к открытию на территории г. Белгорода. На первом этапе авторами был установлен источник первичной информации, занимающийся данным бизнесом в г. Белгороде и г. Новый Оскол с опытом более 20 лет. Среди первичных данных обработаны следующие результаты:
Основными потребителями являются мужчины в возрасте 20-80 лет, женщины в возрасте 20-50 лет с частотой покупки 1 раз в неделю. Площадь помещения для от-рытия магазина рыбалки должна быть не менее 20 м , ассортиментный ряд не менее 10 000 позиций. Число магазинов рыбалки в г. Белгороде составляет 33 (рис. 2). Источником является информация из Яндекс-карт.
Первичные данные, хранятся, как правило, в необработанным виде, удобном для пользования авторами. Наиболее важ-
ной определена следующая геопространственная информация, котрая в дальнейшем является основанием для оптимального местоположения объектов бизнеса:
• ключевыми географическими факторами выступают - наличие парковки, большая часть клиентов добирается на автомобиле, центр города не всегда может обеспечить сочетание данных факторов. Следовательно, территориальные границы для открытия магазина рыбалки смещены в районы второй и третьей линии города (с более низкой арендной ставкой);
клиенты готовы преодолевать расстояния до магазинов рыбалки при условии, что сервис и качество обслуживания представлены на достаточно высоком уровне. Основным фактором соблюдения данного условия является наличие компетентного продавца-консультанта (мужчина).
Рис. 2. Наглядное представление географических локаций магазинов рыбалки в г. Белгород Fig. 2. A visual representation of the geographical locations of fishing shops in Belgorod
Сообщения о дорожном движении и транспортной ситуации в районе исследования сохраняются в базе данных [Ляпин А.М., 2018]. На рис. 3 представлены потенциальные географические районы г. Белгорода (Левобережье, Крейда, Сави-но, Салют) характеризующиеся более низкой арендной ставкой и готовностью кли-
ентов преодолевать расстояние до торгового объекта (площадь 20 м2).
GeoData Mining является мультидис-циплинарной областью, встраивающийся и развивающейся на базе достижений прикладной статистики, распознавания образов, маркетинговых исследований, методов искусственного интеллекта, теории баз данных и др.
Рис.3. Территориальное распределение стоимости арендной платы коммерческих объектов
г. Белгорода
Fig. 3. Territorial distribution of the cost of rent for commercial objects in Belgorod
Заключение
Современные вызовы внешней и внутренней среды компании формирую принципиально новые инструменты для обработки пространственных данных. Перспективным элементом в выборе оптимального местоположения явлется использование обработки информации GeoData mining. GeoData mining позволяет с использованием технологии интеллектуального анализа (сочетание группы инструментов - импакт-анализ, корреляционный анализ, факторный анализ) более качественно обрабатывать группы маркетинговых и бизнес-блоков. Методологическими предпосылками внедрения GeoData mining выступают возможность извлечения и обработки большого массива пространственных данных, апробация и тира-живания консалтинговыми команиями, качественная интерпретация превичных данных. Структурными блоками аналитической информации создания банка пространственных данных GeoData Mining яв-
ляются: данные маркетинговых исследований, обработка первичных маркетинговых данных, результаты геомаркетинговых исследований, маркетинговая разведка. Результаты апробация этапов преобразования пространственных данных GeoData mining представлены на примере магазинов рыбалки г. Белгорода (сегментирование клиентов, наличие траспортных средств передвижения, обустроенность инфраструктурных, городских объектов), как интеллектуальных анализ перспективных районов для открытия объектов торговли [Герасименко, О.А., Авилова, Ж.Н., 2016, Тхориков, Б.А., Ломовцева, О.А., Герасименко, О.А., Саблина, О.М., Титова, И.Н., 2020, Tkhorikov B.A., 2011, Тхориков Б.А., 2012].
Список литературы
1. Герасименко О.А., Авилова Ж.Н., 2016. Ключевые бизнес-компетенции как экономическая категория. Вестн. Белгород. гос. технол. ун-та им. В. Г. Шухова, 2016, № 6: 273-277.
2. Качалов Д.Л., Мишустин А.В., Фар-хадов М.П., 2017. Современные методы обработки больших данных в крупномасштабных системах. Математические модели современных экономических процессов, методы анализа и синтеза экономических механизмов. Актуальные проблемы и перспективы менеджмента организаций в России: материалы XI Всерос. науч.-практ. конф. Самар. науч. центр РАН. Самара, 2017: 65-71.
3. Ляпин А.М., 2018. Методика сбора и интеллектуального анализа коротких сообщений из сети интернет с целью выявления внештатных ситуаций в дорожно-транспортной инфраструктуре. Известия высших учебных заведений. Поволжский регион. Технические науки, 2018, № 2 (46): 27-36.
4. Марц Н., Уоррен Д., 2017. Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном времени. М.: Вильямс, 2017: 68.
5. Омельченко А.С., 2006. Геоданные как инновационный ресурс. Качество, инновации, образование, 2006, № 1.: 12-14.
6. Савиных В.П., Цветков В.Я., 2014. Геоданные как системный информационный ресурс. Вестник Российской Академии Наук. Том 84. № 9: 826-829. DOI: 10.7868/S0869587314090278.
7. Тхориков Б.А., Ломовцева О.А., Герасименко О.А., Саблина О.М., Титова, И.Н., 2020. Геомаркетинг - новый коннцепт или прикладной инструмент бизнеса? Вестн. Томск. гос. ун-та. Экономика. № 49. С. 199213.
8. Тхориков Б.А., 2012. Проектное управление в ЛПУ: опыт Белгородской области. Здравоохранение. № 7. С.28-32.
9. Фомина Е.В., 2020. Применение аппарата нейронных сетей для анализа результатов анкетирования. Вестник ПНИПУ. Социально-экономические науки, 2020, № 2: 99110.
10.Цветков В.Я., Домницкая Э.В., 2008. Геоданные как основа цифрового моделирования. Современные наукоёмкие технологии, 2008, № 4: 100-101.
11. Шайтура, С.В. 2015. Интеллектуальный анализ геоданных. Перспективы науки и образования. № 6 (18): 24-30.
12. Шилина, М.Г., Левченко, В.Ю. 2014. BIG DATA, OPEN DATA, LINKED DATA, ме-
таданные в PR: актуальные модели трансформации теории и практики. Медиаскоп. № 1: 16.
13.Berry M.J., Linoff G., (1997). Data mining techniques: for marketing, sales, and customer support. John Wiley & Sons, Inc., 1997.
14.Frawley W., Piatetsky-Shapiro G., Matheus C., (1992). Knowledge Discovery in Databases: An Overview. AI Magazine. Fall, 1992: 213-228.
15.Hand D., Mannila H., Smyth P., (2001). Principles of Data Mining. MIT Press, Cambridge, MA., 2001.
16.Tkhorikov, B.A., 2011.Technology of municipal public heath service assessment. European Researcher. №. 11 (14). P.1554-1556.
17. Tsvetkov V.Ya., (2014). Information field. Life Science Journal. № 11 (5): 551-554.
18.Tsvetkov V.Ya., (2013). Information interaction as a Mechanism of Semantic Gap Elimination. European Researcher. Vol. 45, № 41: 782786.
Resources
1. Berry M.J., Linoff G., (1997). Data mining techniques: for marketing, sales, and customer support. John Wiley & Sons, Inc. (in USA), 1997.
2. Gerasimenko O.A., Avilova Zh.N., (2016). Key business competencies as an economic category // Vestn. Belgorod. state technol. un-ta them. V.G. Shukhov. 2016. № 6: 273-277. (in Russian)
3. Fomina E.V., (2020). Application of the apparatus of neural networks for the analysis of survey results. PNRPU Bulletin. Socioeconomic sciences, 2020. №. 2: 99-110. (in Russian)
4. Frawley W., Piatetsky-Shapiro G., Matheus C., (1992). Knowledge Discovery in Databases: An Overview. AI Magazine. Fall,1992: 213-228. (in USA)
5. Hand D., Mannila H., Smyth P., (2001). Principles of Data Mining. MIT Press, Cambridge, MA. (in USA), 2001.
6. Kachalov, D.L., Mishustin, A.V., Far-hadov, M.P. 2017. Modern methods of processing big data in large-scale systems. Mathematical models of modern economic processes, methods of analysis and synthesis of economic mechanisms. Actual problems and prospects of management of organizations in Russia: materials of the XI All-Russian. scientific-practical conf. Sa-
mar. scientific. center of RAS. Samara, 2017: 6571. (in Russian)
7. Lyapin A.M., (2018). Methods for collecting and intelligent analysis of short messages from the Internet in order to identify emergency situations in the road transport infrastructure. Proceedings of higher educational institutions. Volga region. Technical science. №2 (46): 27-36. (in Russian)
8. Martz N., Warren D., (2017). Big Data. Principles and practice of building scalable real-time data processing systems. M .: Williams, 2017: 368 (in USA)
9. Omelchenko, A.S. 2006. Geodata as an innovative resource. Quality, innovation, education, 2006, №1:12-14. (in Russian)
10. Savinykh V.P., Tsvetkov V.Ya., (2014). Geodata as a system information resource. Bulletin of the Russian Academy of Sciences. Volume 84. №9. Pp.826-829. DOI: 10.7868 / S0869587314090278. (in Russian)
11. Shilina M.G., Levchenko V.Yu., (2014). BIG DATA, OPEN DATA, LINKED DATA, metadata in PR: current models of transformation of theory and practice. Media scope, 2014, №1: 16. (in Russian)
12. Shaytura S.V., (2015). Intelligent analysis of geodata. Prospects for Science and Education. №6 (18): 24-30. (in Russian)
13. Tkhorikov B.A., Lomovtseva O.A., Gerasimenko O.A., Sablina O.M., Titova I.N., (2020). Geomarketing - a new concept or an applied business tool? // Vestn. Tomsk. state un-that. Economy. №49: 199-213. (in Russian)
14. Tkhorikov B.A., (2011). Technology of municipal public health service assessment // European Researcher. №11 (14): 1554-1556. (in Russian)
15. Tkhorikov B.A., (2012). Project management in health care facilities: the experience of
the Belgorod region. Healthcare. 2G12. №7: 2832. (in Russian)
16. Tsvetkov. V.Ya., (2G14). Information field. Life Science Journal, 2014, №11 (5): 551554. (in Russian)
17.Tsvetkov V.Ya., (2G13). Information interaction as a Mechanism of Semantic Gap Elimination. European Researcher, 2G13, Vol.45, №41:782-78б. (in Russian)
18. Tsvetkov V.Ya., Domnitskaya E.V. (2GG8). Geodata as the Basis for Digital Modeling. Modern high technologies, 2008, №4:100-1G1. (in Russian)
Информация о конфликте интересов:
авторы не имеют конфликта интересов для декларации.
Conflicts of Interest: the authors have no conflict of interest to declare.
Герасименко Ольга Александровна,
доцент, кандидат экономических наук, доцент кафедры менеджмента и маркетинга Института экономики и управления НИУ «БелГУ», (г. Белгород, Россия)
Gerasimenko Olga Aleksandrovna, Associate Professor, Candidate of Economic Sciences, Associate Professor at the Department of Management and Marketing, Institute of Economics and Management, Belgorod State National Research University (Belgorod, Russia)
Казыбаева Айман Мелисовна, доцент, кандидат экономических наук, Алматинского Университета Менеджмента, (г. Алматы, Республика Казахстан)
Kazybayeva Ayman Melisovna, Associate Professor, Candidate of Economic Sciences, Almaty University of Management, (Almaty, Republic of Kazakhstan)