Научная статья на тему 'АЛГОРИТМ ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ ПРОГНОЗИРОВАНИЯ РАЗВИТИЯ ТЕХНОЛОГИЙ НА ПРИМЕРЕ ТЕЛЕ- И РАДИОВЕЩАНИЯ'

АЛГОРИТМ ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ ПРОГНОЗИРОВАНИЯ РАЗВИТИЯ ТЕХНОЛОГИЙ НА ПРИМЕРЕ ТЕЛЕ- И РАДИОВЕЩАНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
50
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕЛЕ- И РАДИОВЕЩАНИЕ / ПАРСИНГ / ПАТЕНТ / ПОСТРОЕНИЕ ВРЕМЕННЫХ РЯДОВ / ПРОГНОЗИРОВАНИЕ РАЗВИТИЯ ТЕХНОЛОГИЙ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Коробкин Д.М., Фоменков С.А., Верещак Г.А., Сороко М.А.

В настоящее время российские компании, производящие программное и аппаратное обеспечение для теле- и радиовещания, могут почерпнуть информацию о мировых новинках и тенденциях в сфере своей деятельности в профильной научно-популярной литературе (журналах, дайджестах), на официальных сайтах зарубежных конкурентов, а также на выставках и презентациях. Однако именно возможность всесторонне проанализировать новинки зарубежных разработчиков, запатентованных в мировых патентных базах, даст российским компаниям конкурентные преимущества при формировании стратегических планов развития. Предлагается сформировать патентный ландшафт на основе данных мирового патентного массива (на английском языке) в области теле- и радиовещания, проанализировать патентные тренды и спрогнозировать развитие технологий в данной области. Новизна разработанного метода прогнозирования развития технологий заключается в кооперации методов кластеризации патентов USPTO (США) на основе международной патентной классификации и прогнозирования технологических трендов посредством сформированных временных рядов. Разработанный метод программно реализован на языке Python, при распараллеливании процесса парсинга патентов использована библиотека Multiprocessing, для анализа данных и проведения процесса прогнозирования - Statsmodels, для визуализации данных - Matplotlib. Для организации хранения информации была выбрана система управления базами данных MySQL. Обработано 28 591 патентов, проведено тестирование процесса прогнозирования развития теле- и радиотехнологий на основе построенных временных рядов на интервале 2015-2020 гг.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Коробкин Д.М., Фоменков С.А., Верещак Г.А., Сороко М.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INFORMATION PROCESSING ALGORITHM FOR FORECASTING DEVELOPMENT OF TECHNOLOGIES ON EXAMPLE OF TELEVISION AND RADIO BROADCASTING

Today, many Russian companies working in the field of software development for television and radio broadcasting can extract the necessary data on trends in their field of activity by analyzing information received from foreign competitors, for example, studying specialized popular science literature posted on the official websites of foreign competitors, when analyzing information obtained from exhibitions and presentations. However, the opportunity to comprehensively analyze the novelties of foreign developers patented in the world patent databases will give Russian companies competitive advantages in the formation of strategic development plans. It is proposed to develop a patent landscape based on the data of the global patent array (in English) in the field of television and radio broadcasting, analyze patent trends and predict the development of technologies in this area. The novelty of the developed method for predicting the development of technologies lies in the cooperation of USPTO (USA) patent clustering methods based on the international patent classification and forecasting technological trends using the generated time series. The developed method is implemented in Python; in parallelizing the process of parsing patents, the Multiprocessing library was used, Statsmodels was used to analyze data and carry out the forecasting process, and Matplotlib was used to visualize data. The MySQL database management system was chosen to organize information storage. There were processed 28,591 patents, the process of forecasting the development of television and radio technologies was tested based on the constructed time series in the interval of 2015-2020.

Текст научной работы на тему «АЛГОРИТМ ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ ПРОГНОЗИРОВАНИЯ РАЗВИТИЯ ТЕХНОЛОГИЙ НА ПРИМЕРЕ ТЕЛЕ- И РАДИОВЕЩАНИЯ»

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2023. N. 3 ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Computer engineering and software

Научная статья УДК 004.853

https://doi.org/10.24143/2072-9502-2023-3-87-96 EDN RTAQDX

Алгоритм обработки информации для прогнозирования развития технологий на примере теле- и радиовещания

Дмитрий Михайлович Коробкинн, Сергей Алексеевич Фоменков, Григорий Алексеевич Верещак, Михаил Алексеевич Сороко

Волгоградский государственный технический университет, Волгоград, Россия, dkorobkin80@mail.ruH

Аннотация. В настоящее время российские компании, производящие программное и аппаратное обеспечение для теле- и радиовещания, могут почерпнуть информацию о мировых новинках и тенденциях в сфере своей деятельности в профильной научно-популярной литературе (журналах, дайджестах), на официальных сайтах зарубежных конкурентов, а также на выставках и презентациях. Однако именно возможность всесторонне проанализировать новинки зарубежных разработчиков, запатентованных в мировых патентных базах, даст российским компаниям конкурентные преимущества при формировании стратегических планов развития. Предлагается сформировать патентный ландшафт на основе данных мирового патентного массива (на английском языке) в области теле- и радиовещания, проанализировать патентные тренды и спрогнозировать развитие технологий в данной области. Новизна разработанного метода прогнозирования развития технологий заключается в кооперации методов кластеризации патентов USPTO (США) на основе международной патентной классификации и прогнозирования технологических трендов посредством сформированных временных рядов. Разработанный метод программно реализован на языке Python, при распараллеливании процесса парсинга патентов использована библиотека Multiprocessing, для анализа данных и проведения процесса прогнозирования - Statsmodels, для визуализации данных - Matplotlib. Для организации хранения информации была выбрана система управления базами данных MySQL. Обработано 28 591 патентов, проведено тестирование процесса прогнозирования развития теле-и радиотехнологий на основе построенных временных рядов на интервале 2015-2020 гг.

Ключевые слова: теле- и радиовещание, парсинг, патент, построение временных рядов, прогнозирование развития технологий

Благодарности: исследование выполнено за счет гранта Российского научного фонда № 22-21-20125, https://rscf.ru/project/22-21-20125/ , и Администрации Волгоградской области.

Для цитирования: Коробкин Д. М., Фоменков С. А., Верещак Г. А., Сороко М. А. Алгоритм обработки информации для прогнозирования развития технологий на примере теле- и радиовещания // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2023. № 3. С. 87-96. https://doi.org/10.24143/2072-9502-2023-3-87-96. EDN RTAQDX.

Original article

Information processing algorithm for forecasting development of technologies on example of television and radio broadcasting

Dmitriy M. KorobkinM, Sergey A. Fomenkov, Grigoriy A. Vereschak, Mikhail A. Soroko

Volgograd State Technical University, Volgograd, Russia, dkorobkin80@mail.ruB

Abstract. Today, many Russian companies working in the field of software development for television and radio broadcasting can extract the necessary data on trends in their field of activity by analyzing information received from foreign competitors, for example, studying specialized popular science literature posted on the official websites of foreign competitors, when analyzing information obtained from exhibitions and presentations. However, the opportunity to comprehensively analyze the novelties of foreign developers patented in the world patent databases will give Russian companies competitive advantages in the formation of strategic development plans. It is proposed to develop

© Коробкин Д. M., Фоменков С. А., Верещак Г. А., Сороко М. А., 2023

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2023. № 3

ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Компьютерное обеспечение и вычислительная техника

a patent landscape based on the data of the global patent array (in English) in the field of television and radio broadcasting, analyze patent trends and predict the development of technologies in this area. The novelty of the developed method for predicting the development of technologies lies in the cooperation of USPTO (USA) patent clustering methods based on the international patent classification and forecasting technological trends using the generated time series. The developed method is implemented in Python; in parallelizing the process of parsing patents, the Multiprocessing library was used, Statsmodels was used to analyze data and carry out the forecasting process, and Matplotlib was used to visualize data. The MySQL database management system was chosen to organize information storage. There were processed 28,591 patents, the process of forecasting the development of television and radio technologies was tested based on the constructed time series in the interval of 2015-2020.

я &

Я «

Я

о ч о я

а к я я

ч я я я

-ея я я и

H

я а

и о а о О

И

о

Keywords: television and radio broadcasting, parsing, patent, constructing time series, forecasting development of technologies

Acknowledgment: the study was supported by the grant from the Russian Science Foundation No. 22-21-20125, https://rscf.ru/project/22-21-20125/, and under support of the Administration of the Volgograd Region.

For citation: Korobkin D. M., Fomenkov S. A., Vereschak G. A., Soroko M. A. Information processing algorithm for forecasting development of technologies on example of television and radio broadcasting. Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2023;3:87-96. (In Russ.). https://doi.org/10.24143/2072-9502-2023-3-87-96. EDN RTAQDX.

Введение

В настоящее время российские компании, производящие программное и аппаратное обеспечение для теле- и радиовещания, могут почерпнуть знания о мировых новинках и тенденциях в сфере своей деятельности в профильной научно-популярной литературе (журналах, дайджестах), а также на основе сведений официальных сайтов зарубежных конкурентов, информации с выставок и презентаций.

Возможность всесторонне проанализировать разработки зарубежных конкурентов может дать российским компаниям конкурентные преимущества при формировании стратегических планов развития. В связи с этим актуальной проблемой является автоматизация сбора, прогнозирования и визуализации статистических и прогнозных данных о развитии технологий в области теле- и радиовещания.

Новизна разрабатываемого метода прогнозирования развития технологий на основе данных мирового патентного массива (на английском языке) в области теле- и радиовещания заключается в кооперации методов кластеризации патентов ТОРТО (США) при помощи международной патентной классификации и прогнозирования технологических трендов посредством сформированных временных рядов.

К разрабатываемому методу можно предъявить следующие требования:

- парсинг патентных данных (извлечение текстовых данных из полей патента «Описание», «Формула изобретения» и метаданных (классы международ-

ной патентной классификации (МПК, IPC) [1], списки цитирований, принадлежность к патентному семейству (Patent Family) и т. д.) осуществляется с сайта Google Patents, причем из классов Международной патентной классификации, соответствующих области теле- и радиовещания;

- построение временных рядов [2] на основе патентных данных для прогнозирования развития технологий в области теле- и радиовещания осуществляется на основе метода Autoreg Ressive Integrated Moving Average (ARIMA) [3].

Материалы и методы

Существующих решений с аналогичным функционалом в области теле- и радиовещания не было найдено, по этой причине было решено проанализировать следующие программные продукты в области аналитики патентных данных: PatSeer [4], Acclaim IP [5], Patent INSIGHT Pro [6], Thomson Reuters [7].

Сравнение существующих решений осуществлялось по следующим критериям:

- актуальность данных;

- коллаборация с другими исследователями;

- просмотр полной информации о патенте;

- наличие патентов разных стран мира;

- визуализация аналитики;

- прогнозирование.

Результаты проведенного сравнительного анализа вышеописанных решений представлены в таблице.

Сравнительный анализ решений Comparative analysis of solutions

-—Решение Критерий " -—-—____ PatSeer Acclaim IP Patent INSIGHT Pro Thomson Reuters

Актуальность данных + + + +

Просмотр полной информации о патенте - + - -

Наличие патентов разных стран мира + - + +

Визуализация аналитики + + + +

Прогнозирование данных - - - -

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2023. N. 3 ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Computer engineering and software

Исходя из результатов проведенного анализа, а также из поставленных функциональных требований, было решено разработать метод прогнозирования развития технологий в области теле- и радиове-

щания и реализовать в виде программного обеспечения (ПО).

Диаграмма потоков данных разрабатываемого метода представлена на рис. 1.

Рис. 1. Диаграмма потоков данных Fig. 1. Data flow graph

Разрабатываемый метод включает в себя пар-синг патентного массива, прогнозирование и визуализацию статистических и прогнозных данных.

Алгоритм парсинга страниц сайта Google Patents содержит следующие шаги (рис. 2): - выбор классов IPC;

- создание директорий для хранения файлов;

- парсинг патента;

- определение общего количества обработанных патентов;

- запись распарсенной информации в БД.

D

7t

s

в p

Рис. 2. Общий алгоритм парсинга Fig. 2. General parsing algorithm

Алгоритм сбора патентной информации содержит в себе следующие шаги (рис. 3):

- получение ссылок из XLSX-документов с патентами;

- загрузка страницы при помощи бота;

- запись HTML-кода [8] в файл;

- парсинг информации из HTML;

- проверка наличия патента в БД;

- получение ссылки на сайт с дополнительной информацией о патенте;

- парсинг дополнительных данных с сайта;

- запись данных в словарь.

я &

Я

>я я о ч о я

а к я я

ч я я я

-ея я я и

H

я а

и о а о О

И

о

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2023. № 3

ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Компьютерное обеспечение и вычислительная техника

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 3. Алгоритм сбора и обновления патентной информации Fig. 3. Algorithm for collecting and updating patent information

Алгоритм построения временных рядов на основе патентных данных и прогнозирования развития технологий на основе метода ARIMA приведен на рис. 4 и содержит следующие шаги:

- выбор патентного класса (на основе этого выбора будут определены количество патентов и их идентификационные номера);

- поиск патентов по их идентификационным номерам в БД;

- разбиение патентных данных по временным отрезкам на основе информации о дате выдачи патента;

- прогнозирование при помощи модели АШМА;

- визуализация статистических и прогнозных данных.

Рис. 4. Алгоритм прогнозирования на основе временных рядов Fig. 4. Time series forecasting algorithm Диаграмма вариантов использования проекти руемого ПО представлена на рис. 5.

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2023. N. 3 ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Computer engineering and software

Рис. 5. Диаграмма вариантов использования проектируемого ПО Fig. 5. Use case diagram of the developed software

Актор - это пользователь, которому доступны основные функции:

- выбор необходимых 1РС-классов;

- парсинг патентов;

- просмотр БД;

- прогнозирование развития технологии. Архитектура проектируемого программного

обеспечения представлена на рис. 6.

Рис. 6. Архитектура разрабатываемого ПО Fig. 6. Architecture of the developed software

В качестве языка программирования выбран Python [9], для реализации интерфейса - библиотека Tkinter [10]. Для сбора файлов с массивами патентов с GooglePatents задействована библиотека Request [11], благодаря которой можно выполнять XHR-запросы (XMLHttpRequest) [12] напрямую к серверу, что поспособствовало увеличению скорости работы программы в части сбора информации. Для извлечения данных из файлов с патентами использованы библиотеки BeautifulSoup [13] и Selenium [14] (программная библиотека для управления браузерами посредством созданного бота, позволяющего прогрузить html-страницу). Поскольку анализируется мировой массив патентов из

GooglePatents [15], то системе необходимо обрабатывать огромное количество данных, следовательно, актуальным является распараллеливание процесса парсинга. Для этого использована библиотека MuШprocessmg [16], которая позволяет распараллелить вычисления для ускорения парсинга. Для анализа данных и прогнозирования была использована библиотека Statsmodels [17], для визуализации прогнозных и статистических данных использована библиотека Matplotlib [18].

Также в качестве системы управления базой данных использована MySql [19, 20]. Схема спроектированной базы данных представлена на рис. 7.

D

7t

S

в p

я &

Я

>я я о ч о я

а к я я

ч я я я

-ея я я и

H

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2023. № 3

ISSN 2072-9502 (Print), ISSN 2224-9761 (Online)

Компьютерное обеспечение и вычислительная техника

я а

и о а о О

И

о

Рис. 7. Структура БД Fig. 7. Structure of the database

Таблица «patents» - центральная, содержит основную патентную информацию, включая текстовые поля «Abstract», «Description», «Claims»; таблица «inventors» - информацию о патентных изобретателях; таблица «classes» - патентные классы, к которым относится патент; таблица «documents» хранит информацию о схожих патентах согласно алгоритмам GooglePatents; таблицы «patent_citations» и «family_citations» содержат списки цитирований для патента (патентного семейства); таблицы

«patent_cited_by» и «family_cited_by» хранят информацию о патентах, которые цитировали данный патент (патентное семейство).

Разработанное ПО апробировано на патентном массиве Google Patents. На вход модуля парсинга подаются xlsx-файлы, содержащие ссылки на патенты Google Patents, зарегистрированные в промежутке времени между 2015 и 2020 гг. (рис. 8), html-файлы с патентной информацией, а также интересующий класс IPC.

F G 1 н

Шев/йззйж state еыШййю slate май slate ESSUltM

2019-03-14 2020-11-03 2020-11-03 №^//KatenJaee»liMOT/Kite!^u5i0S24999B2/SB

2015-04-01 2017-04-18 2017-04-1S

2017-07-03 2019-08-13 2019-08-13

2020-04-29 2021-03-30 2021-03-30 !ïSK://Ea^aS3SSlS^/EaJS№rLIS10962746B2/SÎ]

2019-11-08 2021-12-07 2021-12-07

2021-05-10 2022-03-0S 2022-03-ÜS №^//Katenî&£eœls^^/Eia^usii269064Bi/S5

Рис. 8. Пример файла со ссылками Fig. 8. Example of a file with links

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2023. N. 3 ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Computer engineering and software

Файлы собираются с сайта Google Patents автоматически, при помощи XHR-запросов, в результате выполнения которых извлекаются ссылки на патенты. Ссылки добавляются в массив и передаются в пул процессов для ускорения процесса парсинга. Создается директория html_for_process, в которой формируются html-файлы для каждого процесса (рис. 9).

{'publication': publication, 'title': title, 'status': status, 'priority_date': priority_date, 1 granted_date1 : granted_date, 'link': link^origin, 'link_ru': links_ru, 'abstract': abstract,

D

htm l_for_pro cess

n Spawn Poo I Worker-1 .html ^ SpawnPoolWorker-2.html n SpawnPoolWorker-3.html im SpawnPoolWorker-4.html m SpawnPoolWorker-5.html

assignee : assignee, 'public_as': publieras, 1 classes': classes, 'claims': claims, 'description': description, ' patent_citaticns': patent_citations, 1 familv_citaticns': family_citations, ' patent_cited_by': patent_cited_by, ' family_cited_by': family_cited_by, 'documents': documents}

7T

Рис. 9. HTML-документы для процессов Fig. 9. HTML documents for processes

В каждом процессе сайт загружается по ссылке через бота, созданного при помощи библиотеки Selenium, и весь html-код записывается в файл, соответствующий процессу, информация о патенте сохраняется в словарь (рис. 10).

Собранные данные добавляются в очередь, после чего записываются в БД.

Для активизации парсинга требуется выбрать классы IPC, которые требуются пользователю.

Рис. 10. Пример словаря с информацией о патенте

Fig. 10. Example of a dictionary with information about a patent

В режиме просмотра информации из БД на странице отображается навигационная панель, поле поиска, список с найденными патентами, поля для отображения информации из БД (название, идентификационный номер, ссылки, дата подачи, дата одобрения, статус, изобретатели, патентообладатели и т. д.) (рис. 11).

S

ЕЗ p

/ Patent UnAîopî

Publication; p»t*ritt

US10379W3BÏ US103K7tfBÎ US1G3M99Se*

usmwowei

US1121867Ce? US1124MÎ1B1

usnîMfijie* usiiífóweí

USIlíflWítóí US110761Î4BÎ U$1iaS909ÉBî

и51се®зеггег и$и«4иэег Lisi usures? U51105D99fBÎ

usiceswíeí

US110I??4ÎBÎ US11241169e?

uîuoiîowei изквлвжег

IníoPtftnt

pu№t00it US»»!»«? Mit HtwJ mg<jnttd J.ipIty

priority dalt Lochliinn Wilson, Bikui Chou,Keiichi Silo

granted d«e 2017-0Í-18

lint

itstus Active ajjignee Fovt Int irrrtrtWrt «rtvWrtOrí irtto

pobfcî.« СИЮТвМММ, VVOIOii1ÎM»WrWOλ1iiS91i1Ai, KfiîÛ17iî1î»S04 USMi7i»8SW41,US«3S»«tuai?l8W50W1

ooeri/ou - Ey* teaching input aerajvgefnenci COJB27/Q2 - Vieifitva or reading apparatus

G02Bl?/08£ - CatadlOptrlC system? comprising a refractive elcHot vlth a ceflectlve outface, the reflection taking plate Inside tbe element.

Hang i n mirrors where In tbe system Is node at ■a single block of optical material, e.g. solid catadioptrlc systems GQ2B19/D02B - Condensers, e.g. light collectors or suallar non-uaaglng optics diara:censed by tbe optical scans employed refractive and tefl cctlvc surfaces, <5,13. non-imaging catadioptrlc 3'/jt«=s

GQ2B27/0093 - Optical systews ec appaeacus not provided for by any of the «coups C02B2/00 - C02B26/00, 002630/00 vlth Mans foe »nltorlng da ta relating to tbe user, e.g. head-tratkiog, eye-ttatking G0£B27/0l7 - Head mounted

G02B27/0172 - Head mounted characterised by optical features

Рис. 11. Просмотр патентной информации Fig. 11. Viewing patent information

При запуске процесса прогнозирования развития технологий указывается конкретный класс IPC, который выбирает пользователь. На рис. 12 представлено сравнение результатов прогнозирования

(серая кривая) и реальная информация временных рядов (количество патентов, соответствующих указанному патентному классу, в данном временном периоде) (черная кривая).

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2023. № 3

ISSN 2072-9502 (Print), ISSN 2224-9761 (Online)

Компьютерное обеспечение и вычислительная техника

я &

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Я

>я я

а к я я

Рис. 12. График с прогнозированием Fig. 12. Prediction diagram

ч я я я

-ея я я и S-I

я а

Общая тенденция к плавному затуханию патентования технологии, соответствующей классу H04N5/2258 «Камеры, использующие два или более датчика изображения, например, CMOS-сенсор для видео и CCD-матрицу для неподвижного изображения», прослеживается как на реальных, так и на прогнозируемых данных.

В процессе работы распарсены патенты из Google Patents для класса IPC H04N «Передача изображений, например, телевидение» в количестве 28 591 патентов и записаны в спроектированную БД.

Возможные направления совершенствования системы:

- оптимизация системы парсинга, полный переход на XHR-запросы к серверу;

- улучшение автоматического подбора параметров для модели ARIMA или использование других методов прогнозирования;

- установка разработанного программного обеспечения на кластерную многонодовую систему для ускорения обработки патентных данных.

Область применения разработанного метода -анализ мирового патентного массива [21-23], содержащегося в Google Patents, для прогнозирования и визуализации статистических и прогнозных данных о развитии технологий в области теле- и радиовещания.

Заключение

Разработан метод прогнозирования развития технологий на примере теле- и радиовещания, спроектировано, программно реализовано и протестировано программное обеспечение, реализующее разработанный метод. Было проведено тестирование процесса прогнозирования развития теле- и радиотехнологий на основе построенных временных рядов на интервале 2015-2020 гг.

Новизна метода прогнозирования развития технологий заключается в кооперации методов кластеризации патентов ДОРТО (США) на основе международной патентной классификации и прогнозирования технологических трендов посредством сформированных временных рядов.

Практическая значимость исследования заключается в разработанном программном обеспечении прогнозирования развития технологий в области теле- и радиовещания. Данная программная разработка вышла в финал отборочного этапа IV Всероссийского научно-технического конкурса разработок и научно-практических решений в области кинопроизводства, телерадиовещания и телекоммуникаций «Первый шаг».

Список источников

1. International Patent Classification (IPC) // WIPO. URL: https://www.wipo.int/classifications/ipc/en/ (дата обращения: 05.03.2023).

2. Открытый курс машинного обучения. Тема 9. Анализ временных рядов с помощью Python // Хабр. URL: https://habr.com/ru/company/ods/blog/327242/ (дата обращения: 05.03.2023).

3. Прогнозирование временных рядов с помощью ARIMA в Python 3 // 8host. URL: https://8host-com. turbopages.org/8host.com/s/blog/prognozirovanie-vremennyx-

ryadov-s-pomoshhyu-arima-v-python-3/ (дата обращения: 05.03.2023).

4. Patseer. URL: https://patseer.com/ (дата обращения: 05.03.2023).

5. Speed, Ease-of-use, and Global Patent Data // Ac-claimip. URL: https://www.acclaimip.com/ (дата обращения: 05.03.2023).

6. Patent iNSIGHT Pro. URL: https://www.paten tinsightpro.com/ (дата обращения: 05.03.2023).

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2023. N. 3 ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Computer engineering and software

7. Imagine a new era with generative AI // Thomson Reuters. URL: https://www.thomsonreuters.com/en.html (дата обращения: 05.03.2023).

8. Справочник по HTML. URL: http://htmlbook.ru/ html (дата обращения: 05.03.2023).

9. Python. URL: https://www.python.org/ (дата обращения: 05.03.2023).

10. Tkinter - Python interface to Tcl/Tk // Python. URL: https://docs.python.org/3/library/tkinter.html (дата обращения: 05.03.2023).

11. Документация по библиотеке Python Requests // Digitology.tech. URL: https://digitology.tech/docs/requests/ index.html (дата обращения: 05.03.2023).

12. XMLHttpRequest // М mdn web docs. URL: https://developer.mozilla.org/ru/docs/Web/API/XMLHttpRe quest (дата обращения: 05.03.2023).

13. Документация Beautiful Soup. URL: https://www. crummy.com/software/BeautifulSoup/bs4/doc.ru/bs4ru.html (дата обращения: 05.03.2023).

14. Selenium для Python. Глава 1. Установка // Хабр. URL: https://habr.com/ru/post/248559/ (дата обращения: 05.03.2023).

15. Google Patents // Google. URL: https://patents. google.com (дата обращения: 05.03.2023).

16. Multiprocessing - Process-based parallelism // Python. URL: https://docs.python.org/3/library/multiprocessing.html (дата обращения: 05.03.2023).

17. Statsmodels 0.14.0 // Statsmodels. URL: https:// www.statsmodels.org/stable/index.html (дата обращения: 05.03.2023).

18. Matplotlib: Visualization with Python // Matplotlib. URL: https://matplotlib.org/ (дата обращения: 05.03.2023).

19. MySQL Documentation // MySQL. URL: https:// dev.mysql.com/doc/ (дата обращения: 05.03.2023).

20. Cursor Objects // PyMySQL. URL: https://pymysql. readthedocs.io/en/latest/modules/cursors.html (дата обращения: 05.03.2023).

21. Korobkin D., Saveliev M., Vereschak G., Fomenkov S. The Building a Patent Landscape for Technological Forecasting Tasks // Advances in Automation IV: Conference paper. 2023. V. 986. P. 314-324. DOI: https://doi.org/10.1007/978-3-031-22311-2_31.

22. Kolesnikova V., Korobkin D., Fomenkov S., Rayush-kin E., Glushkin V. The Analysis of Technology Development Trends Based on the Network Semantic Structure "Subject-Action-Object" // Studies in Systems, Decision and Control. 2022. V. 417. P. 43-53. DOI: https://doi.org/10.1007/978-3-030-95116-0_4.

23. Manukyan A., Korobkin D., Fomenkov S., Kolesnikov S. Semantic patent analysis with Amazon Web Services // Journal of Physics: Conference Seriesthis link is disabled. 2021. V. 2060 (1). P. 012025. DOI: 10.1088/1742-6596/2060/1/012025.

D

References

1. International Patent Classification (IPC). WIPO. Available at: https://www.wipo.int/classifications/ipc/en/ (accessed: 05.03.2023).

2. Otkrytyi kurs mashinnogo obucheniia. Tema 9. Analiz vremennykh riadov s pomoshch'iu Python [Open course in machine learning. Topic 9. Time series analysis with Python]. Khabr. Available at: https://habr.com/ru/company/ods/blog/ 327242/ (accessed: 05.03.2023).

3. Prognozirovanie vremennykh riadov s pomoshch'iu ARIMA v Python 3 [Time series forecasting with ARIMA in Python 3]. 8host. Available at: https://8host-com.turbo pages.org/8host.com/s/blog/prognozirovanie-vremennyx-rya dov-s-pomoshhyu-arima-v-python-3/ (accessed: 05.03.2023).

4. Patseer. Available at: https://patseer.com/ (accessed: 05.03.2023).

5. Speed, Ease-of-use, and Global Patent Data. Ac-claimip. Available at: https://www.acclaimip.com/ (accessed: 05.03.2023).

6. Patent iNSIGHT Pro. Available at: https://www. patentinsightpro.com/ (accessed: 05.03.2023).

7. Imagine a new era with generative Al. Thomson Reuters. Available at: https://www.thomsonreuters.com/en.html (accessed: 05.03.2023).

8. Spravochnikpo HTML [HTML Reference]. Available at: http://htmlbook.ru/html (accessed: 05.03.2023).

9. Python. Available at: https://www.python.org/ (accessed: 05.03.2023).

10. Tkinter — Python interface to Tcl/Tk. Python. Available at: https://docs.python.org/3/library/tkinter.html (accessed: 05.03.2023).

11. Dokumentatsiia po biblioteke Python Requests [Documentation for Python Requests]. Digitology.tech.

Available at: https://digitology.tech/docs/requests/index.html (accessed: 05.03.2023).

12. XMLHttpRequest. M mdn web docs. Available at: https://developer.mozilla.org/ru/docs/Web/API/XMLHttpRe quest (accessed: 05.03.2023).

13. Dokumentatsiia Beautiful Soup [Beautiful Soup Documentation]. Available at: https://www.crummy.com/software/ BeautifulSoup/bs4/doc.ru/bs4ru.html (accessed: 05.03.2023).

14. Selenium dlia Python. Glava 1. Ustanovka [Selenium for Python. Chapter 1. Setup]. Khabr. Available at: https://habr.com/ru/post/248559/ (accessed: 05.03.2023).

15. Google Patents. Google. Available at: https://patents. google.com (accessed: 05.03.2023).

16. Multiprocessing — Process-based parallelism. Python. Available at: https://docs.python.org/3/library/multiproces sing.html (accessed: 05.03.2023).

17. Statsmodels 0.14.0. Statsmodels. Available at: https://www.statsmodels.org/stable/index.html (accessed: 05.03.2023).

18. Matplotlib: Visualization with Python. Matplotlib. Available at: https://matplotlib.org/ (accessed: 05.03.2023).

19. MySQL Documentation. MySQL. Available at: https://dev.mysql.com/doc/ (accessed: 05.03.2023).

20. Cursor Objects. PyMySQL. Available at: https:// pymysql.readthedocs.io/en/latest/modules/cursors.html (accessed: 05.03.2023).

21. Korobkin D., Saveliev M., Vereschak G., Fomenkov S. The Building a Patent Landscape for Technological Forecasting Tasks. Advances in Automation IV: Conference paper, 2023, vol. 986, pp. 314-324. DOI: https://doi.org/10.1007/978-3-031-22311-2_31.

22. Kolesnikova V., Korobkin D., Fomenkov S., Rayush-kin E., Glushkin V. The Analysis of Technology Development

s

в p

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2023. № 3

ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Компьютерное обеспечение и вычислительная техника

Trends Based on the Network Semantic Structure "Subject-Action-Object". Studies in Systems, Decision and Control, 2022, vol. 417, pp. 43-53. DOI: https://doi.org/10.1007/978-3-030-95116-0 4.

23. Manukyan A., Korobkin D., Fomenkov S., Kolesnikov S. Semantic patent analysis with Amazon Web Services. Journal of Physics: Conference Seriesthis link is disabled, 2021, vol. 2060 (1), p. 012025. DOI: 10.1088/1742-6596/2060/ 1/012025.

я &

Я

>я я

Статья поступила в редакцию 10.03.2023; одобрена после рецензирования 01.06.2023; принята к публикации 14.07.2023 The article is submitted 10.03.2023; approved after reviewing 01.06.2023; accepted for publication 14.07.2023

Информация об авторах / Information about the authors

a к я я

Дмитрий Михайлович Коробкин - кандидат технических наук, доцент; доцент кафедры систем автоматизированного проектирования и поискового конструирования; Волгоградский государственный технический университет; dkorobkin80@mail.ru

Dmitriy M. Korobkin - Candidate of Technical Sciences, Assistant Professor; Assistant Professor of the Department of Computer-aided Design and Search Engineering; Volgograd State Technical University; dkorobkin80@mail.ru

ч я я я

-ея я я и

H

Сергей Алексеевич Фоменкое - доктор технических наук, профессор; профессор кафедры систем автоматизированного проектирования и поискового конструирования; Волгоградский государственный технический университет; saf@vstu.ru

Григорий Алексеевич Верещак - аспирант кафедры систем автоматизированного проектирования и поискового конструирования; Волгоградский государственный технический университет; grigoryg37@gmail.com

Sergey A. Fomenkov - Doctor of Technical Sciences, Professor; Professor of the Department of Computer-aided Design and Search Engineering; Volgograd State Technical University; saf@vstu.ru

Grigoriy A. Vereschak - Postgraduate Student of the Department of Computer-aided Design and Search Engineering; Volgograd State Technical University; grigoryg37@gmail.com

я

SP

Михаил Алексеевич Сороко - магистрант кафедры систем автоматизированного проектирования и поискового конструирования; Волгоградский государственный технический университет; darkserj18@gmail.com

Mikhail A. Soroko - Master's Course Student of the

Department of Computer-aided Design and Search

Engineering; Volgograd State Technical University; darkserj18@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.