Научная статья на тему 'АВТОМАТИЗАЦИЯ ПОИСКА ТЕХНОЛОГИЧЕСКИХ ПАРТНЕРОВ ДЛЯ ПРОВЕДЕНИЯ НИОКР'

АВТОМАТИЗАЦИЯ ПОИСКА ТЕХНОЛОГИЧЕСКИХ ПАРТНЕРОВ ДЛЯ ПРОВЕДЕНИЯ НИОКР Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
62
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
патенты / обработка текстов на естественном языке / извлечение информации / SAO / patents / natural language processing / information extraction / SAO

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Коробкин Дмитрий Михайлович, Фоменков Сергей Алексеевич, Бородин Николай Юрьевич, Верещак Григорий Алексеевич

В настоящее время компании по-прежнему в значительной степени полагаются на экспертные знания при выборе партнеров по исследованиям и разработкам (НИОКР), но технологии развиваются, и возникает возможность автоматизировать данный процесс. Автоматизация процесса позволит компаниям или частным лицам самостоятельно искать коллег, ведущих работу в смежной предметной области, экономя ресурсы, которые обычно тратятся на анализ патентных данных экспертом. В данной работе предложен метод извлечения из патентных документов USPTO семантических структур Subject-Action-Object и поиска на их основе потенциальных технологических партнеров. Описаны алгоритмы парсинга патентных массивов, извлечения структур SAO и формирования структур «Проблема – Решение», определения схожести технологических проблем и поиска технологических партнеров. Поиск технологических партнеров выполняется на основе технологических проблем и структур «Проблема – Решение». Предложенный метод реализован в виде программного модуля и апробирован на патентах ведомства по патентам и товарным знакам США.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Коробкин Дмитрий Михайлович, Фоменков Сергей Алексеевич, Бородин Николай Юрьевич, Верещак Григорий Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AUTOMATION OF THE SEARCH FOR TECHNOLOGICAL PARTNERS FOR R&D

Currently, companies still rely heavily on expert knowledge when choosing research and development (R&D) partners, but technologies are evolving and it is possible to automate this process. Automation of the process will allow companies or individuals to independently search for colleagues working in a related subject area, saving resources that are usually spent on the analysis of patent data by an expert. In this paper, a method is proposed for extracting SubjectAction-Object semantic structures from USPTO patent documents and searching for potential technological partners based on them. Algorithms for parsing patent arrays, extracting SAO structures and forming "Problem – Solution" structures, determining the similarity of technological problems and searching for technological partners are described. The search for technological partners is carried out on the basis of technological problems and "Problem – Solution" structures. The proposed method is implemented in the form of a software module and tested on patents of the U.S. Patent and Trademark Office.

Текст научной работы на тему «АВТОМАТИЗАЦИЯ ПОИСКА ТЕХНОЛОГИЧЕСКИХ ПАРТНЕРОВ ДЛЯ ПРОВЕДЕНИЯ НИОКР»

DOI 10.54398/20741707_2022_4_5 9 УДК 004.001

АВТОМАТИЗАЦИЯ ПОИСКА ТЕХНОЛОГИЧЕСКИХ ПАРТНЕРОВ ДЛЯ ПРОВЕДЕНИЯ НИОКР1

Статья поступила в редакцию 28.09.2022, в окончательном варианте - 17.10.2022.

Коробкин Дмитрий Михайлович, Волгоградский государственный технический университет, 400005, Российская федерация, г. Волгоград, пр. имени В.И. Ленина, 28,

кандидат технических наук, доцент, ORCID: 0000-0002-4684-1011, e-mail: dkorobkin80@mail.ru Фоменков Сергей Алексеевич, Волгоградский государственный технический университет, 400005, Российская федерация, г. Волгоград, пр. имени В.И. Ленина, 28,

доктор технических наук, профессор, ORCID: 0000-0001-9907-4488, e-mail: saf550@yandex.ru Бородин Николай Юрьевич, Волгоградский государственный технический университет, 400005, Российская федерация, г. Волгоград, пр. имени В.И. Ленина, 28,

студент, ORCID: 0000-0003-3561-1111, e-mail: mr.kolyamba99@yandex.ru Верещак Григорий Алексеевич, Волгоградский государственный технический университет, 400005, Российская федерация, г. Волгоград, пр. имени В.И. Ленина, 28, аспирант, ORCID: 0000-0002-4545-6306, e-mail: grigoryg37@gmail.com

В настоящее время компании по-прежнему в значительной степени полагаются на экспертные знания при выборе партнеров по исследованиям и разработкам (НИОКР), но технологии развиваются, и возникает возможность автоматизировать данный процесс. Автоматизация процесса позволит компаниям или частным лицам самостоятельно искать коллег, ведущих работу в смежной предметной области, экономя ресурсы, которые обычно тратятся на анализ патентных данных экспертом. В данной работе предложен метод извлечения из патентных документов USPTO семантических структур Subject-Action-Object и поиска на их основе потенциальных технологических партнеров. Описаны алгоритмы парсинга патентных массивов, извлечения структур SAO и формирования структур «Проблема - Решение», определения схожести технологических проблем и поиска технологических партнеров. Поиск технологических партнеров выполняется на основе технологических проблем и структур «Проблема - Решение». Предложенный метод реализован в виде программного модуля и апробирован на патентах ведомства по патентам и товарным знакам США.

Ключевые слова: патенты, обработка текстов на естественном языке, извлечение информации, SAO

AUTOMATION OF THE SEARCH FOR TECHNOLOGICAL PARTNERS FOR R&D

The article was received by the editorial board on 28.09.2022, in the final version —17.10.2022.

KorobkinDmitry M., Volgograd State Technical University, 28 Lenin Ave., Volgograd, 400005, Russian Federation,

Cand. Sci. (Engineering), Associate Professor, ORCID: 0000-0002-4684-1011, e-mail: dkorobkin80@mail.ru

Fomenkov Sergey A., Volgograd State Technical University, 28 Lenin Ave., Volgograd, 400005, Russian Federation,

Doct. Sci. (Engineering), Professor, ORCID: 0000-0001-9907-4488, e-mail: saf550@yandex.ru Borodin Nikolay Yu., Volgograd State Technical University, 28 Lenin Ave., Volgograd, 400005, Russian Federation,

student, ORCID: 0000-0003-3561-1111, e-mail: mr.kolyamba99@yandex.ru Vereschak Grigory A., Volgograd State Technical University, 28 Lenin Ave., Volgograd, 400005, Russian Federation,

post-graduate student, ORCID: 0000-0002-4545-6306, e-mail: grigoryg37@gmail.com

Currently, companies still rely heavily on expert knowledge when choosing research and development (R&D) partners, but technologies are evolving and it is possible to automate this process. Automation of the process will allow companies or individuals to independently search for colleagues working in a related subject area, saving resources that are usually spent on the analysis of patent data by an expert. In this paper, a method is proposed for extracting Subject-Action-Object semantic structures from USPTO patent documents and searching for potential technological partners based on them. Algorithms for parsing patent arrays, extracting SAO structures and forming "Problem - Solution" structures, determining the similarity of technological problems and searching for technological partners are described. The search for technological partners is carried out on the basis of technological problems and "Problem - Solution" structures. The proposed method is implemented in the form of a software module and tested on patents of the U.S. Patent and Trademark Office.

Keywords: patents, natural language processing, information extraction, SAO

1 Исследование выполнено за счет гранта Российского научного фонда №№ 22-21-20125, https://rscf.ru/project/22-21-20125/, и от Волгоградской области.

Graphical annotation (Графическая аннотация)

_Патентный массив_ (Patent array)

Парсинг патентных массивов (Parsing patent arrays)

Патентные данные (Patent data) _Jfc_

Сопоставление данных о ^ патенте с его структурой "Проблема-Решение" (Comparison of patent data with its "Problem-Solution" _structure)__,

_Тексты патентов_ (Patent texts)

Структуры "Проблема-Решение" (Problem-Solution Structures)

Извлечение SAO (Extracting SAO)

SAO ♦

Формирование структур "Проблема-Решение" (Formation of "Problem-Solution" structures)

Поисковый запрос

по технологии или изделию - - проблема

(Search query by technology or product - problem)

Данные о патентах со структурой "Проблема-Решение" (Patent data with а "Problem-Solution" structure)

_к_.

Поиск технологических партнеров

Найденные партнеры

по НИОКР (Found R&D Partners)

Отображение найденных партнеров по НИОКР (Display of found R&D partners)

Введение. Процесс генерации новых технических решений, поиск аналогов на разработанную технологию и анализ технологических трендов могут быть упрощены за счет анализа существую -щей патентной базы [1, 2]. Но в настоящее время компании по-прежнему в значительной степени полагаются на экспертные знания при выборе партнеров по исследованиям и разработкам (НИОКР). От экспертов требуется выполнять патентный поиск, который в настоящее время осуществляется с помощью электронных информационно-поисковых систем. В силу большого количества и сложности электронных баз поиск является трудоемким процессом. Несмотря на то, что поиск при помощи электронных баз в сети Интернет считается достаточно полным и объективным, существует потребность в ручном поиске путем детального анализа полученной информации. На ознакомление с проблемой и анализ патентов экспертом затрачиваются такие ресурсы, как время и деньги заинтересованного лица. Существующий поисковый процесс изображен на рисунке 1.

Рисунок 1 - Процесс поиска партнеров по НИОКР на текущий момент

С развитием технологий возникает возможность в автоматизации процесса поиска партнеров по НИОКР. Автоматизация процесса поиска позволит компаниям или частным лицам самостоя -тельно искать коллег, ведущих работу в смежной предметной области, экономя ресурсы, которые обычно тратятся экспертом на анализ патентных данных. На рисунке 2 изображен автоматизированный процесс поиска партнеров по НИОКР.

Рисунок 2 - Автоматизированный процесс поиска партнеров по НИОКР

Автоматизированный процесс позволит компаниям или физическим лицам избавиться от посредника в виде эксперта при поиске технологических партнеров по НИОКР, а экспертам, в свою очередь, ускорить процесс нахождения потенциальных единомышленников для клиентов.

Для повышения качества извлечения данных в [3] отмечается необходимость изучения структуры патентного документа. В [4] анализировались пользовательские отзывы к патенту для определения инновационного потенциала. Из пользовательских отзывов можно извлечь информацию о технологии, указанной в патенте, и окрас реакции пользователей. В [5] предложен метод опреде -ления инновационного потенциала в виде опросного листа по патенту - «Инновационный радар». Инновационный потенциал определяется в виде опросного листа по патенту. В [6] описывается методика определения технологии с высоким потенциалом, закрепленной в патенте, - Technology Opportunity Discovery. Для этого используется кластеризация патентов по ключевым словам.

Одним из распространенных способов извлечения и анализа технологии, закрепленной в патенте, является использование модели Subject-Action-Object (SAO). Модель SAO для извлечения информации из англоязычных патентов используется в [7, 8, 9]. В [10] проверяется близость технологии к технологическому тренду посредством извлечения матричных векторов, состоящих из структур SAO. В [11] создаются терм-документные матрицы на основе структур SAO, где документами являются патенты, а термами - структуры SAO. Инновационный потенциал представлен относительным размером тематического кластера.

В данной работе предлагается метод извлечения из патентных документов USPTO [12] семантических структур SAO, использующихся для формирования структур «Проблема - Решение», и поиска на их основе потенциальных технологических партнеров.

Основная идея разработанного метода заключается в том, что поиск партнеров по НИОКР будет выполняться на основе сходства технологической проблемы, задаваемой в поисковом запросе, и зара -нее подготовленных структур «Проблема - Решение», извлеченных из патентного массива и хранящихся в базе данных. В ответ на поисковый запрос будет предоставляться список схожих проблем и решений, представленных другими компаниями. На основе этого списка предполагается дальнейшее взаимодействие и сотрудничество. На рисунке 3 изображена диаграмма потоков данных.

Разработанный метод включает в себя парсинг патентных массивов, извлечение структур SAO и формирование структур «Проблема - Решение», определение схожести технологических проблем.

Рисунок 3 - Диаграмма потоков данных

Алгоритм парсинга патентных массивов. На вход алгоритма поступает список загруженных патентных массивов USPTO в формате XML. Каждый такой патентный массив содержит в себе описания патентных документов в XML-формате, где перед каждый новым патентным документом есть объявление, что это XML. Именно поэтому изначальный патентный массив не является валидным XML-файлом.

Данные, извлекаемые из патентных документов, - текст, фирма-регистратор, номер, класс патента, изобретатели. Данные извлекаются из соответствующих тегов. Текст патентного документа извлекается из тегов abstract, claim, description. Фирма-регистратор патента указана в теге orgname внутри тега assignes. Уникальным номером патента считается номер из тега doc_number тега application-reference. На рисунке 4 изображен алгоритм парсинга патентных массивов.

Рисунок 4 - Алгоритм парсинга патентных массивов

Извлеченная информация сохраняется в базу данных для дальнейшей обработки.

Алгоритм извлечения структур SAO. На вход алгоритма поступают извлеченные на предыдущем этапе данные - тексты тегов abstract и description патентных документов. Из текстов указанных тегов извлекаются структуры «Subject-Action-Object».

Для извлечения структур SAO необходима предварительная обработка текста. Предобработка текста включает в себя разбиение текста на предложения; токенизацию предложений; фильтрацию предложений, содержащих запрещенные слова; сегментацию предложений, при которой отсекается та часть предложения, которая не имеет ценность при извлечении структур SAO. Сегментированные предложения разбираются при помощи StanzA. Анализируются связи между токенами и принадлежность токенов к определенным частям речи. Принимается, что Action - это VERB; Object -nmod, obj, obl и их дочерние элементы; Subject - nsubj и его дочерние элементы. На рисунке 5 можно увидеть пример разбора предложения с помощью Stanza.

The system or technique of one embodiment allows for the creation of a transparent tile wall supported by support wire

Рисунок 5 - Разбор предложения с помощью Stanza

Извлеченные структуры SAO сохраняются в базу данных. Общий алгоритм извлечения структур SAO изображен на рисунке 6.

\ г

/ Структуры SAO Рисунок 6 - Алгоритм извлечения структур SAO

7

Для формирования структур «Проблема - Решение» используются сохраненные структуры SAO. Принимается, что «Проблема» состоит из двух частей - Action и Object структуры SAO, а «Решение» - Subject. Таким образом, каждый извлеченный триплет SAO содержит в себе описание проблемы и ее решение. Алгоритм формирования структур «Проблема - Решение» изображен на рисунке 7.

Рисунок 7 - Алгоритм формирования структур «Проблема - Решение»

Алгоритм определения схожести технологических проблем. На вход алгоритма поступает поисковый запрос с описанием искомой проблемы. Строка с поисковым запросом разбирается при помощи Stanza. Аналогично поиску структур «Проблема - Решение», из поискового запроса извлекаются Action и Object. Алгоритм определения схожести технологических проблем представлен на рисунке 8.

Рисунок 8 - Алгоритм определения схожести технологических проблем

Сохраненные ранее триплеты SAO сопоставляются с Action и Object поискового запроса. Если соответствующие строки Action совпадают с Action поискового запроса, то присваивается коэффициент схожести со значением 1. Аналогично для Object - если соответствующие строки Object совпадают, то присваивается коэффициент схожести со значением 1.

Помимо точного совпадения выполняется поиск по синонимам с помощью модели Word2Vec. При нахождении синонимов для Object поискового запроса из таблицы SAO по полю Object присваивается коэффициент схожести контекстного синонима к исходному слову. Аналогично для Action - если найден синоним Action из поискового запроса в поле Action таблицы SAO, то присваивается коэффициент схожести контекстного синонима к исходному слову.

Найденные записи SAO, соответствующие поисковому запросу, дополнительно обрабатываются. При нахождении повторяющихся SAO их коэффициенты суммируются. Поскольку из одного патентного документа может быть извлечено несколько записей SAO, найденные записи SAO необходимо отфильтровать по уникальному идентификатору патента. Если были найдены несколько SAO, соответствующих одному и тому же патенту, оставляется только SAO с наибольшим коэффициентом схожести, остальные удаляются.

На выходе алгоритма список потенциальных партнеров, работавших над искомой проблемой.

Результаты. Разработанный метод реализован в виде программного модуля. Программный модуль включает в себя 4 блока:

1) блок парсинга патентного xml-массива;

2) блок формирования структур «Проблема - Решение»;

3) блок поиска технологических партнеров;

4) веб-интерфейс пользователя.

На рисунке 9 изображена архитектура разработанного программного модуля.

Рисунок 9 - Архитектура программного модуля

Программный модуль реализован на языке программирования Python. Для парсинга xml-фай-лов использована библиотека Beautiful Soup. Структуры SAO извлекаются при помощи Stanza -библиотеки для анализа естественного языка на Python. Для создания модели, необходимой для поиска синонимов и выявления схожести технологических проблем, использована библиотека тематического моделирования Gensim. Визуальная составляющая реализована на фреймворке Django в виде веб-приложения с использованием CSS-фреймворка Bootstrap. Для структуризации и хранения данных используется реляционная база данных PostgreSQL.

Программный модуль был апробирован на патентных документах USPTO за 2010-2020 гг. На рисунке 10 изображен результат работы модуля на введенный пользовательский запрос «reducing capacity».

Рисунок 10 - Результат поискового запроса с найденными технологическими партнерами

На рисунке 11 можно увидеть страницу с описанием патентного документа.

Номер патента: US07657700B2

Название патента: Recording device, recording-medium-management method, program of recording-medium-management method, and recording medium recording program of recording-medium-

management method

Компания патентообладатель: Sony Corporation

Изобретатели: Hiroshi Shimono.Jumchi Vokota.Ryogo Ito.Fumihlko Kaise.Kunihiko Take.Hitofumi Todo.Keiji Kanota.Kenichuo imai.Ko KobayashiKatsuhiko Watanabe

Abstract:

A recording device which records data onto a recording medium includes a nonvolatile memory storing and holding data on a free capacity of the recording medium, and a control unit controlling the data recording. The control unit determines the free-capacity data stored in the nonvolatile memory based on the total capacity of the recording medium when power is turned on. When the determination result indicates that a value of the free-capacity data stored in the nonvolatile memory does not exceed a value of the total capacity of the recording medium, the control unit records the data onto the recording medium with reference to the free-capacity data when the power is turned off. the control unit updates the free-capacity data so as to reduce the value of the free-capacity data by as much as an amount of the data recorded onto the recording medium.

Description:

CROSS-REFERENCE TO RELATED APPLICATIONS The present application claims priority from Japanese Patent Application No. IP 2005 -290675 filed on Oct 4.2005, the disclosure of wliich is hereby incorporated by reference herein. BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a recording device, a recording medium management method, a program of the recording-medium-management method, and a recording medium recorded with the program of the recording.medium-management method, and can be used for a digital sbll camera, for example- The present invention allows for storing data on free capacity of the recording medium in a nonvolatile memory independently. Further, the present invention allows for confirming the recorded free-capacity data on the basis of the total capacity of the recording medium and starting tecordtng data when the recording device is started Subsequently, it becomes possible to access the recording medium correctly on the basis of the free-capacity data when the free-capacity data on the recording medium is stored in the nonvolatile memory independently 2, Description of the Related Art In the past recording devices including a digital video camera the digital still camera, and so forth record file data including data on video, a still image, and so forth onto various changeable recording mediums including a memory card, an optical disk, and so forth Therefore, when a recording medium is loaded into the above-described tecordtng device and the power of the recording device is turned on, the recording device detects data on the free capacity of the recording medium and records the file data of various types onto the recording medium only when the recording medium has enough free capacity Japanese Unexamined Patent Application Publication No. 2005-22&180 discloses a method of using the fie* capacity of the recording medium for data backup in

Рисунок 11 - Страница с описанием патентного документа

Заключение. В данной работе описан разработанный метод извлечения из патентных документов USPTO семантических структур Subject-Action-Object и поиска на их основе потенциальных технологических партнеров. Метод включает в себя алгоритмы парсинга патентных массивов, извлечения структур SAO и формирования структур «Проблема - Решение», определения схожести технологических проблем и поиска технологических партнеров. Разработанный метод реализован в виде про -граммного модуля на Python и апробирован на патентных документах USPTO за 2010-2020 гг.

Внедрение программного модуля позволит облегчить и ускорить процесс поиска потенциальных партнеров по НИОКР по сравнению с ручной обработкой данных.

Библиографический список

1. Korobkin, D. The software for computation the criteria-based assessments of the morphological features of technical systems / D. Korobkin, S. Fomenkov, M. Fomenkova, I. Vayngolts, A. Kravets // Cyber-Physical Systems. -Springer, Cham, 2021. - P. 161-172.

2. Korobkin, D. The Formation of Morphological Matrix Based on an Ontology "Patent Representation of Technical Systems" for the Search oflnnovative Technical Solutions / D. Korobkin, S. Fomenkov, G. Vereschak, S. Kolesnikov, D. Tolokin, A. Kravets // Cyber-Physical Systems. - Springer, Cham, 2021. - P. 149-160.

3. Souili A. et al. Starting from patents to find inputs to the problem graph model of IDM-TRIZ // Procedia Engineering. - 2015. - Vol. 131. - P. 150-161.

4. Roh, T. Technology opportunity discovery by structuring user needs based on natural language processing and machine learning / T. Roh et al. // PloS one. - 2019. - Vol. 14, № 10. - P. e0223404.

5. De Prato, G. Innovation radar: Identifying innovations and innovators with high potential in ICT FP7, CIP & H2020 projects / G. De Prato et al. // JRC Scientific and Policy Reports - EUR. - 2015. - Vol. 27314. - P. 11-15.

6. Feng, L. Discovering technology opportunity by keyword-based patent analysis: a hybrid approach of morphology analysis and USIT / L. Feng et al. // Sustainability. - 2019. - Vol. 12, № 1. - P. 136.

7. Guo, J. Subject-action-object-based morphology analysis for determining the direction of technological change / J. Guo, X. Wang, Q. Li, D. Zhu // Technological Forecasting and Social Change. - 2016. - Vol. 105. - P. 27-40.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Wang X., Qiu, P., Zhu, D., Mitkova, L., Lei, M., Porter, A. Identification of technology development trends based on subject-action-object analysis: The case of dye-sensitized solar cells // Technological forecasting and social change. - 2015. - Vol. 98. - P. 24-46.

9. Yang C., Zhu D., Wang X. SAO semantic information identification for text mining // International Journal of Computational Intelligence Systems. - 2017. - Vol. 10, № 1. - P. 593.

10. Yang C., Huang C., Su J. An improved SAO network-based method for technology trend analysis: A case study of graphene // Journal of Informetrics. - 2018. - Vol. 12, № 1. - P. 271-286.

11. Kim S., Park I., Yoon B. SAO2Vec: Development of an algorithm for embedding the subject-action-object (SAO) structure using Doc2Vec // Plos one. - 2020. - Vol. 15, № 2. - P. e0227930.

12. Bulk Data Storage System (BDSS) Version 1.1.0 // United States Patent and Trademark Office : официальный сайт. - Режим доступа: https://bulkdata.uspto.gov/, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 19.08.2022).

References

1. Korobkin, D., Fomenkov, S., Fomenkova, M., Vayngolts, I., & Kravets, A. G. The software for computation the criteria-based assessments of the morphological features of technical systems. Cyber-Physical Systems. Springer, Cham., 2021, pp. 161 -172.

2. Korobkin, D., Fomenkov, S., Vereschak, G., Kolesnikov, S., Tolokin, D., & Kravets, A. G. The Formation of Morphological Matrix Based on an Ontology "Patent Representation of Technical Systems" for the Search of Innovative Technical Solutions. Cyber-Physical Systems. Springer, Cham., 2021, pp. 149-160.

3. Souili, A., Cavallucci, D., Rousselot, F., & Zanni, C. Starting from patents to find inputs to the problem graph model of IDM-TRIZ. Procedia Engineering, 2015, vol. 131, pp. 150-161.

4. Roh, T., Jeong, Y., Jang, H., & Yoon, B. Technology opportunity discovery by structuring user needs based on natural language processing and machine learning. PloS one, 2019, vol. 14(10), e0223404.

5. De Prato, G., Nepelski, D., & Piroli, G. Innovation radar: Identifying innovations and innovators with high potential in ICT FP7, CIP & H2020 projects. JRC Scientific and Policy Reports - EUR, 2015, vol. 27314, pp. 11-15.

6. Feng, L., Niu, Y., Liu, Z., Wang, J., & Zhang, K. Discovering technology opportunity by keyword-based patent analysis: a hybrid approach of morphology analysis and USIT. Sustainability, 2019, vol. 12 (1), p. 136.

7. Guo, J., Wang, X., Li, Q., & Zhu, D. Subject-action-object-based morphology analysis for determining the direction of technological change. Technological Forecasting and Social Change, 2016, vol. 105, pp. 27-40.

8. Wang, X., Qiu, P., Zhu, D., Mitkova, L., Lei, M., & Porter, A. L. Identification of technology development trends based on subject-action-object analysis: The case of dye-sensitized solar cells. Technological forecasting and social change, 2015, vol. 98, pp. 24-46.

9. Yang, C., Zhu, D., & Wang, X. SAO semantic information identification for text mining. International Journal of Computational Intelligence Systems, 2017, vol. 10 (1), p. 593.

10. Yang, C., Huang, C., & Su, J. An improved SAO network-based method for technology trend analysis: A case study of graphene. Journal of Informetrics, 2018, vol. 12 (1), pp. 271-286.

11. Kim, S., Park, I., & Yoon, B. SAO2Vec: Development of an algorithm for embedding the subject-action-object (SAO) structure using Doc2Vec. Plos one, 2020, vol. 15 (2), p. e0227930.

12. Bulk Data Storage System (BDSS) Version 1.1.0. United States Patent and Trademark Office. Available at: https://bulkdata.uspto.gov/ (accessed 19.08.2022).

i Надоели баннеры? Вы всегда можете отключить рекламу.