Научная статья на тему 'ЦИФРОВЫЕ ИНСТРУМЕНТЫ ПАТЕНТНЫХ ИССЛЕДОВАНИЙ'

ЦИФРОВЫЕ ИНСТРУМЕНТЫ ПАТЕНТНЫХ ИССЛЕДОВАНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
479
110
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПАТЕНТЫ / ПАТЕНТНЫЕ ИССЛЕДОВАНИЯ / ЦИФРОВИЗАЦИЯ / МАШИННОЕ ОБУЧЕНИЕ / НЕСТРУКТУРИРОВАННЫЕ ДАННЫЕ / PATENTS / PATENT RESEARCHES / DIGITIZATION / MACHINE LEARNING / UNSTRUCTURED DATA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кашеварова Наталия Александровна, Андреева Анна Андреевна, Пономарева Евгения Ильинична

Патентные исследования являются неотъемлемой частью научных разработок, поскольку обеспечивают создание конкурентоспособных инновационных технологий. Большинство отечественных научных работ посвящены методологии, и мало внимания уделяется цифровизации патентных исследований. В то же время эта тема широко освещена в зарубежных публикациях, а на мировом рынке представлены цифровые инструменты патентного поиска и аналитики. Целью данной работы являлся анализ применения информационных технологий в патентной аналитике на основе обобщения опубликованных работ, а также анализ эффективности существующих цифровых инструментов патентных исследований, их соответствия требованиям нормативных документов. Результаты исследования показали, что технологии, основанные на машинном обучении и реализованные в исследованных цифровых инструментах, позволяют эффективно решать задачи патентных исследований на базе следующих подходов: кластеризация патентной информации, квантитативный анализ, анализ цитирования, обработка естественного языка, визуализация данных, построение патентных ландшафтов. Таким образом, возможно сделать выводы о том, что дальнейшее развитие цифровых инструментов патентных исследований будет базироваться на машинном обучении и искусственном интеллекте. Статья может быть интересна специалистам в сфере интеллектуальной собственности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кашеварова Наталия Александровна, Андреева Анна Андреевна, Пономарева Евгения Ильинична

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DIGITAL TOOLS FOR PATENT RESEARCHES

Patent research is an integral part of R&D, since it provides the creation of competitive innovative technologies. Most Russian scientific papers are devoted to methodology and pay little attention to the digitization of patent research. At the same time, this topic is widely covered in foreign publications, and digital tools for patent search and analytics are presented on the world market. The purpose of this paper work was to analyze the implementation of information technologies in patent analytics based on the generalization of published works, as well as to analyze the effectiveness of existing digital tools for patent research, their compliance with the requirements of regulatory documents. The results of the study showed that technologies based on machine learning and implemented in the studied digital tools can effectively solve the problems of patent research based on the following approaches: clustering of patent information, quantitative analysis, citation analysis, natural language processing, data visualization, and building patent landscapes. Thus, it is possible to draw conclusions that the further development of digital patent research tools will be based on machine learning and artificial intelligence. The article may be of interest to specialists in the intellectual property.

Текст научной работы на тему «ЦИФРОВЫЕ ИНСТРУМЕНТЫ ПАТЕНТНЫХ ИССЛЕДОВАНИЙ»

вопросы инновационной экономики

о

Том 10 • Номер 2 • Апрель-июнь 2020 ISSN 2222-0372 Russian Journal of Innovation Economics

Первое

экономическое издательство

цифровые инструменты патентных исследований

Кашеварова Н.А. 1, Андреева А.А. 1, Пономарева Е.И. 1

1 Московский государственный технический университет им. Н.Э. Баумана, Москва, Россия АННОТАЦИЯ:

Патентные исследования являются неотъемлемой частью научных разработок, поскольку обеспечивают создание конкурентоспособных инновационных технологий. Большинство отечественных научных работ посвящены методологии, и мало внимания уделяется цифровизации патентных исследований. В то же время эта тема широко освещена в зарубежных публикациях, а на мировом рынке представлены цифровые инструменты патентного поиска и аналитики. Целью данной работы являлся анализ применения информационных технологий в патентной аналитике на основе обобщения опубликованных работ, а также анализ эффективности существующих цифровых инструментов патентных исследований, их соответствия требованиям нормативных документов. Результаты исследования показали, что технологии, основанные на машинном обучении и реализованные в исследованных цифровых инструментах, позволяют эффективно решать задачи патентных исследований на базе следующих подходов: кластеризация патентной информации, квантитативный анализ, анализ цитирования, обработка естественного языка, визуализация данных, построение патентных ландшафтов. Таким образом, возможно сделать выводы о том, что дальнейшее развитие цифровых инструментов патентных исследований будет базироваться на машинном обучении и искусственном интеллекте. Статья может быть интересна специалистам в сфере интеллектуальной собственности.

КЛЮЧЕВЫЕ СЛОВА: патенты, патентные исследования, цифровизация, машинное обучение, неструктурированные данные.

ментом поддержки принятия решений в сфере стратегического планирования инновационной деятельности предприятия, а также в процессе научно-исследовательских и опытно-конструкторских работ (НИОКР). В современном мире именно интеллектуальные ресурсы определяют динамику развития как отдельных компаний, так и целых стран. Показатели патентной активности входят в комплексные индексы, отражающие инновационное развитие стран мира, такие как «Глобальный инновационный индекс», публикуемый Всемирной орга-

Digital tools for patent researches

Kashevarova N.A. 1, Andreeva A.A. 1, Ponomareva E.I .1

1 Bauman Moscow State Technical University, Russia

предпосылки исследования

нализ патентной информации является необходимым инстру

низацией интеллектуальной собственности (ВОИС). Анализ патентной активности позволяет не только оценить текущий уровень технологического развития отрасли или конкурентную позицию предприятия, но и спрогнозировать тенденции будущего научно-технического прогресса.

Согласно ГОСТ Р 15.011-96 «СРПП. Патентные исследования. Содержание и порядок проведения», патентные исследования (ПИ) представляют собой исследования технического уровня и тенденций развития объектов хозяйственной деятельности, их патентоспособности, патентной чистоты, конкурентоспособности (эффективности использования по назначению) на основе патентной и другой информации [1]. На основе данного стандарта многие наукоемкие предприятия разрабатывают внутренние регламенты проведения ПИ. В качестве примера можно отметить методические рекомендации, разработанные в ОАО «РЖД» [2], в Государственной корпорации «Ростех» [3] и Центре интеллектуальной собственности «Сколково» [4]. Данные документы раскрывают содержание основных этапов процесса ПИ, регламентируют формы отчетных документов, но не содержат научно-методического аппарата и инструментария, позволяющего решать конкретные задачи ПИ.

Ряд отечественных изданий освещают различные аспекты методологии поиска и анализа патентной информации:

ABSTRACT:_

Patent research is an integral part of R&D, since it provides the creation of competitive innovative technologies. Most Russian scientific papers are devoted to methodology and pay little attention to the digitization of patent research. At the same time, this topic is widely covered in foreign publications, and digital tools for patent search and analytics are presented on the world market. The purpose of this paper work was to analyze the implementation of information technologies in patent analytics based on the generalization of published works, as well as to analyze the effectiveness of existing digital tools for patent research, their compliance with the requirements of regulatory documents. The results of the study showed that technologies based on machine learning and implemented in the studied digital tools can effectively solve the problems of patent research based on the following approaches: clustering of patent information, quantitative analysis, citation analysis, natural language processing, data visualization, and building patent landscapes. Thus, it is possible to draw conclusions that the further development of digital patent research tools will be based on machine learning and artificial intelligence. The article may be of interest to specialists in the intellectual property.

KEYWORDS: patents, patent researches, digitization, machine learning, unstructured data

JEL Classification: 031, 032, 033 Received: 26.02.2020 / Published: 30.06.2020

© Author(s) / Publication: PRIMEC Publishers

For correspondence: Kashevarova N.A. in.kashevarova0yandex.ru)

CITATION:_

Kashevarova N.A., Andreeva A.A., Ponomareva E.I. (2020) Tsifrovye instrumenty patentnyh issledo-vaniy [Digital tools for patent researches]. Voprosy innovatsionnoy ekonomiki. 10. (2). - 1059-1074. doi: 10.18334/vinec.10.2.100816

• теоретические и практические основы проведения ПИ [5, 6] (Skornyakov, Gorbunova, 2011; Skornyakov, Gorbunova, 2014);

• отбор изобретений на основе критериев значимости изобретений [7] (Skornyakov, Gorbunova, 2008);

• анализ патентной чистоты объекта в зависимости от его вида, условий коммерциализации и стадии жизненного цикла [8] (Shvedova, 2015);

• ПИ при оценке стоимости объектов промышленной собственности [9] (Skornyakov, Tsekhmistrenko, Gorbunova, 2008).

Следует отметить, что данные методические издания не уделяют внимания использованию современных информационных технологий (ИТ). Однако на сегодняшний день задачи ПИ требуют обработки значительных массивов неструктурированных данных. В условиях цифровизации экономики решение этих задач без применения ИТ является необоснованно трудоемким и неэффективным.

В ряде отечественных научных публикаций описываются ИТ-решения, позволяющие автоматизировать те или иные задачи поиска и анализа патентной информации, например технология поиска аналогов и прототипов новых технических решений [10] (Petrova, Puchkova, 2016) или информационная система для комплексного анализа метаданных и полных текстов патентов [11] (Smirnov, 2018).

Применению современных ИТ, в том числе технологий, основанных на искусственном интеллекте, в патентной аналитике посвящено значительное количество работ зарубежных авторов последних лет. Так, например, в статье [12] (Aristodemou, Tietze, 2018) приведен масштабный обзор литературы по применению искусственного интеллекта, машинного обучения и методов глубокого обучения для анализа данных об интеллектуальной собственности. Работа [13] (Zambetti, Sala, Russo, Pezzotta, Pinto, 2018) представляет собой обзор патентов на методы машинного обучения и приложения, позволяющие анализировать конкуренцию и технологические ландшафты отрасли. Таким образом, на сегодняшний день цифровизация и развитие методов ПИ является актуальной задачей для наукоемкого бизнеса.

Научная новизна статьи состоит в обобщении перспективных подходов к ПИ, основанных на машинном обучении.

Методология. Целью данной статьи является анализ применения ИТ в патентной аналитике на основе обобщения опубликованных работ, а также анализ эффективно-

ОБ АВТОРАХ:_

Кашеварова Наталия Александровна, доцент кафедры предпринимательства и внешнеэкономической

деятельности, к.э.н. (n.kashevarova@yandex.ru)

Андреева Анна Андреевна, студент (a.andreeva.980mail.ru)

Пономарева Евгения Ильинична, студент (ponomareva.evgeniya290gmail.com)

ЦИТИРОВАТЬ СТАТЬЮ:_

Кашеварова Н.А., Андреева А.А., Пономарева Е.И. Цифровые инструменты патентных исследований // Вопросы инновационной экономики. - 2020. - Том 10. - № 2. - С. 1059-1074. doi: 10.18334/vinec.10.2.100816

сти существующих цифровых инструментов ПИ, их соответствия требованиям нормативных документов. Для достижения этой цели были приняты описательный и аналитический подходы к обзору литературы. Гипотеза исследования заключается в том, что технологии машинного обучения накрывают все ключевые задачи ПИ.

Результаты. А.Дж. Трипп в работе 2003 года [14] (Trippe, 2003) выделяет следующие частные задачи для инструментов патентной аналитики:

• создание и обработка списков;

• формирование матриц и диаграмм;

• кластеризация структурированных данных;

• кластеризация текстовых данных;

• сопоставление кластеров информации;

• отображение (картирование) кластеров;

• добавление к кластерным картам параметра времени;

• анализ цитирования;

• анализ с помощью модели «субъект - действие - объект».

С учетом актуального состояния ИТ можно сгруппировать подходы к цифровиза-ции патентного анализа следующим образом:

• кластеризация выборки патентов по заданным параметрам;

• анализ цитируемости;

• квантитативный (количественный) анализ информации;

• анализ текста на основе методов обработки естественного языка;

• визуализация данных;

• построение патентных ландшафтов.

1. Кластеризация выборки патентов по заданным параметрам. Кластеризация данных в рамках ПИ подразумевает поиск и упорядочивание попавших в первоначальную выборку патентов в группы по определенным критериям отбора, в частности по технической направленности или уровню цитируемости. Актуальность применения методов кластеризации обусловлена следующей проблемой патентного поиска: изобретатели и эксперты патентных ведомств зачастую не точно классифицируют заявки по Международной патентной классификации (МПК) [15, 16] (Li, Hu, Cui, Hu, 2018; Seneviratne, Geva, Zuccon, Ferraro, Chappell, Meireles, 2016). В результате это значительно усложняет процесс поиска релевантной информации. Применение машинного обучения для кластеризации патентов позволяет обнаружить значимые ассоциации по всему корпусу патентов [17] (Smith, Agrawal, 2015), и это означает, что тематический поиск патентов по рубрикам МПК недостаточно эффективен, однако может быть использован для первого этапа кластеризации данных [18] (Giachanou, Salampasis, Paltoglou, 2015). Эксперимент, описанный в работе [17] (Smith, Agrawal, 2015), показал, что методы ^-средних и ^-медиан позволяют успешно формировать кластеры патентов на основе частоты терминов в каждом патенте. При этом следует отметить ряд ограничений и недостатков, присущих методу ^-средних [19] (Han, Pei, Kamber, 2011) и актуальных в том числе для работы с патентными данными:

• необходимость заранее указать количество кластеров;

• невозможность обработать зашумленные данные и выбросы;

• невозможность обнаружения кластеров с невыпуклыми формами.

2. Анализ цитируемости патентов. Статистический анализ показателей цитирования патентов позволяет исследовать распространение, диффузию и жизненный цикл технологий. При прочих равных условиях патенты с большим числом цитирований имеют более высокое качество и рассматриваются как базовое изобретение в данной области [20] (Breschi, Tarasconi, Catalini, Novella, Guatta, Johnson, 2006). Помимо измерения технологического воздействия инноваций, анализ цитируемости используется в других областях. Например, в работе [21] (Breitzman, Thomas, 2002) предлагается на его основе оценивать портфель интеллектуальной собственности компаний при подготовке сделок слияний и поглощений; в работе [22] (Jia, Xuan-ting, Yun, 2013) с помощью сетей патентного цитирования измеряются международные потоки знаний. Согласно [23] (Sharma, Tripathi, 2017), на сегодняшний день алгоритмы сетевого анализа цитирования патентов активно развиваются на базе методов теории графов, теории решения изобретательских задач и т.д. Результаты такого анализа представляются в виде графов и дорожных карт.

3. Квантитативный анализ информации. Методы квантитативного анализа патентной информации основаны на работе с метаданными патента: дата приоритета изобретения, дата регистрации патента, заявитель, автор, их страновая принадлежность и др. Результаты количественного анализа позволяют оценить темпы изобретательской активности в отрасли, лидеров в НИОКР, сферу патентной деятельности конкретного предприятия или ученых. Доступность и полнота патентной информации делает ее незаменимой при анализе рынка наукоемкой продукции, а также при исследованиях технологического развития той или иной сферы. Однако патентные документы в своем первоначальном виде обладают недостатком, который существенно затрудняет их автоматизированную обработку для целей статистического моделирования: они являются неструктурированными данными [24] (Park, Jun, 2017). Методы интеллектуального анализа текста позволяют представить их в виде структурированных данных - таблицы, в которой строки содержат патенты, а столбцы - переменные [25] (Jun, 2014). Современные базы и системы поиска патентной информации хранят метаданные загруженных патентов уже в структурированном виде.

4. Анализ текста патентов на основе методов обработки естественного языка. Решение таких задач ПИ, как оценка патентной чистоты, технического уровня, изучение тенденций развития объекта техники, требует анализа больших объемов неструктурированных данных, содержащихся в названии, формуле и описании патента. Инструментарий обработки естественного языка (Natural Language Processing, NLP) обеспечивает решение задач, связанных с поиском, анализом и составлением текстов на основе обработки текстовой информации. Выделяется два подхода к анализу текста на основе NLP: (а) использование ключевых слов, (б) использование методологии

«субъект -действие - объект» (Subject - Action - Object, SAO) [26] (Abbas, Zhang, Khan, 2014). При этом методы, относящиеся к группе (а), не учитывают значение отдельных слов и структурные связи между компонентами, что существенно снижает их результативность. Кроме того, необходимо предварительное составление перечня ключевых слов и фраз, требующее экспертных знаний в данной технической сфере. Методы группы (б) анализируют неструктурированную информацию, выявляя взаимосвязи между ключевыми компонентами, учитывая в том числе семантические отношения между словами. При этом используются не векторы ключевых слов, а структуры SAO, которые представляют понятия в форме «задача - решение» [27, 28, 29] (Yoon, Kim, 2011; Park, Ree, Kim, 2013; Choi, Kim, Yoon, Kim, Lee, 2013).

4. Визуализация данных. Визуальное представление патентной информации необходимо лицам, принимающим решения, или экспертам для оценки и анализа результатов ПИ. Наиболее простым методом визуализации структурированных патентных данных является построение временных рядов, гистограмм, круговых диаграмм, позволяющих оценить количественные тенденции патентной активности по различным параметрам. Для отображения взаимосвязей между изобретениями используются патентные карты, построенные на основе ключевых слов и фраз [26] (Abbas, Zhang, Khan, 2014), а также патентные сети, в которых узлы представляют собой патенты, а связи - отношения между узлами-патентами [30] (Yoon, Park, 2004). Альтернативными методами визуализации результатов патентного анализа являются самоорганизующиеся карты [31] (Segev, Kantola, 2012) и построение патентных карт на основе кластеризации методом k-средних [32] (Kim, Suh, Park, 2008). Особенностью последнего метода является то, что он применим в том числе и для неструктурированных данных.

5. Построение патентных ландшафтов. Патентный ландшафт представляет собой обзор патентной деятельности и тенденций в той или иной технологической области и является эффективным инструментом поддержки принятия управленческих решений в наукоемком бизнесе. При этом, как отмечено в Руководстве ВОИС по подготовке отчетов о патентных ландшафтах [33], на сегодняшний день нет общепринятого определения патентного ландшафта, и одни авторы подразумевают под патентным ландшафтом многостороннее исследование, включающее также анализ рынка и непатентных данных; ряд других авторов рассматривают патентный ландшафт как вариант патентной карты. Однако независимо от трактовки термина всегда подразумевается, что патентный ландшафт представляет комплексную информацию в доступной для широкого круга потребителей форме. Методические рекомендации Роспатента, разработанные на основе методологии ВОИС, содержат следующее определение: «Патентный ландшафт - это информационно-аналитическое исследование патентной документации, показывающее в общем виде патентную ситуацию в определенном технологическом направлении либо в отношении патентной активности субъектов инновационной сферы с учетом временной динамики и территориального признака: страны, региона или в мировом масштабе» [34]. Цифровизация процесса формиро-

вания патентных ландшафтов предполагает комбинацию различных методов интеллектуального анализа патентной информации и методов визуализации результатов данного анализа.

В настоящее время существует ряд коммерческих и открытых информационно-поисковых систем, обеспечивающих доступ к патентным базам данных многих стран. Среди баз со свободным доступом можно выделить следующие:

1. Сервис «Яндекс.Патенты» [35], который позволяет проводить поиск по базам Федерального института промышленной собственности. Поиск документов может проводиться по метаданным патентного документа, а также по ключевым словам с учетом различных морфологических форм и синонимов. Использование операторов позволяет уточнять поисковый запрос, например, по цитате с пропущенными словами или частями слова. Вывод найденных документов происходит следующим образом: в выдаче отображаются патенты, соответствующие ключевым критериям запроса, также схожие патенты. Также отображаются документы, цитирующие искомый патент. В качестве недостатка данного сервиса можно отметить географическую ограниченность поиска.

2. Сервис Google Patents [36] работает по такому же принципу, как и поисковая система Google. Патенты, опубликованные не на английском языке, автоматически переводятся и индексируются системой. Сложные алгоритмы и поисковые запросы позволяют получить наиболее релевантный результат. Google Patents поддерживает поиск по метаданным патента, а также поиск по тексту патента на основе булевой логики, операторов приближения, поиска внутри отдельных полей документа и усечения слов. Отдельно можно отметить функцию поиска по химическим формулам и обозначениям.

3. База ВОИС Patentscope [37], содержащая патентную информацию по международным патентным заявкам, поданным по системе Patent Cooperation Treaty (РСТ), а также по региональным и национальным патентным коллекциям 60 патентных ведомств. Поддерживается поиск как по метаданным патента, так и по тексту с использованием булевой логики, операторов приближения и усечения слов, также поддерживается поиск по химическим обозначениям. Отличительной особенностью системы Patentscope является инструмент для перевода патентных текстов, разработанный на основе технологий искусственных нейронных сетей и обученный на двуязычных корпусах патентных документов, относящихся к 32 техническим областям, определенным по МПК.

4. Сервис Espacenet [38], разработанный Европейским патентным ведомством, обеспечивающий доступ к патентам Европейской патентной организации, а также к патентным коллекциям многих национальных ведомств. По данным на 2017 год, в базе Espacenet содержалось около 110 миллионов патентных документов. Инструментарий поиска аналогично описанным выше системам включает поиск по метаданным и полным текстам патентов, но кроме того, Espacenet позволяет проводить поиск не только

на уровне отдельных документов, но и патентных семейств. Также предусмотрена функция машинного перевода документов.

В сфере патентного поиска и аналитики также существует значительное количество коммерческих продуктов. В настоящей работе будут рассмотрены следующие:

1. Интегрированная платформа IP Platform, разработанная компанией CPA Global, обеспечивающая оцифровку и автоматизацию всех этапов жизненного цикла результата интеллектуальной деятельности и соответствующих бизнес-процессов. Платформа включает приложения для поиска, анализа и визуализации патентной информации, основанные на современных технологиях больших данных и искусственного интеллекта [39].

2. Система Orbit Intelligence компании Questel, аккумулирующая данные о поданных заявках и зарегистрированных патентах 95 национальных и международных патентных ведомств. Все содержащиеся в базе патенты объединены в коллекции по тематическому признаку. Большинство документов содержат аннотации на английском языке, полные тексты документов приводятся на языке оригинала. Система содержит поисковый и аналитический инструментарий, позволяющий решать задачи различной направленности [40].

3. Веб-платформа PatSeer компании Gridlogics Technologies, реализующая современные методы поиска информации, интеллектуального анализа и визуализации патентных данных [41]. База включает полные тексты патентов 67 стран и библиографические описания патентов 106 стран. Машинный перевод на английский язык доступен для патентов 36 стран. Платформа содержит широкий набор аналитических инструментов, ориентированных на мониторинг рынка и конкурентную разведку.

4. Платформа патентной аналитики PatSnap, включающая инструменты, ориентированные на анализ технологических тенденций развития отрасли, конкурентную разведку и поддержку принятия управленческих решений в сфере НИОКР [42]. В базе PatSnap содержится более 130 миллионов патентов различных стран, а также непатентные документы, такие как лицензионные договоры, судебные протоколы, финансовая и корпоративная отчетность, а также данные по химическим веществам, лекарствам и продуктам питания.

5. Созданная компанией Clarivate Analytics платформа Derwent Innovation, предоставляющая доступ к патентам и научной литературе и позволяющая решать различные задачи ПИ, включая технические обзоры, конкурентный анализ, бенчмаркинг, оценку рисков [43]. Платформа использует базы данных собственной разработки: Derwent Word Patent Index (DWPI) - глобальная база патентной информации и Derwent Patent Citation Index (DPCI) - база патентного цитирования.

Все перечисленные инструменты позволяют эффективно оцифровать процесс патентного поиска, однако в части анализа патентной информации их функциональные возможности различны.

Обсуждение. В ГОСТ Р 15.011-96 выделяются следующие задачи ПИ:

• определение технического уровня исследуемой техники, товара или услуги;

• анализ патентной деятельности основных конкурентов, исследуемой компании в сфере рассматриваемого направления;

• определение тенденций развития рассматриваемого вида техники;

• анализ существующих изобретений по теме указанной разработки;

• определение и исследование уровня новизны рассматриваемого объекта деятельности;

• исследование патентной чистоты по выбранной сфере;

• исследование патентоспособности рассматриваемого объекта.

В таблице 1 приведено сопоставление рассмотренных выше подходов к цифрови-зации патентного анализа с задачами ПИ, перечисленными в ГОСТ, с точки зрения эффективности их применения. Обозначения:

++ - подход полностью соответствует задаче; + - подход может быть использован; 0 - подход слабо соответствует задаче.

Как видно из таблицы, методы кластеризации, квантитативного анализа патентных данных и построения патентных ландшафтов наиболее эффективны при решении задач, связанных с выявлением закономерностей и тенденций в больших массивах

Таблица 1

эффективность подходов к цифровизации патентного анализа при решении задач пи

задачи пи подходы к цифровизации патентного анализа

кластеризация Анализ цитируемо-сти квантитативный анализ Анализ текста визуализация патентные ландшафты

Определение технического уровня ++ ++ + ++ + 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Анализ патентной деятельности конкурентов + + ++ + + ++ ++

Определение тенденций развития рассматриваемой области ++ + ++ + ++ ++

Исследование патентной чистоты 0 + 0 ++ 0 0

Исследование патентоспособности объекта + ++ 0 ++ 0 0

данных. При этом патентные ландшафты ориентированы на исследование текущей конъюнктуры рынка в целом и слабо подходят для исследования технического уровня разработки, требующего ретроспективного анализа в узкой области. Анализ цити-руемости также отвечает этим задачам, связанным с исследованием рынка, но при этом он эффективен и для задач, требующих точечного выявления наиболее релевантных патентов. Методы интеллектуального анализа текста соответствуют всем задачам ПИ, поскольку позволяют максимально детализированно изучать развитие научно-технических областей и проводить сравнительный анализ формул изобретений. Визуализация результатов анализа мало актуальна для исследования патентной чистоты и патентоспособности разработки, т.к. в рамках данных задач необходимо выявить наличие совпадающих изобретений или подтвердить их отсутствие.

Все перечисленные подходы позволяют выполнить требования ГОСТ Р 15.011-96, что является необходимым условием, в частности при выполнении НИОКР по государственному контракту.

Результаты анализа функциональных возможностей перечисленных выше инструментов поиска и анализа патентной информации представлены в таблице 2 в виде сопоставления с подходами к цифровизации патентного анализа.

Обозначения:

++ - подход реализован в данном инструменте;

+ - подход частично реализован в данном инструменте;

0 - подход не реализован в данном инструменте.

Таблица 2

Анализ функциональных возможностей цифровых инструментов патентного поиска и аналитики

Инструменты Подходы к цифровизации патентного анализа

Кластеризация Анализ ци-тируемости Квантитативный Анализ текста Визуализация патентные ландшафты

Яндекс.Патенты 0 + + + 0 0

Google Patents 0 + + + 0 0

Patentscope 0 0 ++ + + 0

Espacenet 0 0 0 0 0 0

IP Platform ++ ++ ++ + ++ ++

Orbit Intelligence ++ ++ ++ ++ ++ ++

PatSeer + ++ ++ + ++ +

PatSnap ++ + ++ ++ ++ ++

Derwent Innovation + ++ ++ ++ ++ ++

Результаты сравнительного анализа показывают, что в рассмотренных коммерческих системах достаточно полно реализованы все подходы к цифровизации патентной аналитики, включая алгоритмы обработки естественного языка, что делает их мощными инструментами, позволяющими решать все ключевые задачи ПИ. Функционал открытых информационно-поисковых систем значительно ограничен по сравнению с коммерческими продуктами, в частности, ни в одной из них не реализована возможность кластеризации выборки патентов и построения патентных ландшафтов. Визуальное представление результатов количественного анализа выборки реализовано только в системе Patentscope. Таким образом, открытые информационно-поисковые системы позволяют решать «точечные» задачи, например поиск наиболее релевантных патентов для оценки новизны научно-технического решения, однако малоэффективны для выявления закономерностей и тенденций развития в больших выборках.

заключение

Патентные исследования представляют собой работу с большим количеством как структурированной, так и неструктурированной информации, в связи с чем их цифро-визация требует применения современных методов анализа больших данных и обработки естественного языка, основанных на машинном обучении. Сегодня на рынке представлено значительное количество цифровых инструментов патентного поиска и аналитики, которые эффективно реализуют данные технологии и позволяют проводить поиск по метаданным и ключевым словам, выполнять кластеризацию патентов по различным критериям и проводить глубокий анализ текста патентов, исследовать связи между ними и уровень изобретательской активности в отрасли, а также формировать аналитические отчеты в виде патентных ландшафтов. Частично этот функционал реализован в открытых информационно-патентных системах, что позволяет эффективно использовать их для ПИ небольшого масштаба.

Таким образом, на сегодняшний день является возможной цифровизация широкого спектра задач ПИ, с которыми сталкиваются разработчики в процессе выполнения и экспертизы НИОКР, что приводит к снижению затрат организации на НИОКР и повышению их результативности. При этом постоянное совершенствование технологий машинного обучения и тенденции формирования цифровой экономики позволяют сделать вывод о том, что методы и инструменты ПИ имеют широкую перспективу дальнейшего развития на базе данных технологий.

ИСТОЧНИКИ:

1. ГОСТ Р 15.011-96. «Система разработки и постановки продукции на производство. Патентные исследования. Содержание и порядок проведения». Docs.cntd.ru. [Электронный ресурс]. URL: http://docs.cntd.ru/document/5200264 (дата обращения: 20.01.2020).

2. Методические рекомендации по проведению патентных исследований в ОАО «РЖД». Doc.rzd.ru. [Электронный ресурс]. URL: http://doc.rzd.ru/doc/public/ ru?STRUCTURE_ID=704&layer_id=5104&id=6434 (дата обращения: 20.01.2020).

3. Рекомендации по проведению патентных исследований при проведении НИОКР в организациях Корпорации. Intellectexport. [Электронный ресурс]. URL: https:// www.intellectexport.ru/documents (дата обращения: 20.01.2020).

4. Методические рекомендации по проведению патентных исследований на уровень техники новых разработок и проведению экспертизы на патентную чистоту созданных и выпускаемых объектов интеллектуальной собственности в соответствии с ГОСТ Р 15.011-96 «Патентные исследования. Содержание и порядок проведения». Sk.ru. [Электронный ресурс]. URL: http://sk.ru/foundation/ipcenter/b/news/ archive/2013/10/16/provedenie-patentnyh-issledovaniy-metodicheskie-rekomendacii. aspx (дата обращения: 20.01.2020).

5. Скорняков Э.П., Горбунова М.Э. Патентные исследования. / Учебное пособие. - М.: Патент, 2011. - 181 c.

6. Скорняков Э.П., Горбунова М.Э. Патентные исследования на основе баз данных, представленных в Интернете. - М.: Патент, 2014. - 158 c.

7. Скорняков Э.П., Горбунова М.Э. Отбор наиболее эффективных изобретений из мирового патентного фонда для использования в НИОКР. - М.: Патент, 2008. - 176 c.

8. Шведова В.В. Исследование патентной чистоты объекта. / Учебное пособие. - М.: Патент, 2015. - 212 c.

9. Скорняков Э.П., Цехмистренко Н.М., Горбунова М.Э. Патентные исследования при стоимостной оценке объектов промышленной собственности. - М.: Патент, 2008. -76 c.

10. Петрова И.Ю., Пучкова А.А. Методика проведения патентного анализа с целью поиска аналогов и прототипов полученных технических решений // Вестник Мордовского университета. - 2016. - № 1. - c. 50-57. - doi: 10.15507/02362910.026.201601.050-057.

11. Смирнов И.В. Патентная аналитика для научно-технологического развития стран Большой Евразии // Аналитика развития, безопасности и сотрудничества: Большая Евразия - 2030: XVII международная научная конференция «Модернизация России: приоритеты, проблемы, решения» (Москва, 01 января-31 декабря 2017 г.). сб. тез. межд. науч. конф. М., 2018. - c. 602-603.

12. Aristodemou L., Tietze F. The state-of-the-art on Intellectual Property Analytics (IPA): A literature review on artificial intelligence, machine learning and deep learning methods for analysing intellectual property (IP) data // World Patent Information. - 2018. - p. 37-51.

13. Zambetti M.; Sala R.; Russo D.; Pezzotta G.; Pinto R. A patent review on machine learning techniques and applications: Depicting main players, relations and technology landscapes // Industrial Systems Engineering: 23rd Summer School «Francesco Turco». 2018. - p. 115-128.

14. Trippe A.J. Patinformatics: Tasks to tools // World Patent Information. - 2003. -№ 25(3). - p. 211-221.

15. Li S., Hu J., Cui Y., Hu J. DeepPatent: patent classification with convolutional neural networks and word embedding // Scientometrics. - 2018. - № 2. - p. 721-744. - doi: 10.1007/ s11192-018-2905-5.

16. Seneviratne D., Geva S., Zuccon G., Ferraro G., Chappell T., & Meireles M. A signature approach to patent classification. Information Retrieval Technology. [Электронный ресурс]. URL: https://www.researchgate.net/publication/299610256_A_Signature_ Approach_to_Patent_Classification.

17. Smith M., Agrawal R. A comparison of patent classifications with clustering analysis // Web Information Systems Engineering - WISE 2015: Lecture Notes in Computer Science. Майами, Флорида, США, 2015. - p. 400-413.

18. Giachanou A., Salampasis M., Paltoglou G. Multilayer source selection as a tool for supporting patent search and classification // Information Retrieval. - 2015. - № 6(18). -p. 559-585.

19. Han J., Pei J., Kamber M. Data mining: concepts and techniques. , 2011. - 744 p.

20. Breschi S., Tarasconi G., Catalini C., Novella L., Guatta P., Johnson H. Highly cited patents, highly cited publications, and research networks. - Milan, Italy: CESPRI-Bocconi University, 2006.

21. Breitzman A., Thomas P. Using patent citation analysis to target/value M&A candidates // Research-Technology Management. - 2002. - № 5. - p. 28-36.

22. Jia L., Xuan-ting Y. E., Yun L. Study on the effect of international knowledge flows on the industry innovation performance in China // Journal of Applied Sciences. - 2013. -№ 10. - p. 1669-1676.

23. Sharma P., Tripathi R.C. Patent citation: A technique for measuring the knowledge flow of information and innovation // World Patent Information. - 2017. - p. 31-42.

24. Park S., Jun S. Statistical Technology Analysis for Competitive Sustainability of Three Dimensional Printing // Sustainability. - 2017. - № 7. - p. 1142.

25. Jun S. A technology forecasting method using text mining and visual apriori algorithm // Applied Mathematics. - 2014. - № 1L. - p. 35-40.

26. Abbas A., Zhang L., Khan S.U. A literature review on the state-of-the-art in patent analysis // World Patent Information. - 2014. - p. 3-13.

27. Yoon J., Kim K. Detecting signals of new technological opportunities using semantic patent analysis and outlier detection // Scientometrics. - 2011. - № 2. - p. 445-461.

28. Park H., Ree J.J., Kim K. Identification of promising patents for technology transfers using TRIZ evolution trends // Expert Systems with Applications. - 2013. - № 2. - p. 736743.

29. Choi S., Kim H., Yoon J., Kim K., Lee J.Y. An SAO-based text-mining approach for technology roadmapping using patent information // R and D Management. - 2013. -№ 1. - p. 52-74.

30. Yoon B., Park Y. A text-mining-based patent network: Analytical tool for high-technology trend // Journal of High Technology Management Research. - 2004. - № 1. - p. 37-50.

31. Segev A., Kantola J. Identification of trends from patents using self-organizing maps // Expert Systems with Applications. - 2012. - № 18. - p. 13235-13242.

32. Kim Y.G., Suh J.H., Park S.C. Visualization of patent analysis for emerging technology // Expert Systems with Applications. - 2008. - № 3. - p. 1804-1812.

33. Guidelines for Preparing Patent Landscape Reports. Wipo.int. [Электронный ресурс]. URL: https://www.wipo.int/edocs/pubdocs/en/wipo_pub_946.pdf (дата обращения: 20.01.2020).

34. Методические рекомендации по подготовке отчетов о патентном обзоре (патентный ландшафт). Docs.cntd.ru. [Электронный ресурс]. URL: http://docs.cntd.ru/ document/456040849 (дата обращения: 20.01.2020).

35. Патенты. Яндекс. [Электронный ресурс]. URL: https://yandex.ru/patents (дата обращения: 20.01.2020).

36. Google Patents. [Электронный ресурс]. URL: https://patents.google.com (дата обращения: 20.01.2020).

37. Patentscope. [Электронный ресурс]. URL: https://patentscope.wipo.int/search/ru/ search.jsf (дата обращения: 20.01.2020).

38. Espacenet. Worldwide. [Электронный ресурс]. URL: https://worldwide.espacenet.com (дата обращения: 20.01.2020).

39. IP Platform. Cpaglobal.com. [Электронный ресурс]. URL: https://www.cpaglobal.com/ ip-intelligence/innography-corporate (дата обращения: 20.01.2020).

40. Orbit Intelligence. Questel.com. [Электронный ресурс]. URL: https://www.questel.com/ business-intelligence-software/orbit-intelligence (дата обращения: 20.01.2020).

41. PatSeer. [Электронный ресурс]. URL: https://patseer.com/patseer-content (дата обращения: 20.01.2020).

42. PatSnap. [Электронный ресурс]. URL: https://www.patsnap.com/product (дата обращения: 20.01.2020).

43. Derwent Innovation. Clarivate.com. [Электронный ресурс]. URL: https://clarivate.com/ derwent/solutions/derwent-innovation (дата обращения: 20.01.2020).

REFERENCES:

Abbas A., Zhang L., Khan S.U. (2014). A literature review on the state-of-the-art in

patent analysis World Patent Information. 37 3-13. Aristodemou L., Tietze F. (2018). The state-of-the-art on Intellectual Property Analytics (IPA): A literature review on artificial intelligence, machine learning and deep learning methods for analysing intellectual property (IP) data World Patent Information. 55 37-51. Breitzman A., Thomas P. (2002). Using patent citation analysis to target/value M&A candidates Research-Technology Management. 45 (5). 28-36.

Breschi S., Tarasconi G., Catalini C., Novella L., Guatta P., Johnson H. (2006). Highly cited patents, highly cited publications, and research networks Milan, Italy: CESPRI-Bocconi University.

Choi S., Kim H., Yoon J., Kim K., Lee J.Y. (2013). An SAO-based text-mining approach for

technology roadmapping using patent information R and D Management. (1). 52-74. Derwent InnovationClarivate.com. Retrieved January 20, 2020, from https://clarivate.

com/derwent/solutions/derwent-innovation EspacenetWorldwide. Retrieved January 20, 2020, from https://worldwide.espacenet.com

Giachanou A., Salampasis M., Paltoglou G. (2015). Multilayer source selection as a tool for

supporting patent search and classification Information Retrieval. (6(18)). 559-585. Google Patents. Retrieved January 20, 2020, from https://patents.google.com Guidelines for Preparing Patent Landscape ReportsWipo.int. Retrieved January 20,

2020, from https://www.wipo.int/edocs/pubdocs/en/wipo_pub_946.pdf Han J., Pei J., Kamber M. (2011). Data mining: concepts and techniques Morgan Kaufmann.

IP PlatformCpaglobal.com. Retrieved January 20, 2020, from https://www.cpaglobal.

com/ip-intelligence/innography-corporate Jia L., Xuan-ting Y. E., Yun L. (2013). Study on the effect of international knowledge flows on the industry innovation performance in China Journal of Applied Sciences. 13 (10). 1669-1676.

Jun S. (2014). A technology forecasting method using text mining and visual apriori

algorithm Applied Mathematics. (1L). 35-40. Kim Y.G., Suh J.H., Park S.C. (2008). Visualization of patent analysis for emerging

technology Expert Systems with Applications. (3). 1804-1812. Li S., Hu J., Cui Y., Hu J. (2018). DeepPatent: patent classification with convolutional neural networks and word embedding Scientometrics. 117 (2). 721-744. doi: 10.1007/ s11192-018-2905-5.

Orbit IntelligenceQuestel.com. Retrieved January 20, 2020, from https://www.questel.

com/business-intelligence-software/orbit-intelligence Park H., Ree J.J., Kim K. (2013). Identification of promising patents for technology transfers using TRIZ evolution trends Expert Systems with Applications. (2). 736-743. Park S., Jun S. (2017). Statistical Technology Analysis for Competitive Sustainability of

Three Dimensional Printing Sustainability. (7). 1142. PatSeer. Retrieved January 20, 2020, from https://patseer.com/patseer-content PatSnap. Retrieved January 20, 2020, from https://www.patsnap.com/product Patentscope. Retrieved January 20, 2020, from https://patentscope.wipo.int/search/ru/ search.jsf

Petrova I.Yu., Puchkova A.A. (2016). Metodikaprovedeniyapatentnogo analiza s tselyu poiska analogov i prototipov poluchennyh tekhnicheskikh resheniy [The use of the patent analysis method for finding analogues and prototypes of received technical solutions]. Vestnik Mordovskogo universiteta. 26 (1). 50-57. (in Russian). doi: 10.15507/0236-2910.026.201601.050-057.

Segev A., Kantola J. (2012). Identification of trends from patents using self-organizing maps Expert Systems with Applications. (18). 13235-13242.

Seneviratne D., Geva S., Zuccon G., Ferraro G., Chappell T., & Meireles M. A signature approach to patent classificationInformation Retrieval Technology. Retrieved from https://www.researchgate.net/publication/299610256_A_Signature_Approach_to_ Patent_Classification

Sharma P., Tripathi R.C. (2017). Patent citation: A technique for measuring the knowledge flow of information and innovation World Patent Information. 51 31-42.

Shvedova V.V. (2015). Issledovaniepatentnoy chistoty obekta [Research of patent purity of the object] M.: Patent. (in Russian).

Skornyakov E.P., Gorbunova M.E. (2008). Otbor naibolee effektivnyh izobreteniy iz mirovogo patentnogo fonda dlya ispolzovaniya v NIOKR [The selection of the most effective inventions from the global patent fund for R&D] M.: Patent. (in Russian).

Skornyakov E.P., Gorbunova M.E. (2011). Patentnye issledovaniya [Patent research] M.: Patent. (in Russian).

Skornyakov E.P., Gorbunova M.E. (2014). Patentnye issledovaniya na osnove baz dannyh, predstavlennyh v Internete [Patent researches based on the databases available in the Internet] M.: Patent. (in Russian).

Skornyakov E.P., Tsekhmistrenko N.M., Gorbunova M.E. (2008). Patentnye issledovaniya pri stoimostnoy otsenke obektov promyshlennoy sobstvennosti [Patent researches in the valuation of industrial property] M.: Patent. (in Russian).

Smirnov I.V. (2018). Patentnaya analitika dlya nauchno-tekhnologicheskogo razvitiya stran Bolshoy Evrazii [Patent analytics for scientific and technological development of the countries of Big Eurasia] Analysis of development, security and cooperation: Big Eurasia 2030. 602-603. (in Russian).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Smith M., Agrawal R. (2015). A comparison of patent classifications with clustering analysis Web Information Systems Engineering - WISE 2015. 400-413.

Trippe A.J. (2003). Patinformatics: Tasks to tools World Patent Information. (25(3)). 211-221.

Yoon B., Park Y. (2004). A text-mining-based patent network: Analytical tool for high-technology trend Journal of High Technology Management Research. (1). 37-50.

Yoon J., Kim K. (2011). Detecting signals of new technological opportunities using semantic patent analysis and outlier detection Scientometrics. (2). 445-461.

Zambetti M.; Sala R.; Russo D.; Pezzotta G.; Pinto R. (2018). A patent review on machine learning techniques and applications: Depicting main players, relations and technology landscapes Industrial Systems Engineering. 115-128.

i Надоели баннеры? Вы всегда можете отключить рекламу.