Cloud of Science. 2017. T. 4. № 4 http:/ / cloudofscience.ru
Актуализация образовательных программ на основе патентного анализа как индикатора развития инновационных технологий
Е. В. Никульчев*' **, Д. Ю. Ильин*'**, Г. Г. Бубнов*
Московский технологический институт 119334, Москва, Ленинский проспект, 38а
**Московский технологический университет 119454, г. Москва, просп. Вернадского, 78
e-mail: [email protected]
Аннотация. В исследовании поднят вопрос о необходимости проверки соответствия навыков образовательной программы текущим реалиям. В качестве исходных данных предложена выборка из 20 навыков, разделенных на 5 групп. Проведен анализ этих навыков с использованием данных о патентной активности и состоянии рынка труда. Для этого задействован сервис прогнозного обучения, в котором были внесены доработки в соответствии с требованиями исследования. Результаты показывают, что существует высокий уровень корреляции между патентной активностью и последующей востребованностью навыков на рынке труда. Ключевые слова: развитие инновационных технологий, патентный анализ, информационно-аналитический сервис, прогнозные модели.
1. Введение
В настоящее время в высокотехнологичных профессиях быстро меняется набор базовых навыков и умений. Чтобы оставаться специалистом, например, в ИТ, необходимо постоянно повышать свою компетентность, не только изучая новые языки программирования, но и технологии и даже технику программирования и новые стандарты. Навык является базовой единицей принадлежности к той или иной профессиональной группе в профессиональных социальных сетях, таких как LinkedIn и ResearchGate [1], где с помощью навыков формируются профессиональные группы, определяются темы для обсуждений, а также предлагаются актуальные вакансии.
Однако перед каждым специалистом встают важные вопросы: чему дальше учиться, чтобы навык был востребован; чтобы навык остался актуальным через несколько лет; чтобы навык являлся основой для освоения новейших технологий. Выбор источников информации для принятия решений при выборе так называемой образовательные траектории весьма затруднителен. Компании определяя навыки при повышении квалификации своими сотрудниками руководствуются используе-
мыми в их деятельности технологиями. При частном выборе конкретного человека — чему же поучиться, чтобы не отстать в профессии, источником является опрос знакомых, чтение аналитических материалов часто общего, чисто конъюнктурного характера. Важным источником здесь также являются социальные сети. Для многих появившиеся поля навыков участников профессиональных сообществ являются поводом к популяризации профессионального навыка. Это, например, наблюдалось с навыком «технологии дип леанинг», когда популярность термина опережала новизну предлагаемых алгоритмических и технологических решений. Другим примером являются облачные технологии, когда набор ранее известных технологий создал новый термин и устоявшийся профессиональный навык.
В образовательном учреждении при составлении программ всегда возникает вопрос о том, какие базовые технологии изучать из имеющихся альтернатив [2]. Это, например, может быть актуально и с самых ранних курсов — для программистов с какого языка начать обучение профессии, с какой версии и с какой операционной системы [3]. Таким образом, главное даже для специалистов в области обучения — выбор из имеющихся вариантов для практических занятий в дисциплинах, которые лягут в основу профессии.
На сегодняшний день существует целый ряд методов для оценки актуальности программ обучения. Одним из них является внутренний опрос сотрудников образовательного учреждения [4] в формате структурированного или неструктурированного интервью, тем самым привлекая большее количество экспертов к вопросу. Для оценки рассматриваются показатели достижений, например — уровень трудоустройства среди выпускников [5].
Авторы разрабатывают подход актуализации профессиональных навыков на основе использования патентного анализа и оценки востребованности на рынке труда. Основная гипотеза исследований — навыки, в частности, с рассматриваемой в статье областью ИТ, напрямую связаны с количеством зарегистрированных патентов по конкретной технологии. Несмотря на 1.5-2-летнюю формальную задержку, связанную с формальным оформлением патентов, количество патентов с использованием технологии определяет текущую и будущую популярность соответствующего навыка на рынке труда.
Таким образом, показатель инновационности сфер экономической деятельности и соответствующих им профессий можно определить, применяя методики, связанные с анализом патентной активности [6]. Предлагается использовать этот факт для актуализации образовательных программ профессионального образования и повышения квалификации.
Статья посвящена результатам исследований для актуализации образовательных программ в области ИТ по оценке актуальности 26 конкретных навыков. Для
этого был проведен патентный анализ по этим навыкам и получены корреляционные зависимости между количеством патентов на 2014 год и текущей востребованностью на рынке труда.
2. Оценка актуальности навыков в области ИТ
Рассматривалась задача по оценке актуальности освоения навыков и технологий, входящих в образовательные программы в области ИТ. Сбор экспертных оценок является наиболее распространенным методом решения подобной задачи [7], но его сложно назвать достаточно объективным. В качестве базедовых оценок актуальности компетенций предлагается использовать, во-первых, результаты патентного анализа [8], а именно, количественные оценки патентов с упоминанием технологии и значения роста числа патентов за последние годы; во-вторых текущую востребованность навыка на рынке труда, т. е. частоту упоминания навыка в вакансиях работодателей [5].
Были определены следующие ключевые концептуальные положения.
1. Набор навыков определяет состояние профессиональной пригодности в текущий момент времени. То есть профессиональная пригодность есть динамическая характеристика. Даже очень хорошее знание ретро-технологий не позволит сейчас же приступить к функциональным обязанностям. Необходимость тех или иных навыков даже для одной профессии меняется со временем. Поэтому представляется возможность оценить своевременность навыка.
2. Набор навыков определяется по их востребованности на рынке труда. Ведь в профессиональной деятельности на первом месте является владение текущими технологиями, представляет интерес прогноз развития востребованности технологий в будущем. На основании мониторинга вакансий можно тем самым оценить текущую востребованность навыка.
3. Навыки представляют интерес в сочетаниях друг с другом.
В рамках исследования были проанализированы 20 навыков, входящих в программы курсов профессионального образования. Для удобства восприятия назначим каждому из них код навыка и код группы навыка (табл. 1). Расшифровка групп навыков представлена в табл. 2.
Для исследования были заданы следующие вопросы: какая связь существует между спросом на специалистов на рынке труда и предшествующей этому патентной активностью? какие специализированные технические решения могут быть необходимы для анализа патентной активности по отдельно взятым навыкам? какие из перечисленных навыков следует считать перспективными и востребованными на рынке труда?
Таблица 1. Перечень исследуемых навыков
Skill Skill Code Skill Group Code
C SOi GOi
Java S02 GOi
Python S03 GOi
HTML S04 GO2
CSS S05 GO2
HTML5 S06 GO2
CSS3 S07 GO2
Machine Learning SOS GO3
Deep Learning S09 GO3
Big Data Analytics SiO GO3
Search Engine Optimization Sii GO4
Internet Marketing Si2 GO4
Email Marketing Si3 GO4
Content Marketing Si4 GO4
Social Media Marketing Si5 GO4
Linux Administration Si6 GO5
FreeBSD Administration Si7 GO5
TCP/IP SiS GO5
Network Security Si9 GO5
Computer Networking S2O GO5
Таблица 2. Группы навыков
Skill Group Skill Group Code
Programming Languages GOi
Web Development (Frontend) GO2
Analytics GO3
Marketing GO4
System Administration GO5
Разработан сервис прогнозного обучения [9] для поддержки принятия решений, осуществляющий сбор, гомогенизацию данных, а также их визуализацию. В нем используются открытые данные о патентной активности, данные рынков труда и другие. Задействованные источники имеют ряд особенностей: существование омонимов, которые привносят в данные шум; различия в написании наименований технологий (например, использование акронимов и аббревиатур). Первая особенность характеризуется тем, что процент ложноположительных результатов при патентном поиске, а также при поиске в иных источниках данных (научные публикации, базы вакансий) может превышать разумные границы. Например, как было замечено при поиске вакансий, в ряде случаев доля шума может составлять более 94%. В связи с этим в исследовании будет задействован метод контекстных слов. В табл. 3 приведены контекстные слова, задействованные для вышеобозначенных групп слов при патентном поиске.
Таблица 3. Задействованные в исследовании контекстные слова
Группы Контекстные слова
G01, G02, G03, G05 software, database, framework, application, developer, server, program, programmer, script, scripting
G04 marketing, sales
Для иллюстрации второй особенности приведем пример из области маркетинга: Search Engine Optimization (SEO). Эта область знаний востребована в организациях, занятых продвижением товаров и услуг в поисковых системах. Она встречается в патентах как в виде полного названия, так и в виде аббревиатуры (рис. 1), однако во втором случае среди патентов присутствует большой процент посторонних документов (рис. 2). В вакансиях работодателей чаще применяется аббревиатура (рис. 3). В связи с этим целесообразно использовать полное название для одних источников (патенты, научные публикации) и аббревиатуру для других (интернет-рекрутинговые агентства).
Рисунок 1. Дданные из сервиса USPTO, результаты фильтрованы с помощью контекстных слов (marketing, sales), по оси Y — количество патентов
Рисунок 2. Данные из сервиса USPTO, результаты не подвергались фильтрации, по оси У — количество патентов
■*■ Query: Search Engine Optimization Query: SEO
3
2014 2015 2016 2017
Рисунок 3. Данные интернет-рекрутингового агентства Indeed.com, по оси У — процент вакансий от всех вакансий на рынке
Для проведения исследований, требующих указания различных вариаций написания ключевых слов для различных источников данных, в сервисе был реализован механизм, обеспечивающий эту возможность. На рис. 4 показана ER-диаграмма, где с таблицей ключевых слов, отвечающих за навыки, связана схожая по структуре таблица, содержащая альтернативные варианты написания. Связь этой таблицы с источником данных реализована с помощью строкового идентификатора, однозначно идентифицирующего источник.
IT! headhunter history
V id Blglnt :I:U ♦ date Date ♦ value Double Precision ♦ keyword.id Bigint ♦ created at Timestamp With Time Zone ♦ updated at Timestamp With Time Zone »
m uspto patents.history_T_
V id Bigirttl U
♦ date Date
♦ value Double Precision
♦ keyword id Bigint
♦ created.at Timestamp With Time Zone
♦ updated at Timestamp with Time Zone
ITI indeed history
v* id Blglrtt:l:U » date Date ♦ value Double Precision ♦ keyword.id Bigint * created.at Timestamp With Time Zone * updated at Timestamp With Time Zone ►
Рисунок 4. ER-диаграмма, иллюстрирующая способ хранения альтернативных ключевых
слов и их связь с источниками данных
Собранные данные патентной активности (табл. 4) говорят о том, что навыки S02, S03, S04, S05, S08, S16, S18, S19, S20 можно считать устоявшимися на рынке, при этом по ним наблюдается рост востребованности. В то же время навык S01 также можно считать устоявшимся, но в отношении него наблюдается снижение
востребованности (пик приходится на 1996-1998 гг.). В отношении навыка S06 можно смело говорить о стремительном развитии рынка, он будет востребован. Навыки S07, S09, S10 перспективны, находятся на раннем этапе развития. Все навыки из области маркетинга (S11-S15) показывают небольшой стабильный прирост в ежегодном числе патентов, что говорит о развитии рынка. Тем не менее общее число патентов невелико. В отличие от S16, навык S17 показывает крайне низкую патентную активность, из чего можно сказать о неактуальности направления.
Данные по навыку S01 были нормализованы и представлены в процентах от максимального числа патентов. Это связано с особенностями поиска результатов в сервисе USPTO, который не позволяет выявить патенты, связанные с названиями из одной буквы, а также с упоминанием спецсимволов (что может быть актуально для таких технологий, как C++ или C#). Для того чтобы проверить соответствие полученных данных и реального состояния рынка труда, были собраны показатели доли вакансий на рынке труда в США. Из этих данных были вычислены средние показатели на промежутке с января 2014 г. по июнь 2017 г. (табл. 5). Визуализация корреляции патентной активности в 2012 г. и востребованности навыков на рынке труда в 2014-2017 гг. показана на рис. 5.
Таблица 4. Патентаня активность в отношении исследуемых навыков
Skill 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014
S01* 31.93 40.59 71.78 91.34 91.09 88.37 85.89 83.91 73.76 67.08 59.16 64.85 42.08
S02 5 8 9 442 1911 3449 3922 4419 5194 6459 7519 11349 7261
S03 1 1 7 8 19 47 113 169 280 569 746 1591 1367
S04 0 0 8 671 1883 3985 3734 3824 4328 4891 5031 7225 4791
S05 46 67 100 124 156 308 248 341 457 604 698 1220 987
S06 0 0 0 0 0 3 0 1 0 1 101 520 388
S07 1 0 0 0 0 0 0 0 1 3 5 25 28
S08 7 19 25 49 80 169 246 397 636 921 1084 1788 2060
S09 0 0 0 0 1 2 1 1 0 0 2 4 53
S10 0 0 0 0 0 0 0 0 0 0 0 6 44
S11 0 0 0 0 0 0 0 0 9 16 22 40 37
S12 0 0 0 3 2 8 9 10 17 12 24 30 31
S13 0 0 0 0 0 3 3 18 11 28 15 26 24
S14 0 0 0 2 4 8 6 6 15 10 26 21 13
S15 0 0 0 0 0 0 0 0 0 0 2 6 10
S16 0 0 0 3 12 109 262 257 357 326 441 553 491
S17 0 0 0 3 1 2 11 17 18 7 30 21 17
S18 24 78 234 1072 2352 3968 4327 4624 5147 5770 5469 7350 5222
S19 6 12 46 107 194 373 479 649 785 719 755 1047 865
S20 6 18 42 100 238 301 373 396 378 358 404 603 480
Таблица 5. Средняя доля вакансий на рынке труда (США, по данным Indeed.com)
за период с января 2014 г. по июнь 2017 г.
Skill Vacancy Share (%)
S01 0.959720536
S02 1.608262607
S03 0.809376988
S04 1.204022790
S05 0.878797361
S06 0.350968613
S07 0.176563370
S08 0.150017934
S09 0.008187359
S10 0.358372186
S11 0.269257827
S12 0.069587299
S13 0.101806401
S14 0.056104254
S15 0.079025001
S16 0.467847123
S17 0.000567359
S18 0.390674714
S19 0.296862010
S20 0.165207664
1,8 S? 1 1,4 E о ■d 12 С 3 i Корреляция патентной активности и доли вакансий на рынке труда
.502
.S04
5 1 Q. V a 0,8 I 1 2 0,6 4 « 0,4 i < =t 5 1 0,2 , .sos .S03 i
#S16 .S18
Lsio^soe ,S19 k Sil
»520 e$08 ,51^-515 I — S12 LSiBl^Msi?_
( ) 2000 4000 6000 8000 10000 12000 Число патентов за 2012 год
Рисунок 5. Визуализация корреляции патентной активности (2012 г.) и вакансий на рынке труда (2014-2017 гг.), по оси X — ежегодное число патентов, по оси У — процент вакансий
на рынке труда
Исходя из полученных данных, можно с уверенностью сказать, что большинство навыков из представленных 20 актуальны к изучению: они либо устоявшиеся, либо развивающиеся. Исключением становится FreeBSD Administration, о чем свидетельствуют как низкие показатели патентной активности, так и минимальный запрос рынка труда на специалистов.
3. Заключение
По результатам исследования можно сказать, что анализ патентной активности можно применять не только для оценки технологий и прогнозирования их развития, но и для оценки востребованности связанных с ними навыков. Более того, возможна оценка востребованности методик, связанных с операциональными навыками. Высокая корреляция между ежегодным числом патентов и вакансиями на рынке труда говорит о возможности прогнозирования спроса на навыки.
Для задействования различных источников данных в сервисе прогнозного обучения были реализованы механизмы для применения соответствующих вариантов наименования навыков. Реализован механизм фильтрации на основе контекстных слов для данных из сервиса USPTO.
С помощью вышеописанного был проведен анализ 20 навыков. Языки программирования C, Java и Python являются востребованными и устоявшимися на рынке, при этом C имеет некоторую убыль в востребованности. Навыки веб-разработки состоят из устоявшихся (HTML и CSS) и из сравнительно новых, но заметно приобретающих популярность (HTML5 и CSS3). Machine Learning — устоявшийся навык из области аналитики, а навыки Deep Learning и Big Data Analytics начинают занимать свои доли рынка. Все перечисленные навыки из области маркетинга показывают небольшой стабильный прирост востребованности. Навыки системного администрирования также востребованы, за исключением навыка FreeBSD Administration.
Результаты работы могут быть применены для проведения аналогичных исследований оценки актуальности программ обучения.
Литература
[1] Altuntas S., Dereli T., Kusiak A. Forecasting technology success based on patent data // Technological Forecasting and Social Change. 2015. Vol. 96. P. 202-214.
[2] Brusilovsky P., Edwards S., Kumar A. et al. Increasing adoption of smart learning content for computer science education // In Proceedings of the Working Group Reports of the 2014 on Innovation & Technology in Computer Science Education Conference, 2014. P. 31-57.
[3] Konecki M., Petrlic M. Main problems of programming novices and the right course of action // In Central European Conference on Information and Intelligent Systems, 2014. P. 116.
[4] Bird J., van de Mortel T., Holt J., Walo M. Academics' perceptions of continuous and collaborative curriculum review: An Australian case study // Journal of Hospitality and Tourism Management. 2015. Vol. 24. P. 18-24.
[5] Crebert G., Bates M., Bell B. et al. Developing generic skills at university, during work placement and in employment: graduates' perceptions // Higher Education Research & Development. 2004. Vol. 23. No. 2. P. 147-165.
[6] Lee C., Kim J., Kwon O., Woo H.-G. Stochastic technology life cycle analysis using multiple patent indicators // Technological Forecasting and Social Change. 2016. Vol. 106. P. 53-64.
[7] Tynjálá P., Slotte V., Nieminen J. et al. From university to working life: Graduates' workplace skills in practice // Higher education and working life: Collaborations, confrontations and challenges, 2006. P. 73-88.
[8] Hagiu A., Yoffie D. B. The new patent intermediaries: platforms, defensive aggregators, and super-aggregators // The Journal of Economic Perspectives. 2013. Vol. 27. No. 1. P. 45-65.
[9] Nikulchev E., Ilin D., Bubnov G., Mateshuk E. Scalable service for predictive learning based on the professional social networking sites // International Journal of Advanced Computer Science and Applications. 2017. Vol. 8. No. 5. P. 9-15.
Евгений Витальевич Никульчев — доктор технических наук, профессор кафедры управления и моделирования систем Московского технологического университета (МИРЭА); проректор по научной работе Московского технологического института
Дмитрий Юрьевич Ильин — начальник центра интеллектуального анализа информации Московского технологического института; аспирант Московского технологического университета (МИРЭА)
Григорий Георгиевич Бубнов — доктор экономических наук, профессор, ректор Московского технологического института, директор Высшей школы системного инжиниринга, Московской физико-технический институт (государственный университет)
Авторы:
The actualization of educational programs based on patent analysis as an indicator of the development of innovative technologies
Evgeny Nikulchev* **, Dmitry Ilin '**, Gregory Bubnov*
*Moscow Technological Institute 38A, Leninskiy pr., Moscow, 119334
**Moscow Technological University 78, Vernadskogo prospect, Moscow, 119454
e-mail: [email protected]
Abstract. The study raises the issue of the need to verify the suitability of the educational program skills to current realities. As the initial data, a sample of 20 skills is proposed, divided into 5 groups. An analysis of these skills was conducted using data on patent activity and the state of the labor market. To do this, the forecasting service is involved, in which improvements were made in accordance with the requirements of the study. The results show that there is a high level of correlation between patent activity and subsequent demand for skills in the labor market.
Key words: development of innovative technologies, patent analysis, information and analytical services, forecast models.
References
[1] Altuntas S., Dereli T., Kusiak A. (2015) Technological Forecasting and Social Change, 96:202-214.
[2] Brusilovsky P., Edwards S., Kumar A. et al. (2014) Increasing adoption of smart learning content for computer science education. In Proceedings of the Working Group Reports of the 2014 on Innovation & Technology in Computer Science Education Conference, pp. 31-57.
[3] Konecki M., Petrlic M. (2014) Main problems of programming novices and the right course of action. In Central European Conference on Information and Intelligent Systems, p. 116.
[4] Bird J., van de Mortel T., Holt J., Walo M. (2015) Journal of Hospitality and Tourism Management, 24:18-24.
[5] Crebert G., Bates M., Bell B. et al (2004) Higher Education Research & Development, 23(2):147-165.
[6] Lee C., Kim J., Kwon O., Woo H.-G. (2016) Technological Forecasting and Social Change, 106:53-64.
[7] Tynjàlà P., Slotte V., Nieminen J. et al. (2006) From university to working life: Graduates' workplace skills in practice. Higher education and working life: Collaborations, confrontations and challenges, pp. 73-88.
[8] Hagiu A., Yoffie D. B. (2013) The Journal of Economic Perspectives, 27(1):45-65.
[9] Nikulchev E., Ilin D., Bubnov G., Mateshuk E. (2017) International Journal of Advanced Computer Science and Applications, 8(5): 9-15.