Научная статья на тему '2017. 03. 027. Финелли С. Дж. , Боррего М. , расулифар г. Создание дерева ключевых слов для исследований в области инженерного образования. Finelli C. J. , Borrego M. , rasoulifar G. development of a taxonomy of keywords for engineering education research // European journal of engineering education. - 2016. - Vol. 41, n 3. - p. 231-251. - doi: 10. 1080/03043797. 2016. 1153045'

2017. 03. 027. Финелли С. Дж. , Боррего М. , расулифар г. Создание дерева ключевых слов для исследований в области инженерного образования. Finelli C. J. , Borrego M. , rasoulifar G. development of a taxonomy of keywords for engineering education research // European journal of engineering education. - 2016. - Vol. 41, n 3. - p. 231-251. - doi: 10. 1080/03043797. 2016. 1153045 Текст научной статьи по специальности «История и археология»

CC BY
29
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНЖЕНЕРНОЕ ОБРАЗОВАНИЕ / ТАКСОНОМИЯ / КЛАССИФИКАЦИЯ НАУК / НАУЧНЫЕ ЖУРНАЛЫ
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по истории и археологии , автор научной работы — Анисимова А.Э.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «2017. 03. 027. Финелли С. Дж. , Боррего М. , расулифар г. Создание дерева ключевых слов для исследований в области инженерного образования. Finelli C. J. , Borrego M. , rasoulifar G. development of a taxonomy of keywords for engineering education research // European journal of engineering education. - 2016. - Vol. 41, n 3. - p. 231-251. - doi: 10. 1080/03043797. 2016. 1153045»

более 0,5% часто употребляемых слов не приводит к увеличению плотности распределения тем, что подтверждает сделанное еще в 1950-е годы Х.П. Луном наблюдение, согласно которому для нужд индексирования текстов наиболее полезны термины, имеющие среднюю частоту употребления.

Данное исследование, реализованное на основе трех баз данных, не позволяет распространить полученные выводы на другие хранилища знаний. Сделанные в публикации выводы хорошо отражают процессы в англоязычных научных базах данных. Для других естественных языков удаление или прибавление группы слов, установление заданного количества тем могут привести к совершенно другим результатам.

А. Э. Анисимова

2017.03.027. ФИНЕЛЛИ С.Дж., БОРРЕГО М., РАСУЛИФАР Г. СОЗДАНИЕ ДЕРЕВА КЛЮЧЕВЫХ СЛОВ ДЛЯ ИССЛЕДОВАНИЙ В ОБЛАСТИ ИНЖЕНЕРНОГО ОБРАЗОВАНИЯ. FINELLI C.J., BORREGO M., RASOULIFAR G. Development of a taxonomy of keywords for engineering education research // European journal of engineering education. - 2016. - Vol. 41, N 3. - P. 231-251. -DOI: 10.1080/03043797.2016.1153045.

Ключевые слова: инженерное образование; таксономия; классификация наук; научные журналы.

Авторы публикации, исследователи из Университета штата Мичиган и Техасского университета в Остине (США), предприняли попытку обновить оптимальную таксономию терминов в области развития инженерного образования по результатам обследования научных журналов, конференций и опроса специалистов. В статье описана процедура составления таксономии. В результате длительных итераций было составлено шестиуровневое дерево из 455 терминов и 14 ветвей (с. 365). Работа выполнена при поддержке Национального научного фонда.

Полученная в результате классификация подходила для составления ключевых слов к 243 статьям из трех специализированных журналов (с. 365). Поскольку все термины распределялись равномерно, авторы пришли к выводу о том, что уровни специали-

зации терминов достаточны для описания реального массива исследований1.

Интерес к периодическому обновлению частных таксономических структур возникает в публикации не случайно. Востребованность классификационных систем обусловлена значением ключевых слов для поиска информации и подготовки аналитических документов. Различные ключевые слова, имеющие схожий смысл, выделяются в таксономии в единый синонимический ряд, при этом только один из терминов определяется как предпочтительный. Таксономии отдельных научных направлений все больше двигаются в сторону естественного языка.

Терминологические классификации полезны для редакций журналов, которым бывает важно сузить предметную специализацию своего издания, различным научным фондам, а также при выборе экспертов.

Исследователи нередко подбирают ключевые слова, используя вновь образованные термины или жаргонные слова. При этом в готовой обновленной классификации терминов по дисциплине они могут выбрать более распространенные термины. Преимущество использования единой таксономической системы заключается в том, что она позволяет с наименьшей затратой сил идентифицировать исследования на одну тему.

С появлением Интернета большие надежды возлагались на поисковые машины. Традиционные тезаурусы и предметные классификаторы как будто ушли на второй план. Поиск по запросу среди миллионов документов, однако, пока не дает желаемого результата.

В 2011-2014 гг. как минимум три исследовательских коллектива занимались вопросами таксономии в области исследований инженерного образования. На основе уже существующей таксономии Образовательного ресурсного информационного центра (Education resources information center - ERIC) было проведено исследование, позволяющее устанавливать невидимые связи между

1 В случаях частого употребления термина специалистам стоит задуматься о большем его дроблении, в случае редкого употребления - об объединении ряда терминов. - Прим. реф.

исследователями1. Наиболее значительные базы данных по инженерным наукам (IEEE, INSPEC, Compendex) сегодня имеют собственные таксономии с контролируемым словарем и словарем иерархически организованных синонимов, однако для исследований в области инженерного образования такая работа до сих пор не проводилась.

Авторы приняли активное участие в крупнейших ежегодных конференциях, посвященных разработкам в области инженерного образования (American society for engineering éducation annual conférence, Research in engineering education symposium, European society for engineering education annual conference, Frontier in education annual conference). На этих конференциях определялись группы экспертов, каждая из них формировала свой иерархически организованный список терминов. К последней итерации их число сократилось вдвое и достигло 455 терминов (с. 372).

На первом этапе эксперты проанализировали около 900 международных журнальных статей за период 2005-2008 гг. и сформировали список терминов, четко определяющих исследовательские области. На втором этапе анализу были подвергнуты 2216 статей за период 1959-2012 гг. На третьем этапе были рассмотрены 35 статей за период 2006-2012 гг. и 86 докладов (с. 373). Все полученные термины были обработаны машинным способом при помощи специального менеджера по формированию таксономии «Access innovations», способного создавать более глубокие иерархии.

В результате были выбраны термины, которые многократно выделялись экспертами в качестве ключевых. Для подтверждения воспроизводимости процедуры был поставлен эксперимент на 30 аннотациях к докладам Ежегодной конференции Американского общества по инженерному образованию 2013 (American Society for Engineering Education - ASEE). Участники коллектива выделяли ключевые слова на основе выработанной таксономии и сравнивали свои результаты. Расхождения между участниками оказались незначительными.

После создания протестированной таксономии авторы смогли сделать анализ частоты употребления ключевых слов. Были

1 Xian H., Madhavan K. Anatomy of scholarly collaboration in engineering education: A big-data bibliometric analysis // Journal of engineering education. - 2014. -Vol. 103, N 3. - P. 486-514.

отобраны 243 публикации из трех журналов за 2011-2013 гг. В каждом из журналов за год было опубликовано неравное число статей, но для анализа было отобрано равное их количество. К каждой статье были приписаны от трех до шести ключевых слов без учета авторских слов на основании апробируемой таксономии.

В результате оказалось, что 168 терминов таксономии не пригодились для тестового анализа, а оставшиеся 270 в среднем были употреблены 4,4 раза. Максимальное число повторений - 39, медиана - 2. Чаще всего были употреблены термины «survey», «case-study» и «undergraduate» (с. 379). Все употребленные ключевые слова были достаточно равномерно распределены в массиве аннотаций. Ключевые слова, ни разу не выделенные в массиве, остаются естественными кандидатами на выбывание из таксономии терминов.

В научной среде распространено мнение о том, что лучше всего охарактеризовать исследование при помощи ключевых слов может сам автор исследования, но опыт показывает, что достичь однообразия можно только при помощи использования единых таксономических таблиц. К собственной таблице авторы составили подробную инструкцию о том, как наилучшим образом подобрать ключевые слова, описывающие публикацию. В ней рекомендовано описывать исследование с трех ракурсов (тематика, цель или мотивация и исследовательский подход).

Для удобства использования созданная таксономия может быть скопирована в электронном виде в качестве бесплатного приложения для айфона. Распространяется электронный продукт по свободной лицензии CC-BY-SA1.

Несмотря на то что данное исследование проводилось с учетом опыта исследователей из разных стран, в основном оно построено на американских исследованиях об инженерном образовании. В дальнейшем авторы планируют использовать публикации других регионов для получения более широкой картины. Авторы полагают, что целесообразно обновлять таксономические таблицы по отдельным дисциплинам каждые пять-десять лет.

А.Э. Анисимова

1 Скачать последнюю версию таксономии можно на сайте. - Mode of access: http://taxonomy.engin.umich.edu/wp-content/uploads/2016/02/EER-Taxonomy-Version-Current.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.