Научная статья на тему 'Использование семантических аналогов при обучении студентов технических специальностей'

Использование семантических аналогов при обучении студентов технических специальностей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
162
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОГНИТИВНЫЕ ТЕХНОЛОГИИ / СЕМАНТИЧЕСКИЙ АНАЛОГ / ВЫСШЕЕ ОБРАЗОВАНИЕ / ТЕХНИЧЕСКИЕ СПЕЦИАЛЬНОСТИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шахнов В. А., Глушко А. А., Журавлева Л. В., Зинченко Л. А., Казаков В. В.

В работе рассмотрены особенности обучения студентов технических специальностей с использованием дескриптивной семантики. Представлено разработанное на основе технологии Word2 vec и веб-сервиса RusVectores программное обеспечение для визуализации семантической близости слов. Рассмотрены преимущества использования когнитивных технологий для повышения качества обучения студентов. Предложены методики внедрения разработки в процесс обучения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шахнов В. А., Глушко А. А., Журавлева Л. В., Зинченко Л. А., Казаков В. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование семантических аналогов при обучении студентов технических специальностей»

траектории дальнейшего движения ВС вносит погрешность, связанная не с искажённой передачей навигационной информации на борт ВС, а с другими факторами, такими как психологическое состояние экипажа ВС или интенсивность воздушного движения .

5. Заключение

В рамках данной работы были получены следующие результаты:

Проведена классификация ошибок при определении местоположения воздушного судна.

Рассмотрена погрешность при определении местоположения воздушного судна, связанная с искажённой информацией о дальности до навигационного космического аппарата и проведён расчёт,

иллюстрирующий влияние этой погрешности на ошибку при определении местоположения воздушного судна.

Сделан вывод о последствиях таких погрешностей.

Приведён алгоритм выявления ошибки при передаче навигационной информации по линии передачи данных.

Приведён алгоритм определения вероятности ошибок при выборе дальнейшей траектории движения ВС.

Приведены результаты нахождения вероятности этих ошибок.

ЛИТЕРАТУРА

1. Г.В. Анцев, В.А. Сарычев. Высокоточное оружие. - Москва, Радиотехника, 2017.

2. А.А. Поваляев. Спутниковые радионавигационные системы: время, показания часов, формирование измерений и определение относительных координат. - М.: Радиотехника, 2008.

3. Ю.А. Соловьёв. Системы спутниковой навигации. - ЭКО-ТРЕНДЗ, Москва, 2002.

4. Затучный Д.А. Определение ложной информации по голосу пилота. - Труды Международного Симпозиума " Надёжность и качество ", Пенза, 2010, Том 1, стр. 429-430.

5. Руководство по требуемым навигационным характеристикам (RNP), Издание третье, 2008.

6. Анодина Т.Г. и др. Автоматизированные системы УВД. - М.: Транспорт, 1992.

7. Затучный Д.А., Овчинников В.В. Методика определения оптимального уровня регулярности полётов по множеству критериев. - Труды Международного симпозиума «Надёжность и качество», Пенза, 2017, Том 1, стр. 187-190.

8. Затучный Д.А., Овчинников В.В. Методика определения «коммерческих» расходов при обслуживании нерегулярно выполненных рейсов авиакомпании. - Труды Международного симпозиума «Надёжность и качество», Пенза, 2017, Том 2, стр. 299-301.

УДК 05.13.11

ШОхнов В.А., Глушко А.А., Журавлева Л.В., Зинченко Л.А., Казаков В.В., Макарчук В.В., Нажмутдинова К. А.

Московский государственный технический университет им. Н. Э. Баумана, Москва, Россия ИСПОЛЬЗОВАНИЕ СЕМАНТИЧЕСКИХ АНАЛОГОВ ПРИ ОБУЧЕНИИ СТУДЕНТОВ ТЕХНИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ

В работе рассмотрены особенности обучения студентов технических специальностей с использованием дескриптивной семантики. Представлено разработанное на основе технологии Word2vec и веб-сервиса RusVectores программное обеспечение для визуализации семантической близости слов. Рассмотрены, преимущества использования когнитивных технологий для повышения качества обучения студентов. Предложены методики внедрения разработки в процесс обучения. Ключевые слова:

КОГНИТИВНЫЕ ТЕХНОЛОГИИ, СЕМАНТИЧЕСКИЙ АНАЛОГ, ВЫСШЕЕ ОБРАЗОВАНИЕ, ТЕХНИЧЕСКИЕ СПЕЦИАЛЬНОСТИ.

1 Алгоритмы и программы выявления семантических аналогов

Анализ естественных языков является нетривиальной задачей. Не применяя соответствующих алгоритмов, невозможно формализовать его особенности. Одним из возможных подходов является использование алгоритмов для расчета векторных представлений слов Word2vec [12], которые ставят в соответствие каждому слову некий вектор из чисел, описывая таким образом каждое слово, внесенное в модель, в многомерном пространстве.

Применение Word2vec требует предварительного обучения, так как в его основе лежит нейросеть прямого распространения. При обучении на вход поступает достаточно большой объем текстовой информации. Используется два основных алгоритма обучения: CBOW и Skip-gram. Оба эти алгоритма базируются на использовании нейронных сетей. Принципиальным отличием является то, что алгоритм CBOW предсказывает слова при данном контексте, а алгоритм Skip-gram предсказывает контекст при данном слове. Также в анализе естественных языков используется алгоритм fastText, который позволяет учитывать морфемную информацию о словах. Алгоритмы обучения анализируют весь текст, поступивший на вход, и рассчитывают встречаемость каждого слова в нем. Далее массив всех слов сортируется по убыванию частоты, причем самые редкие по частоте слова удаляются. После этого строится дерево Хаффмана для кодирования всего словаря и экономии памяти и вычислительной мощности. Затем из текста выбирается небольшая часть, называемая субпредложением, используемая для обучения. В результате получается обученная нейросеть, способная ставить каждому изученному слову в соответствие многомерный вектор и наоборот, вектору - соответствующее слово.

Как правило, обученная модель, с которой можно работать, имеет достаточно большой объем,

Введение

Одной из важнейших задач в эффективном обучении технических специалистов является задача объяснения новых терминов. При этом зачастую студент при обучении в школе не сталкивался со словами русского языка, используемыми инженерами в своей практической деятельности. В частности, термин «оснастка» [1], используемый при обучении по курсу «Технология производства», отсутствует в Национальном Корпусе русского языка [2]. Для преодоления проблемы понимания новых слов задача преподавателя высшей школы состоит в том, чтобы выстроить такую цепочку аналогий с имеющимся опытом студента, чтобы новый термин запоминался как можно проще и понятнее [3-5].

Учет специфики современного обучаемого контингента, являющегося в большинстве своем «сетевым поколением», требует перехода от вербального обучения к визуальным обучающим средам [6, 7] и новым форматам передачи знаний. Для организации эффективного процесса обучения в условиях цифровой экономики требуется использовать новые подходы в обучении, основанные на информационных [8, 9], когнитивных технологиях [10, 11] и семантическом анализе [12]. Обеспечение интерактивности процесса обучения позволяет преподавателю проще удерживать внимание студентов во время лекций и семинаров.

Все вышеизложенное приводит к необходимости разработки программного обеспечения, ориентированного на особенности современного учебного процесса. Для этого должны быть проанализированы существующие алгоритмы и программы выявления семантических аналогов. В настоящей статье рассмотрены существующие алгоритмы и программы выявления семантических аналогов, после чего описано разработанное программное обеспечение для изучения новых терминов на основе анализа семантической близости слов.

поэтому не всегда удобно работать с программами, которые хранят модели на локальной машине и каждый раз загружают их в оперативную память.

Для решения этой проблемы представляется целесообразным использование сервиса RusVectores [12], который предоставляет уже обученные модели, основанные на различных наборах слов (корпусах), для русского языка. Также имеется возможность производить математические действия с векторами слов и получать другую аналитическую информацию средствами Representational State Transfer Application Programming Interface (REST API) . При отправке корректного запроса на сервис в ответ он выдает необходимую информацию. Это позволяет реализовать программу, которая автоматически производит такие действия, анализирует ответ сервиса, и представляет его в необходимом для пользователя виде.

Текущая версия RusVectores дает возможность использовать 5 словарей. Модель

araneum_none_fasttextskipgram_300_5_2018 - самая предпочтительная для использования. При ее обучении использовался Araneum Maximum - самый большой корпус русских слов из доступных, он включает около 10 миллиардов слов. Также эта модель использует алгоритм fastText, он позволяет использовать морфемную информацию в слове и, даже если слова нет в словаре, он способен сгенерировать для него вектор для расчета семантической araneum

на корпусе Araneum Maximum, но использует алгоритм обучения skip-gram.

Модель

ruwikiruscorpora_upos_skipgram_3 0 0_2_2 018 обучена на корпусе русской википедии и национальном корпусе русского языка [2]. Она включает 600 миллионов слов. Модель

ruscorpora_upos_skipgram_3 0 0_5_2 018 обучена

только на национальном корпусе русского языка и включает 250 миллионов слов.

2 Программа изучения технических терминов NearWords

Разработанная программа NearWords была реализована на языке программирования C# и языке описания пользовательских интерфейсов XAML. Средой разработки была выбрана Visual Studio 2017 и Microsoft Blend for Visual Studio 2017. Для создания пользовательского интерфейса был использован фреймворк Windows Presentation Foundation (WPF) [13].

Окно разработанной программы NearWords представлено на рисунке 1.

Интерфейс логически разделен на две части. Левая часть предназначена для ввода изучаемого термина в поле "Основное слово" и предлагаемых семантических аналогов в поле "Новое слово". Ниже выводится информация результатов расчета семантической близости введенных слов. Для удобства анализа результатов список добавленных слов

семан-

близости. Модель

upos skipgram 300 2 2018 также обучена

сортируется по убыванию по рассчитанной тической близости.

Рисунок 1 - Главное окно разработанного программного обеспечения Доступна загрузка различные: предобученны:': моделей из веб-интерфейса КисУесЬогес (рисунок 2)

Рисунок 2 - Элементы управления и доступные словари

Работа с программой происходит поэтапно. После запуска программы необходимо удостовериться в доступности сервиса RusVectores: центральный круг в правой части должен быть зеленого цвета. Затем необходимо выбрать словарь из списка доступных. Далее необходимо ввести основное слово и нажать на кнопку справа. Если цвет центрального круга остался неизменным, то в выбранном словаре данное слово существует, и можно продолжать работу. В случае, если такого слова нет в выбранном словаре, то добавление новых слов будет недоступно.

После задания основного слова и доступности сервиса можно приступать к добавлению сравниваемых слов. При вводе нового слова необходимо нажать на кнопку добавления с символом "+". В результате происходит добавление нового слова в список, выполняется расчет семантической близости и обновление визуализации. После ввода каждого нового слова можно оперативно отслеживать результат. Если добавленное слово необходимо удалить, в списке после каждого элемента предусмотрен красный полукруг, по нажатию на который слово удалится, а визуализация обновится.

В правой части визуализируются результаты расчета семантической близости. Визуализация построена на принципе солнечной системы, в центре располагается основное слово.

Вокруг располагаются разноцветные круги, соответствующие добавленным словам. Цвет каждого круга связан с цветом, соответствующим слову в списке и он показан слева от слова. Также цвет зависит от значения семантической близости, слова со значением 1 имеют зеленый цвет, а слова со значением 0 и ниже имеют красный цвет. Темно-серое кольцо показывает линию, на которой рас-

полагаются слово с нулевым значением семантической близости к заданному слову. Внутреннее светло-серое кольцо обозначает границу семантической близости, равной 0.5.

Эти два кольца добавлены для удобства визуального анализа полученных результатов. Для масштабирования визуализации предусмотрен сервис ^аскЬаг, который можно активировать нажатием на зеленый круг. Так как элемент требуется достаточно редко и на непродолжительное время, он не отображается все время работы программы. Тем самым снижается нагруженность интерфейса различными элементами управления и упрощается взаимодействие с программой. Сервис ^аскЬаг используется в случаях, когда все слова являются близкими или введены сильно отличающиеся слова.

Для иллюстрации возможностей дескриптивной семантики в набор заданных слов включено слово «слово». Анализ полученных результатов позволяет сделать вывод, что программа выявляет слабую семантическую похожесть между изучаемым термином «оснастка» и предлагаемым словом «слово» и визуализирует эту информацию.

Следует заметить, что, используя разные модели для Word2vec можно получить немного отличающиеся результаты одного и того же набора слов. Это связано со спецификой тех или иных корпусов. Например, при обучении модели на технических текстах получаются более точные модели для данной области. Обучая модель на общих текстах, некоторые технические термины могут не попасть в модели или иметь малую семантическую близость.

На рисунке 3 представлено сравнение различных моделей Word2Vec, обученных на различных наборах текстов.

Рисунок 3. Сравнение моделей сервиса RusVerctores для Word2Vec: 1 - araneum_none_fasttextskipgram_3 0 0_5_2 018; 2 - araneum_upos_skipgram_3 0 0_2_2 018; 3 ruwikiruscorpora_upos_skipgram_3 0 0_2_2 018; 4 - ruscorpora_upos_skipgram_300_5_2018

3 Методика использования NearWords в учебном процессе

При обучении техническим специальностям словарный запас студента значительно расширяется.

Разработанная программа может быть использована при проведении лекций, семинаров, а также для контроля знаний и при организации самостоятельной работы студентов.

В ходе лекции преподаватель может использовать при объяснении семантические аналоги для нового термина.

В ходе семинара студенты дополнительно выполняют задания преподавателя по более глубокому изучению тех или иных ключевых терминов.

При выполнении контрольных заданий студенту необходимо подобрать слова, наиболее полно соответствующих заданному для проверки знаний термину. Наличие количественных значений семантической близости позволяет обосновать оценку знаний студента и автоматизировать процесс оценки знаний.

Количественные значения семантический близости вносят соревновательный элемент при подборе наиболее близкого термина к заданному. Это поз-

воляет увлечь студентов в процессе самостоятельной работы поиском наиболее близкого слова, что способствует более глубокому пониманию изучаемого предмета. Использование механизмов визуальной аналитики позволяет упростить процесс самоконтроля студента.

В текущей версии NearWords имеется возможность выбирать любой словарь, доступный на RusVectores. Однако первоначальное тестирование показало, что не рекомендуется использовать словарь, основанный на новостных статьях.

Необходимо отметить, что использование разработанного программного обеспечения в рамках тенденции BYOD [14] позволяет создать единую среду для самоконтроля и последующей оценки знаний студента, что делает среду обучения более комфортной.

Заключение

В настоящее время внедрение дескриптивной семантики в процесс обучения является важной задачей, без которой невозможно передать студенту тот объем информации, который ему необходимо освоить в сжатые сроки обучения.

Для повышения эффективности использования дескриптивной семантики в разработанной программе

были использованы когнитивные технологии и методы визуальной аналитики. Представленное в работе программное обеспечение позволяет анализировать семантическую близость изучаемого термина и предлагаемых семантических аналогов и проводить контроль понимания терминов студентами.

В разработанной программе запросы к сервису идут только при добавлении новых слов или загрузке похожих, что позволяет снизить требования к скорости обмена информации с сервером.

ЛИТЕРАТУРА

1. Журавлева Л.В., Лебедев А.С. Формализация информации по прототипам технологической оснастки для сборки электронной аппаратуры. Информационные технологии в проектировании и производстве. 2017. В 2 (166). С. 67-72.

2. http://ruscorpora.ru

3. Зинченко Л.А., Резчикова Е.В. Особенности обучения студентов технического профиля в условиях инновационной экономики. Гуманитарный вестник. 2015. В 1 (27). С. 6.

4. Вьюгина С.В. Формирование критического мышления и развитие интеллектуального потенциала студента в образовательном процессе // Труды Международного Симпозиума «Надежность и Качество». - В 1, 2017. - С. 283 - 287.

5. Shakhnov V.A., Zinchenko L.A., Rezchikova E.V., Verstov V.A. Distinctions of a learning content for education in the field of nanotechnology. International Journal of Nanotechnology. 2017. Т. 14. В 7-8. С. 690-697.

6. Shakhnov V., Vlasov A., Zinchenko L., Rezchikova E. Visual learning environment in electronic engineering education. В сборнике: 2013 International Conference on Interactive Collaborative Learning, ICL 2013 2013. С. 379-388.

7. Shakhnov V., Zinchenko L., Rezchikova E. Cognitive learning environment for nanoinformatics. В сборнике: Recent advances in information science. Proceedings of the 4th European Conference of Computer Science (ECCS '13). 2013. С. 260-266.

8. Глушань В.М., Полуянович Н.К., Зинченко Л.А. Применение новых информационных технологий и компьютерной алгебры в задачах математического моделирования электрических цепей. В сборнике: Новые информационные технологии в преподавании электротехнических дисциплин (НИТЭ-98). Материалы четвертой международной научно-методической конференции. 1998. С. 100-104.

9. Имамутдинов А.И., Емашкина Т.С., Юрков Н.К. Информационные технологии и процесс обучения // Труды Международного симпозиума «Надежность и Качество». - В 1, 2017. - С. 311 - 313.

10. Kazakov, V., Verstov, V., Zinchenko, L., Makarchuk, V. Visual Analytics Support for Carbon Nanotube Design Automation. In: Samsonovich A., Klimov V., Rybina G. (eds) Advances in Intelligent Systems and Computing, vol. 449 (2016)

11. Shakhnov V.A., Zinchenko L. A., Makarchuk V.V., Rezchikova E. V., Kazakov V.V. Visual analytics in investigation of chirality-dependent thermal properties of carbon nanotubes. Journal of Physics: Conference Series, 1(829), 2017.

12. Kutuzov A., Kuzmenko E. (2017) WebVectors: A Toolkit for Building Web Interfaces for Vector Semantic Models. In: Ignatov D. et al. (eds) Analysis of Images, Social Networks and Texts. AIST 2016 // Communications in Computer and Information Science, vol. 661. Springer, Cham.

13. Казаков В.В., Верстов В.А., Зинченко Л.А., Аверьянихин А.Е. Особенности использования подсистемы WPF в задачах визуализации транспортных свойств углеродных нанотрубок. // Технологии инженерных и информационных систем - В 2, 2016. - С. 34 - 41.

14. Шахнов В.А., Зинченко Л.А., Резчикова Е.В., Глушко А.А., Сергеева Н.А. Особенности тенденции BYOD в инженерном образовании. Образовательные технологии и общество. 2016. Т. 19. В 4. С. 334345.

УДК 004.94 Колосков Д.В.

Московский технологический университет (МИРЭА), Москва, Россия

СТРУКТУРА ЕДИНОЙ БАЗЫ ДАННЫХ РАДИОЭЛЕКТРОННЫХ КОМПОНЕНТОВ

Использование САПР неотъемлемая часть процесса создания радиоэлектронной аппаратуры на всех его этапах. Однако помимо внедрения САПР, для эффективного и качественного проектирования и изготовления изделий необходимо обеспечить интеграцию всех используемых САПР. Одной из проблем, с которой сталкиваются отечественные предприятия, является большая разрозненность информации о применяемой элементной базе: электрорадиоизделия (ЭРИ), стандартные изделия и т.д. Все это может привести к снижению производительности, увеличению сроков выполнения поставленной задачи и привести к ошибкам во время работы. Тем самым появляется необходимость создания единой базы данных, а чтобы управлять структурным и жизненным циклом сложных изделий возможно использование PDM или PLM систем. Решением данной проблемы может стать разработка и внедрение единой базы (библиотеки) компонентов

Ключевые слова:

ЭРИ, БАЗА ДАННЫХ, ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, САПР

Текущее положение

Результаты анализа применяемых баз данных в конструкторско-технологических комплексах,

представлены на рисунке 1. Реальное количество применяемых баз о компонентах во всех подразделениях предприятий, как правило гораздо больше. Необходимо учитывать специфику работы каждого предприятия.

На текущий момент имеется некоторое количество специализированных баз данных о компонентах. Все эти базы никак не связаны между собой, при каких либо изменениях в этих базах могут происходить расхождения. Все это может привести к снижению производительности, увеличению сроков выполнения поставленной задачи и привести к ошибкам во время работы которые в последствии

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Необходимо отметить, что использование разработанного программного обеспечения позволяет внести интерактивное взаимодействие и разнообразие в процесс обучения, что способствует повышению его качества.

Работа выполнена при частичной поддержке гранта РФФИ № 16-06-00404 а.

могут привести в браку. На предприятиях которые занимаются массовым производством это может повлечь за собой большие финансовые затраты. При этом каждая база содержит некоторую общую часть информации, например: наименование, обозначение, документ на поставку.

Разработка единой базы данных ЭРИ позволит решить вышеперечисленные проблемы. База данных должна включать в себя следующую информацию:

сборочные чертежи, схемы электрические принципиальные, сборочные единицы, ограничительные перечни,

разрешения на применения МОП;

3Б-модели, такие как конструкторские и расчетные (испытания на ударную нагрузку, усталость, частотные расчеты и т.д.);

i Надоели баннеры? Вы всегда можете отключить рекламу.