Научная статья на тему 'СОСТАВЛЕНИЕ ГЛОССАРИЯ ПО УЧЕБНИКУ РАДИОТЕХНИЧЕСКОЙ ОТРАСЛИ С ПОМОЩЬЮ ПРОГРАММ ИЗВЛЕЧЕНИЯ ТЕРМИНОВ'

СОСТАВЛЕНИЕ ГЛОССАРИЯ ПО УЧЕБНИКУ РАДИОТЕХНИЧЕСКОЙ ОТРАСЛИ С ПОМОЩЬЮ ПРОГРАММ ИЗВЛЕЧЕНИЯ ТЕРМИНОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
4
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
термин / глоссарий / программное обеспечение / радиотехника / определение / term / glossary / software / radio engineering / definition

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Литвинова В.А.

Статья посвящена рассмотрению способа составления глоссария технических терминов. Суть способа заключается упрощении и ускорении работы путем использования программного обеспечения для извлечения терминов из текста. Было проведено сравнение результатов работы разного программного обеспечения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPILING GLOSSARY OF TEXTBOOK OF RADIO ENGINEERING INDUSTRY USING TERM EXTRACTION PROGRAMS

Article is devoted to the consideration of the method of compiling a glossary of technical terms. The essence of the method is to simplify and speed up the work by using software to extract terms from the text. The results of the work of different software were compared.

Текст научной работы на тему «СОСТАВЛЕНИЕ ГЛОССАРИЯ ПО УЧЕБНИКУ РАДИОТЕХНИЧЕСКОЙ ОТРАСЛИ С ПОМОЩЬЮ ПРОГРАММ ИЗВЛЕЧЕНИЯ ТЕРМИНОВ»

УДК 81

Литвинова В.А.

студент кафедры иностранных языков Уральский федеральный университет им. первого Президента России Б.Н. Ельцина (г. Екатеринбург, Россия)

СОСТАВЛЕНИЕ ГЛОССАРИЯ ПО УЧЕБНИКУ РАДИОТЕХНИЧЕСКОЙ ОТРАСЛИ С ПОМОЩЬЮ ПРОГРАММ ИЗВЛЕЧЕНИЯ ТЕРМИНОВ

Аннотация: статья посвящена рассмотрению способа составления глоссария технических терминов. Суть способа заключается упрощении и ускорении работы путем использования программного обеспечения для извлечения терминов из текста. Было проведено сравнение результатов работы разного программного обеспечения.

Ключевые слова: термин, глоссарий, программное обеспечение, радиотехника, определение.

В настоящее время наука радиотехника активно развивается, радиотехнические решения внедряются повсеместно. Однако радиотехнических глоссариев представлено не так много. Составление глоссариев - это сложная задача в силу своих особенностей: требуется большое количество времени, которое необходимо для ознакомления с литературой, необходимо в полной мере понимать критерии терминов. В данной статье рассматривается новый способ составления глоссария, который упрощает работу путем использования программного обеспечения для извлечения терминов из текста.

Терминология является одним из важнейших каналов социальной коммуникации, оказывающим огромное влияние на языковое существование в целом. Терминотворчество можно представить как целенаправленный поиск необходимой информации на основе имеющегося языкового опыта и

закрепление ее в «информационно-терминологической сфере» конкретного языка, где кодируется и декодируется, хранится и перерабатывается национальная и интернациональная терминологическая информация, создаваемая и воспринимаемая человеком [1, с. 17].

Общепризнанным является тот факт, что одной из основных черт языка науки является наличие в нем терминов, выражающих понятия специальной области научного знания или деятельности. Следует особо подчеркивать то обстоятельство, что научная речь в большинстве своих жанровых разновидностей характеризуется консервативность в отборе языковых средств выражения. Это обстоятельство отмечается многими исследователя научного стиля речи.

Терминология в целом относится к числу интегрирующих факторов, которые позволяют создавать единое информационное (научно-техническое, образовательное, экономическое и т.д.) пространство, поскольку именно терминология обеспечивает информационное взаимопонимание на национальном и межнациональном уровнях, совместимость законодательных, правовых и нормативных документов и т.п. Однако нельзя не учитывать и того факта, что для передачи профессиональной информации совершенно необходимы и нейтральные в стилистическом отношении пласты лексики, имеющие свою функциональную специфику в рамках языка науки [2, с. 170].

Известно, что наиболее информативной единицей научного текста является термин. Однако анализ лингвистической литературы по данной проблеме позволил сделать вывод о том, что на сегодняшний день для данного понятия нет общепринятого определения, способного отразить его сущность и типологические разновидности, а само понятие представляется собой «... наиболее слабое звено в теории терминоведения, так как является не только многоаспектным, но и внутренне противоречивым объектом исследования» [3, с. 10].

В настоящее время выделяется три основных подхода к определению термина: а) попытка дать термину логическое определение, б) описательно

раскрыть содержание термина, приписывая ему характерные признаки и в) выделить термин, противопоставив его какой-либо смежной единице [4, с. 10].

Не обсуждая и не анализируя каждый из имеющихся подходов, предлагаем принять в рамках настоящего исследования следующее определение: термин - это слово или словосочетание, обозначающее понятие специальной области знания или деятельности, обладающее особой дефиницией и ограниченное определенным местом в специальной терминосистеме.

Традиционно к основным специфическим особенностям термина относят: 1) тенденция к однозначности в пределах своего терминологического поля, 2) точность, 3) краткость, 4) отсутствие синонимов, 5) системность, 6) стилистическую нейтральность и т.д. Все эти свойства термин реализует только внутри терминологического поля, за пределами которого теряются его дефинитивные и системные характеристики [2, с. 169].

Терминам (как и словам общелитературного языка) свойственна синонимия, но наличие терминологической синонимии по-разному оценивается лингвистами. «Синонимические отношения, реализуя тенденцию знака к асимметрии его сторон - означаемого и означающего, связывают слова одной и той же части речи, которые обладают тождественным лексическим значением или же близкими лексическими значениями. Синонимы относятся к одному и тому же денотату (и к одному и тому же сигнификату или же к близким по денотативной основе сигнификатам)» [5, с. 127].

Некоторые исследователи полагают, что терминологическая синонимия недопустима. А. В. Крыжановская рассматривает ее как результат словарной избыточности. По мнению Л. А. Капанадзе, нет терминов, близких по значению, есть терминологические дублеты - явление принципиально отличное от синонимии. Н. В. Левандровская полагает, что «в действительности термины, называющие концепты специальных структур знания, могут включать и варианты, и дублеты, и синоными. Соотнесенные с одним и тем же понятием, такие термины неравноценны по устойчивости, частотности, сфере употребления (разные стили специальной речи), их образование связанно со

стадией возникновения и становления новых концептов данной сферы знания» [6, с. 97].

Другие лингвисты, напротив, рассматривают синонимию терминов как весьма распространенное и позитивное явление. Так, например, Ю. Н. Марчук отмечает, что «такие семантические классы терминов, как синонимия, [...] имеют едва ли не большее распространение, чем соответствующие группы слов в общелитературном языке. Благодаря этим разрядам терминологических единиц выражаются многообразные логико-понятийные взаимосвязи в терминологии. С помощью множественности номинативных средств языка реализуется лабильность мыслительных структур» [7, с. 144].

На основе анализа теоретических работ своих предшественников, с. В. Гринев-Гриневич указывает на факторы, которые в конечном счете обусловили для большинства ученых для обозначения эквивалентных по значению терминов выбор термина «дублетность», а не «синонимия». Так, синонимия, которая по определению отнюдь не подразумевает полную эквивалентность значения двух и более лексических единиц, свойственна общеупотребительной лексике, и здесь выделяют две разновидности: идеографические (разнопредметные) синонимы, различающиеся оттенками значения, и стилистические синонимы, имеющие положительную окраску и принадлежащие к различным стилевым уровням [8, с. 104].

В отличие от общеупотребительной лексики, в специальной лексике, «если <...> термины обозначают одно и то же понятие, то, они, как правило, являются абсолютными эквивалентами по значению. Поэтому <...> было предложено использовать для этого явления термин дублетность <...>» [Гринев-Гриневич 2008, с. 104]. Б.Н. Головин и Р.Ю. Кобрин предлагают следующее определение дублетности: «Терминологические дублеты — это слова или словосочетания, которые объединяются особой терминологической соотнесенностью с одним и тем же научным понятием и объектом действительности» [9, с. 54].

Данная работа будет ориентироваться на определение «термина», предложенного в работе [4, с. 10], также будут рассмотрены и проанализированы терминологические дублеты.

В данной работе рассматриваются программа AntConc и сайт ОпеСНскТегш. Ап1Сопс - это программа для поиска и подсчета различных элементов текста, анализа частотности и контекста употребления словоформ, словосочетаний и морфем, сравнения употребительности словоформ в разных текстах. OneQickTerm - сайт для извлечения терминов из текста.

Для исследования выбран текст книги С. А. Баранова «Устройства СВЧ и антенны» [11].

Интерфейс программы AntConc приведен на рисунке 1. На данном рисунке представлен список слов/терминов, выделенных программой.

¡*гд« Ссгры КЮК «о! Ые ¥1«¥ tv.fc.tef M-iia.ii СсАосяе Иыь кеуцсго «с^Ооий

■Чага «ню €Т1(г1с4 П5М/Ш54 То 1Ы Рмч 4 Рздр 51» И '. 1 миМаМ 1534 ЫГ! О

Туре лпк Кгпде

ЬатапоЛи! 1 ЭМИЧ11Ы В 673 1

2 водаи 3 поля 13 47В 1 Ю ЗЕЬ 1 21 333 1

5 гз ж 1

6 «и6рл1сра 8 шд^иенв» 32 ¿411 1 43 199 1 46 Ш 1

9 да 10 во» 11 1ИИ.1К!1Ке 5» 165 1 154 1 57 152 1

1? поле 64 130 1

11 ВИб(М10р0е 67 Ш 1

14 (ГНТрЩНИЯещЧ» 14 Передачи 6Л Г7Й 1 70 122 1

17 н'аправютмти 13 №9 1 76 ЮТ 1

1Й МАиОвйАЛ 79 №3 1

19 МЕНЯЙ 2С элементов 21 Мр«ЙЯ9 ВЗ 99 1 № 96 1 Э0 95 1

2? влЬрлтор М 92 1;

£№<14 Оиегу я I {«е- Редек Мш »г«) ' М „.Я«.* . :

И_ 5гап йай!

С-«|иеги,

Рисунок 1. Интерфейс программы AntConc.

Также программа выделяет союзы, предлоги, слова описания и пр. Для фильтрации выделяемых слов необходимо составить «черный список» слов. Реализация данной функции представлена на рисунке 2.

Рисунок 2. «Черный список» в АПСопс.

Для того, чтобы определить, является ли выделенное слово термином, можно вывести на экран часть текста, в котором используется выбранное слово. Далее приведены термины, выделенные программой:

Вибратор - излучатель в виде проводника длиной + 12 произвольного сечения, питаемый в точке разрыва источником электромагнитного поля через линию передачи.

Антенна - пассивное устройство, предназначенное для излучения или приема радиоволн и состоящее из проводников и магнитодиэлектриков.

ДН (Диаграмма направленности) - характеризует угловое распределение амплитуды поля и является положительной вещественной функцией.

Программа хорошо выделяет термины при использовании «черного списка», но необходимо учитывать, что в технических текстах термины используются много раз, поэтому программа выводит несколько примеров использования одних и тех же слов.

Интерфейс сайта ОпеСНскТегт приведен на рисунке 3. Сайт выводит списки слов и словосочетаний. Сайт выводит меньше слов и словосочетаний по

сравнению с AntConc. Для отображения полного списка необходима авторизация на сайте. Возможность составления «черного списка» отсутствует.

Рисунок 3. Интерфейс сайта OneQickTerm.

Сайт также позволяет вывести на экран часть текста, в котором используется выбранное слово. На рисунке 4 представлены части текста, в которых используется термин «Линия передачи». В четвертой строке написано определение термина.

В учебном пособии рассмотре- ны пинии передачи , используемые а различных диапазонах волн , и методы расчета устройств на их основе , а , также наиболее упо- требительные типы антенн для радиосистем и систем радиосвязи . 4 Введение Материал разделов излагается в

последовательности от основных нормативных определений через теоретическое обоснование инже- нерного метода расчета , его описания и примеров использования к техническому выполнению конкретного устройства .

3 Характеристики линий передачи Линия передачи (ЛП ) устройство, ограничивающее область распространения электромагнитных колебаний и

^ Характеристики пиний передачи Линия передачи (ЛП ) - устройство , ограничивающее область распространения электромагнитных колебаний и

с Линии передачи характеризуются большим набором парамет- ров : конструкционных . массо-габаритных . эксплуатационных . стой- мостных и т. д. К наиболее важным из них относятся электрические характеристики линий передачи .

Рисунок 4. Части текста с выбранным термином на сайте ОпеСНскТегт.

Таким образом, использование программного обеспечения для извлечения терминов облегчает и ускоряет составление глоссария технических

терминов. При использовании ПО необходимо рассматривать ту часть текста, к которой относится выделенное слово/словосочетание.

Использование ПО предпочтительнее использования сайта, так как ПО предлагает больше слов и словосочетаний.

Была изучена научная литература о терминологии и выявлено определение термина. Были рассмотрены научные статьи о составления глоссариев, а также выявлены проблемы, возникающие при выполнении данной работы.

Результаты работы показывают перспективность использования ПО для извлечения терминов в составлении глоссариев технических терминов.

СПИСОК ЛИТЕРАТУРЫ:

1. Володина М. Н. Теория терминологической номинации. М., 1997;

2. Граудина Л. К., Ширяев Е. Н. Культура русской речи. - М., 2002;

3. Алексеева Л. М. Проблемы термина и терминообразования. - Пермь, 1998;

4. Комарова З. И. Семантическая структура специального слова и ее лексикографическое описание. - Свердловск, 1991;

5. Сусов И. П. Введение в языкознание: учеб. М.: 2007. С. 127;

6. Левандровская Н. В. Глагольная синонимия в терминологии военной авиации (на материале английского и русского языков) // Современная лингвистика: теория и практика: материалы VII межвуз. Науч.-метод. конф. Ч. 1. Краснодар, 2007. С. 97;

7. Марчук Ю. Н. Компьютерная лингвистика: учеб. пособие. М., 2007. С. 144;

8. Гринев-Гриневич С. В. Терминоведение: учеб. пособие / С. В. Гринев-Гриневич. - М.: Академия, 2008. - 303 с;

9. Головин Б. Н., Кобрин Р. Ю. Лингвистические основы учения о терминах: учеб. пособие. М., 1987. С. 54;

10. Баранов С. А. Устройства СВЧ и антенны. Учебное пособие для вузов. -М.: Горячая линия - Телеком, 2022. - 344 с

Litvinova V.A.

Ural Federal University named after Boris Yeltsin (Ekaterinburg, Russia)

COMPILING GLOSSARY OF TEXTBOOK OF RADIO ENGINEERING INDUSTRY USING TERM EXTRACTION PROGRAMS

Abstract: article is devoted to the consideration of the method of compiling a glossary of technical terms. The essence of the method is to simplify and speed up the work by using software to extract terms from the text. The results of the work of different software were compared.

Keywords: term, glossary, software, radio engineering, definition.

i Надоели баннеры? Вы всегда можете отключить рекламу.