Научная статья на тему 'Информационно-коммуникационные технологии в терминологических исследованиях'

Информационно-коммуникационные технологии в терминологических исследованиях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
304
64
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕРМИНЫ / КОМПЬЮТЕРНЫЙ ПОДЪЯЗЫК / ИНФОРМАЦИОННО-КОММУНИКАЦИОННЫЕ ТЕХНОЛОГИИ / WEB 2.0 / ОБЛАЧНОЕ ХРАНЕНИЕ ДАННЫХ / MICROSOFT EXCEL / TERMS / COMPUTER SUBLANGUAGE / ICT / CLOUD STORAGE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Глазырина Анна Игоревна

Описывается применение информационно-коммуникационных технологий в исследовании терминологий и терминосистем с точки зрения создания, обработки, хранения, использования и передачи информации, а также управления ею.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Information and Communication Technologies in Terminological Studies

The article describes the implementation of ICT in terminological studies in all possible aspects: information making, processing, storing, using, transmitting and controlling.

Текст научной работы на тему «Информационно-коммуникационные технологии в терминологических исследованиях»

Критерий Общеупотребительный язык Профессиональный язык

1. Сфера функционирования все носители данного национального языка независимо от специальности, образования, социального положения и местожительства определенная профессиональная среда

2. Средство формирования, хранения и передачи обыденных знаний научных знаний

3. Языковые нормы общие нормы определенного литературного языка общие нормы определенного литературного языка + дополнительные нормы, делающие специальные тексты однозначно понятными

4. Форма представления информации вербальная форма эффективные вербальные и невербальные средства представления научных понятий, законов, принципов, теорий

5. Степень интернационализации менее интернационализирован, чем созданные на его основе профессиональные языки более интернационализирован, чем общеупотребительный язык

6. Естественность / искусственность полностью естественный язык частично искусственный язык, то есть естественный язык с элементами искусственных языков

7. Открытость / закрытость знаковой системы открытая знаковая система терминология, номенклатура и отдельные системы УО являются частично открытыми знаковыми системами, а другие системы УО - закрытыми.

Список литературы

1. Авербух, К. Я. Общая теория термина. М., 2006. 252 с.

2. Голованова, Е. И. Введение в когнитивное терминоведение : учеб. пособие М., 2011. 224 с.

3. Лейчик, В. М. Терминоведение: Предмет, методы, структура. 4-е изд. М., 2009. 256 с.

4. Гінзбург, М. Наукова картина світу як засіб інтегрувати та систематизувати фахові знання // Вісник Національного авіаційного університету. Сер. Філософія. Культурологія. 2012. Вип. 2 (16). С. 9-17.

Вестник Челябинского государственного университета. 2013. № 31 (322).

Филология. Искусствоведение. Вып. 84. С. 25-28.

А. И. Глазырина

ИНФОРМАЦИОННО-КОММУНИКАЦИОННЫЕ ТЕХНОЛОГИИ В ТЕРМИНОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ

Описывается применение информационно-коммуникационных технологий в исследовании терминологий и терминосистем с точки зрения создания, обработки, хранения, использования и передачи информации, а также управления ею.

Ключевые слова: термины, компьютерный подъязык, информационно-коммуникационные технологии, Web 2.0, облачное хранение данных, Microsoft Excel.

Термин выступает особой единицей - еди- теристик терминов, которые, бесспорно, под-ницей языка и логоса. Его специфическая чиняются общим законам существования и природа «слова в особой функции» [1. C. 77] развития языка как системы, так и внеязыко-обусловливает изучение как языковых харак- вых характеристик.

Для терминоведа несомненный интерес представляют информационно-коммуникационные технологии (ИКТ), оптимизирующие сбор, систематизацию и исследование материала, а также верификацию полученных результатов. Англоязычная аббревиатура ICT (ИКТ) имеет две трактовки: 1) Information and Computing Technology [3]; 2) Information and Communication Technology [2]. Последняя трактовка «применяется в Европе вместо или как расширение термина Information Technology (IT), информационная технология - «общий термин, используемый для ссылок на все технологии, связанные с созданием, обработкой, хранением, использованием, пересылкой и управлением информацией в цифровом виде» [2]. В любом случае термины ИТ и ИКТ подразумевают следующую триаду: компьютер - компьютерные сети - программное обеспечение.

Web 2.0 (методика проектирования систем, которые путем учета сетевых взаимодействий становятся тем лучше, чем больше людей ими пользуются) как единая ИКТ предоставляет широкий диапазон разнообразных средств создания, обработки, хранения, использования, пересылки и управления информацией, в том числе и в терминологических исследованиях. Остановимся на некоторых понятиях, обозначающих способы хранения информации в цифровом виде: облачное хранение данных/ облачный сервис(Dropbox, iCloud, Google Docs, Spideroak, SugarSync, Windows Live Sky-Drive, ZumoDrive, MandrivaSync), социальное онлайн-хранилище (Wuala, Ubuntu One), файлообменные хостинги (4shared), веб-сервисы (iWork.com, Syncplicity), система управления документами (TeamDrive). Стоит упомянуть также веб-сервисы (см. web-сервис, вебслужбы) - сервисы, в которых обмен сообщениями производится по Интернету с использованием XML, SOAP или других принятых в ИТ-индустрии стандартов [2]. Все большее распространение получает интеллектное программное обеспечение (intelligent software), например, работа с искусственным интеллектом.

Системы резервного копирования данных представлены сервисами на следующих сайтах: http://www.ibackup.com, http://www.mozy. com, http://www.carbonite.com, http://www. idrive.com, http://www.omnidrive.com, http:// www.iomega.com, http://www.xdrive .com.

Технология (формат, механизм, стандарт) RSS - «метод распространения новостной информации через Интернет по подписке, разно-

видность XML. Поскольку технология не устоялась, сейчас имеется три расшифровки аббревиатуры RSS: а) Really Simple Syndication -действительно простая синдикация; б) Rich Site Summary - исчерпывающая сводка сайта, «хорошее обобщение сайта»; в) RDF (Resource Description Framework - инфраструктура описания ресурсов) Site Summary - сводка сайта с инфраструктурой описания ресурсов протокол для передачи и приема оперативно рассылаемых новостей, может служить дополнением Web-журнала, наряду с RSS-агрегатором» [2]. Данная ИКТ терминология может оказаться чрезвычайно полезной при исследовании специальных единиц стандарта и субстандарта в их функциональном аспекте: употребление в дискурсе СМИ и т. д.

Перейдем к средствам, предоставляемым ИТ (программное обеспечение). Наибольший интерес для терминоведения, на наш взгляд, представляют программы Microsoft Open Access и Microsoft Excel. Эра «карточек в коробочках» канула в Лету: сегодня бессмысленно от руки составлять картотеки, перекладывая затем карточки в нужном порядке в зависимости от условий поиска.

Работая с программами пакета Microsoft Office (Microsoft Office 2010 - текущая версия офисного пакета, базовая поддержка которой будет прекращена 15 июля 2015 г.), пользователи не до конца осознают и используют их потенциал. Все это правомерно и для проведения исследований, записи результатов и их обработки в лингвистике.

Исследование уровней языков в рамках изучениях терминологий и терминосистем (о различии последних см. работы А. С. Герда, С. В. Гринева, В. М. Лейчика, С. Д. Шелова) предполагают выделение инвентаря определенных признаков (например, аффиксов и по-луаффиксов, интернациональных терминоэле-ментов, всех видов сем).

Инвентаризация и анализ всей совокупности признаков могут быть осуществлены в рамках стандартных программ пакета Microsoft Office, а именно - Microsoft Office Excel и Microsoft Office Access (для тех, кто не может определиться с программой будет полезна следующая гиперссылка - http://office.mi-crosoft.com/en-us/training/quick-reference-card-RZ010253998.aspx? section=12&mode =print). Эти программы, предназначенные для ведения любой аналитической работы, обладают одним неоспоримым преимуществом - позволяют ав-

томатически сортировать данные в зависимости от необходимого параметра.

Чем же особенно удобен Microsoft Excel 2007 и 2010 при исследовании морфологического и/или семантического уровней? Работа с данными в Microsoft Excel (вкладка «Данные») делится на 5 этапов: «Получение внешних данных», «Подключение», «Сортировка и фильтр», «Работа с данными», «Структура».

Во-первых, множество вкладок позволяют структурировать материал, вынести отдельно условные обозначения, которые, несомненно, будут присутствовать в таблицах.

Во-вторых, количество строк и колонок в таблицах Excel не ограничено. В отличие от Microsoft Word исследователю не приходится составлять таблицы вручную. Microsoft Excel автоматически выравнивает ширину колонок. Единственный недостаток - при выводе на печатный носитель необходимо учитывать размер бумаги (чтобы не ошибиться с количеством колонок на одну страницу можно воспользоваться функцией программы «Предварительный просмотр»).

Microsoft Excel позволяет автоматически получать внешние данные из текста (одно условие -данные должны быть представлены в формате .txt).

Следует учитывать, что текст необходимо располагать в одной ячейке Microsoft Excel, так как автоматическая разбивка по столбцам возможна лишь в этом случае. Таблицы Excel легко копируются в Microsoft Word с последующими трансформациями уже в Microsoft Word, что немаловажно при написании работы исследовательского характера.

Если выбрать во вкладке «Формат данных» параметр «фиксированной ширины», то данные автоматически разобьются на столбцы выбранной ширины (вкладка «Установите ширину полей»), исключая ненужный ввод с клавиатуры из документов с расширением .doc.

Самой важной функцией, предоставляемой программой Microsoft Excel, является сортировка данных по различным параметрам: количество параметров теоретически не ограничено. Возможна классификация по следующим параметрам: 1) фильтр; 2) цвет шрифта; 3) цвет заливки ячеек.

Гипотетически, имея 3 фильтра (суффиксы или семы), 2 шрифта (2 словника) и 2 разных цвета ячейки (2 регистра) возможно выделить 12 подмножеств элементов.

При сортировке данных имеет смысл выполнить сортировку сразу по нескольким критериям, например: 1) по столбцам; 2) значениям; 3) порядку. Немаловажно, что в данном случае программа позволяет учитывать регистр. Исследователь вправе выбрать любой необходимый ему фильтр, присвоив ему любое имя. Вкладка «Работа с данными» позволяет распределять содержимое одной ячейки Excel по столбцам. Следует учитывать, что данные должны обязательно помещаться в одну ячейку. Работа с данными в нескольких ячейках невозможна.

Первый шаг в реализации этой процедуры -указание формата данных: 1) с разделителями; 2) фиксированной ширины. Стандартные разделители (предусмотренные программой) включают: знак табуляции, точку с запятой, запятую или пробел. Однако наиболее интересным представляется вариант с выбором любого символа в качестве разделителя. Из опыта работы с текстовыми данными наибольшую «продуктивность» представляет символ %, поскольку он практически не встречается в текстах. Программа однозначно будет воспринимать данный символ в качестве разделителя столбцов. К сожалению, автоматизировать процедуру разбиения текста на смысловые фрагменты с помощью данных разделителей не представляется возможным. Данная операция производится исследователем вручную. Ниже в диалоговом окне исследователь сразу видит образец разбора данных. Затем программа запрашивает формат данных: общий, текстовый или дата. Наиболее оптимальным представляется общий или текстовый формат. Следует, однако, учитывать некоторые нюансы: для значений формата «Общий» осуществляется автоматическое преобразование числовых значений в числа, дат - в даты, а всех прочих значений - в текст.

Одной из необходимых функций в работе лингвистов является функция «Удаление дубликатов», осуществляющая удаление повторяющихся строк с листа. С помощью данной функции возможна проверка столбцов на повторы. Удаление возможно лишь при выборе режима «Сортировать в пределах указанного выделения», причем удаление данных возможно лишь в рамках одного столбца. Программа оставляет лишь уникальные значения, показывая количество удаленных повторяющихся значений. Такой механизм позволяет со 100% точностью вести подсчет идентичных элементов в массиве данных.

Вкладка «Работа с данными» поможет проверить введенную информацию. Тип данных может представлять собой целое число, действительное, список, дату, время, длину текста. Значения варьируются от «между» до «меньше или равно» («вне», «равно», «не равно», «больше», «меньше», «больше или равно», «меньше или равно»). Например, выберем тип данных «Длина текста», значение «Между», при этом минимум составит 1 единица, максимум - 3 единицы. Затем во вкладке «Проверка данных» выбираем команду «Обвести неверные данные». Команда «Удалить обводку неверных данных» позволяет «в один клик» отменить все выделения. Остальные функции программы предназначены в основном для работы с числовыми значениями и формулами.

Описанная программа практически не содержит так называемых «горячих клавиш». Интерес представляют лишь 2 горячие клавиши: Ctrl+Shift+А - «Отображение формата ячейки»; Ctrl+Alt+F5 - «Обновить все».

Одной из полезных и наглядных функций является функция создания гиперссылок как в самом тексте, так и между документами. Создание гиперссылок между документами позволяет с легкостью осуществлять навигацию, экономя время, нервы и силы исследователей.

Что касается создания гиперссылок между ячейками, то здесь необходимо помнить о двух «подводных камнях»: во-первых, создание мультиссылок невозможно (переход будет осуществляться поэтапно, от одной гиперссылки к другой); во-вторых, при передвижении данных по ячейкам в процессе работы над документом исследователь рискует нарушить систему гиперссылок. Гиперссылки в документе чрезвы-

чайно удобны в случае необходимости связи лексем, состоящих в тех или иных парадигматических отношениях (синонимии, парони-мии, антонимии и т. д.). Исследователь вручную указывает номер ячейки перехода запроса (например, А232). Если данные в результате автоматической сортировки переместились в ячейку А343, то гиперссылка все равно будет связана с предыдущим указанным значением. Следовательно, данный этап можно назвать “last but not least” (англ. «хотя и последний, но не менее важный») и осуществлять данную процедуру в самом конце исследования, когда все данные уже были отсортированы и проверены на предмет наличия дубликатов.

Использование широких возможностей программы Microsoft Excel облегчит работу лингвиста, однако полностью автоматизировать процесс исследования, конечно же, не сможет. Любое автоматическое действие требует контроля и корректировки со стороны самого исследователя.

Список литературы

1. Капанадзе, Л. А. О понятиях «термин» и «терминология» // Развитие лексики современного русского языка. М., 1965. С. 75-86.

2. Пройдаков, Э. М. Англо-русский толковый словарь по вычислительной технике, Интернету и программированию [Электронный ресурс]. М., 2004. 1 электрон. опт. диск (CD-ROM).

3. New Oxford American Dictionary [Электронный ресурс]. Oxford, 2005. 1 электрон. опт. диск (CD-ROM).

Вестник Челябинского государственного университета. 2013. № 31 (322).

Филология. Искусствоведение. Вып. 84. С. 28-32.

Е. И. Голованова

ПРОФЕССИОНАЛЬНАЯ КОГНИЦИЯ КАК РАЗНОВИДНОСТЬ ИНТЕРПРЕТИРУЮЩЕЙ ДЕЯТЕЛЬНОСТИ

В статье рассматривается проблема выявления специфики профессиональной когниции. На основе различных языковых фактов устанавливается своеобразие профессионального восприятия и интерпретации объектов.

Ключевые слова: профессиональная когниция, интерпретирующая деятельность, профессиональная личность, профессиональный дискурс.

i Надоели баннеры? Вы всегда можете отключить рекламу.