Научная статья на тему 'ТИПОЛОГИЯ БД КАК ЛЕКСИКОГРАФИЧЕСКОГО ПРОДУКТА: ОСНОВНЫЕ ХАРАКТЕРИСТИКИ И ПРЕИМУЩЕСТВА'

ТИПОЛОГИЯ БД КАК ЛЕКСИКОГРАФИЧЕСКОГО ПРОДУКТА: ОСНОВНЫЕ ХАРАКТЕРИСТИКИ И ПРЕИМУЩЕСТВА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
249
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТИПОЛОГИЯ БАЗ ДАННЫХ / ЛЕКСИКОГРАФИЧЕСКАЯ БАЗА ДАННЫХ / ХРАНИЛИЩЕ ИНФОРМАЦИИ / ТЕКСТОВЫЙ ПРОЕКТ / СИСТЕМЫ ПЕРЕВОДА / КЛЮЧ / ГИПЕРТЕКСТ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гусева А.Х.

Публикация посвящена проблеме отбора и типологии лексикографических баз данных. Приведена классификация БД, перечислены основные характеристики, оптимальные для преподавания иностранного языка и перевода. Проанализирована методическая концепция работы с данным форматом, сформулированы образовательные задачи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гусева А.Х.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DB TYPOLOGY AS A LEXICOGRAPHIC PRODUCT: MAIN CHARACTERISTICS AND ADVANTAGES

The publication is devoted to the problem of selection and typology of lexicographic databases. The classification of the database is given, the main characteristics that are optimal for teaching a foreign language and translation are listed. The methodological concept of working with this format is analyzed, educational tasks are formulated.

Текст научной работы на тему «ТИПОЛОГИЯ БД КАК ЛЕКСИКОГРАФИЧЕСКОГО ПРОДУКТА: ОСНОВНЫЕ ХАРАКТЕРИСТИКИ И ПРЕИМУЩЕСТВА»

ТИПОЛОГИЯ БД КАК ЛЕКСИКОГРАФИЧЕСКОГО ПРОДУКТА: ОСНОВНЫЕ ХАРАКТЕРИСТИКИ И ПРЕИМУЩЕСТВА

А.Х. Гусева, канд. пед. наук, доцент

Российский государственный гуманитарный университет (Россия, г. Москва)

DOI:10.24412/2500-1000-2021-10-2-71-74

Аннотация. Публикация посвящена проблеме отбора и типологии лексикографических баз данных. Приведена классификация БД, перечислены основные характеристики, оптимальные для преподавания иностранного языка и перевода. Проанализирована методическая концепция работы с данным форматом, сформулированы образовательные задачи.

Ключевые слова: типология баз данных, лексикографическая база данных, хранилище информации, текстовый проект, системы перевода, ключ, гипертекст.

В условиях доступности и открытости информации на иностранных языках линг-водидактика встала перед проблемой выбора адекватного аутентичного текстового дидактического материала для ведения образовательной деятельности в режиме онлайн, а также самостоятельной работы студентов оффлайн.

Важно отметить, что помимо ознакомления с оцифрованными источниками информации, наиболее продуктивными видами деятельности является продукция, т.е. самостоятельная разработка баз данных текстов на иностранном языке и лексикографических баз данных.

Для студентов, изучающих иностранный язык как язык специальности в данной образовательной парадигме, всемирная сеть рассматривается как один из наиболее перспективных инструментов для обеспечения межкультурного взаимодействия, сотрудничества и информационного обмена. Эффективными средствами развития письменной речи, совершенствования навыков художественного и спецперевода являются цифровые технологии, а активное использование в учебном процессе вуза электронных ресурсов на иностранном языке позволяет не только развить аудитивные и фонетические умения, но также и выработать схему коммуникации с представителями современной культуры страны изучаемого языка - носителями языка.

Изучение иностранных языков и практики перевода предполагает ежедневную

работу с лексикографическими базами данных (ЛБД) как в устном, так и в письменном режимах. По типологии известного лингвиста В.Н. Шевчука ЛБД следует относить к информационным системам, которые «обеспечивают автоматический поиск лингвистической и экстралингвистической информации в Интернете, а также управление информационными потоками (энциклопедии, электронные библиотечные каталоги, банки терминов, серверы поиска и т. д.)» [3, с. 18].

Современные базы данных можно разделить на следующие виды:

1. Простейшие (простые структуры БД)

2. Иерархические

3. Сетевые

4. Реляционные

5. «Ключ-значение»

6. Документоориентированные

7. Графовые

8. Колоночные

9. Комбинированные

10. Многомодульные

С появлением мультимедийных ресурсов студентам и преподавателям стали доступны как ЛБД на дисковых носителях, являющиеся электронной версией толковых, переводных и энциклопедических словарей, так и сетевые и онлайн версии данных продуктов.

Вне зависимости от вида, объектом описания ЛБД является лексическая единица, сопровожденная словарной статьей и входящая в состав машиночитаемого сло-

варного массива. Среди основных типов ЛБД следует перечислить следующие:

1. Рубрикаторы

2. Тезаурусы

3. Классификаторы

4. Терминологические словари

5. Тематические словари

6. Иллюстрированные и визуальные словари

Конкретизируем понятие гипертекста, поскольку в информатике, лингвистике и литературоведении данный термин трактуется по-разному: и с точки зрения технологии, и как текстовый формат, и как структура баз данных: «гипертекст - текст, устроенный таким образом, что он превращается в систему, иерархию текстов, одновременно составляя единство и множество текстов. Простейший пример гипертекста - любой словарь или энциклопедия, где каждая статья имеет отсылки к другим статьям этого же словаря. В результате читать такой текст можно по-разному: от одной статьи к другой, по мере надобности, игнорируя гипертекстовые отсылки; читать статьи подряд, справляясь с отсылками; наконец, пуститься в гипертекстовое плавание, то есть от одной отсылки переходить к другой. Гипертекст это нелинейный лабиринт, своеобразная картина мира, и выйти из него, войдя один раз, труднее, чем может показаться на первый взгляд» [2, с. 46].

Как правило, все лингвистические базы данных словарного типа основаны на жестком структурировании и нуждаются в регулярном редактировании и обновлении в связи с возникновением в языке и в конкретной области деятельности человека новых лексических единиц, терминов и терминированных понятий. В этой связи используемые технологии при разработке ЛБД на иностранных языках по своей сути представляют собой тезаурусы и классификаторы, а по структуре чаще всего являются колоночными, комбинированными и реляционными.

Для многомодульных ЛБД характерна опция конвертации при работе в системах перевода с целью ведения терминологической, тематической и проектной баз данных перевода. В этом случае лексическая

единица также выступает структурной единицей БД, связывающей по технологии гипертекста различные модули системы. В МЛБД используются различные представления для разных типов данных и объединены функциональные возможности нескольких видов БД. Например, в случае работы группы переводчиков над одним текстовым проектом навигация МЛБД позволяет управлять всеми элементами в рамках одного запроса.

Следует отметить, что данная функция особенно важна при переводе объемного корпуса текстов, т.к. она обеспечивает согласованные действия в случае обновления, редактирования и изменения хранящейся лексической информации. Основными преимуществами МЛБД для ведения переводческой деятельности с крупными проектами можно считать следующие: непрерывный доступ, простое распределение данных, постоянство базовой инфраструктуры, расширение за счет добавочных модулей, снижение нагрузки на СУБД.

Безусловно, для грамотного изучения и освоения иностранного языка, а также активизации лексического запаса студентов необходимо постоянное пополнение БД дидактическими материалами и текстами разнообразной тематики.

Данную задачу решают документоори-ентированнные БД, совместно использующие базовую семантику доступа и поиска хранилищ ключей и значений. Накопитель текстовых проектов или хранилище документов имеет ключ для уникальной идентификации данных ДОБД. Необходимо отметить, что в данном случае семантика предполагает однозначное значение лексической единицы, являющейся структурной единицей системы в том числе.

В обязательном порядке единообразно структурирован текстовый проект ДОБД, что требует от студентов определенной лингвистической обработки при внесении того или иного текстового проекта в ДОБД. Среди неоспоримых преимуществ данного вида ЛБД следует назвать такие, как: наличие собственной внутренней структуры, оперативность разработки, возможность изменения свойств при по-

стоянной структуре, сохранение данных в стандартном формате по заданной схеме.

Для обучения переводу как письменному, так и устному, ДОБД является ценным дидактическим материалом преподавателя, к которому можно неоднократно обращаться в случае необходимости при дальнейшей работе, а студенты, создав ДОБД приобретают привычку работы с лексическим материалом в формате текстовых проектов и корпусов на постоянной основе.

Следует упомянуть о визуализации данных как одного из эффективных методов изучения иностранного языка и присвоения иноязычной информации. При размещении лексики в реляционные базы данных студенты приобретают авыки построения логико-семантических схем. РБД в основном структурированы в виде таблицы, где каждый столбец в таблице имеет имя и тип, а каждая строка представляет отдельную запись или элемент данных в таблице, который содержит значения для каждого из столбцов.

Как и в ДОБД, в РБД связи между данными организованы с помощью табличного гипертекста. Основными функциями данного вида ЛБД являются: высокоорганизованная структура и гибкость, возможность адаптации к различным типам данных, наличие нескольких полей (ключей) в формате внешней и внутренней ссылки, возможность ссылочного соединения с полями других таблиц.

При редактировании стандартной ЛБД словарного типа (в первую очередь, переводных словарей) закономерно применения такого формата, как колоночные базы данных. КБД следует отнести, скорее всего, к нереляционным колоночным хранилищам или БД с широкими столбцами. Как и РБД, КБД хранят данные, используя строки и столбцы, но с иной связью между элементами. Например, все строки РБД соотнесены по фиксированной схеме, определяющей назначение столбцов, типы данных и другие критерии.

В КБД используются так называемые «колоночные семейства», которые, в отличие от таблиц, содержат строки, каждая из которых определяет собственный формат.

Функция поиска осуществляется уникальным идентификатором, определяющим значения и имена.

Строка состоит из уникального идентификатора, используемого для поиска, за которым следуют наборы имён и значений столбцов. В качестве преимуществ КБД для разработки и редактирования словаря укажем высокую производительность, доступность по одному идентификатору, гарантированное размещение всех данных строки в одном кластере, что упрощает сегментацию и масштабирование данных.

Высокая образовательная ценность вышеперечисленных ЛБД как для преподавателя иностранного языка и его научной деятельности, так и для студента, изучающего язык и культуру зарубежных стран, зависит от типа контента и формата навигации.

Разработка и редактирование студентами ЛБД направлены на выполнение креативных заданий как удаленно, не выходя из дома, так и в компьютерном классе, в аудиторном режиме.

Перечислим образовательные задачи при работе ЛБД:

1. ознакомить со спецификой чтения и перевода источников гипертекстового формата на иностранном языке;

2. выработать умение применять полученные теоретические знания в практической деятельности при дискурсивном и поисковом чтении материалов и аргументировано обосновывать собственные переводческие решения;

3. научить проводить лингвистический и лингвостилистический анализ посредством аналитического чтения;

4. научить анализировать структуру текстовых материалов при размещении в ЛБД;

5. совершенствовать навыки работы в сетевых средах профессиональных приложениях переводчика с целью разработки и поддержки ЛБД.

В заключение отметим, что ЛБД как технология и формат должны использоваться в комплексе с традиционными источниками информации, в первую очередь, образовательной литературой, что обусловлено концептуально новыми фактора-

ми образовательного процесса - как индивидуального, внеаудиторного (оффлайн), так и коллективного, аудиторного (онлайн).

Основным выводом по вопросам использования баз данных в преподавании иностранного языка является констатация

аутентичного материала в цифровом формате позволяет сократить время поисковой деятельности, оптимизировать усвоение информации гипер-объема, совершенствовать коммуникативную компетенцию, и, как следствие, повысить мотивацию к освоению технологий перевода.

факта, что лингвистическая обработка

Библиографический список

1. Полонский В.М. Словарь по образованию и педагогике. - М.: Высш. шк., 2004. -511 с.

2. Руднев В.П. Словарь культуры XX века: ключевые понятия и тексты - М.: Аграф, 1999. - 381 с.

3. Шевчук В.Н. Информационные технологии в переводе. Электронные ресурсы переводчика. - М.: Зебра Е, 2013. - 384 с.

DB TYPOLOGY AS A LEXICOGRAPHIC PRODUCT: MAIN CHARACTERISTICS

AND ADVANTAGES

A.Kh. Guseva, Candidate of Pedagogical Sciences, Associate Professor Russian State University for the Humanities (Russia, Moscow)

Abstract. The publication is devoted to the problem of selection and typology of lexicographic databases. The classification of the database is given, the main characteristics that are optimal for teaching a foreign language and translation are listed. The methodological concept of working with this format is analyzed, educational tasks are formulated.

Keywords: database typology, lexicographic database, information storage, text project, translation systems, key, hypertext.

i Надоели баннеры? Вы всегда можете отключить рекламу.