Научная статья на тему 'ПРОБЛЕМЫ КОРПУСНОГО ПОИСКА НЕМЕЦКИХ ФРАЗЕОЛОГИЗМОВ В МАНГЕЙМСКОМ КОРПУСЕ НЕМЕЦКОГО ЯЗЫКА'

ПРОБЛЕМЫ КОРПУСНОГО ПОИСКА НЕМЕЦКИХ ФРАЗЕОЛОГИЗМОВ В МАНГЕЙМСКОМ КОРПУСЕ НЕМЕЦКОГО ЯЗЫКА Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
69
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕМЕЦКИЙ ЯЗЫК / ФРАЗЕОЛОГИЗМ / КОРПУСНАЯ ЛИНГВИСТИКА / МАНГЕЙМСКИЙ КОРПУС

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Нурзет Ц.С.-Б.

Рассматриваются трудности при поиске фразеологических единиц в лингвистическом корпусе и способы их преодоления. Несмотря на большой интерес к корпусной лингвистике и обилию корпусных исследований, до сих пор существуют определенные проблемы с более эффективным использованием данного лингвистического инструмента. Данная статья описывает самые распространенные проблемы поиска немецких фразеологизмов с учетом особенностей немецкого языка и поможет справиться с большинством из них. В исследовании мы пользовались наиболее крупным корпусом немецкого языка, мангеймским корпусом DeReKo, который оснащен корпусным менеджером COSMOS II, позволяющим сужать поисковые запросы. В статье также описан поэтапный алгоритм работы в корпусе. Результаты данной работы могут быть полезны лингвистам, исследующим языковые явления, лексикографам для актуализаций словарных статей и преподавателям иностранных языков.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SEARCH PROBLEMS OF GERMAN PHRASEMES IN THE GERMAN REFERENCE CORPUS

The article shows search difficulties of phraseological units in the linguistic corpus and methods of overcoming them. Despite a great interest in corpus linguistics and an abundance of corpus research, there are certain problems with more effective usage of this linguistic tool. The study describes the most common search problems of German phraseological units considering features of the German language and helps to overcome the most of them. The study is based on the largest corpus of the German language, namely German Reference Corpus, abbreviated as DeReKo. DeReKo has a corpus manager called COSMOS II that narrows a search query. The article also describes a step-by-step algorithm for working in DeReKo. The study results can be useful to linguists studying linguistic phenomena, lexicographers for updating dictionary entries and teachers of foreign languages.

Текст научной работы на тему «ПРОБЛЕМЫ КОРПУСНОГО ПОИСКА НЕМЕЦКИХ ФРАЗЕОЛОГИЗМОВ В МАНГЕЙМСКОМ КОРПУСЕ НЕМЕЦКОГО ЯЗЫКА»

УДК 811.112.22 https://doi.org/10.34680/2411-7951.2022.5(44).575-578

Ц.С.-Б. Нурзет

ПРОБЛЕМЫ КОРПУСНОГО ПОИСКА НЕМЕЦКИХ ФРАЗЕОЛОГИЗМОВ В МАНГЕЙМСКОМ

КОРПУСЕ НЕМЕЦКОГО ЯЗЫКА

Рассматриваются трудности при поиске фразеологических единиц в лингвистическом корпусе и способы их преодоления. Несмотря на большой интерес к корпусной лингвистике и обилию корпусных исследований, до сих пор существуют определенные проблемы с более эффективным использованием данного лингвистического инструмента. Данная статья описывает самые распространенные проблемы поиска немецких фразеологизмов с учетом особенностей немецкого языка и поможет справиться с большинством из них. В исследовании мы пользовались наиболее крупным корпусом немецкого языка, мангеймским корпусом DeReKo, который оснащен корпусным менеджером COSMOS II, позволяющим сужать поисковые запросы. В статье также описан поэтапный алгоритм работы в корпусе. Результаты данной работы могут быть полезны лингвистам, исследующим языковые явления, лексикографам для актуализаций словарных статей и преподавателям иностранных языков.

Ключевые слова: немецкий язык, фразеологизм, корпусная лингвистика, мангеймский корпус

В современной лингвистике одним из новых инструментов научных исследований является корпус

текстов или лингвистический корпус. Научные труды, основанные на корпусах, благодаря большому объему эмпирических данных и быстрому поиску искомых языковых единиц, позволяют качественно и в кратчайшие сроки подтверждать или опровергать языковые гипотезы, дополнять существующую языковую теорию. Практическую пользу корпусов можно обнаружить в актуализации одноязычных и многоязычных словарей, например, имея аутентичные тексты можно выявить определенные сдвиги в семантике лексических единиц. Однако в работе с любым корпусом можно обнаружить определенные проблемы в поиске языковых единиц и чаще всего данные проблемы возникают в поиске фразеологизмов, так как данные единицы языка обладают такими важными характеристиками как раздельнооформленность, что заставляет искать не отдельное слово, а целое словосочетание, также единая неделимая семантика, которая должна учитываться, поскольку фразеологизм по компонентному составу можно перепутать со свободным сочетанием слов.

Целю данного лингвистического исследования является выявление проблем поиска немецких фразеологизмов в лингвистическом корпусе.

Актуальность данной работы обусловлена тем, что, используя лингвистические корпуса можно столкнуться с определенными проблемами поиска фразеологических единиц, а результаты данной работы помогут преодолеть их и облегчить работу в корпусе.

Данная работа связана с исследованием Е.В.Пивоваровой и Ц.С.-Б.Нурзета «Корпусный анализ немецких фразеологизмов с компонентом-числительным (0—5)» и демонстрирует проблемы, с которыми столкнулись исследователи при поиске фразеологических единиц [1].

Для поиска любых фразеологических единиц надо опираться на определение фразеологизма и стоит учитывать их основные свойства, отличающие их от других лексических единиц.

Фразеологизм (фразеологическая единица) — общее название семантически связанных сочетаний слов и предложений, которые, в отличие от сходных с ними по форме синтаксических структур, не производятся в соответствии с общими закономерностями выбора и комбинации слов при организации высказывания, а воспроизводятся в речи в фиксированном соотношении семантической структуры и определённого лексико-грамматического состава [2, с. 559]. Мы полагаем, что данное определение лучше подходит для исследований фразеологизмов в корпусе, поскольку оно включает в себя основные свойства фразеологизмов, разграничивающие их от свободных сочетаний слов, а именно: 1) воспроизводимость, которая характеризует фразеологизмы как относительно устойчивые сочетания языковой системы и в речевом акте они не образуются, а воспроизводятся [3, с. 19]; 2) устойчивость, подразумевающая, что фразеологизмы — относительно стабильные единицы, и их изменяемость ограничена [4, с. 160]; 3) идиоматичность т.е. невыводимость общего значения устойчивого сочетания слов из суммы значения лексических компонентов [3, с. 20]; 4) раздельнооформленность — особенность строения синтаксического единства, заключающаяся в том, что составляющие его единицы являются отдельными словами [5, с. 365]. Вышеперечисленные свойства фразеологизмов помогут при поиске разграничивать фразеологические единицы от свободных сочетаний слов.

Также следует рассмотреть основные понятия корпусной лингвистики, затрагивающие проблемное поле исследования.

Корпус — количественно оцениваемая компьютерная коллекция текстов, представленная в электронном и в интерактивном виде, и к которой можно получить доступ [6, с. 1045]. Если говорить о лингвистических корпусах, то это собрания текстов, включающие тексты полностью или, по крайней мере, очень большие отрывки текстов. Кроме того, лингвистические корпусы часто, но не всегда репрезентативны по отношению к предмету, к которому они относятся, снабжены метаданными и лингвистическими аннотациями [7, с. 39].

Ученые записки Новгородского государственного университета. 2022. № 5 (44). С. 575-578. ' '

Неотъемлемой частью понятия «корпус текстов» является система управления текстовыми и лингвистическими данными, которую в последнее время чаще всего называют корпусным менеджером [8, с. 55].

Корпусный менеджер полезен в поиске языковых единиц тем, что он позволяет строить как KWIC (Key Word In Context или ключевое слово в контексте), так и полные конкордансные списки, искать как отдельные слова, так и словосочетания, сортировать списки по нескольким критериям, выбираемым пользователем, давать возможность отображать найденные словоформы в неограниченном контексте, давать статистическую информацию по отдельным элементам корпуса, отображать морфологические характеристики словоформ и метаданные (библиографические, типологические) [8, с. 55-56].

Das Deutsche Referenz Korpus (DeRe^) или Мангеймский корпус немецкого языка, в котором мы проводили исследование, является на данный момент самым массивным корпусом среди немецких с объемом данных в 53 миллиарда слов (8 марта 2022 г.) [9]. Корпус состоит из аутентичной немецкой беллетристики, научных и публицистических текстов. Стоит отметить, что DeReKo имеет корпусный менеджер COSMAS II (Corpus Search, Management and Analysis System или корпусный поиск, системное управление и анализ), благодаря которому осуществляется поиск слов и словосочетаний, также он снабжен функцией выбора морфологических словоформ. Также в COSMAS II можно пользоваться операторами (специальными символами, добавляемыми к поисковому запросу), сужающими поисковый запрос.

Для исследования были отобраны фразеологизмы из словаря Duden — «Redewendungen und sprichwörtliche Redensarten» 2013 года. Данное исследование ограничивается анализом фразеологизмов с компонентом-числительным в диапазоне от 0 до 5. В результате было отобрано всего 49 фразеологических единиц: с компонентом Null 7 фразеологизмов, с компонентом eins — 11, с компонентом zwei — 13, с компонентом drei — 8, с компонентом vier — 8 и 2 фразеологизма с компонентом fünf.

Поэтапный алгоритм работы с Мангеймским корпусом немецкого языка:

1) Выбор архива. В данной работе мы пользовались архивом письменного языка;

2) ввод фразеологизма. Перед глаголом, обязательно ставим символ «&», для поиска всех возможных

форм;

3) выбор нужных словоформы среди всех возможных;

4) предоставление корпусным менеджером контекстов, где найдены искомое сочетание слов;

5) анализ найденных сочетаний слов в контекстах на предмет соответствия основным свойствам фразеологизмов;

6) выявление способов решения проблем поиска фразеологических единиц.

Пятый этап нужен для обнаружения проблем с поиском фразеологических единиц, если найденное сочетание слов не соответствует основным свойствам фразеологизму, то исследователь столкнулся с проблемой в поиске, и мы в данных ситуациях ищем поиски решения проблем. Мы анализируем первые 30 контекстов, поскольку в данном диапазоне уже выявляются проблемы в поиске, особенности употребления фразеологических единиц, также следует учитывать, что примерно после 15 контекста могут начаться повторы контекстов.

Далее предоставлены примеры проблем поиска немецких фразеологизмов в корпусе DeReKo.

1) Фразеологизм jmdm. eins sein. Значение в словаре DUDEN — jdmd. gleichgültig sein [10, c. 182] (быть равнодушным). Было найдено 25 995 контекстов с сочетание слов eins sein в корпусе. Ни в одном из 30 контекстов не было найдено фразеологизма jmdm. eins sein. Проблема поиска: невозможно задать корпусу команду искать одушевленное существительное, которое подразумевается под местоимением jmdm., а также компонентный состав фразеологизма употребляется чаще как свободное сочетание слов, в прямом фразеологически не связанном значении.

Пример из корпуса: Nur eins ist sicher: Kardinal Lehmann bleibt Bischof in Mainz — und hoffentlich gesund.

Перевод: Точно только одно: Кардинал Леманн остается епископом в Майнце и, надеюсь, он здоров.

В примере видно, что eins и sein это свободные сочетания слов. Для того чтобы прийти к однозначному выводу по данному фразеологизму, мы проанализировали еще 20 контекстов в корпусе, но фразеологизма не нашли. В таких случаях, когда корпус выдает большое количество контекстов, но найти фразеологизм среди них не удается, мы можем обратиться к интернет поисковым системам, как одному из способов решения проблемы. Мы воспользовались интернет-сервисом Google, который показал следующие результаты по данному сочетанию слов: 395 000 случаев употребления (при поиске фразеологизм был полностью в кавычках, поскольку данная операция позволяет искать словосочетания в том порядке и только те словоформы, которые были введены). Словосочетание «eins sein» в поисковой системе Google также употребляется как свободное сочетание слов. Данная проблема с поиском не была решена, в таких сложных случаях придется рассматривать каждый контекст.

2) Фразеологизм jmdm. drei Schritte vom Leibe bleiben. Значение в словаре DUDEN — jmdm. nicht zu nahe kommen [10, c. 667] (не подходить слишком близко к кому-либо). В корпусе не было найдено данного фразеологизма. Зная особенности синтаксиса немецкого языка, мы искали фразеологизм в корпусе, используя определенные команды в корпусном менеджере, чтобы глагол bleiben мог стоять в отрыве от других компонентов фразеологизма, однако такой способ поиска не помог. Однако мы смогли найти 3 контекста с данным фразеологизмом без глагола, исключив bleiben из поиска.

Пример из корпуса: Auch diese Reduzierung der Farbe auf das feierlich Gedämpfte hat eine Heroisierung des Sujets, eine Monumentalisierung der dargestellten Szene zur Folge und vertieft, noch einmal, die Distanz zur Realität des Themas und zur Existenz des Betrachters. In dieser "Ewigkeitstemperatur" (so beschrieb Karl Scheffler die Gestimmtheit von Feuerbachs Bildern) kulminiert Feuerbachs Ideal von Würde und Schönheit, Größe und Form, von Kunst also in seinem Sinne als dem Gegenteil von Leben und Formlosigkeit. Feuerbach, selber. sprach von der "wahrhaft majestätischen abweisenden Ruhe" seiner Bilder, und das, was er schon von der "Poesie" (1856) sagte, gilt für die "Iphigenie" und manches andere Bild: "Das Ganze sieht aus, als ob sie sagte, drei Schritte vom Leibe".

Перевод: Кроме того, это приглушение цвета до величественного приводит к героизации сюжета, монументализации изображаемой сцены и, еще раз, увеличивает дистанцию с реальностью изображенного и со зрителем. В этой «температуре вечности» (так Карл Шеффлер описал уверенность образов Фейербаха) идеал Фейербаха достигает кульминации достоинства и красоты, величия и формы, то есть искусство в его понимании — это противоположность жизни и бесформенности. Сам Фейербах говорил о «поистине величественно холодном покое» своих картин. То, что он уже сказал о поэзии 1856 году, относится к «Ифигении» и некоторым другим образам: «Все это выглядит так, как будто она сказала отрешенно (дословно: в трех шагах от тела)».

В примере видно, что словосочетание drei Schritte vom Leibe имеет фразеологическое значение, поскольку общее значение словосочетание нельзя понимать дословно. В данном случае произошел вторичный метафорический сдвиг, и у фразеологизма появилось отличное от словарного значение, а именно значение отдаленности, отрешенности, безучастности. Убрав из поискового запроса глагол bleiben, нам удалось найти фразеологизм, хотя и в другом его значении. Стоит сказать, что такой способ поиска фразеологических единиц может помочь в поиске, особенно, если фразеологизм состоит из 4 и более слов, так как иногда некоторые компоненты фразеологизмов могут быть отделены от остальной части, например в немецком языке глагол имеет фиксированное место в предложении в отличии от других частей речи.

В исследовании нам удалось обнаружить три основных проблем поиска фразеологизмов:

Проблема поиска фразеологизмов с компонентом глаголом, который в немецком языке может быть расположен в отрыве от остальной части фразеологизма. В таких случаях можно искать фразеологизм убрав глагольный компонент. Такая проблема поиска была обнаружена в следующих фразеологизмах: zusammenpassen wie zwei alte Latschen; jmdm. drei Schritte vom Leibe bleiben; alle viere von sich (Dativ) strecken; fünf[e] gerade/eine gerade Zahl sein lassen.

Проблема поиска фразеологизмов, чей компонентный состав чаще употребляется как свободное сочетание слов. В таких случаях, если фразеологизм состоит из двух компонентов, то придется их искать среди всех найденных контекстов или воспользоваться семантически аннотированными корпусами, которых на данный момент мало. В таких случаях попытки поиска в интернет поисковых системах тщетны. К таким фразеологизмам мы относим: jmdm. eins sein и für zwei.

Проблема поиска «громоздких» фразеологизмов, к которым чаще всего относятся фразеологические выражения коммуникативного характера. В случае если такие фразеологизмы не удалось найти в корпусе, то их придется искать только через интернет поисковые системы, например, Google. Так как такие фразеологизмы являются устойчивыми в своем составе и употреблении, и их компонентный состав никак не изменяем, например, в отличии от фразеологических сочетаний, то их следует искать именно в таком виде, в котором они употреблены в словаре, а использование разных операторов для сужения поиска бесполезны. В данном исследовании мы обнаружили такую проблему в следующих фразеологических единицах: wenn zwei dasselbe tun, so ist es nicht dasselbe; zwei Seelen wohnen, ach, in meiner Brust; wenn zwei sich streiten, freut sich der Dritte; drei/sieben usw. Meilen gegen den Wind; sich (Dativ) jmdm., etw. drei Schritte vom Leibe halten.

1. Пивоварова Е.В., Нурзет Ц.С-Б. Корпусный анализ немецких фразеологизмов с компонентом-числительным (0—5) // Филологический аспект. 2019. № 7. С. 56-65.

2. Телия В.Н. Фразеологизм // Лингвистический энциклопедический словарь / Гл. ред. В.Н.Ярцева. М.: Большая Российская энциклопедия, 1998. С. 685.

3. Солодилова И.А., Щербина В.Е. Лингвокогнитивные и дискурсивные аспекты современной фразеологии. Оренбург: ИПК ГОУ ОГУ, 2011. 307 с.

4. Виноградов В.В. Лексикология и лексикография. Избранные труды. М.: Наука, 1977. 310 с.

5. Ахманова О.С. Словарь лингвистических терминов. М.: Советская энциклопедия, 1966. 607 с.

6. Moon R. Korpuslinguistische Aspekte der Phraseologie. Corpus linguistic aspects of phraseology / H.Burger, G.Ungheuer, H.E.Wiegand. Berlin: De Gruyter, 2007. 1077 s.

7. Lemnitzer L., Zinsmeister H. Korpuslinguistik. Eine Einführung. 3 Auflage. Tübingen: Narr Verlag, 2015. S. 224.

8. Захаров В.П., Богданова С.Ю. Корпусная лингвистика: учеб. пособие. Иркутск: ГОУ ВПО «Иркутский государственный лингвистический университет», 2011. 161 с.

9. Dr. Kupietz M., Belica C., Dr. Lüngen H., Perkuhn R. Ausbau und Pflege der Korpora geschriebener Gegenwartssprache [Электр. ресурс]. URL: https://www1.ids-mannheim.de/kl/projekte/korpora.html (дата обращения: 26.04.20).]

10. Scholze-Stubenrecht W., Haller-Wolf A., Schoch M. Duden — Redewendungen. Wörterbuch der deutschen Idiomatik. Berlin: Dudenverlag, 2013. 928 s.

References

1. Pivovarova E.V., Nurzet Ts.S-B. Korpusnyy analiz nemetskikh frazeologizmov s komponentom-chislitel'nym (0—5) [Corpora analysis of German phrasemes containing numerals (0—5)]. Filologicheskiy aspekt, 2019, no. 7, pp. 56-65.

2. Teliya V.N. Frazeologizm [Phraseologism]. In: Yartseva V.N., ed. Lingvisticheskiy entsiklopedicheskiy slovar'. Moscow, 1998, p. 685.

3. Solodilova I.A., Shcherbina V.E. Lingvokognitivnye i diskursivnye aspekty sovremennoy frazeologii [Linguo-cognitive and discursive aspects of modern phraseology]. Orenburg, 2011. 307 p.

4. Vinogradov V.V. Leksikologiya i leksikografiya. Izbrannye trudy [Lexicology and lexicography. Selected works]. Moscow, 1977. 310 p.

5. Akhmanova O.S. Slovar' lingvisticheskikh terminov [Dictionary of linguistic terms]. Moscow, 1966. 607 p.

6. Moon R. Korpuslinguistische Aspekte der Phraseologie. Corpus linguistic aspects of phraseology / H.Burger, G.Ungheuer, H.E.Wiegand. Berlin: De Gruyter, 2007. 1077 p.

7. Lemnitzer L., Zinsmeister H. Korpuslinguistik. Eine Einführung. 3 Auflage. Tübingen: Narr Verlag, 2015, p. 224.

8. Zakharov V.P., Bogdanova S.Yu. Korpusnaya lingvistika: ucheb. Posobie [Corpus linguistics: textbook]. Irkutsk, 2011. 161 p.

9. Dr. Kupietz M., Belica C., Dr. Lüngen H., Perkuhn R. Ausbau und Pflege der Korpora geschriebener Gegenwartssprache. Available at: https://www1 .ids-mannheim.de/kl/projekte/korpora.html (accessed: 26.04.2020).

10. Scholze-Stubenrecht W., Haller-Wolf A., Schoch M. Duden — Redewendungen. Wörterbuch der deutschen Idiomatik. Berlin: Dudenverlag, 2013. 928 p.

Nurzet T. S-B. Search problems of German phrasemes in the German Reference Corpus. The article shows search difficulties of phraseological units in the linguistic corpus and methods of overcoming them. Despite a great interest in corpus linguistics and an abundance of corpus research, there are certain problems with more effective usage of this linguistic tool. The study describes the most common search problems of German phraseological units considering features of the German language and helps to overcome the most of them. The study is based on the largest corpus of the German language, namely German Reference Corpus, abbreviated as DeReKo. DeReKo has a corpus manager called COSMOS II that narrows a search query. The article also describes a step-by-step algorithm for working in DeReKo. The study results can be useful to linguists studying linguistic phenomena, lexicographers for updating dictionary entries and teachers of foreign languages.

Keywords: the German language, phraseological unit, corpus linguistics, German Reference Corpus.

Сведения об авторе. Сведения об авторе. Нурзет Цэринчимэд Суге-Баадырович — Магистр филологии; ФГАОУ ВО «Дальневосточный федеральный университет»; программы «Западноевропейские языки, культуры и лингвокультуры»; Восточный институт Школа региональных и международных исследований; ORCID: 0000-0003-2373-6152; tchimed2016@yandex.ru.

Статья публикуется впервые. Поступила в редакцию 10.08.2022. Принята к публикации 01.09.2022.

Ссылка на эту статью: Нурзет Ц. С.-Б. Проблемы корпусного поиска немецких фразеологизмов в Мангеймском корпусе немецкого языка // Ученые записки Новгородского государственного университета. 2022. № 5(44). С. 575-578. DOI: 10.34680/2411-7951.2022.5(44).575-578

For citation: Nurzet T. S-B. Search problems of German phrasemes in the German Reference Corpus. Memoirs of NovSU, 2022, no. 5(44), pp. 575-578. DOI: 10.34680/2411-7951.2022.5(44).575-578

i Надоели баннеры? Вы всегда можете отключить рекламу.