Научная статья на тему 'LEXIKOGRAPHIE DES SPRACHWANDELS AM LEIBNIZ-INSTITUT FÜR DEUTSCHE SPRACHE: EMPIRISCHE METHODEN UND LEXIKOGRAPHISCHE PROZESSE'

LEXIKOGRAPHIE DES SPRACHWANDELS AM LEIBNIZ-INSTITUT FÜR DEUTSCHE SPRACHE: EMPIRISCHE METHODEN UND LEXIKOGRAPHISCHE PROZESSE Текст научной статьи по специальности «Языкознание и литературоведение»

8
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Entlehnung / Internetlexikographie / Lexikalische Dynamik / Neologismenermittlung / Neologismus / Sprachkontaktlexikographie / Sprachwandellexikographie / Zeitverlaufsgraph / borrowing / identification of neologisms / internet lexicography / lexical dynamics / lexicography of language change / lexicography of language contact / neologism / time course graph

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Stefan Engelberg

Dynamische Prozesse im Lexikon bilden einen Schwerpunkt der lexikalischen Forschung und lexikographischen Praxis am Leibniz-Institut für Deutsche Sprache. In diesem Rahmen erforschen wir unter anderem die Erweiterung des Wortschatzes durch neue Wörter. Lexikologisch stehen dabei zwei Aufgaben im Mittelpunkt der Arbeit, zum einen die Ermittlung und Dokumentation sprachkontaktbedingter lexikalischer Entlehnungsprozesse mit dem Deutschen als Zieloder als Quellsprache (Fremdwörter im Deutschen, deutsche Lehnwörter in anderen Sprachen), zum anderen die Beobachtung, Dokumentation und empirische Erforschung aktueller Wandelprozesse im deutschen Wortschatz (Neologismen). Die Ergebnisse der Forschung werden lexikographisch in Online-Informationssysteme überführt: das Deutsche Fremdwörterbuch, das Lehnwortportal Deutsch und das Neologismenwörterbuch. Die lexikographische Arbeit gründet sich dabei auf korpusund internetbasierten Entwicklungen in zwei Bereichen. Erstens werden softwarebasierte lexikographische Arbeitsprozesse etabliert, die eine empirisch anspruchsvolle Erschließung des Gegenstands ermöglichen. Das beinhaltet unter anderem die Entwicklung korpusbasierter Analysesoftware und lexikographischer Redaktionssysteme. Zweitens werden zur Dokumentation der Forschung lexikalische Informationssysteme konzipiert und implementiert, die sich zum Teil an den Bedürfnissen von Laien orientieren, aber auch als Plattformen für die lexikologische Forschung dienen. Der Beitrag wird diese Grundprinzipien lexikographischer Arbeit an Beispielen aus der aktuellen lexikographischen Tätigkeit am Leibniz-Institut für Deutsche Sprache illustrieren, insbesondere in Bezug auf die laufende empirische Ermittlung von Neologismen und ihre internetlexikographische Dokumentation. Der komplexe Prozess der Neologismenermittlung involviert dabei frequenzgesteuerte Prozesse der Vorselektion von Neologismenkandidaten, manuelle Sammlungen von Neologismen aus verschiedenen Quellen und die Analyse der Kandidaten mit korpusanalytischer Software wie COSMAS II und OWIDplusLIVE. Unterstützt wird der lexikographische Prozess durch die Entwicklung komplexer, integrativer lexikographischer Werkzeuge wie NeoRate.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Dynamic processes in the lexicon are a focus of lexical research and lexicographic practice at the Leibniz Institute for the German Language. In this context, we investigate, among other things, the expansion of vocabulary through new words. In lexicological terms, our work focuses on two tasks: firstly, the identification and documentation of lexical borrowing processes caused by language contact with German as the target or source language (foreign words in German, German loanwords in other languages), and secondly, the observation, documentation and empirical research of current processes of change in the German lexicon (neologisms). The results of this research are transferred lexicographically into online information systems: the German dictionary of foreign words, the German loanword portal, and the dictionary of neologisms. The lexicographical work is based on corpusand internet-based developments in two areas. Firstly, software-based lexicographical processes are established that enable an empirically sophisticated exploration of the lexicon. This includes the development of corpus-based analysis software and lexicographical editing systems. Secondly, lexical information systems are designed and implemented for the documentation of our research, which are partly oriented towards the needs of lay users, but also serve as platforms for lexicological research. The lecture will illustrate these basic principles of lexicographical work with examples from current lexicographical work at the Leibniz Institute for the German Language, in particular with regard to the ongoing empirical identification of neologisms and their Internet lexicographical documentation. The complex process of identifying neologisms involves a frequency-controlled preselection of neologism candidates, manual collections of neologisms from various sources, and the verification of candidates using corpus-analytical software such as COSMAS II and OWIDplusLIVE. The lexicographic process is supported by the development of complex, integrative lexicographic tools such as NeoRate.

Текст научной работы на тему «LEXIKOGRAPHIE DES SPRACHWANDELS AM LEIBNIZ-INSTITUT FÜR DEUTSCHE SPRACHE: EMPIRISCHE METHODEN UND LEXIKOGRAPHISCHE PROZESSE»

LEXIKOGRAPHIE DES SPRACHWANDELS AM LEIBNIZ-INSTITUT FÜR DEUTSCHE SPRACHE: EMPIRISCHE METHODEN UND LEXIKOGRAPHISCHE PROZESSE

Stefan Engelberg

Leibniz-Institut für Deutsche Sprache, Mannheim

ABSTRACT DEUTSCH:

Dynamische Prozesse im Lexikon bilden einen Schwerpunkt der lexikalischen Forschung und lexikographischen Praxis am Leibniz-Institut für Deutsche Sprache. In diesem Rahmen erforschen wir unter anderem die Erweiterung des Wortschatzes durch neue Wörter. Lexikologisch stehen dabei zwei Aufgaben im Mittelpunkt der Arbeit, zum einen die Ermittlung und Dokumentation sprachkontaktbedingter lexikalischer Entlehnungsprozesse mit dem Deutschen als Ziel- oder als Quellsprache (Fremdwörter im Deutschen, deutsche Lehnwörter in anderen Sprachen), zum anderen die Beobachtung, Dokumentation und empirische Erforschung aktueller Wandelprozesse im deutschen Wortschatz (Neologismen).

Die Ergebnisse der Forschung werden lexikographisch in OnlineInformationssysteme überführt: das Deutsche Fremdwörterbuch, das Lehnwortportal Deutsch und das Neologismenwörterbuch. Die lexikographische Arbeit gründet sich dabei auf korpus- und internetbasierten Entwicklungen in zwei Bereichen. Erstens werden softwarebasierte lexikographische Arbeitsprozesse etabliert, die eine empirisch anspruchsvolle Erschließung des Gegenstands ermöglichen. Das beinhaltet unter anderem die Entwicklung korpusbasierter Analysesoftware und lexikographischer Redaktionssysteme. Zweitens werden zur Dokumentation der Forschung lexikalische Informationssysteme konzipiert und implementiert, die sich zum Teil an den Bedürfnissen von Laien orientieren, aber auch als Plattformen für die lexikologische Forschung dienen.

Der Beitrag wird diese Grundprinzipien lexikographischer Arbeit an Beispielen aus der aktuellen lexikographischen Tätigkeit am Leibniz-Institut für Deutsche Sprache illustrieren, insbesondere in Bezug auf die laufende empirische Ermittlung von Neologismen und ihre internetlexikographische Dokumentation. Der komplexe Prozess der Neologismenermittlung involviert dabei frequenzgesteuerte Prozesse der Vorselektion von Neologismenkandidaten, manuelle Sammlungen von Neologismen aus verschiedenen Quellen und die Analyse der Kandidaten mit korpusanalytischer Software wie COSMAS II und OWIDplusLIVE. Unterstützt wird der

23

lexikographische Prozess durch die Entwicklung komplexer, integrativer lexikographischer Werkzeuge wie NeoRate.

ABSTRACT ENGLISCH:

Dynamic processes in the lexicon are a focus of lexical research and lexicographic practice at the Leibniz Institute for the German Language. In this context, we investigate, among other things, the expansion of vocabulary through new words. In lexicological terms, our work focuses on two tasks: firstly, the identification and documentation of lexical borrowing processes caused by language contact with German as the target or source language (foreign words in German, German loanwords in other languages), and secondly, the observation, documentation and empirical research of current processes of change in the German lexicon (neologisms).

The results of this research are transferred lexicographically into online information systems: the German dictionary of foreign words, the German loanword portal, and the dictionary of neologisms. The lexicographical work is based on corpus- and internet-based developments in two areas. Firstly, software-based lexicographical processes are established that enable an empirically sophisticated exploration of the lexicon. This includes the development of corpus-based analysis software and lexicographical editing systems. Secondly, lexical information systems are designed and implemented for the documentation of our research, which are partly oriented towards the needs of lay users, but also serve as platforms for lexicological research.

The lecture will illustrate these basic principles of lexicographical work with examples from current lexicographical work at the Leibniz Institute for the German Language, in particular with regard to the ongoing empirical identification of neologisms and their Internet lexicographical documentation. The complex process of identifying neologisms involves a frequency-controlled preselection of neologism candidates, manual collections of neologisms from various sources, and the verification of candidates using corpus-analytical software such as COSMAS II and OWIDplusLIVE. The lexicographic process is supported by the development of complex, integrative lexicographic tools such as NeoRate.

Schlagwörter deutsch: Entlehnung, Internetlexikographie, Lexikalische Dynamik, Neologismenermittlung, Neologismus, Sprachkontaktlexikographie, Sprachwandellexikographie, Zeitverlaufsgraph

24

Chirchik State Pedagogical University Current Issues of Modern Philology and Linguodidactics

Staatliche Pädagogische Universität Chirchik Aktuelle Fragen der modernen Philologie und Linguodidaktik

chirchiadaviat^iagog^in^ss^^—^^amonsi^^^iâio^iïo^s^^^^isiâmssaiaiaii

Schlagwörter englisch: borrowing, identification of neologisms, internet lexicography, lexical dynamics, lexicography of language change, lexicography of language contact, neologism, time course graph

1 Internetlexikographie und Sprachwandel

Die Abteilung „Lexik" am Leibniz-Institut für Deutsche Sprache (IDS) beherbergt ein Zentrum für Internetlexikographie, in dem seit den 1990er Jahren Internetwörterbücher verschiedener Typen erstellt werden (Engelberg 2018; Engelberg, Klosa-Kückelhaus & Müller-Spitzer 2020; Klosa-Kückelhaus 2023).

Zu den Aufgaben, die sich die Abteilung Lexik gesetzt hat, gehören dabei die Beobachtung, Dokumentation und Erklärung lexikalischen Sprachwandels. Das beinhaltet die Untersuchung von Phänomenen wie Neologismen, Archaismen, Lehnwörtern, Fremdwörtern, Anglizismen, Bedeutungswandel u.a. Die Entwicklung dreier lexikographischer Ressourcen steht seit einiger Zeit im Zentrum unserer Arbeit zu lexikalischem Sprachwandel: das Deutsche Fremdwörterbuch, das Lehnwortportal Deutsch und das Neologismenwörterbuch.

(i) Das Deutsche Fremdwörterbuch dokumentiert als Standardwerk der deutschen historischen Fremdwortlexikographie den Fremdwortschatz der gegenwärtigen gehobenen Alltagssprache. Dabei werden die Wortverwendung und die Bedeutungsgeschichte vom Entlehnungszeitpunkt bis zur Gegenwart unter Anführung zahlreicher Belege nachgezeichnet (Brückner 2015) (Abb. 1).

Das Fremdwörterbuch wurde ab 1913 von Hans Schulz erstellt und später von Otto Basler bis zum Buchstaben Q weitergeführt. Von 1974 bis 1988 wurde das Fremdwörterbuch dann am IDS fertiggestellt. 1990 begann die Neuerarbeitung der Lemmastrecke A bis Q; gegenwärtig wird der Buchstaben I bearbeitet. Mittlerweile sind alle Bearbeitungsphasen als Internetwörterbuch in dem Wörterbuchportal OWID verfügbar (https://www.owid.de/wb/dfwb/start.html) (Abb. 2).

Die Fremdwortlexikographie am IDS befindet sich gegenwärtig in einer Phase der Neukonzeption, die ab 2025 ihren internetlexikographischen Niederschlag finden wird.

25

266 - 290 (409) | Apostroph | apostrophieren | Apotheke | Apotheose I Apparat I Appartement | Appeal | Appeasement | Appell | appellieren | Appendix | Apperzeption I Appetit I applaudieren | Applikation | applizieren | approbiert | Approximation | apropos | Apsis I Aquädukt I Aquarell | Aquarium | Äquator | Aquavit

Deutsches Fremdwörterbuch

Appetit

M. (-(e)s; -e ungebr.), Anfang 15. Jh. eventuell unter Einfluß von frz. appetit (altfrz. apetit) 'heftiges Verlangen, Gelüste, Eßlust' aufgekommen, über mlat. appetitus (tibi) 'Verlangen (nach Speise)' zurückgehend auf lat. appetitus 'Verlangen, Begierde, Trieb' (subst. Part. Perf. von appetere 'nach etwas langen, etwas begehren', aus ad- 'hin, zu' und petere 'zu erreichen suchen, begehren, verlangen'), anfangs in der lat. (flekt.) Form.

Zunächst und bis heute vor allem auf Nahrung bezogen in der Bed. 'Eßlust', im Ggs. zu Hunger ohne das Merkmal des Lebensnotwendigen, anfangs häufig in verdeutlichenden Wendungen wie Appetit zum Essen, zu der Speise u. ä. (s. Belege 1508, 1549) oder in synonymischen Formeln wie Lust oder Appetit (s. Belege 1519, 1616), bes. im 20. Jh. als Bestimmungswort in subst. und adj. Zss. wie Appetitsild, -zügler, -Verlust, -häppchen; appetitanregend, -hemmend; in festen Wendungen wie (den) Appetit erregen, hemmen, stillen, anregen, vertreiben, bringen, (er)wecken, haben, bekommen, entwickeln; gewaltiger, großer, guter, unmässiger, gesunder, herzhafter, gesegneter Appetit; bis zur ersten Hälfte des 20. Jhs. in den präp. Verbindungen Appetit zu/nach etwas, seit Mitte 19. Jh. und heute vor allem Appetit auf etwas; auch ohne Attribut gebraucht, z. B. mit Appetit essen, Appetit haben, in positivem Sinn 'mit gutem Appetit essen, großen Appetit haben'; seit späterem 16. Jh. die aus gleichbed. frz. rappetit vienten mangeant lehnübersetzte Redensart der Appetit kommt beim Essen (s. Beleg 1575), seit Mitte 18. Jh. die Wunschformel vor oder während der Mahlzeit Guten Appetit! (vgl. frz. bon appetit, s. Beleg 1759).

Etwa gleichzeitig auch in der allgemeineren (direkt auf das Lat. zurückgehenden) Bed. 'Lust, Begierde' (s. Belege 1481, 1597, 1615, 1692, 1718, 1895, 1911, 1973), die dann möglicherweise unter Einfluß der zunehmend dominierenden Bed. 'Eßlust' (s. o.) metaphorischen Charakter erhält, zumeist mit ironischem, den Grad der Begierde verringerndem Beiklang; je nach Bezug spezifiziert, dabei häufig im Sinn von 'Liebeslust, Geschlechtstrieb' (s. Belege 1528, 1588, 1626, 1705, 1709, 1727, 1808, 1845, 1932),'Besitz-, Machtstreben' (s. Belege 1598, 1712, 1741, 1966, 1992), 'Wissensdurst' (s. Belege 1700, 1702, 1704, 1709, 1731, 1920), z. B. ein Buch, eine Ausstellung macht (einem) Appetit; vgl. bes. Wendungen wie

elexiko

P a ro ny m w ö rterb uch

Sp rieh w ö rterb uch

Kommunikationsverben

Verlaufsformen

I Fremdwörterbuch Starts eite Wortartikel Projekt ö1

Benutzungshinweise Volltextsuche Neologismen Wörterbuch Demokratiediskurs 1918-25 Schulddiskurs 1945-55 Protestdiskurs 1967/68 Schlüsselwörter 1989/90

ОВELEXn

Korpus su che

MlW^

Abb. 1: Beginn des Artikels zu Appetit in der Online-Fassung des Deutschen Fremdwörterbuchs.

Artikelübersichten

Neubearbeitung A - H; IDS 1990ff.

1. Auflage I - K; Schulz 1913 (orange markiert) 1. Auflage L - Q; Basler 1942 (1972) (orange markiert) 1. Auflage R - Z; IDS 1977-1983 (orange markiert)

A - Z; vollständige Buchstabenstrecke (Kombination dieser 4 Teilstrecken)

Abb. 2: Bearbeitungsphasen in der Online-Fassung des Deutschen Fremdwörterbuchs.

(ii) Das Lehnwortportal Deutsch ist in gewissem Sinne das Pendant zum Fremdwörterbuch, insofern als es nicht Entlehnungen ins Deutsche, sondern Entlehnungen aus dem Deutschen in andere Sprachen dokumentiert. Von der Konzeption her unterscheidet es sich allerdings grundsätzlich vom Fremdwörterbuch, insofern als es auf einer Sammlung von bereits existierenden oder in der Entstehung begriffenen Wörterbüchern basiert, die in digitaler Form aufbereitet und zu einem Netz verknüpft werden, das es erlaubt, den gesamten Datenbestand ausgehend von

April 23-24, 2024

26

^hjrchiq^avlat^edagogjka^niViiiitii^^^H

^^mvnaviyfilologiya^aJingvodiäaktikaningdo^

den deutschen Etyma zu durchsuchen (Engelberg & Meyer 2015). In der bisherigen Fassung ist das Lehnwortportal unter http://lwp.ids-mannheim.de/ verfügbar (Abb.

3).

IDS

DEUTSCHE SPRACHE

Lehnwortportal Deutsch

Startseite | Erweiterte Suche | Dokumentation | Bibliografie Suche nach deutschen Herkunftswörtern

ihandlowiec

Das Lehnwortportal Deutsch des IDS

stellt Wörterbücher zu Entlehnungen aus dem I Deutsch

Deutschen in andere Sprachen zur Verfügung. Diese Wörterbücher können als Einzelwerke konsultiert

werden; in der Datenbasis des Portals sind sämtliche Lehnwörterbücher

Informationen jedoch zusätzlich als komplexes,

wörterbuchübergreifendes Netzwerk von Lehn- und I Polnisch

Herkunftswörtern repräsentiert. So ist das Portal als

„umgekehrtes Lehnwörterbuch" nutzbar: Im I Teschener Polnisch

Wörterbuch der Herkunftswörter kann ausgehend

von deutschen Lexemen in allen Wörterbüchern nach I Slovenisch

zugehörigen Lehnwörtern in anderen Sprachen

gesucht werden. Für Experten bietet das Portal I Hebräisch

komplexe Suchfunktionen an, um Lehn- oder

Herkunftswörter beispielsweise auch anhand von I Tok Pisin

grammatischen Merkmalen oder zeitlich-dialektaler Zuordnung zu finden.

—geführten Tour bekommen Sie einen schnellen Überblick über die Portalfunktionen.

' '^Jhandlöwka

.........

)szw£rc \®handk)wiec landel ^handlowy ihandlowmk

Abb. 3 Fassung des Lehrwortportals Deutsch bis 2024.

In einer vollständigen Neukonzeption mit 16 integrierten Wörterbüchern wird das Lehnwortportal ab Mai 2024 unter https://lehnwortportal.ids-mannheim.de/ zugreifbar sein (Meyer 2022) (Abb. 4).

Abb. 4: Neue Fassung des Lehnwortportals Deutsch ab 2024. (iii) Das Neologismenwörterbuch dokumentiert den neologistischen Wortschatz der Standardsprache seit 1990, zunächst in Form von Printwörterbüchern,

27

qdaVat^edagog

seit 2006 auch in internetlexikographischer Form. Auf das Neologismenwörterbuch wird in Abschnitt 4 noch genauer eingegangen.

Die internetlexikographische Arbeit am IDS beinhalt dabei nicht nur die Konzeption und Implementierung von Wörterbüchern und ihren Zugriffsstrukturen und die Erstellung von lexikographischen Artikeln, sondern zunächst die Entwicklung eines lexikographischen Prozesses, der softwaregestützt von den grundlegenden Sprachdaten zu den fertigen Artikeln führt. Die unterschiedliche Konzeption der drei lexikalischen Informationssysteme bedingt dabei auch sehr unterschiedliche lexikographische Prozesse. Exemplarisch sollen diese Prozesse im Folgenden am Beispiel der Neologismenlexikographie am IDS illustriert werden, wobei der Fokus auf dem für die Neologismenlexikographie besonders anspruchsvollen Prozess der Lemmalistenerstellung liegt.

2 Der lexikographische Prozess in der Neologismenlexikographie

Unter Neologismen im Sinne der Neologismenlexikographie des IDS werden neben neuen Wörtern auch Neubedeutungen, neue Mehrwortlexeme und neue Wortbildungselemente verstanden (Klosa & Lüngen 2018: 560). Die Ermittlung solcher Neologismen stellt dabei ein besonderes lexikographisches Problem dar. In großen Korpora finden sich oft unterschiedliche Lexeme im zweistelligen Millionenbereich. Viele davon treten nur ein- oder zweimal auf, ohne sich im Wortschatz zu etablieren. Das Konzept des Neologismus beinhaltet aber genau so eine Verstetigung im Wortschatz. Entsprechend werden für das Neologismenwörterbuch des IDS nur solche Wörter berücksichtigt, (i) deren Erstvorkommen noch nicht lange zurück liegt, (ii) die bereits über eine bestimmte Dauer hinweg in den zugrundeliegenden Korpora zu beobachten sind, (iii) die mit einer hinreichenden Frequenz in den Korpora auftreten und (iv) die über verschiedene Textsorten und Medien verbreitet sind. Unter den Wörtern, die diese Kriterien erfüllen, sind wiederum bestimmte Lemmata auszuschließen, etwa Eigennamen, Hashtags und Komposita, deren Bedeutung weitgehend transparent ist (vgl. auch Steffens 2017).

Für die Erstellung der Lemmaliste im Rahmen der lexikographischen Arbeit bedeutet das, dass (i) das Vorkommen von Kandidatenwörtern in verschiedenen Korpora überprüft wird, (ii) die Gesamtfrequenz des Kandidatenwortes ermittelt wird, (iii) das Vorkommen des Wortes innerhalb der kritischen Zeitspanne festgestellt wird, (iv) die Verbreitung des Wortes hinsichtlich textueller und medialer Restriktionen überprüft wird, ebenso wie (v) die Buchung des Kandidatenwortes in anderen aktuellen Wörterbüchern.

28

^hi^hiaiavlatfisdagogika^nivsrsitst^—^^^imonoi^^^iiyaisiisgisd^^iksnisg^^^msss^ar^

Im Einzelnen vollzieht sich der Prozess der Lemmaselektion in folgenden Schritten: (i) automatische korpusbasierte Vorselektion von Neologismenkandidaten, (ii) manuelle Bereinigung und Ergänzung der Kandidatenliste, (iii) erste Annotationen und Überprüfung der Kandidatenwörter durch Korpusanalysewerkzeuge.

(i) Die automatische Vorselektion von Neologismenkandidaten basiert auf einem virtuellen Teilkorpus des Deutschen Referenzkorpus (DeReKo). Zu jeder Wortform in dem Korpus werden Gesamtfrequenzen und Frequenzverläufe erhoben. Die Wortformenliste wird in der Folge automatisch auf Wörter mit einer Mindestfrequenz und mit neologismentypischen Frequenzverläufen geprüft. In weiteren Schritten wird die entstehende Liste von Kandidatenwörtern zudem um Eigennamen (qua Named Entity Recognition) und Regionalismen bereinigt. Insgesamt wird dabei eher konservativ vorgegangen, um mögliche Neologismen nicht vorzeitig auszuschließen (Keibel et al. 2010; Klosa & Lüngen 2018). Abb. 5 zeigt den Anfang der automatisch erstellten Kandidatenliste 2023 nach Stärke des Kandidatenstatus geordnet.

A B C D E F G H 1 J K L M N O P Q R s T u V w X

1 6 Heizungsgesetz 3500 0.0DK 0.320DÜ DE s 9.956.773 11017.84 2024 3500 2023 0 0 0 0 0 0 0 0 0 0 0 0 3500

2 18 Chat-GPT 1682 75.00% 0.60939 CH 4.784.944 5296.49 2023 1674 2023 0 0 0 0 0 0 0 0 0 0 0 8 1674

3 30 Deutschlandtickets 1165 66.67% 0.297DO DE SW 3.314.186 3669.46 2023 1101 2023 0 0 0 0 0 0 0 0 0 0 0 64 1101

4 52 Wagner-Chef 718 5.56% 0.24930 CH 2.042.563 2262.73 2023 704 2023 0 0 0 0 0 0 0 0 0 0 1 13 704

5 73 Quantumania 476 0.00% 0.64286 DE N 1.354.123 1501.14 2023 472 2023 0 0 0 0 0 0 0 0 0 0 0 4 472

6 78 Wachstumschancengesetz 444 0.0D% 0.34DD9 DE S 1.263.089 1400.44 2024 444 2023 0 0 0 0 0 0 0 0 0 0 0 0 444

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7 83 Rehragout-Rendezvous 420 18.18% 0.37857 DE N 1.194.814 1324.91 2022 376 2023 0 0 0 D D 0 0 0 0 D 25 19 376

8 92 Pietreczko 359 0.DD% 0.42618. DE S 1.021.282 1132.94 2024 359 2023 0 0 0 0 0 0 0 0 0 0 0 0 359

9 98 Haushaltsurteil 343 0.0DK 0.32070 DE S 975.765 1082.59 2024 343 2023 0 0 0 0 0 0 0 0 0 0 0 0 343

10 99 Heizungsgesetzes 340 0.00% 0.27353 DE S 967.231 1073.15 2024 340 2023 0 0 0 0 0 0 0 0 0 0 0 0 340

11 109 Brückenstrompreis 312 0.00% 0.37179 DE SW 887.576 985.03 2024 312 2023 0 0 0 0 0 0 0 0 0 0 0 0 312

12 112 Wagner-Truppen 306 7.41% 0.47059 CH 870.508 966.15 2022 280 2023 0 0 0 0 0 0 0 0 0 0 6 20 280

13 117 D-Ticket 294 0.00% 0.47619 DE SW 836.370 928.38 2023 289 2023 0 0 0 0 0 0 0 0 0 0 0 5 289

14 118 Spionageballon 290 0.0D% 0.34483 CH 824.991 915.79 2024 289 2023 0 0 0 0 0 0 0 0 0 0 0 1 289

15 119 JfYesWeCare 285 0.0D% 0.84211 TWI 810.767 900.06 2022 148 2022 0 0 0 0 0 0 0 0 0 0 131 148 6

Abb. 5: Automatisch vorselektierte Liste der Neologismenkandidaten 2023 mit verschiedenen quantitativen Parametern und Informationen zu regionalen Besonderheiten und Vorkommen in Twitter.

(ii) Die manuelle Bearbeitung der Liste beinhaltet zum einen das Herausfiltern weiterer nicht einschlägiger Kandidaten gemäß der oben genannten Kriterien, u.a. Eigennamen, Regionalismen und transparente Komposita, soweit sie nicht für bestimmte Diskurse von besonderer Relevanz sind. Zum anderen wird die Liste um Kandidatenwörter ergänzt, die auf anderem Wege gefunden wurden. Dazu gehören Wörter, die bei der täglichen Durchsicht von Tageszeitungen und aktuellen Zeitschriften aufgefallen sind, die bei einer Evaluation von Twitter/X-Trends gefunden wurden, die durch den Vergleich mit anderen Wörterbüchern aufgespürt wurden oder die in Form von Nutzervorschlägen eingetroffen sind.

29

¿hirchiaiavlatisdago&inivsrsitst^

(iii) In einem weiteren Schritt führen die Lexikographinnen eigene Korpusanalysen durch, um die Relevanz der Kandidatenwörter und ihre Eigenschaften zu überprüfen sowie um erste Annotationen zu erstellen (z.B. zur Diskurszugehörigkeit der Kandidatenwörter). Ein besondere Rolle spielen dabei das im IDS entwickelte „Corpus Search, Management and Analysis System" COSMAS II, über das das Deutsche Referenz-Korpus (DeReKo) zugänglich ist, und das Analysewerkzeug OWIDplusLIVE. Während die Textquellen in den üblichen großen Korpora wie DeReKo erst eine gewisse Zeit nach ihrem Erscheinen in das Korpus aufgenommen werden können, gründet sich OWIDplusLive auf tagesaktuelle Quellen, was für die Untersuchung von Neologismen natürlich von besonderer Relevanz ist. Es wird insofern zunehmend für bestimmte Neologismengruppen genutzt. Das Werkzeug basiert auf den sogenannten RSS-Feeds von 13 deutschsprachigen Online-Zeitungen. Als Quellen werden dabei im Stundentakt die Titel und Köpfe (Vorspanne) aller Artikel dieser Organe gesammelt. Das wortart-getaggte und lemmatisierte Korpus in OWIDplusLive wird auf diese Weise täglich aktualisiert und wächst pro Tag um mehr als 70.000 Wortformen. Die Software erlaubt es nun, auf der Basis der aus dem Korpus extrahierten Uni-, Bi- und Trigramme die Frequenzverläufe für Wörter in Zeitverlaufsgraphiken (s. Abb. 6) oder Kalenderdarstellungen anzuzeigen ebenso wie die Frequenzen von Wortkombinationen in sogenannten Sankey-Diagrammen (Wolfer & Rüdiger 2023).

Abb. 6: Zeitverlaufsgrafik in OWIDplusLIVE für Gierflation (,Versuch von Unternehmen, in Inflationszeiten Preissteigerungen durchzusetzen, die über die Inflationsbereinigung hinausgehen').

30

¿hirchiaiavlätisdägogikainivsrsitst^

3 NeoRate

Das bisherige Vorgehen bei der Ermittlung und Beschreibung von Neologismen bedingte die Arbeit mit sehr unterschiedlichen elektronischen Ressourcen im Bereich von Korpora, Korpusanalysewerkzeugen und Internetwörterbüchern. Diese Ressourcen werden auf unterschiedlichen Oberflächen angeboten, unter unterschiedlichen Zugriffsstrukturen und mit unterschiedlichen Output-Formaten. Das erschwert und verlangsamt die lexikographische Arbeit mit ihnen. Aus dieser Mängelanalyse heraus wurde im IDS im Zusammenhang mit der Untersuchung des coronabezogenen neologistischen Wortschatzes das Werkzeug NeoRate von Jan Oliver Rüdiger erstellt, das kontinuierlich hinsichtlich der Bedürfnisse unserer Neologismenforschung und -lexikographie weiterentwickelt wird. (Klosa-Kückelhaus & Rüdiger 2023).

NeoRate (i) bietet eine einheitliche Präsentation aller ermittelten Daten, (ii) erlaubt die parallele Suche in verschiedenen Korpora und Internetwörterbüchern, (iii) ermittelt Gebrauchsfrequenzen und Frequenzverläufe und (iv) bietet über den Filter LexVertex eine automatische Berechnung der Relevanz der Kandidatenwortes als Neologismus, einschließlich der Überprüfung der Frequenzen auf saisonale Effekte und Kurzzeiteffekte sowie eine Segmentierung des Zeitverlaufs in markante Abschnitte.

Das Dashboard von NeoRate erzeugt dabei eine Übersicht über den Bestand an Daten (Abb. 7).

Abb. 7: Dashboard von NeoRate zu dem Beispielwort asymptomatisch: (1) Kandidatenwort, (2) Zusammenfassung der automatischen Abschätzung der Relevanz

31

des Wortes, (3) Relevanzfilterung durch LexVertex, (4) Belege in Ausschnitten des Deutschen Referenzkorpus, (5) Belege im Webkorpus CeHugeWeb, (6) Belege im Twitter-Korpus, (7) Artikel in anderen Internetwörterbüchern, (8) Frequenzinformation aus OWIDplusLIVE, (9) Kommentarfeld.

Neben einer einheitlichen Ansicht von Belegen aus den verschiedenen Korpora und Artikeln aus den durchsuchten Internetwörterbüchern erlaubt NeoRate auch die durch verschiedene Parameter justierbare Darstellung von Frequenzverläufen (Abb. 8).

[ pandeiracbadinqt - | ->

<p QMoMif 0j.hr« (QjahtKhm IQowiOpiudivt MC( Bfidfl» Kandidat für NEO-Langartikel

Abb. 8: Frequenzverlauf des Kandidatenwortes pandemiebedingt mit der Möglichkeit, bestimmte Zeiträume ein- und auszuzoomen.

4 Die Neologismenwörterbücher am IDS

Die Neologismenlexikographie am IDS hat zunächst ihren Ausdruck in zwei Printwörterbüchern gefunden, die dekadenweise den neologistischen Wortschatz der 1990er und der 2000er Jahre erfasst haben (Herberg, Kinne & Steffens 2004; Steffens & al-Wadi 2015), ergänzt durch ein deutsch-russisches Neologismenwörterbuch (Steffens & Nikitina 2016). Seit 2006 werden die Neologismen zudem in internetlexikographischer Form dokumentiert. In seiner gegenwärtigen Form ist das Neologismenwörterbuch in das Wörterbuchportal OWID integriert (Klosa-Kückelhaus 2023).

Die Internetversion des Neologismenwörterbuchs enthält mehr als 2.100 neue Wörter, neue Phraseologismen, neue Wortbildungselemente und Neubedeutungen etablierter Wörter, die seit 1991 in den allgemeinsprachlichen Teil des deutschen Wortschatzes eingegangen sind. Die lexikographische Bearbeitung der Lemmata, die Resultat des in Abschnitt 2 und 3 dargestellten Selektionsprozesses sind, führt zu Artikeln, die detaillierte Informationen zu Bedeutung, Grammatik, Wortbildung, Schreibung, Aussprache, Verwendungsrestriktionen und Gebrauchsfrequenzen bieten (Abb. 9).

32

Abb. 9: Artikel zu Helikoptereltern im Neologismenwörterbuch des IDS. Das Neologismenwörterbuch verfügt dabei über elaborierte Zugriffsstrukturen, u.a. eine facettierte Suche (Abb. 10) und eine onomasiologische Suche (Abb. 11).

33

Erweiterte Suche im Neologismenwörterbuch

Stichwort

NeologisirteiTtyp

(■) Neulexem

Q Neulexem (nur Wörter) Q Neulexem (nur Phraseologismen) O Neubedeutung

Informationen sichtbar

Aufkommen und Herkunft

Aufkommen

Herkunft (Spradie)

aus Englisch (S) aus anderer Fremdsprache

Informationen sichtbar

i l

Herkunft (Typ)

Wortbildung

Wortbildung (Typ)

Wortbildung (Konstituenten)

Wortbildungsproduktivität

Grammatik

Wortarten und Phrasenkategorie

Neologism en typ Herkunft (Sprache]

1- 25 von 47 vor >

B a IIa y age Neulexem (W.) andere

B arista Neulexem (W.) andere

Bezness Neulexem (W.) andere

Caffè Latte Neulexem (W.) andere

Churro Neulexem (W.) andere

Ciabatta Neulexem (W.) andere

Emoji Neulexem (W.) andere

Fatbiikefaforen Neulexem (W.) andere

Fengshui Neulexem (W.) andere

Gabíone Neulexem (W.) andere

Hídschab Neulexem (W.) andere

Hygge Neulexem (W.) andere

hyggelig Neulexem (W.) andere

Kafala Neulexem (W.) andere

Kakuro Neulexem (W.) andere

Karaoke Neulexem (W.) andere

Ken-Ken Neulexem (W.) andere

Latte macchiato Neulexem (W.) andere

Lomí-Lomi Neulexem (W.) andere

Macaron Neulexem (W.) andere

Manga Neulexem (W.) andere

Match a Neulexem (W.) andere

Menemen Neulexem (W.) andere

Ñamaste Neulexem (W.) andere

Níkab Neulexem (W.) andere

Abb. 10: Facettierte Suche im Neologismenwörterbuch nach allen Neologismen vom Typ ,Neulexem', die seit 1990 aus anderen Sprachen als dem Englischen ins Deutsche entlehnt wurden.

34

¿hirchiaiavlätisdägogikainivsrsitst^

Abb. 11: Onomasiologische Suche nach Neologismen aus dem Themenbereich Umweltschutz/Energie, die seit 1990 neu im Deutschen aufgetreten sind.

Darüber hinaus bietet das Neologismenwörterbuch eine ausführliche Dokumentation des neuen Wortschatzes im Zusammenhang mit der Corona-Pandemie sowie eine Liste von aktuellen „Wörtern unter Beobachtung", deren Neologismenstatus noch nicht erwiesen ist.

Gegenwärtig ist eine Neukonzeption des Neologismenwörterbuchs in Arbeit, die im laufenden Jahr implementiert und freigeschaltet wird (Storjohann 2024). Neben einem neuen Artikelformat, das in Abb. 12 illustriert ist, werden in einem sogenannten Dashboard zusätzliche, zum Teil einzelwortübergreifende Informationen angeboten (Abb. 13).

35

^hjrchjqdavlat^edagogjka^nViiiiiii^^^H

Abb. 12: Artikel zu Greenflation in der Neukonzeption des Neologismenwörterbuchs.

Abb. 13: Dashboard in der Neukonzeption des Neologismenwörterbuchs. Zu den gegenwärtigen Aufgaben unseres Arbeitsbereichs zur Lexikographie

des Sprachwandels gehört es Sprachwandel (Deutsches Neologismenwörterbuch) über vernetzen.

zudem, die drei Ressourcen zu lexikalischem

Fremdwörterbuch, eine gemeinsame

Lehnwortportal Deutsch, Zugriffsstruktur stärker zu

36

q^avjat^edagogj

LITERATUR

1. Brückner, Dominik (2015): Lexikographische Arbeitsprozesse - am Beispiel des Deutschen Fremdwörterbuchs. In: Germanica Wratislaviensia 140/2015, 139-154.

2. Engelberg, Stefan (2018): Lexicologie et lexicographie a l'Institut für Deutsche Sprache. Cahiers de lexicologie, 112, 63-77.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Engelberg, Stefan, Annette Klosa-Kückelhaus & Carolin Müller-Spitzer (2020): Internet Lexicography at the Leibniz-lnstitute for the German Language. - K Lexical News, 28. Juli 2020, 41-63.

4. Engelberg, Stefan & Peter Meyer (2015): Das Lehnwortportal Deutsch als kontaktlinguistisches Forschungsinstrument. - Emmerich Kelih, Jürgen Fuchsbauer & Stefan Michael Newerkla (Hg.): Lehnwörter im Slawischen: Empirische und crosslinguistische Perspektiven. Frankfurt/M. et al.: Peter Lang, 149-170.

5. Herberg, Dieter, Michael Kinne & Doris Steffens (2004): Neuer Wortschatz. Neologismen der 90er Jahre im Deutschen. Unter Mitarbeit von Elke Tellenbach und Doris al-Wadi. Berlin, New York: de Gruyter.

6. Keibel, Holger, Sophie Hennig & Rainer Perkuhn (2010): Effiziente halbautomatische Detektion von Neologismuskandidaten. Technical Report IDS-KL-2010-01. Mannheim: Institut fur Deutsche Sprache.

7. Klosa-Kückelhaus, Annette (2023): OWID und OWIDplus - lexikographisch-lexikologische Online-Informationssysteme des IDS. In: edition 1/2023, 19-23.

8. Klosa, Annette & Harald Lüngen (2018): New German Words: Detection and Description. In: Cibej, Jaka, Vojko Gorjanc, Iztok Kosem & Simon Krek (Hg.): Proceedings of the XVIII EURALEX International Congress. Lexicography in Global Contexts, 17-21 July, Ljubljana. Ljubljana: Znanstvena zalozba, 559-569.

9. Klosa-Kückelhaus, Annette & Jan Oliver Rüdiger (2023): Introducing NeoRate. A corpus-lexicographic tool to support the detection of unregistered words for a German COVID-19 discourse dictionary. In: Lexicography 10, 2. (Special issue: Klosa-Kückelhaus, Annette & Ilan Kernerman (Hg.): Unregistered words, neologisms, and dictionaries), 117-137.

10. Meyer, Peter (2022): Lehnwortportal Deutsch: a new architecture for resources on lexical borrowings. In: Klosa-Kückelhaus, Annette, Stefan Engelberg, Christine Möhrs & Petra Storjohann (Hg.): Dictionaries and Society. Proceedings of the XX EURALEX International Congress, 12-16 July 2022, Mannheim, Germany. Mannheim: IDS-Verlag, 578-583.

11. Steffens, Doris (2017): Vom Print- zum Onlinewörterbuch - Zur Erfassung, Beschreibung und Präsentation von Neologismen am IDS. In: D^browska-Burkhardt,

37

qdaVat^edagog

Я

Jarochna, Ludwig M. Eichinger, Uta Itakura (Hg.): Deutsch: lokal - regional -global. Festschrift für Gerhard Stickel zum 80. Geburtstag. Tübingen: Narr, 281-294.

12. Steffens, Doris & Doris al-Wadi (2015): Neuer Wortschatz. Neologismen im Deutschen 2001-2010. 3., durchges. Aufl. Mannheim: Institut für Deutsche Sprache. [1. Aufl. 2013.]

13. Steffens, Doris & Olga Nikitina (2016): Deutsch-russisches Neologismenwörterbuch. Neuer Wortschatz im Deutschen 1991-2010. Немецко-русский словарь неологизмов. Новая лексика в немецком языке 1991-2010. 2., überarb. Aufl. Mannheim: Institut für Deutsche Sprache. [1. Auf. 2013.]

14. Storjohann, Petra (2024): IDS Neo2020+: Eine neuartige Ressource für neue Wörter im Gebrauch. In: Sprachreport 1/2024, 10-17.

15. Wolfer, Sascha & Jan Oliver Rüdiger (2023): Tagesaktuelle Aufbereitung, Analyse und Exploration sprachlicher Daten aus RSS-Feeds. In: Blum, Lothar B. (Hg.): Angewandte Data Science: Projekte | Methoden | Prozesse. Wiesbaden: Springer Vieweg, 3-27.

38

i Надоели баннеры? Вы всегда можете отключить рекламу.